본문 바로가기

:)

검색하기
:)
프로필사진 andre99

  • 분류 전체보기 (59)
    • AI (21)
    • Algorithm (5)
    • Data Structure (7)
    • Data Visualization (10)
    • Paper Review (16)
Guestbook
Tags
  • 자연어처리
  • Algorithm
  • multimodal
  • coursera
  • deep learning
  • model context protocol
  • SDGs
  • gemmasprint
  • paper review
  • 자료구조
  • stable diffusion
  • deepseekmath
  • Diffusion Models
  • 태블로
  • tableau
  • 거대언어모델
  • animatediff
  • 딥러닝
  • 강화학습
  • LLM
  • elastic search
  • 코세라
  • NLP
  • Data Structure
  • Rag
  • Unsloth
  • Firebase
  • Gen AI
  • 논문 리뷰
  • 알고리즘
more
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록deepseekmath (1)

:)

[LLM/Domain] DeepSeekMath

1. 개요DeepSeek MATH: 수학적 추론 능력을 극대화하기 위해 개발된 오픈소스 AI 모델DeepSeek-Coder-Base-v1.5 7B를 기반으로 학습자연어 데이터 뿐만 아니라 수학 관련 데이터와 코드 데이터를 추가 학습해 정확도 향상 2. ContributionMath Pre-Training at Scale 대규모 수학 사전 학습Common Crawl에서 120B 토큰 규모의 수학 데이터(DeepSeekMath Corpus) 생성 (Minerva의 7배)DeepSeekMath-Base 7B가 Minerva 540B와 유사한 성능 → 모델 크기보다 데이터 품질이 중요함을 증명.코드 학습의 효과 확인: 코드 학습 후 수학 학습을 진행하면 문제 해결 및 도구 활용 능력 향상arXiv 데이터 학습은..

Paper Review 2025. 4. 2. 10:31
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바