딥시크(DeepSeek) 소개
딥시크(DeepSeek)는 중국 항저우에 본사를 둔 인공지능(AI) 스타트업으로, 오픈 소스 대형 언어 모델(LLM)과 추론 특화 AI 모델을 개발하는 회사입니다. 2023년 설립된 이 회사는 중국 헤지펀드 High-Flyer의 자금 지원을 받아 시작되었으며, 창립자는 량원펑(Liang Wenfeng)입니다.
주요 특징 및 성과
- 모델 개발:
- 2024년 12월, 대규모 언어 모델(V3)을 공개했으며, 2025년 1월 추론 특화 모델(R1)을 발표했습니다.
- R1 모델은 수학, 코딩, 언어 이해 등 다양한 평가에서 오픈AI와 메타(Meta)의 최신 모델을 능가하거나 비슷한 성능을 보였습니다.
- 비용 효율성: 딥시크는 AI 개발에 약 550만 달러를 투입했으며, 이는 경쟁사 대비 매우 낮은 비용입니다. 엔비디아의 구형 AI 칩(H800)을 활용해 비용을 절감하면서도 높은 성능을 달성했습니다.
- 기술 혁신:
- 강화학습과 그룹 상대 정책 최적화(GRPO) 기술을 통해 학습 효율성을 극대화했습니다.
- 전문가 기반 혼합(Mixture-of-Experts) 기술로 일부 매개변수만 활성화하여 연산 비용을 줄이고 고품질 결과를 제공했습니다.
- 오픈 소스 전략: 모든 모델과 데이터를 무료로 공개하며, 전 세계 개발자들이 참여할 수 있도록 장려하고 있습니다. 이로 인해 빠른 기술 발전과 비용 절감이 가능했습니다.
- 글로벌 영향력: 딥시크의 AI 챗봇은 애플 앱스토어 다운로드 차트 1위를 기록하며 세계적으로 주목받고 있습니다. 미국 AI 업계에 큰 충격을 주며 기존 빅테크 기업들에게 위협적인 존재로 부상했습니다.
딥시크는 저비용 고성능 AI 개발로 글로벌 시장에서 빠르게 성장하고 있으며, 오픈 소스 전략과 혁신적인 기술로 AI 생태계에 새로운 방향성을 제시하고 있습니다.