제목 | [산업동향] 딥시크의 출시에 따른 AI 산업의 영향 및 시사점 |
---|
분류 | 성장동력산업 | 판매자 | 민준석 | 조회수 | 75 | |
---|---|---|---|---|---|---|
용량 | 745.8KB | 필요한 K-데이터 | 7도토리 |
파일 이름 | 용량 | 잔여일 | 잔여횟수 | 상태 | 다운로드 |
---|---|---|---|---|---|
![]() |
745.8KB | - | - | - | 다운로드 |
데이터날짜 : | 2025-02-17 |
---|---|
출처 : | 국책연구원 |
페이지 수 : | 21 |
1. 딥시크의 등장과 배경
£ 2025년 1월 20일, 중국의 스타트업인 딥시크(창업자: 량원평)가 전세계 AI 산업계에 상당한 파급력을 갖는 DeepSeek-R1
모델(이하 R1 모델)을 출시1)2)
∙ 딥시크의 추론형 AI 모델 ‘R1’과 ‘R1-Zero’*는 AI 연구 커뮤니티와 업계 관계자들 사이에서 상당한 화제로 부상3)
* R1-Zero는 강화학습만으로 학습된 모델로 지도학습 기반 파인튜닝(Supervised Fine-Tuning, SFT) 없이 스스로 문제 해결하는
모델이며, 반면에 R1은 소량의 콜드스타트(Cold-start) 데이터와 다단계 학습 과정을 통해 더욱 향상된 성능과 가독성을 제공하는
모델
∙ 딥시크는 R1 모델 발표와 함께 AI 산업에서 핵심 플레이어 중 하나로 빠르게 자리 잡아가고 있으며 가성비 높은 AI 모델로서의
입지를 구축해가는 추세
£ 오픈AI 및 구글은 기반모델을 개발하여 폐쇄적인 형태로 운영하는 반면, 딥시크는 오픈소스 기반으로 R1 모델 개발4)
∙ 딥시크는 오픈소스 기반으로 지식 증류와 다단계 강화학습과 같은 비용 절감 기술을 도입하여 AI 모델의 효율성을 향상5)
∙ R1 모델은 AI 학습의 효율성을 극대화하기 위해 전문가 혼합(MoE, Mixture-of-Experts) 기술을 활용
∙ 딥시크는 벤치마킹 평가 결과를 통해 R1 모델이 GPT-4 모델과 경쟁할 만한 성능을 기록했다고 주장
4. 딥시크 관련 주요 이슈
£ 딥시크는 연구논문에서 MoE, MLA 등의 기법을 활용하여 연산 자원 사용을 최적화하여 오픈AI의 GPT-4 등의 AI 모델보다
학습비용이 낮다고 주장29)
∙ 그러나 일부에서는 딥시크가 비용 절감을 달성한 것으로 평가하면서도 인프라 및 인력 비용까지 고려했을 때 실제로는
보다 많이 비용이 들었을 수 있다고 추측
* 독립적인 연구 기업인 SemiAnalysis는 딥시크의 600만 달러라는 추산은 주로 GPU 사전학습 비용을 고려하였으며,
회사에서 발생하는 연구 개발, 인프라 및 기타 필수 비용에 대한 상당한 투자는 무시되었다고 주장30)
£ 딥시크는 중국의 규제 환경 속에서 운영되어 개인정보 처리 방식에 대한 의문을 유발31)
∙ 중국의 사이버 보안법에 따르면, AI 기업들은 데이터를 국내에서 저장 및 처리해야 하며,
필요 시 정부기관에 제공해야 하는 의무를 보유
* 딥시크 약관에 수집된 데이터는 중국 내 서버에 저장되며 중국 정부의 요청 시 제공될 수 있도록 규정
∙ 딥시크는 일반적인 생성AI와 다르게 키보드 입력 패턴과 같은 개인 식별이 가능한 정보를 수집하고, 중국 업체의 서버와
직접 통신하는 기능이 포함되어 사용자의 채팅 기록이 외부로 유출될 가능성 제기32)
* 2025년 2월 9일, 국정원은 딥시크에 대한 기술 검증 결과 ▲과도한 개인정보 수집 ▲입력 데이터의 학습 데이터 활용
▲광고주와의 무제한 정보 공유 ▲국외 서버 저장 등의 문제점을 확인했다고 밝힘
---------------------------------------------------------------------------------------------------------------------------------------------------------
※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.