중국 AI 딥시크(DeepSeek) 미국 빅테크를 저격! 과도한 AI 투자 의구심 증폭

미국의 대중국 AI 견제 현주소

미국은 AI를 미국의 안보와 직결되는 핵심 기술로 지정하고 타국이 미국 AI 기술을 넘보지 못하도록 반도체 수출 차단 등의 강경한 태도를 취하고 있습니다. 특히 중국의 AI 발전을 매우 경계하며 중국에는 최첨단 반도체의 수출 자체를 금지한 상태입니다. 엔비디아는 과거 H100이 아닌 H800 같은 성능이 낮은 AI 반도체를 중국에 수출하였으나 이마저도 미국 바이든 행정부에 의해 막힌 상태입니다.

25년 1월 20일 중국 스타트업 기업에서 딥시크(DeepSeek) 모델 공개

미국의 이러한 견제를 비웃기라도 하듯 최근 중국 AI 스타트업 "딥 시크"는 GhatGPT와 유사한 DeepSeek라 불리는 AI 모델을 지난 25년도 1월 20일에 공개하였습니다. 딥시크(DeepSeek) 모델은 출시하자마자 전 세계 AI 업계에 큰 주목을 받고 있습니다. 특히 미국 AI 개발자들 사이에 위기감을 조성하고 있는 상황입니다.

딥시크(DeepSeek) AI 모델이란?

딥시크는 오픈 소스 모델로 개발하여 누구나 사용할 수 있도록 하고 있습니다. 이는 메타(Meta, 구 페이스북)과 같은 오픈소스 AI 전략으로 AI 생태계에 영향력을 가지기 위한 포석으로 보입니다. 혹은, AI에 대한 중국의 영향력을 확대하고 기술력에 대한 확신을 보여주기 위함일지도 모릅니다.

메타(Meta) 라마 AI 모델 개발 비용의 1% 수준인 557만 달러(80억원)로 개발한 딥시크

딥시크 모델 버전 3은 혁신적인 아키텍처를 도입하여 메모리 사용량과 계산 비용을 줄였습니다. 특히 메타의 오픈 소스 모델 라마 AI 모델 개발 비용의 1/10인 557만 달러(한화 약 82억 원)를 투자해서 이 모델을 개발하였다는 점에서 수많은 AI 개발자들에게 충격을 주고 있습니다. 메타의 최신 AI 모델인 라마(llama) 3.1 개발 비용이 6억 4천만 달러(한화 약 8960억 원)의 1% 수준으로 알려져 더욱 큰 충격을 주고 있습니다.

딥시크가 비용 효율성을 달성한 핵심 요인

딥시크는 엔비디아의 H800 GPU를 약 2000개를 사용해 모델을 훈련시켰습니다. 이는 메타 등의 빅테크가 1만 6000개 이상의 고성능 칩을 사용한 것과 대조되며 GPU 자원 사용을 최적화하였습니다.

또한, MoE(Mixture of Experts) 기술을 이용해 총 6700억개의 매개변수 중 370억 개만 활성화하는 방식을 취해 자원 효율성을 극대화하였습니다. 메타 라마 3.1에 비해 대략 11배 적은 시간에 훈련을 완료하여 비용을 효과적으로 줄였습니다. 딥시크가 2백만 GPU 시간으로 훈련을 달성한 것에 대비 라마 3은 3천만 GPU 시간으로 훈련을 달성하였습니다.

딥시크와 GPT-4o 및 라마 3.1 비교

딥시크 모델은 공개되자마자 코드 및 수학 분야의 성능 벤치마크인 코드포스(Codeforces)와 MATH 테스트에서 오픈 AI의 GPT-4o 그리고 메타 라마 3.1을 능가하는 성적을 기록하였습니다.

또한, 언어 처리 분야에서 MMLU 벤치마크의 점수는 GPT-4o가 기록한 88.7점에 근접한 88.5점을 획득하여 최상위권 성능을 가졌음을 입증하였습니다.

미국의 과도한 AI 자본 투자(CAPEX)에 대한 논란 확대

미국은 AI 시대를 선도하기위해 4년간 총 5000억 달러를 투자하는 스타게이트(Stargate) 프로젝트를 1월 20일에 발표하였습니다. 그런데 이번 딥시크의 발표는 미국의 과도한 AI 투자에 대한 우려를 낳았습니다. 100억 원 수준의 개발 비용은 메타에서 AI 개발진 인건비 수준의 비용으로 미국 빅테크 회사들에게 막대한 AI 개발 비용에 대한 정당성을 입증해야하는 어려운 과제가 주어진 셈입니다. 이미 이러한 영향으로 엔비디아 등의 AI 회사 주가는 소폭 하락하며 장을 마감하였습니다. 앞으로 미국 빅테크들의 AI 투자에 제동이 걸릴지 그리고 AI 기업들의 주가가 버블인지에 대한 논란에 불을 지필 것으로 보입니다.

참고

https://zdnet.co.kr/view/?no=20250109140201

[AI는 지금] 中 딥시크, 'V3'로 실리콘밸리에 도전장…"비용·성능 모두 잡았다"

중국 인공지능(AI) 스타트업 딥시크가 최근 새로운 오픈소스 거대언어모델(LLM) 'V3'를 공개하며 주목받고 있다. 주요 벤치마크에서 오픈AI 등 실리콘밸리 빅테크의 AI 모델과 대등하거나 우수한 성

zdnet.co.kr

저작자표시 비영리 변경금지

'테크' 카테고리의 다른 글

구글 서치 콘솔(Goolge Search Console)에 도메인 등록하기 (Gabia 활용 방법) (3)	2025.01.31
메타 CEO 마크 저커버그 "중급 엔지니어들 AI로 대체될 것" AI 에이전트(Agent)란 무엇인가? (2)	2025.01.24

K-인사이트(K-insight)

중국 AI 딥시크(DeepSeek) 미국 빅테크를 저격! 과도한 AI 투자 의구심 증폭

미국의 대중국 AI 견제 현주소

25년 1월 20일 중국 스타트업 기업에서 딥시크(DeepSeek) 모델 공개

딥시크(DeepSeek) AI 모델이란?

메타(Meta) 라마 AI 모델 개발 비용의 1% 수준인 557만 달러(80억원)로 개발한 딥시크

딥시크가 비용 효율성을 달성한 핵심 요인

딥시크와 GPT-4o 및 라마 3.1 비교

미국의 과도한 AI 자본 투자(CAPEX)에 대한 논란 확대

참고

'테크' 카테고리의 다른 글

티스토리툴바

중국 AI 딥시크(DeepSeek) 미국 빅테크를 저격! 과도한 AI 투자 의구심 증폭

미국의 대중국 AI 견제 현주소

25년 1월 20일 중국 스타트업 기업에서 딥시크(DeepSeek) 모델 공개

딥시크(DeepSeek) AI 모델이란?

메타(Meta) 라마 AI 모델 개발 비용의 1% 수준인 557만 달러(80억원)로 개발한 딥시크

딥시크가 비용 효율성을 달성한 핵심 요인

딥시크와 GPT-4o 및 라마 3.1 비교

미국의 과도한 AI 자본 투자(CAPEX)에 대한 논란 확대

참고

'테크' 카테고리의 다른 글

관련글

티스토리툴바