2026년 1월, 대한민국 IT 업계가 뜨겁게 달아오르고 있습니다. 단순한 신기술 발표나 주가 상승 소식이 아닙니다. 바로 우리가 '국산'이라고 믿어 의심치 않았던 대한민국 대표 인공지능(AI) 모델들이 '출생의 비밀' 논란에 휩싸였기 때문입니다. 정부가 수백억 원의 예산을 투입하며 육성하려던 '소버린 AI(Sovereign AI, 주권 AI)' 프로젝트의 핵심 기업들이 중국산 기술을 차용했다는 의혹이 제기되면서, '프롬 스크래치(From Scratch)'라는 낯선 용어가 뉴스 헤드라인을 장식하고 있습니다.
도대체 프롬 스크래치가 무엇이길래 이토록 난리인 걸까요? 이것은 단순한 기술 용어를 넘어, 대한민국 AI 산업의 자존심이자 생존 전략과 직결된 문제입니다. 오늘은 이 뜨거운 감자인 '프롬 스크래치'의 정확한 개념부터, 네이버와 SKT가 겪고 있는 논란의 핵심, 그리고 이것이 우리에게 시사하는 바가 무엇인지 아주 상세하게 파헤쳐 보겠습니다. 이 글을 끝까지 읽으시면 현재 한국 AI 시장의 흐름과 미래 투자 포인트까지 명확하게 보이실 겁니다.
1. 도대체 '프롬 스크래치(From Scratch)'가 뭔가요?
가장 먼저 이 용어의 뜻부터 명확히 짚고 넘어가야 합니다. 요리에 비유하자면 가장 이해가 쉽습니다. 여러분이 토마토 스파게티를 만든다고 가정해 봅시다.

- 밀키트 조리 (파인 튜닝): 마트에서 완성된 토마토소스와 면을 사 와서, 내 입맛에 맞게 소금과 후추만 조금 더 뿌려서 완성합니다. 쉽고 빠르고 맛도 보장되지만, 소스의 근본적인 맛을 바꿀 수는 없습니다.
- 프롬 스크래치 (From Scratch): 밭에서 토마토를 직접 따고, 밀가루를 반죽해 면을 뽑는 것부터 시작합니다. 소스에 들어가는 향신료의 배합까지 '바닥(Scratch)'부터 내 맘대로 결정합니다. 시간과 비용이 엄청나게 들지만, 세상에 없는 나만의 완벽한 맛을 낼 수 있습니다.
* AI 개발에서의 프롬 스크래치
인공지능 개발, 특히 거대언어모델(LLM) 개발에서 '프롬 스크래치'란 "모델의 뇌세포(가중치, Weights)가 텅 빈 백지상태(무작위 초기화)에서 시작해, 수조 개의 데이터를 학습시키며 지능을 만들어가는 과정"을 의미합니다.
남이 만들어 놓은 똑똑한 모델(오픈소스)을 가져와서 한국어만 조금 더 가르치는 것(파인 튜닝)이 아니라, 모델의 설계도(아키텍처)부터 학습 데이터 구성, 사전 학습(Pre-training)까지 모든 과정을 자체 기술과 자본으로 수행하는 것을 말합니다. 이것이 중요한 이유는 바로 '기술적 원천성'과 '데이터 주권' 때문입니다. 남의 기술을 빌려 쓰면, 그 기술을 만든 국가나 기업의 정책에 휘둘릴 수밖에 없기 때문입니다.
2. 왜 지금 한국에서 이 용어가 난리인가? : 국가대표 AI의 딜레마
이 논란의 배경에는 대한민국 정부의 야심 찬 계획인 '독자 AI 파운데이션 모델 확보 전략'이 있습니다. 정부는 2027년까지 세계 3대 AI 강국(G3)으로 도약하겠다는 목표 아래, 우리만의 원천 기술을 가진 AI 기업을 뽑아 막대한 예산과 인프라를 지원하기로 했습니다. 이른바 'AI 국가대표 선발전'입니다.
정부가 내건 핵심 조건은 명확했습니다.
"남의 것을 베끼지 말고, 설계부터 학습까지 우리 기술로 만든(프롬 스크래치) 모델일 것."
그런데 최근 유력한 후보였던 네이버와 SK텔레콤의 모델에서 중국 기술의 흔적이 발견되면서 파장이 일었습니다.
2-1) 네이버 하이퍼클로바X의 경우: "눈은 빌려 썼다"

네이버는 자타공인 한국 최고의 AI 기술력을 가진 기업입니다. 하지만 이번 심사 과정에서 네이버가 제출한 멀티모달(텍스트+이미지 이해) 모델의 핵심 부품인 '비전 인코더(Vision Encoder)'가 중국 알리바바의 '큐원(Qwen)' 모델을 가져다 쓴 것이 드러났습니다.
쉽게 말해, AI의 '두뇌'는 직접 만들었지만, 세상을 보는 '눈'은 중국산 부품을 사용한 셈입니다. 네이버 측은 "전체 효율성을 위한 전략적 선택이었으며, 이를 한국 상황에 맞게 최적화했다"고 해명했지만, '완전한 독자 기술'을 기대했던 여론과 심사 기준에는 미치지 못한다는 비판이 나왔습니다.
2-2) SK텔레콤 A.X(에이닷엑스)의 경우: "구조가 너무 똑같다"

SK텔레콤이 공개한 자체 AI 모델 'A.X' 역시 논란을 피해 가지 못했습니다. 이 모델의 설계 구조(아키텍처)와 내부 설정값들이 중국의 돌풍을 일으키고 있는 AI 스타트업 '딥시크(DeepSeek)'의 모델과 지나치게 유사하다는 지적입니다.
SKT는 "최신 트렌드를 따랐을 뿐 표절은 아니다"라고 강변하고 있지만, 업계 전문가들은 "우연의 일치라고 하기엔 구조적 유사성이 너무 높다"며 의구심을 표하고 있습니다.
이것이 문제가 되는 이유는 국민의 세금이 투입되는 국책 사업이기 때문입니다. "중국이 무료로 푼 기술을 가져다 쓰는 것에 왜 수백억 원의 나랏돈을 지원해야 하느냐"는 '세금 낭비론'이 힘을 얻고 있는 상황입니다.
3. 왜 그들은 '프롬 스크래치'를 포기하고 '혼종'이 되었나?
그렇다면 네이버와 SKT 같은 대기업들이 기술력이 없어서 남의 것을 가져다 썼을까요? 그렇게 단순하지 않습니다. 여기에는 냉혹한 비용과 효율성의 경제학이 숨어 있습니다.

3-1) 천문학적인 비용과 시간
제대로 된 AI 모델 하나를 '프롬 스크래치'로 만들려면 수천억 원이 듭니다. 엔비디아의 최신 GPU 수천 대를 몇 달 동안 24시간 돌려야 하는데, 이 전기세만 해도 수십억 원이 나옵니다. 반면, 이미 검증된 해외의 오픈소스 모델을 가져다 튜닝하면 비용을 1/10, 1/100로 줄일 수 있습니다. 기업 입장에서 '맨땅에 헤딩'은 엄청난 리스크입니다.
3-2) 압도적인 글로벌 격차
미국의 마이크로소프트, 구글, 메타는 매년 AI 인프라에만 수십조 원을 쏟아붓습니다. 한국 기업들이 아무리 날고 기어도 자본력 싸움에서 이기기 힘든 구조입니다. 네이버 입장에서는 "모든 것을 처음부터 다 만들기보다, 이미 잘 만들어진 '눈(비전 인코더)'은 가져다 쓰고, 우리가 잘하는 '한국어 두뇌'에 집중하자"는 전략적 판단을 내린 것입니다.
3-3) 기술의 상향 평준화
현재 AI 기술은 오픈소스 생태계를 통해 빠르게 공유되고 있습니다. 구글이 만든 '트랜스포머' 구조를 전 세계가 쓰고 있고, 메타가 만든 '파이토치' 도구를 모두가 씁니다. 이런 상황에서 "어디까지가 독자 개발인가?"에 대한 경계가 모호해진 것도 사실입니다.
4. 프롬 스크래치 vs 파인 튜닝: 장단점 완벽 비교
이 논란을 제대로 바라보기 위해서는 두 개발 방식의 장단점을 명확히 이해해야 합니다.
| 구분 | 프롬 스크래치 (From Scratch) | 파인 튜닝 (Fine-Tuning) |
| 정의 | 백지상태에서 데이터 수집, 설계, 학습까지 전 과정을 직접 수행 | 이미 학습된 모델(Pre-trained)을 가져와 특정 목적에 맞게 재학습 |
| 비유 | 농사지어 요리하기 | 밀키트로 요리하기 |
| 장점 | 기술 완전 독립 (소버린 AI) 보안성 최상 데이터 저작권 및 편향성 통제 가능 |
비용 및 시간 절감 검증된 성능 확보 용이 개발 난이도 낮음 |
| 단점 | 천문학적인 비용과 시간 소요 실패 리스크 높음 고도의 인프라와 인재 필요 |
원천 기술 종속 우려 (디지털 식민지) 기반 모델의 편향성/오류 답습 가능 보안 문제 발생 가능 |
| 적합 분야 | 국가 안보, 핵심 원천 기술 확보, 초거대 플랫폼 기업 | 특정 산업(의료, 법률) 특화 서비스, 스타트업, 기업 내부용 AI |
5. 전문가들이 말하는 미래: 우리는 어떤 길을 가야 할까?
이번 논란은 한국 AI 산업이 성숙해가는 과정에서 겪는 성장통입니다. 전문가들은 무조건적인 '순수혈통' 고집보다는 '실리적인 기술 주권'을 찾아야 한다고 조언합니다.

5-1) 재정의가 필요한 '소버린 AI'
무조건 코드 한 줄까지 다 새로 짜야만 '우리 것'이라는 생각은 버려야 합니다. 핵심은 '데이터를 누가 통제하느냐'입니다. 해외 기술을 일부 차용하더라도, 한국의 데이터센터에 저장된 한국의 데이터로 학습시키고, 한국의 법률과 규제 안에서 통제할 수 있다면 그것이 실질적인 '주권 AI'일 수 있습니다.
5-2) 하이브리드 전략의 부상
모든 것을 다 만들 수 없다면, '선택과 집중'이 필요합니다. LG AI연구원의 경우처럼 산업 현장에 특화된 데이터와 기술력으로 승부를 보거나, 업스테이지처럼 경량화된 모델(sLLM) 시장을 공략하는 등 틈새 전략이 유효할 수 있습니다.
5-3) 정부 지원의 방향 전환
정부는 기업들에게 "처음부터 다 만들라"고 강요하고 채점할 것이 아니라, 기업들이 마음껏 뛰어놀 수 있는 '공용 인프라(GPU 팜)'를 깔아주는 데 집중해야 합니다. 컴퓨팅 파워가 부족해서 중국 기술을 빌려 쓰는 일이 없도록 말입니다.
6. 결론: 기술적 허영을 버리고 실력을 키워야 할 때
2026년의 '프롬 스크래치' 논란은 우리에게 뼈아픈 질문을 던졌습니다. "우리는 껍데기만 국산인 AI에 만족할 것인가, 아니면 힘들더라도 진짜 실력을 키울 것인가?"
네이버와 SKT의 이번 이슈는 비판받을 지점도 분명히 있지만, 글로벌 빅테크와의 힘겨운 싸움에서 살아남기 위한 처절한 몸부림이기도 했습니다. 중요한 것은 이번 논란을 계기로 '무늬만 국산'을 걸러내고, 진짜 경쟁력 있는 기술에 자원을 집중하는 안목을 갖추는 것입니다.
독자 여러분도 이제 뉴스에서 '한국형 AI'라는 단어가 나오면, 단순히 박수만 칠 것이 아니라 "저것은 진짜 프롬 스크래치인가? 아니면 영리한 튜닝인가?"를 한 번쯤 의심해 보고 분석해 보는 시각을 가지시길 바랍니다. 그것이 AI 시대를 살아가는 현명한 투자자이자 소비자의 자세일 것입니다.

7. 참고자료
- https://www.etnews.com/20260109000273
- https://www.fnnews.com/news/202601111844336387
- https://www.aitimes.com/news/articleView.html?idxno=205438
- https://www.technologyreview.kr/
- https://zdnet.co.kr/view/?no=20250728101615
- https://www.chosun.com/economy/tech_it/2026/01/07/QGEZI2VOHJHPTO6XZV743ZLI6Q/
- https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard
'알짜정보 > 기술' 카테고리의 다른 글
| '전자 두뇌'의 완성을 향하여: 멤트랜지스터(Memtransistor)와 미래 반도체 패권 전쟁 (0) | 2026.01.13 |
|---|---|
| 상품 검색하는 시대는 끝났다? 구글이 던진 승부수 'UCP'와 쇼핑의 미래 (1) | 2026.01.12 |
| ADC 항암제: 암세포만 골라 죽이는 '유도미사일', 차세대 바이오의 미래를 바꾸다 (0) | 2026.01.07 |
| NVIDIA DLSS 4.5 완벽 분석: 2세대 트랜스포머 AI가 4K 240Hz 게이밍을 현실로 만드는 방법 (1) | 2026.01.06 |
| CES 2026, AI 칩셋 전쟁의 서막: 내 컴퓨터와 로봇이 천재가 되는 순간 (0) | 2026.01.06 |
댓글