[뉴스토마토 안창현 기자] 인공지능(AI) 스타트업 업스테이지가 포털 다음을 인수하면서 자체 AI 개발에 속도를 내고 있습니다. 다음이 보유한 방대한 데이터를 기반으로 AI 기술력을 고도화하고, 차세대 AI 플랫폼 구축에 나설 것이란 전망입니다. 스타트업으론 유일하게 2단계에 진출한 국가대표 AI 선발전에서는 다음과의 시너지 효과를 통해 경쟁력을 한층 높일 것이라는 관측이 제기됩니다.
4일 업계에 따르면 업스테이지는 자체 개발한 거대언어모델(LLM) '솔라 오픈 100B'에서 기존 파라미터 규모를 2배 수준으로 키우면서 200B 모델로 확대하고 있습니다. 솔라 오픈 100B는 업스테이지 컨소시엄이 국대 AI를 선정하는 '독자 AI 파운데이션 모델(독파모)' 프로젝트를 통해 내놓은 첫 번째 결과물입니다. 지난달 15일 프로젝트의 1차 평가에서 네이버클라우드와 NC AI를 제치고 1차 단계를 통과하면서 스타트업의 저력을 보여줬다는 평가를 받았습니다.
성능 면에서 글로벌 프런티어급 AI 모델들과 어깨를 나란히 한다는 게 업스테이지 설명입니다. 독파모 1차 평가 중 글로벌 개별 벤치마크 항목에서 LG AI연구원과 함께 10점 만점으로 최고점을 받기도 했습니다. 특히 업스테이지는 플리토와 노타, 래블업 등 기술 스타트업과 학계·연구기관을 중심으로 컨소시엄을 꾸려 성과를 냈습니다. 2차 단계에서 연구진과 주요 산업 파트너들을 확대해 핵심 모델 연구 역량을 끌어올리고, 다양한 산업 현장에 AI 전환(AX) 서비스를 확산한다는 계획입니다.
이번 업스테이지의 다음 인수가 주목받고 있는 건 무엇보다 AI 기술력 고도화에 대한 기대감 때문입니다. 자체 LLM 모델인 솔라 오픈의 강점은 한국어와 현장 적용 가능성이 꼽힙니다. 중국의 대표적인 AI 모델인 '딥시크 R1' 대비 크기는 15%에 불과하지만, 우리나라 문화 이해도와 한국어 지식 벤치마크 평가에서 2배 이상의 성능 격차를 냈습니다.
김성훈 업스테이지 대표가 지난 2024년 창사 첫 기자간담회를 열고 자사의 AI 솔루션을 소개하고 있다. (사진=뉴시스)
전문가들은 LLM 경쟁에서 AI 모델 구조만큼 중요한 것이 학습 데이터라고 지적합니다. 특히 한국어처럼 상대적으로 데이터가 부족한 경우, 대규모 AI 학습에 제약이 있을 수밖에 없습니다. 업스테이지는 그동안 한국어 저자원 문제를 보완하기 위해 합성 데이터와 금융·법률·의학 등 분야별 특화 데이터를 활용하면서 데이터 학습과 필터링 방법론을 고도화했다고 밝혔습니다. 여기에 다음이 수십 년간 축적한 방대한 양의 한국어 데이터를 AI 학습에 활용하면, 한국어 강점을 내세운 국내 AI 기술의 경쟁력을 확보할 수 있을 것이란 기대감이 큽니다.
더구나 다음 플랫폼을 통해 AI 생태계를 확장하는 계기가 될 수 있습니다. 앞서 업스테이지는 독파모 프로젝트를 통해 최종적으로 '솔라 WBL' 모델을 개발하고, 이를 기반으로 향후 3년간 1000만명 이상의 사용자를 확보하는 대국민 AI 서비스 제공을 목표로 내세웠습니다. 기업용 AI 솔루션 개발에 주력하던 업스테이지가 다음 서비스를 통해 자체 플랫폼을 구축하는 환경을 마련한 겁니다.
업계 관계자는 "업스테이지의 다음 인수가 자체 AI 기술력을 고도화하고, 다양한 서비스를 개발할 플랫폼의 기반을 마련했다고 볼 수 있다. 당장 독파모 프로젝트에서도 AI 개발 속도를 높이고 기술 경쟁력을 노릴 수 있을 것"이라며 "다만 장기적인 관점에서 포털 시장 경쟁력이 이미 떨어진 다음이 성공적인 AI 플랫폼으로 자리 잡는 건 쉽지 않을 것"이라고 말했습니다.
안창현 기자 chahn@etomato.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김충범 테크지식산업부장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지