(헬스&사이언스)고대 문헌, AI가 빠르고 정확하게 해독한다
딥마인드의 고대 문헌 해독 AI, 이타카(Ithaca)에서 아이네아스(Aeneas)로 진화
2025-07-29 10:10:01 2025-07-29 14:09:20
1899년 이집트에서 발견되어 고대 이집트 상형문자 해독에 열쇠가 된 로제타 스톤(Rosetta Stone). 여기에 새겨진 이집트 상형문자를 해독하고 문자 체계를 이해하기까지는 10년의 세월이 걸렸다.(사진=Wikipedia)
 
[뉴스토마토 서경주 객원기자] 로제타 스톤(Rosetta Stone)은 이집트 상형문자를 해독하는 데 열쇠가 되었습니다. 이 돌에는 기원전 196년경에 작성된 이집트 프톨레마이오스 5세의 즉위 기념 칙령이 이집트 상형문자, 이집트 민중문자(Demotic), 고대 그리스문자로 새겨져 있습니다. 
 
1799년 7월 나폴레옹이 이끄는 프랑스의 이집트 원정대 공병장교 피에르-프랑스와 부샤르가 축성 자재로 쓰인 이 비석을 발견했습니다. 여기에 새겨진 그리스어 비문은 1803년에 비교적 쉽게 해독되었고 상형문자는 1822년에 가서야 읽을 수 있었습니다. 프랑스 그르노블 대학의 문헌학자 장-프랑스와 샹폴리옹이 본격적으로 해독에 착수한 지 8년 만이었고, 그가 『이집트 상형문자 체계에 대한 초보적 해설(Précis du système hiéroglyphique)』을 출간할 때까지 따지면 10년의 세월이 걸렸습니다. 
 
이런 고대 금석문을 해석하는 데 인공지능을 이용하면 어떨까요? 챗GPT에 지금 인공지능을 이용해 로제타 스톤을 해석한다면 얼마나 걸리겠느냐는 질문을 던졌습니다. 상형문자의 문화적 함축이나 상징성은 여전히 인간 전문가의 맥락적 해석이 필요하다는 단서를 덧붙이긴 했지만, 챗GPT의 대답을 그대로 옮기면 이렇습니다: "인공지능(AI), 특히 자연어 처리(NLP), 이미지 인식, 언어 비교 모델, 번역 모델, 그리고 생성형 신경망 기술이 발달한 지금, 동일한 텍스트를 해독하는 작업은 훨씬 빠르게—며칠에서 몇 주 이내에 상당히 높은 정확도로—완료될 수 있습니다." 
 
읽어버린 텍스트를 찾아 나선 딥마인드
 
2022년 3월9일, 알파고(AlphaGo)로 잘 알려진 딥마인드(DeepMind)는 "딥 신경망(deep neural network)을 이용한 고대 문헌 복원 및 출처 지정(Restoring and attributing ancient texts using deep neural networks)"이라는 논문을 발표하며 이타카(Ithaca)라는 딥러닝 기반 텍스트 복원 시스템을 선보였습니다. 
 
이 시스템은 7만8000건의 고대 그리스어 문헌을 기반으로 훈련되었으며, 고대 그리스어 텍스트의 부분 복원, 작성 연대 예측, 출처 정보 추정 기능을 수행합니다. 이타카는 테스트에서 "너 자신을 알라(Γν?θι σαυτ?ν)"라는 구절이 들어 있는 것으로 유명한 델포이 금언(Delphic maxims)의 손실된 부분을 정확히 복원해냈습니다. 
 
지난 7월23일, 딥마인드는아타카에서 한 걸음 더 나아가 생성형 신경망(generative neural network) 기반 인공지능 아이네이아스(Aeneas)를 자사 블로그와 과학 저널 네이처를 통해 발표했습니다. 트로이가 함락된 후 이탈리아 반도로 건너가 로마의 건국시조가 된 전설적 영웅의 이름을 붙인 이 AI는 손상된 고대 라틴어 기록의 빈틈을 메우기 위해 만들어졌습니다. 
 
이 AI는 그동안 수많은 고고학자와 문헌학자들이 손상된 파피루스 조각이나 깨진 비석의 문장을 수십 년에 걸쳐 수작업으로 복원해 과정을 단시간에 수행할 수 있습니다. 더 놀라운 것은 단지 '빈칸을 채우는' 기계적 복원 수준을 넘어서, 고대 세계의 문맥과 언어 구조, 시대적 배경을 종합적으로 이해하는 능력을 갖추었다는 점입니다. 
 
생성형 신경망으로 고대를 종합적으로 학습
 
아이네이아스가 작동하는 방식은 현대의 생성형 언어 모델들과 비슷하지만, 중요한 차이가 있습니다. 일반적인 거대언어모델(LLM)은 방대한 양의 현대 텍스트(뉴스 기사, 위키피디아, 블로그, 논문, 소셜미디어 등)를 바탕으로 훈련됩니다. 그러나 아이네이아스는 초기부터 고대 언어, 특히 라틴어와 고대 그리스어, 그리고 이들과 관련된 철학적·역사적 문서를 학습 대상으로 삼았습니다. 이 AI는 단순히 단어와 문법을 아는 것이 아니라, 고대 문헌이 가진 문체적 특징, 문화 사조, 장르별 표현 방식은 물론 문자 이미지의 시각적 특성도 학습하도록 설계되었습니다. 
 
예를 들어, 고대 로마의 역사가 리비우스의 문장이 일부 손실되었다고 가정하면, 아이네이아스는 해당 문서가 기록된 시기, 저자의 문체, 사용된 어휘, 그리고 유사한 맥락에서 쓰인 다른 문헌들의 구조를 바탕으로, 손실된 부분을 여러 가지 가능태로 복원해 확률적으로 가장 자연스러운 구절뿐 아니라, 문학적으로도 설득력 있는 문안을 제시합니다. 
 
즉, '하나의 정답'이 아니라 인간 해석자가 비교·선택할 수 있는 '가능한 해석의 스펙트럼'을 제공합니다. 이러한 접근 방식은 인문학의 전통적인 복원 방식과 유사합니다. 고전학자들이 해석의 다양성을 열어두고, 각각의 복원안이 갖는 문화적 함의나 역사적 맥락을 두고 논의해 온 것처럼, 아이네이아스가 수행하는 복원은 해석 가능성을 확장하는 작업입니다. 
 
공개 테스트에서 전문가 수준의 실력 입증
 
아이네이아스가 실질적으로 보여준 성과도 주목할 만합니다. 학계에 공개된 테스트에서 손상된 고대 파피루스 텍스트들을 대상으로 복원 실험을 진행한 결과, 학자들이 수작업으로 제안한 복원 문장과아이네이아스가 제안한 복원안이 70% 이상 일치했습니다. 나머지 30%의 경우도 '문법적, 문체적, 논리적으로 충분히 가능한 대안'이라는 평가를 받았습니다. 즉, AI가 고대 문헌 전문가 수준에 버금가는 결과를 낼 수 있다는 것이 입증되었습니다. 
 
예를 들면 아이네이아스는 로마 제국의 초대 황제 아우구스투스가 자신의 통치 업적을 로마 전역에 널리 알리기 위해 작성한 공식 문서인 "신과 같은 아우구스투스의 업적(Res Gestae Divi Augusti)"의 작성 시기를 하나는 기원전 1세기 말, 다른 하나는 기원후 10~20년으로 추정했습니다. 이는 역사학계에서 논란이 이어져 온 기존 연대 추정과 일치하는 시기입니다. 
 
고대 문헌을 해독하는 데 있어서 최대의 난제는 '결손 문자(missing text)'입니다. 오랜 풍상에 마모되어 자취를 감춘 문자를 추정하는 일은 과거에는 고전학자들이 문법과 맥락, 그리고 유사한 문헌을 참고해 수작업으로 이루어졌습니다. 이 방법은 시간이 오래 걸릴 뿐 아니라 사람마다 해석이 달라질 수 있었습니다. 
 
아이네이아스는 생성형 신경망을 이용해, 결손된 부분을 자동으로 예측해 확률적으로 제시합니다. 예를 들어 "Caesar ad ( )venit"라는 라틴어 문장이 있습니다. 이 문장이 작성된 배경을 검토하여 아이네이아스는 'Galliam'을 가장 높은 확률로 제시해 "Caesar ad Galliam venit(카이사르는 갈리아로 갔다)"라는 문장을 완성합니다. 
 
AI, 고대 문헌 해석을 문화적 이해의 영역으로 확장
 
아이네이아스는 앞서 나온 이타카의 기능을 계승하면서도, 고대 문헌 해석을 단순 복원이 아닌 '문화적 이해의 영역'으로 확장하려는 시도라고 볼 수 있습니다. 이타카가 인공지능이 고대 언어를 '읽을 수 있다'는 가능성을 보여줬다면, 아이네이아스는 그것을 '이해하고 해석할 수 있는 수준'으로 끌어올렸습니다. 따라서 아이네이아스는 단순한 기술 진보의 차원을 넘어 AI가 인류의 과거에 질문하고, 그 의미를 되묻는 새로운 인문학적 실험의 출발점이라고 할 수 있습니다.
 
그럼에도 불구하고 아이네이아스가 생성한 복원안은 어디까지나 통계적 추정치이며, 언어의 상징성과 정치적 의미, 문화적 함의를 100% 이해한다고 보기엔 아직 이릅니다. 예컨대 풍자적 표현, 중의적 어휘나 문장, 당대의 상황을 암시적으로 내포한 구절은 AI가 기술적으로는 감지할 수 있어도, 그 의미의·역사적 인문학적 해석은 여전히 인간 연구자의 영역으로 남아 있습니다. 
 
아이네이아스는 인간의 직관과 추론을 지원하고 확장해 인류가 오래도록 '읽을 수 없었던 기록'을 다시 읽을 수 있게 해주는 열쇠지만, 그 열쇠로 발견한 텍스트의 의미는 여전히 인간의 선택과 해석에 달려 있습니다. 
 
사르데냐에서 출토된 트라야누스 황제가 군함의 한 선원에게 발급한 청동 군복무 증서의 파편. 빨간색으로 쓰인 글씨는 아이네이아스가 추정해 제시한 것이다. (사진=메트로폴리탄 뮤지엄, 퍼블릭 도메인)
 
서경주 객원기자 kjsuh57@naver.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 강영관 산업2부장이 최종 확인·수정했습니다.

ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지

관련기사
0/300

뉴스리듬

    이 시간 주요 뉴스

      함께 볼만한 뉴스