나랏말싸미 美·中과 달라…한글 특화 AI 모델 속속 등장
페이지 정보
본문
영어·중국어 등 특정 언어에 편중된 생태계에서 한국어에 특화된 인공지능AI 모델이 잇달아 나오고 있다.
11일 관련 업계에 따르면 인공지능AI 인프라 솔루션 기업 모레는 자체 개발한 한국어 거대언어모델LLM 모티프를 글로벌 AI 플랫폼 허깅페이스에 오픈소스로 공개했다.
모티프는 웹사이트에서 수집된 글 외에도 국내 특허·연구 보고서 등 전문 분야 문서를 학습 데이터로 활용했다. 모티프는 한국판 AI 성능 평가 지표인 KMMLU에서 이달 3일 기준 64.74점을 받아 글로벌 빅테크인 오픈AI·메타보다 높은 성능을 나타냈다.
AI 전문 기업 디노티시아도 자체 개발한 LLM 파운데이션 모델 DNA를 허깅페이스에 오픈소스로 공개하면서 생성형 AI 어시스턴트의 베타 테스트를 시작한다고 밝혔다.
KMMLU에서 인문학·사회학·과학 기술 등을 평가하는 한글·영어 벤치마크 전반에서 DNA는 평균 53.26점을 기록했다. 회사 측은 해당 수치가 LG 엑사원 3.5, 엔씨소프트 바르코 등을 능가한 수치라고 전했다.
한국어 특화 AI 모델 경쟁이 심화되는 건 글로벌 빅테크 AI 모델이 가진 한계에서 비롯된다는 평가다. AI 모델은 본격적인 학습 이전에 기본적인 패턴을 익히는 프리·트레이닝과 특정 분야에 AI를 최적화하는 파인 튜닝미세조정 과정을 거친다. 이 과정에서 사용되는 데이터가 대부분 영어·중국어 기반으로 알려졌다. 이로 인해 오픈소스 AI 모델을 사용하는 개발자 및 기업은 영어·중국어 중심의 모델에서 발생할 수 있는 번역 오류, 문화적 차이 등을 무시할 수 있다는 우려가 제기된다.
네이버가 소버린AI 전략을 펼치는 것도 이런 문제를 해소하기 위한 것이다. 네이버는 사우디아라비아 등 자국의 문화 등을 익히고 이를 반영하는 AI 모델 도입 국가 또는 기업과의 협력을 추진하고 있다.
또 AI 모델을 오픈소스로 공개해 전세계 개발자들이 한국어 모델을 테스트하며 활용하게 되면 장기적으로 한국어 특화 AI 생태계 조성에 도움을 줄 수 있다는 견해도 나온다. 자연어 외에도 이미지를 인식하거나 법률·의료 등 전문 영역에 특화된 한국어 AI 모델도 등장했다. 한국어 특화 AI 모델 시장은 더욱 활성화될 것으로 전망된다.
엔씨소프트는 한국어 처리에 특화된 중소형 오픈소스 시각언어모델VLM 바르코 비전을 공개했으며 오픈AI는 지난달 한국산업은행과 AI 생태계 발전을 위한 업무협약MOU을 통해 한국어 맥락에 맞춘 AI 모델 개발 방침을 밝혔다. 모레는 텍스트를 입력하면 이미지를 생성하는 모티프 비전을 이달 출시하고 오픈소스로 공개할 계획이다.
최경진 가천대 법과대학 교수는 "한국적 맥락을 모르는 AI에 그림 생성을 시킬 경우 한국의 자치기 놀이를 하는 어린이인데 옷은 중국 복장으로 표현할 수 있다"며 "AI 수준의 핵심은 다양한 수준의 적응성으로 많은 양과 다양한 지역의 데이터를 학습해야 더 정확하고 다양한 답변을 제공할 수 있다"고 했다.
이정윤 기자 leejuyoo@asiae.co.kr
[관련기사]
☞ "혹시 시위 다녀왔어요?"…식당서 묻던 남성, 갑자기 꺼낸 것
☞ "배우로 연 1000만원, 부업으로 월 400만원"…40대 투잡배우는 누구?
☞ "선배님 안녕하세요? 저흰 안녕못해요"…김 여사 모교에 붙은 대자보
☞ 안젤리나 졸리 아들 연세대 다니는 거 아니었어?…뭐하나 봤더니
☞ 티맵 보고 국회 진입한 계엄군… 다른 지도앱 봤으면 달랐을까
▶ 2025년 사주·운세·토정비결·궁합 확인!
▶ 비상계엄 후폭풍, 다시 맞이한 탄핵 정국
lt;ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제www.asiae.co.kr 무단전재 배포금지gt;
관련링크
- 이전글컴투스홀딩스 워킹데드: 올스타즈, 신규 생존자 개척자 에릭 출시 24.12.11
- 다음글"애플워치, 와이파이 없어도 문자 가능…혈압 모니터 기능도 적용" 24.12.11
댓글목록
등록된 댓글이 없습니다.