오픈소스AI에서 메타 이어 세계 2위…업스테이지, 허깅페이스서 우뚝 > IT/과학기사 | it/science

본문 바로가기
사이트 내 전체검색

IT/과학기사 | it/science

오픈소스AI에서 메타 이어 세계 2위…업스테이지, 허깅페이스서 우뚝

페이지 정보

profile_image
작성자 수집기
댓글 0건 조회 102회 작성일 23-07-19 09:22

본문

뉴스 기사
- 오픈AI와 연동한 AskUp, 130만명 사용중
- 여기에 자체 제작 모델로 허깅페이스 오픈 LLM 리더보드 세계 2위
- 프라이빗 AI 시장 공략할 것
- 기업들의 챗GPT 금지령 대안될 것


[이데일리 김현아 기자]
오픈소스AI에서 메타 이어 세계 2위…업스테이지, 허깅페이스서 우뚝
업스테이지는 65B 이하 모델에선 1위를 차지했고, 전체 모델 평가에선 2위를 차지했다. 1위는 19일 새벽 마크저커버그가 직접 공개한 ‘라마2’ 70B 모델이다.


오픈AI, 바이두, 네이버 등이 초거대 AI 파운데이션 모델로 자체 생태계 구축에 나서고 있는 가운데, 국내 스타트업인 업스테이지가 오픈소스AI에서 메타에 이어 세계 2위의 성능을 입증해 관심이다. 그간 업스테이지는 카카오톡 플랫폼에서 오픈AI의 챗GPT와 연동한 애스크업AskUp을 서비스하면서 130만 명의 가입자를 모았는데, 이번에 오픈소스AI 프로그램을 튜닝해 제작한 자체 모델에서 글로벌 2위 성능을 보여준 것이다.

업스테이지대표 김성훈는 자사가 오픈소스AI를 파인튜닝해 개발한 AI 모델이 글로벌 AI 플랫폼인 허깅페이스HuggingFace에서 운영하는 오픈 LLMLarge Language Model : 거대언어모델 리더보드에서 2위를 차지했다고 19일 밝혔다.

허깅페이스는 다양한 언어와 산업에 대한 거대언어모델을 제공하는 글로벌 AI 플랫폼이다. 오픈AI 챗GPT, 구글의 바드 등 초거대AI 모델들과는 다르지만, 300여개가 넘는 세계 최고의 AI 모델들이 허깅페이스의 Open LLM 리더보드에서 경쟁 중이다.

매일 수십개의 전세계 각국 대표 AI 모델들의 업데이트되며 치열한 경쟁이 이뤄지는 리더보드는 모델의 추론과 상식능력 뿐 아니라 언어이해 종합능력과 환각현상할루시네이션 방지 등 생성AI 평가에 꼭 필요한 4가지 지표의 평가 점수 평균으로 최종 순위를 결정한다.

최근에는 1000억개 매개변수100B 이하의 오픈 LLM들의 경쟁도 허깅페이스의 리더보드를 통해 시간 단위로 치열하게 이뤄지고 있다.

메타 라마2 70B 매개변수 이어 2위 차지

업스테이지는 이달 초 자체 구축한 모델을 허깅페이스의 리더보드에 제출, 성능을 평가받았다. 그 결과 업스테이지의 모델은 메타가 오늘 새벽 저커버그가 직접 공개한 ‘라마2’ 70B 모델에 이어 평균 64.7점으로 2위를 차지했다.

회사는 “이는 30B300억매개변수 모델 최고의 순위로 라마2의 절반도 안되는 사이즈로 경쟁력 있는 결과를 만든 것”이라고 평했다.

특히 업스테이지 모델은 비교적 작은 모델 사이즈에도 생성AI의 가장 큰 문제점 중 하나인 환각현상 방지 지표에서는 56.5점을 기록, 메타의 최신 ‘라마2’ 모델의 52.8점의 평가를 훌쩍 뛰어넘는 놀라운 결과를 기록했다.

이 모델은 라마2를 제외한 메타, MS 등 빅테크 기업이 만든 모델과 Stability AI, 데이터브릭스 등 글로벌 AI/LLM 대표 기업의 모델 포함, 최근 몇 달간 줄곧 1,2위를 지키던 UAE 기술혁신연구소의 ‘팰컨’ 모델과 최근 데이터브릭스가 13억 달러약 1조 7천억원에 인수한 모자이크ML의 모델 등 최고 성능의AI 모델 대비 평균 10% 가량 높은 성적으로 2위를 기록했다.

자체 모델 구축 시작한 지 2달 만의 성과

그간 업스테이지는 네이버 출신의 개발자들이 포진해 있음에도 오픈AI 연동으로 서비스를 오픈해 AI주권에는 무감한 것 아니냐는 평가를 받았다.

하지만 이번에 자체 모델 구축에 나선지 약 두 달 만에 세계 최고 성능의 AI 모델을 만든 것으로 알려져 주위를 놀라게 했다.

회사는 “최초의 한국어 자연어이해NLU 평가 데이터셋인 ‘클루KLUE’를 직접 구축한 것은 물론, 130만 이용자를 돌파한 국내 대표 생성AI 서비스 AskUp을 직접 운영하며 쌓은 국내 최고의 프롬프트 엔지니어링 및 파인튜닝 노하우를 바탕으로 캐글과 다양한 국제 학회 논문 등으로 입증된 최고의 인력들이 TF를 꾸려 이번 오픈 LLM 모델 개발에 나섰다”고 설명했다.

이어 “비교적 작은 사이즈인 30B300억로 규모에서 1위를 차지하면서, 업스테이지는 오픈 LLM 모델 글로벌 톱의 기술력을 확인하며 프라이빗 AI 시장에서 글로벌 선두에 설 가능성을 보여줬다”고 평했다.

경량화 AI, 기업용AI 선도할 것

65B이하의 작은규모 LLM은 1조를 넘는 매개변수를 가진 것으로 알려진 빅테크의 초거대AI와 달리 가벼운 규모로 비용 절감효과가 크고 내부 서버에 설치및 운영이 가능해 개별 기업이 활용할 프라이빗 AI 등 그 활용성이 매우 높을 것으로 기대를 모은다.

그동안 챗GPT에 기업 내부 정보를 입력하면 외부로 유출될 수 있다는 우려가 번지면서 챗GPT의 이용을 제한하거나 아예 막는 회사가 늘어나고 있어 챗GPT, 바드 등 대중들이 활용하는 생성 AI 서비스 그 이후 대한 관심이 높아지고 있다.

프라이빗 AI는 개별 기업이 보유한 데이터를 학습시켜 내부 정보 유출을 막고 잘못된 정보를 생성하는 환각 현상을 줄일 수 있어 생성AI 경쟁의 새로운 장으로 주목 받고 있다. 실제로 애플, 월마트, 아마존, JP모건 등 글로벌 업계 대표 기업들은 ‘챗GPT 경계령’을 내린 바 있다. 삼성전자도 기밀 정보 유출 가능성을 이유로 내부에서 챗GPT 같은 AI도구 사용을 금지하며 자체 AI 개발을 천명하기도 했다.

이번 업스테이지가 완성한 최고 성능의 가진 작은 규모 AI를 통해 기업과 기관들은 정보유출에 대한 부담 없이 생성AI를 자체적으로 구축하고 활용할 수 있다. 예를 들어 기업의 내부 규정과 정보 등을 학습시켜 기업 임직원들이 회사 내부의 정보에 대한 답을 손쉽게 알아볼 수 있는 AI를 구축하는 것은 물론 재무 데이터를 활용해 매출의 흐름을 분석하고 알맞은 마케팅 전략을 AI가 제안하는 등의 다양한 업무수행도 가능해질 전망이다.

업스테이지는 추가적으로 국내 다양한 산업의 기업들의 요구에 부응하고자 한국어 성능을 높이기 위해 한국어 데이터를 추가 학습시킬 예정이다.

김성훈 업스테이지 대표는 “업스테이지의 AI 기술력이 지금 가장 치열한 경쟁을 벌이고 있는 생성AI 글로벌 톱 플랫폼의 평가에서도 세계 최고의 성과를 거둬 무척 기쁘다”며 “이번에 입증된 업스테이지의 기술력을 바탕으로 국내 기업은 물론 전세계 모든 기업들이AI를 편리하게 사용할 수 있도록 노력할 것”이라고 말했다.

▶ 관련기사 ◀
☞ 라면 빨리 끓여…동료 선원 바다에 던져 죽인 30대男[그해 오늘]
☞ “올해 76% 올랐다”…개미들 5조 넘게 사들인 ‘이 주식
☞ 손흥민·이강인도 시달렸는데...아프리카 사람? 광고에 경악
☞ 학생들 앞 수십 대 맞아...초6에 짓밟힌 교사, 학부모는 신고
☞ 내년도 최저임금 9860원…16시간 노사 혈투 끝 2.5% 인상종합

[바이오 성공 투자 1%를 위한 길라잡이 팜이데일리]
[새로워진 이데일리 연재 시리즈 취향대로 PICK하기]
[뉴땡 Shorts 아직 못봤어? 뉴스가 땡길 때, 1분 순삭!]
[10대의 뉴스는 다르다. 하이스쿨 커뮤니티 하이니티]
[다양한 미국 주식정보! 꿀 떨어지는 이유TV에서 확인!]
[빅데이터 AI트레이딩 솔루션 매직차트]

<ⓒ종합 경제정보 미디어 이데일리 - 무단전재 amp; 재배포 금지>


김현아 chaos@

댓글목록

등록된 댓글이 없습니다.

회원로그인

회원가입

사이트 정보

회사명 : 원미디어 / 대표 : 대표자명
주소 : OO도 OO시 OO구 OO동 123-45
사업자 등록번호 : 123-45-67890
전화 : 02-123-4567 팩스 : 02-123-4568
통신판매업신고번호 : 제 OO구 - 123호
개인정보관리책임자 : 정보책임자명

접속자집계

오늘
240
어제
770
최대
2,563
전체
397,252
Copyright © 소유하신 도메인. All rights reserved.