"특정 업무에 최적"…AI 소형언어모델 뜬다
페이지 정보
본문
마이크로소프트MS가 파라미터가 37억개에 불과한 소형언어모델sLM을 전격 출시했다. 현재까지 빅테크 기업이 공개한 언어모델 가운데 가장 작은 크기다. 파라미터는 인간 두뇌 시냅스에 해당해 많으면 많을수록 인공지능AI 성능이 우수하다는 견해가 지배적이었다. 하지만 대규모언어모델LLM은 학습·추론하는 데 막대한 비용과 전력이 투입되다 보니 AI 업계가 더 작지만 더 강한 모델 구축을 서두르는 장면이다. 23일현지시간 MS는 파이-3Phi-3 미니를 공개했다. 챗GPT 근간이 되는 오픈AI GPT-3.5의 파라미터가 1750억개인 점과 비교할 때 크기가 약 50분의 1에 불과한 셈이다. 그동안 파라미터가 수십억 개에 불과한 LLM을 소형대규모언어모델sLLM이라고 불렀는데, MS는 이번 파이-3 미니를 sLM이라고 명명했다. "가장 작고 강하다"는 것을 전면에 내세운 것이다. MS는 파라미터 70억개의 파이-3 스몰과 140억개의 파이-3 미디엄을 내놓을 예정이다. 파이-3 미니는 언어, 추리, 코딩 등 다양한 능력을 갖추고 있다. 특히 작지만 12만8000개 토큰을 입력할 수 있다. 대략 A4 64쪽 분량이다. 보고서 등을 업로드하고 질의응답을 할 수 있다. 루이스 바가스 MS AI담당 부사장은 "어떤 고객은 작은 모델만 필요할 수도 있고, 어떤 고객은 큰 모델이 필요할 수도 있다"면서 "특히 작은 모델은 클라우드에 설치되지 않고 디바이스인 에지에서 작동되기 때문에 지연 시간을 최소화하고 프라이버시를 극대화할 수 있다"고 강조했다. 파이3-미니는 파라미터 수가 2배 많은 모델보다 대다수 지표에서 우수했다고 덧붙였다. 또 비슷한 기능을 가진 다른 모델과 비교해 추론 비용이 10분의 1 수준이라고 강조했다. 하이퍼클로바X를 전면에 내세운 네이버는 sLLM을 포함한 다양한 버전의 모델 출시를 준비 중이다. 하이퍼클로바X sLLM은 네이버클라우드의 AI 플랫폼인 클로바 스튜디오에 탑재될 예정이다. 페이스북 운영사인 메타는 라마3 sLLM 2종을 공개해 주목받았다. 파라미터 80억개, 700억개의 두 개 버전이다. 특히 메타는 라마3를 누구나 내려받아 사용할 수 있는 오픈소스로 공개했다. 오픈AI의 GPT-4와 앤스로픽의 클로드3가 폐쇄형인 점을 고려할 때 확장성이 큰 셈이다. 이에 중국 클라우드 기업이 잇달아 지원을 발표했다. 알리클라우드는 자사가 보유한 바이롄 언어모델 플랫폼에 라마3를 훈련·배포·추론할 수 있는 서비스를 선보였고, 텐센트클라우드·바이두클라우드 역시 같은 지원을 선언했다. 앞서 프랑스 스타트업인 미스트랄도 sLLM을 공개한 바 있다. 한국 스타트업들도 잇달아 sLLM을 출시하고 있다. 솔트룩스는 루시아LUXIA로 허깅페이스 오픈 LLM 리더보드에서 35B 이하 모델 기준 세계 1위 성능을 기록해 주목받았다. sLLM이 각광을 받는 이유는 추론 비용이 매우 낮아서다. 라마3파라미터 80억개의 경우 출력 토큰 100만개당 7.5달러 정도다. 소형대규모언어모델sLLM 두뇌 시냅스에 해당하는 파라미터가 수십억 개에 불과한 AI 모델. 범용성은 낮지만 추론 학습 비용이 적게 든다. [이상덕 기자 / 실리콘밸리 이덕주 특파원] ▶ “1억 번다길래 시작했는데” 1년도 안돼 절반 그만뒀다…실제 연봉 평균 4천만원 미만 ▶ “조민 포르쉐 탄다”…무죄 선고 판사, 강용석에 이례적으로 한 말 ▶ 식당 휴무날 직원들이 마음대로 문 열어 장사…그런데 초대박, 감동 사연 ▶ 유재석에 이효리까지 역부족?…충격의 적자, 10배 이상 늘어난 이 회사 ▶ “선우은숙 언니 강제추행” 유영재 피소…혼인 취소소송도 제기[전문] [ⓒ 매일경제 amp; mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지] |
관련링크
- 이전글SK하이닉스, 청주 M15X 신규 D램생산기지로 낙점…20조이상 투자 24.04.24
- 다음글초대 우주항공청장에 윤영빈…5월 개청준비 속도낸다 24.04.24
댓글목록
등록된 댓글이 없습니다.