코난테크놀로지, 초거대언어모델 코난 LLM 출시 속도
페이지 정보
본문
코난테크놀로지가 파라미터 131억개로 자체개발 초거대언어모델LLM 코난 LLM 출시에 속도를 낸다고 19일 밝혔다. 코난테크놀로지는 지난 17일 기준 전체 학습 토큰 4920억개, 한국어 토큰 2840억개로 학습을 마쳤다. 총 파라미터매개변수는 131억개에 달한다. 13.1B 파운데이션 모델은 파인튜닝을 거쳐 다음달 정식 출시되며 내달 1일 학습을 시작해 10월 중 마무리할 코난 LLM 파운데이션 모델의 파라미터는 400억개다. 전체 토큰 6000억개, 한국어 토큰은 4000억개로 준비 중이다. 코난 LLM은 온프레미스 제공으로 생성형 AI의 보안과 기밀유출 우려를 방지하고 B2B, B2G향 초거대 인공지능AI을 표방하는 점이 특징이다. B2C 기반 챗GPT의 경우 질의시 기업의 중요 기밀이 외부로 유출되는 것이 허들로 작용한다. 코난 LLM은 이러한 점을 해소하고, 해당 기업이나 기관에 최적화된 지도학습 및 강화학습을 거쳐서 문서 초안 생성, 문서 요약, 질의, 응대 등에 사용시 뛰어난 성능을 제공한다는 계획이다. 특정 기업의 API나 오픈소스 기반이 아닌 B2B, B2G 특화로 자체 개발된 생성형 언어 모델은 코난 LLM이 처음으로 출시했다. 합리적인 비용으로 고객 부담을 낮추는데도 신경 썼다. 통상 생성형 AI 학습비용은 토큰개수보다는 파라미터 개수에 더 크게 비례함에 따라 모델 파라미터의 사이즈는 줄이면서 성능을 유지하는 것이 B2B, B2G 제품에서 중요하다. 코난 LLM은 기업 수요에 따라 13.1B와 40B 파라미터 모델 중 해당 기관에 최적화된 사양을 선택하고 강화학습을 거쳐 비용은 합리적으로, 성능은 고도화한다는 전략이다. 김영섬 코난테크놀로지 대표이사는 "자체개발 초거대 언어모델 확보를 위해 24여년간의 기술력을 쏟아 부었다”며 “기업과 기관에 최적화된 모델로 시장 요구에 부응하고 온프레미스 형태로 보안을 강화시켜 생성형 AI 생태계 구축을 이끌겠다”고 말했다. [파이낸셜뉴스 핫뉴스] → 하정우, 퇴근길 지하철 탔다가 살짝 당황 인증샷 화제 → 한혜진 "그 자식과 샀던 60만원 청바지" 전남친 언급하며... → 집에서 숨진 20대 딸과 60대 父, 알고보니 땅 주인이... → "이낙연! 내 1억 돌려줘" 李 면전서 청구한 80대 노인 → "속옷 안 입고 팔뚝에 밀착해서..." 모델의 남자 유혹 비법 |
관련링크
- 이전글조석과 디아블로 4의 만남…웹툰 성역의 기묘한 이야기 공개 23.07.19
- 다음글"요구르트에서 세균이" 이 제품, 마시지 마세요 23.07.19
댓글목록
등록된 댓글이 없습니다.