코난테크놀로지, 초거대언어모델 코난 LLM 출시 속도 > IT/과학기사 | it/science

본문 바로가기
사이트 내 전체검색

IT/과학기사 | it/science

코난테크놀로지, 초거대언어모델 코난 LLM 출시 속도

페이지 정보

profile_image
작성자 수집기
댓글 0건 조회 62회 작성일 23-07-19 15:15

본문

뉴스 기사
코난테크놀로지, 초거대언어모델 코난 LLM 출시

코난테크놀로지가 파라미터 131억개로 자체개발 초거대언어모델LLM 코난 LLM 출시에 속도를 낸다고 19일 밝혔다.

코난테크놀로지는 지난 17일 기준 전체 학습 토큰 4920억개, 한국어 토큰 2840억개로 학습을 마쳤다. 총 파라미터매개변수는 131억개에 달한다. 13.1B 파운데이션 모델은 파인튜닝을 거쳐 다음달 정식 출시되며 내달 1일 학습을 시작해 10월 중 마무리할 코난 LLM 파운데이션 모델의 파라미터는 400억개다. 전체 토큰 6000억개, 한국어 토큰은 4000억개로 준비 중이다.

코난 LLM은 온프레미스 제공으로 생성형 AI의 보안과 기밀유출 우려를 방지하고 B2B, B2G향 초거대 인공지능AI을 표방하는 점이 특징이다. B2C 기반 챗GPT의 경우 질의시 기업의 중요 기밀이 외부로 유출되는 것이 허들로 작용한다. 코난 LLM은 이러한 점을 해소하고, 해당 기업이나 기관에 최적화된 지도학습 및 강화학습을 거쳐서 문서 초안 생성, 문서 요약, 질의, 응대 등에 사용시 뛰어난 성능을 제공한다는 계획이다. 특정 기업의 API나 오픈소스 기반이 아닌 B2B, B2G 특화로 자체 개발된 생성형 언어 모델은 코난 LLM이 처음으로 출시했다.

합리적인 비용으로 고객 부담을 낮추는데도 신경 썼다. 통상 생성형 AI 학습비용은 토큰개수보다는 파라미터 개수에 더 크게 비례함에 따라 모델 파라미터의 사이즈는 줄이면서 성능을 유지하는 것이 B2B, B2G 제품에서 중요하다. 코난 LLM은 기업 수요에 따라 13.1B와 40B 파라미터 모델 중 해당 기관에 최적화된 사양을 선택하고 강화학습을 거쳐 비용은 합리적으로, 성능은 고도화한다는 전략이다.

김영섬 코난테크놀로지 대표이사는 "자체개발 초거대 언어모델 확보를 위해 24여년간의 기술력을 쏟아 부었다”며 “기업과 기관에 최적화된 모델로 시장 요구에 부응하고 온프레미스 형태로 보안을 강화시켜 생성형 AI 생태계 구축을 이끌겠다”고 말했다.

[파이낸셜뉴스 핫뉴스]

하정우, 퇴근길 지하철 탔다가 살짝 당황 인증샷 화제
한혜진 "그 자식과 샀던 60만원 청바지" 전남친 언급하며...
집에서 숨진 20대 딸과 60대 父, 알고보니 땅 주인이...
"이낙연! 내 1억 돌려줘" 李 면전서 청구한 80대 노인
"속옷 안 입고 팔뚝에 밀착해서..." 모델의 남자 유혹 비법

댓글목록

등록된 댓글이 없습니다.

회원로그인

회원가입

사이트 정보

회사명 : 원미디어 / 대표 : 대표자명
주소 : OO도 OO시 OO구 OO동 123-45
사업자 등록번호 : 123-45-67890
전화 : 02-123-4567 팩스 : 02-123-4568
통신판매업신고번호 : 제 OO구 - 123호
개인정보관리책임자 : 정보책임자명

접속자집계

오늘
1,275
어제
1,540
최대
2,563
전체
409,787
Copyright © 소유하신 도메인. All rights reserved.