트웰브랩스, 차세대 영상 AI 모델 페가수스-1.2 공개…산업 현장 활용성 ... > IT/과학기사 | it/science

본문 바로가기
사이트 내 전체검색

IT/과학기사 | it/science

트웰브랩스, 차세대 영상 AI 모델 페가수스-1.2 공개…산업 현장 활용성 ...

페이지 정보

profile_image
작성자 수집기
댓글 0건 조회 31회 작성일 25-02-12 09:46

본문

트웰브랩스 제공.
트웰브랩스 제공.
[파이낸셜뉴스] 트웰브랩스는 기존 영상이해 인공지능AI 모델 ‘페가수스’를 고도화한 ‘페가수스-1.2’를 공개했다고 12일 밝혔다.

지난 2023년 11월 처음 공개한 페가수스는 트웰브랩스가 자체 개발한 800억 매개변수파라미터 규모의 초거대 영상언어 생성 모델로 긴 영상을 텍스트로 요약하거나 영상에 관한 자유로운 질의응답을 가능케 하는 등 영상 기반 텍스트 생성 기능들을 구현한다.

이번에 공개한 페가수스-1.2는 기존 버전에서 여러 가지 기능을 개선했다. 영상의 화면·음성을 동시에 분석해 텍스트로 변환하는 능력을 강화했으며 짧은 영상부터 1시간짜리 장편 영상까지 다양한 길이의 영상을 높은 정확도로 처리할 수 있다. 또 영상을 효율적으로 저장 및 재사용하는 기술을 적용해 이미 한 번 처리한 영상은 다음 분석 시 더 빠르고 경제적으로 처리할 수 있다.


이번 페가수스-1.2는 비전 인코딩 기술을 끌어올리고 알고리즘 길이를 줄여 모델의 효율성과 이해도를 크게 높였다. 다른 영상 AI 모델들이 대규모 모델 사이즈로 성능을 끌어올리는 방식을 택한 것과 달리 페가수스-1.2는 상대적으로 가벼운 모델 크기로도 뛰어난 성능을 구현했다는 게 특징이다.

특히 오픈AI이 챗GPT-4o와 제미나이 1.5 프로보다 빠른 응답 속도, 더 낮은 비용으로 제공한다고 회사 측은 설명했다.

페가수스-1.2는 뛰어난 성능과 효율성으로 다양한 산업 분야에서 활용할 수 있다. 엔터테인먼트 분야에서는 영상 콘텐츠 분류와 하이라이트 추출에 활용 가능하며, 교육 분야에서는 강의 영상 요약 및 핵심 내용 추출이 가능하다. 보안 분야에서는 폐쇄회로CCTV 영상 분석 및 이상 징후 탐지에도 적용 가능하다.

이승준 트웰브랩스 최고기술개발자CTO는 “영상 이해를 위해서는 화면 속 객체들의 공간적 관계, 시간에 따른 변화, 전후 맥락 간의 복잡한 상호작용을 모두 파악할 수 있는 고도화된 AI 모델이 필요하다”며 “페가수스-1.2는 혁신적인 시공간 정보 이해 방식을 도입해 영상을 정확하게 이해하고 다양한 산업 현장의 요구사항을 충족시킬 수 있게 됐다”고 말했다.

wongood@fnnews.com 주원규 기자

Copyrightⓒ 파이낸셜뉴스. 무단전재 및 재배포 금지.

[파이낸셜뉴스 핫뉴스]

불륜녀와 여행 중 모텔서 돌연사한 남편, 시댁 반응이...
아내 4명 일부다처제 무직남 "성관계를..." 깜짝 고백
이연복 임대료 걱정에 서장훈 뜻밖 반응 "내 건물로.."
이수근 아내 박지연, 안타까운 근황 "신장 이식받았지만..."
피묻은 여교사, 손녀찾는 할머니 마주치자 한 행동이...

댓글목록

등록된 댓글이 없습니다.

회원로그인

회원가입

사이트 정보

회사명 : 원미디어 / 대표 : 대표자명
주소 : OO도 OO시 OO구 OO동 123-45
사업자 등록번호 : 123-45-67890
전화 : 02-123-4567 팩스 : 02-123-4568
통신판매업신고번호 : 제 OO구 - 123호
개인정보관리책임자 : 정보책임자명

접속자집계

오늘
1,020
어제
2,382
최대
3,806
전체
922,212
Copyright © 소유하신 도메인. All rights reserved.