저비용 AI 학습 가속화 가능…KAIST. GPU 활용 스텔라트레인 프...
페이지 정보
본문
일반 소비자용 GPU 장치 활용해 기술 개발
한국과학기술원KAIST은 일반 소비자용 그래픽처리장치GPU를 활용해 네트워크 대역폭이 제한된 분산 환경에서도 인공지능AI 모델 학습을 가속할 수 있는 기술을 개발했다고 19일 밝혔다.
기존에는 AI 모델을 학습하기 위해 개당 수천만 원에 달하는 고성능 서버용 GPU엔비디아 H100 여러 대와 이들을 연결하기 위한 400Gbps급 고속 네트워크를 가진 고가 인프라가 필요했다. 하지만 소수의 거대 정보기술IT 기업을 제외한 대부분의 기업과 연구자들은 비용 문제로 이러한 고가의 인프라를 도입하기 어려웠다.
한동수 전기및전자공학부 교수 연구팀은 이러한 문제를 해결하기 위해 스텔라트레인StellaTrain이라는 분산 학습 프레임워크를 개발했다.
이 기술은 고성능 H100에 비해 10~20배 저렴한 소비자용 GPU를 활용한다.고속 전용 네트워크 대신 대역폭이 수백에서 수천 배 낮은 일반 인터넷 환경에서도 효율적인 분산 학습을 가능하게 한다.
기존의 저가 GPU를 사용할 경우 작은 GPU 메모리와 네트워크 속도 제한으로 인해 대규모 AI 모델 학습 시 속도가 수백 배 느려지는 한계가 있었다.
하지만 연구팀이 개발한 스텔라트레인 기술은 CPU와 GPU를 병렬로 활용해 학습 속도를 높이고, 네트워크 속도에 맞춰 데이터를 효율적으로 압축 및 전송하는 알고리즘을 적용해 고속 네트워크 없이도 여러 대의 저가 GPU를 이용해 빠른 학습을 가능하게 했다.
학습을 작업 단계별로 CPU와 GPU가 나누어 병렬적으로 처리할 수 있는 새로운 파이프라인 기술을 도입해 연산 자원의 효율을 극대화했다.
또 원거리 분산 환경에서도 GPU 연산 효율을 높이기 위해, AI 모델별 GPU 활용률을 실시간으로 모니터링해 모델이 학습하는 샘플의 개수배치 크기를 동적으로 결정하고, 변화하는 네트워크 대역폭에 맞추어 GPU 간의 데이터 전송을 효율화하는 기술을 개발했다.
연구 결과, 스텔라트레인 기술을 사용하면 기존의 데이터 병렬 학습에 비해 최대 104배 빠른 성능을 낼 수 있는 것으로 나타났다.
한동수 교수는 "이번 연구가 대규모 AI 모델 학습을 누구나 쉽게 접근할 수 있게 하는 데 큰 기여를 할 것"이라며 “앞으로도 저비용 환경에서도 대규모 AI 모델을 학습할 수 있는 기술 개발을 계속할 계획이라고 말했다.
데일리안 김소희 기자 hee@dailian.co.kr
- Copyrights ⓒ 주데일리안, 무단 전재-재배포 금지 -
관련기사
☞배현진 "일왕에 앞서 우리말로 먼저 일본 무조건 항복 알린 방송 있었다"
☞"갈비탕서 휴지 나와 돈 못 줘" 알고보니 본인이 입닦은 것
☞[데일리 헬스] 박서진 "母, 투병 사실 알린 후 악플"…자궁경부암 전조증상과 생존율은?
☞[오늘 날씨] 추석 지났는데 더위 언제까지?…기온 1도 오르면 이것 13% 높아진다
☞"승무원은 알고 있다" 기내 커피의 더러운 비밀
관련링크
- 이전글애플, 내년 AI 지원 언어에 한국어 뒤늦게 추가…아이폰16 부진에 놀랐... 24.09.19
- 다음글닌텐도, 포켓몬 특허권 침해로 팔월드 개발사 포켓페어 고소 24.09.19
댓글목록
등록된 댓글이 없습니다.