딥시크, 무기 공격 계획과 청소년 자해 조장 캠페인도 생성…탈옥테스...
페이지 정보

본문
탈옥 공격 시 불법·위험 콘텐츠 생성 가능
시스코 테스트 결과 100% 공격 성공률
‘딥시크 탈옥’ 검색량도 3000% 급등
시스코 테스트 결과 100% 공격 성공률
‘딥시크 탈옥’ 검색량도 3000% 급등

중국 인공지능AI 스타트업 딥시크의 AI 모델이 ‘탈옥jailbreaking’에 취약해 불법적인 콘텐츠를 생성할 수 있다는 지적이 이어지고 있다.
‘탈옥’은 보안시스템을 우회해 불법적이거나 위험한 콘텐츠를 생성하는 현상을 지칭한다. 대부분의 AI는 범죄와 연동될 수 있거나 차별적인 발언을 생성하지 않도록 학습돼 있지만, 시스템을 우회하면 생성 제한을 없앨 수 있다. 탈옥 현상은 범죄에 악용될 수 있어 각별한 유의가 필요하다.
8일현지시간 월스트리트저널WSJ은 자체적으로 딥시크의 R1 모델을 테스트한 결과를 보도했다. 이 보도에 따르면, 딥시크 R1 모델은 탈옥에 취약해 ‘생물 무기 공격 계획’을 세우거나 ‘청소년 자해 조장 캠페인’까지 설계하도록 조작될 수 있다. 히틀러를 옹호하는 선언문을 작성하고, 악성 코드가 포함된 피싱 이메일을 작성하는 것도 가능하다.
앞서 6일에는 다리오 아모데이 앤트로픽 CEO가 팟캐스트를 통해 “딥시크가 안전 테스트 중 생물학 무기에 대한 희귀한 정보를 생성했고, 테스트한 모든 모델 중 ‘최악’의 성과를 보였다”고 밝히기도 했다.
한편 지난달 31일 미국 보안 회사 시스코는 펜실베이니아 대학과 협력해 AI 모델 탈옥 안정성 테스트 결과를 발표했는데, 이 시험에서도 딥시크가 탈옥 공격에 가장 취약한 것으로 평가됐다.
이 분석은 딥시크의 R1, 메타의 라마 3.1 405B, 오픈AI의 GPT-4o 및 o1, 구글의 제미나이 1.5 프로, 앤트로픽의 클로드 3.5 소넷 등을 대상으로 진행됐다.
테스트 결과, 딥시크의 R1만이 100%의 공격 성공률을 보인 유일한 모델이었다. 오픈AI o1 모델의 공격 성공률이 26%로 가장 탈옥으로부터 안전하다고 평가됐으며, 다른 모델은 36~96% 사이의 성공률을 보였다.
이같은 사실이 알려지면서 최근에 딥시크 탈옥에 대한 검색량이 급등하는 상황도 발생했다. 구글 트렌드에 따르면, 3일 오후 2시부터 7일 오후 2시까지 딥시크의 관련 검색어 중 ‘딥시크 탈옥 버전’의 검색량은 7일 오후 2시 이전 전체 기간 대비 3450% 급등했다. 같은 시기 ‘딥시크 탈옥 방법’의 검색량은 600% 상승했다.
▶ 오늘의 운세 2025년 2월 10일 月음력 1월 13일
▶ 선우은숙 며느리 초대받은 정용진...한강뷰 집에서 복요리로 홈파티
▶ 尹 “비상계엄 선포, 나라가 위기란 대통령 판단 기해 이뤄져”
▶ “몸 이상해 병원 갔다 깜짝”…50대 술집 여주인에 필로폰 넣은 술 먹인 60대 男
▶ “잘 가, 영원한 라이벌이여”...故송대관, 태진아 배웅 속 영면
[ⓒ 매일경제 amp; mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
관련링크
- 이전글[속보] 시프트업, 작년 영업이익 1486억…전년比 33.8%↑ 25.02.10
- 다음글"값비싼 리튬 99.8% 회수" 전기車 배터리 재활용 OK 25.02.10
댓글목록
등록된 댓글이 없습니다.