원미디어 시스템

딥시크, 무기 공격 계획과 청소년 자해 조장 캠페인도 생성…탈옥테스...

페이지 정보

작성자 수집기
댓글 0건 조회 33회 작성일 25-02-10 16:35

본문

탈옥 공격 시 불법·위험 콘텐츠 생성 가능
시스코 테스트 결과 100% 공격 성공률
‘딥시크 탈옥’ 검색량도 3000% 급등

딥시크, 무기 공격 계획과 청소년 자해 조장 캠페인도 생성…탈옥테스트 최악

중국 인공지능AI 스타트업 딥시크의 AI 모델이 ‘탈옥jailbreaking’에 취약해 불법적인 콘텐츠를 생성할 수 있다는 지적이 이어지고 있다.

‘탈옥’은 보안시스템을 우회해 불법적이거나 위험한 콘텐츠를 생성하는 현상을 지칭한다. 대부분의 AI는 범죄와 연동될 수 있거나 차별적인 발언을 생성하지 않도록 학습돼 있지만, 시스템을 우회하면 생성 제한을 없앨 수 있다. 탈옥 현상은 범죄에 악용될 수 있어 각별한 유의가 필요하다.

8일현지시간 월스트리트저널WSJ은 자체적으로 딥시크의 R1 모델을 테스트한 결과를 보도했다. 이 보도에 따르면, 딥시크 R1 모델은 탈옥에 취약해 ‘생물 무기 공격 계획’을 세우거나 ‘청소년 자해 조장 캠페인’까지 설계하도록 조작될 수 있다. 히틀러를 옹호하는 선언문을 작성하고, 악성 코드가 포함된 피싱 이메일을 작성하는 것도 가능하다.

앞서 6일에는 다리오 아모데이 앤트로픽 CEO가 팟캐스트를 통해 “딥시크가 안전 테스트 중 생물학 무기에 대한 희귀한 정보를 생성했고, 테스트한 모든 모델 중 ‘최악’의 성과를 보였다”고 밝히기도 했다.

한편 지난달 31일 미국 보안 회사 시스코는 펜실베이니아 대학과 협력해 AI 모델 탈옥 안정성 테스트 결과를 발표했는데, 이 시험에서도 딥시크가 탈옥 공격에 가장 취약한 것으로 평가됐다.

이 분석은 딥시크의 R1, 메타의 라마 3.1 405B, 오픈AI의 GPT-4o 및 o1, 구글의 제미나이 1.5 프로, 앤트로픽의 클로드 3.5 소넷 등을 대상으로 진행됐다.

테스트 결과, 딥시크의 R1만이 100%의 공격 성공률을 보인 유일한 모델이었다. 오픈AI o1 모델의 공격 성공률이 26%로 가장 탈옥으로부터 안전하다고 평가됐으며, 다른 모델은 36~96% 사이의 성공률을 보였다.

이같은 사실이 알려지면서 최근에 딥시크 탈옥에 대한 검색량이 급등하는 상황도 발생했다. 구글 트렌드에 따르면, 3일 오후 2시부터 7일 오후 2시까지 딥시크의 관련 검색어 중 ‘딥시크 탈옥 버전’의 검색량은 7일 오후 2시 이전 전체 기간 대비 3450% 급등했다. 같은 시기 ‘딥시크 탈옥 방법’의 검색량은 600% 상승했다.

▶ 오늘의 운세 2025년 2월 10일 月음력 1월 13일

▶ 선우은숙 며느리 초대받은 정용진...한강뷰 집에서 복요리로 홈파티

▶ 尹 “비상계엄 선포, 나라가 위기란 대통령 판단 기해 이뤄져”

▶ “몸 이상해 병원 갔다 깜짝”…50대 술집 여주인에 필로폰 넣은 술 먹인 60대 男

▶ “잘 가, 영원한 라이벌이여”...故송대관, 태진아 배웅 속 영면

[ⓒ 매일경제 amp; mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]

댓글목록

등록된 댓글이 없습니다.

딥시크, 무기 공격 계획과 청소년 자해 조장 캠페인도 생성…탈옥테스... > IT/과학기사 | it/science

인기검색어

IT/과학기사 | it/science

딥시크, 무기 공격 계획과 청소년 자해 조장 캠페인도 생성…탈옥테스...

페이지 정보

본문

관련링크

댓글목록

회원로그인

사이트 정보

공지사항

접속자집계