"유명 시인보다 AI가 쓴 시가 점수 높았다" 충격 연구 결과
페이지 정보
본문
오픈AI. 로이터=연합뉴스
미국 피츠버그대 브라이언 포터 박사팀은 15일 과학 저널 사이언티픽 리포트Scientific Reports에 이같은 내용을 발표했다.
연구팀은 유명 시인 10명의 시와 이들의 시를 모방해 챗GPT3.5가 지어낸 시를 일반인에게 제시한 뒤 구분하고 평가하게 하는 실험을 통해 이같은 결과를 얻었다.
연구팀은 이 연구에서 첫 실험으로 1634명을 대상으로 AI가 생성한 시와 유명 시인의 시를 구별하는 테스트를 했다. 두 번째 실험에서는 696명을 대상으로 AI의 시와 시인들의 시에 대해 아름다움, 리듬, 독창성 등 14가지 특성을 평가하게 했다.
실험에서는 14세기 시인 제프리 초서부터 윌리엄 셰익스피어, 월트 휘트먼, TS 엘리엇, 현대의 도러시아라스키 등 유명 시인 10명의 시 50편과 챗GPT3.5가 이들의 시를 모방해 지은 시 50편이 사용됐다.
첫 번째 실험에서 유명 시인의 시 5편과 AI의 시 5편을 무작위로 제시한 다음 시인과 AI의 시를 구별하도록 했다. 그 결과 정확도는 46.6%로 나왔다. 무작위로 찍을 경우 나오는 기대값은 50%다. 여기에도 미치지 못할 정도로 구분을 못 했다는 결과다.
도리어 참가자들은 AI가 쓴 시를 사람이 쓴 것이라고 판단할 가능성이 더 높았다. 또 이들이 시인이 썼을 가능성이 가장 낮다고 평가한 시 5편은 실제 시인이 쓴 것으로 나타났다.
두 번째 실험에서는 참가자들을 세 그룹으로 나눈 다음 각 그룹에 시를 제시할 때 시에 대해 사람이 쓴 시, AI가 쓴 시, 출처 정보 없음 등 정보를 주고 그 시의 질과 아름다움, 감정, 리듬, 독창성 등 14가지 특성을 평가하게 했다.
그 결과 AI가 쓴 시라는 말을 들은 참가자들은 실제 시인이 쓴 시인지 AI가 쓴 시인지 관계없이 사람이 쓴 시라는 말을 들은 참가자들에 비해 13가지 특성에서 낮은 점수를 줬다.
시의 출처 정보가 없다는 말을 들은 참가자들은 AI가 생성한 시를 시인들이 쓴 시보다 더 높은 점수를 준 것으로 나타났다.
연구팀은 AI의 시를 이처럼 긍정적으로 평가하는 경향은 사람이 쓴 시의 복잡성을 AI가 만들어낸 일관성 없음으로 착각하고, 생성형 AI가 얼마나 인간과 유사해 보일 수 있는지에 대해 과소평가하고 있기 때문일 수 있다고 설명했다.
이어 "시는 생성형 AI가 아직 인간과 구별할 수 없는 수준의 작품을 쓰지 못하는 텍스트 영역 중 하나로 여겨져왔다"면서 "하지만 이 연구 결과는 생성형 AI의 능력이 시에서도 이미 사람들의 기대를 넘어섰음을 보여준다고 말했다.
챗GPT 3.5는 이전 버전이며, 현재는 한층 성능이 향상된 챗GPT 4.0을 서비스하고 있다.
이해준 기자 lee.hayjune@joongang.co.kr
이 시각 많이 본 뉴스
▶ 2시간 웨이팅했는데…"새치기" 그 젊은이 비밀
▶ 유명 셰프도 숨진 채 발견…의문사 줄잇는 이 나라
▶ 새벽 4시 목격한 끔찍 장면…내 아내는 우울증이다
▶ "물병에 소변 보고 뒷처리 시켜"…男배우 갑질 충격
▶ 女성기구 쓴 김소연 "환상의 세계"…19금 발언 뭔일
▶ "이제 못 참겠는데"…채림, 전 남편 루머에 분노 왜
▶ 시체 썩는 냄새 피어올랐다…5000명 홀린 꽃 정체
▶ "나체 보였다"…곰돌이 사진 올렸다 삭제 무슨 일
▶ "황정음 따라하다 큰일" 이혼 변호사 경고한 행동
▶ "안녕 내 친구" 김소은, 송재림에 먹먹한 추모글
▶ 중앙일보 / 페이스북 친구추가
▶ 넌 뉴스를 찾아봐? 난 뉴스가 찾아와!
ⓒ중앙일보https://www.joongang.co.kr, 무단 전재 및 재배포 금지
이해준 lee.hayjune@joongang.co.kr
관련링크
- 이전글[지스타 2024] SOOP, AI 신기술 공개…시청 경험 극대화 24.11.15
- 다음글모델 지예 큐티매력 한도초과![엑s 숏폼] 24.11.14
댓글목록
등록된 댓글이 없습니다.