"한국 수능 문제 풀어봐" 챗GPT vs 딥시크 승자는
페이지 정보

본문
지원하지 않는 브라우저로 접근하셨습니다.
Internet Explorer 10 이상으로 업데이트 해주시거나, 최신 버전의 Chrome에서 정상적으로 이용이 가능합니다.
[앵커]
중국의 딥시크는 돈을 훨씬 적게 쓰고도 챗GPT와 비슷한 성능을 보이고 있다는 평가가 많습니다.
저희 취재진이 챗 GPT와 딥시크 성능을 비교하기 위해 각각 수능 시험을 치르게 해봤는데, 어떤 게 더 점수가 높았는지, 정아람 기자가 전해드립니다.
[기자]
중국 스타트업 딥시크가 전 세계 AI 시장에 돌풍을 일으키고 있는 가운데, 재미있는 실험을 해봤습니다.
미국 오픈 AI사가 만든 챗GPT o1과 딥시크 AI 모델 R1에 각각 2025년 대입 수능 국어·수학 공통과목을 풀게 했습니다.
승자는 누구일까.
국어와 수학 두 과목 모두 챗GPT 오답이 딥시크보다 더 적어, 승자는 챗GPT로 가려졌습니다.
다만 두 모델 모두 수능 응시생들이 많이 틀린 문제를 주로 틀리는 유사성을 보이기도 했습니다.
[이상근/고려대 정보보호대학원 교수 : 재밌는 게 있는데요. 8번 같은 경우는 사람과 모든 AI가 다 틀렸고요.]
두 모델이 가장 많이 틀린 국어 문제는 가장 적절한 것 혹은 적절하지 않은 것을 묻는 유형이었습니다.
[이상근/고려대 정보보호대학원 교수 : 적절하지 않은이면, 어쨌든 보기에 있는 그것과 반대로 한 번 생각해야 하는데 그런 것들이 좀 어렵지 않나.]
흥미로운 점도 있었는데, 우리 시조를 다룬 국어 영역 문제에서 챗GPT는 오답을 냈지만 딥시크는 훌륭한 추론으로 정답을 맞혔습니다.
[이상근/고려대 정보보호대학원 교수 : 딥시크가 중국 또는 아시아 문화권에 있는 자료는 조금 더 많이 보지 않았을까.]
최근 업그레이드된 챗GPT o3 미니 하이에도 같은 문제를 줬더니, 수학은 오답이 줄었지만 국어는 오답이 오히려 늘었습니다.
[이상근/고려대 정보보호대학원 교수 : 수학이나 코딩 능력을 강화하기 위해서 코딩 데이터를 더 많이 보게 되면 언어 능력이 약화할 수도 있는…]
수능 풀이 만으로 성능을 단언하긴 어렵지만, 가성비를 앞세운 딥시크가 전 세계 AI 시장에 큰 화두를 던진 것만은 확실해 보입니다.
[이상근/고려대 정보보호대학원 교수 : 굉장히 성능이 놀랄 정도로 많이 따라왔다, 중국 모델이. 특히 이걸 오픈 소스로 공개를 했기 때문에…]
[영상취재 유규열 / 영상편집 김지훈 / 영상디자인 한영주]
정아람 기자 aa@jtbc.co.kr
[핫클릭]
▶ 재판장서 김병주 유튜브 틀자…눈 감고있던 윤 대통령 반응
▶ 막판 터져나온 이진우 증언…"그만" 윤갑근, 마이크 빼앗겨
▶ "V님 대국민 연설 전파 시"…계엄 하루 전 이진우 메모장
▶ 곽종근 "윤 대통령, 요원 아닌 의원 끌어내라 지시 맞다"
▶ 비단아씨 "노상원, 군인들 사주 물어보며 배신할지 물어봐"
JTBC의 모든 콘텐트기사는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
Copyright by JTBC All Rights Reserved.
관련링크
- 이전글세제 혜택 극대화…국민통장된 ISA 계좌 가입하셨나요? 25.02.04
- 다음글신한·KB도 애플페이 도입 임박…삼성페이 유료화에 카드사 긴장 25.02.04
댓글목록
등록된 댓글이 없습니다.