챗GPT와 딥시크에 수능 국어·수학 풀게 해봤더니…승자는?
페이지 정보

본문
지원하지 않는 브라우저로 접근하셨습니다.
Internet Explorer 10 이상으로 업데이트 해주시거나, 최신 버전의 Chrome에서 정상적으로 이용이 가능합니다.
중국 스타트업 딥시크가 전 세계 AI 시장에 돌풍을 일으키고 있는 가운데, 재미있는 실험을 해봤습니다.
미국 오픈 AI사가 만든 챗GPT o1과 딥시크 AI 모델 R1에 각각 2025년 대입 수능 국어·수학 공통과목을 풀게 했습니다.
승자는 누구일까.
국어와 수학 두 과목 모두 챗GPT 오답이 딥시크보다 더 적어, 승자는 챗GPT로 가려졌습니다.
다만 두 모델 모두 수능 응시생들이 많이 틀린 문제를 주로 틀리는
유사성을 보이기도 했습니다.
[이상근/고려대 정보보호대학원 교수]
"재밌는 게 있는데요. 8번 같은 경우는 사람과 모든 AI가 다 틀렸고요."
두 모델이 가장 많이 틀린 국어 문제는 가장 적절한 것 혹은 적절하지 않은 것을 묻는 유형이었습니다.
[이상근/고려대 정보보호대학원 교수]
"적절하지 않은이면, 어쨌든 보기에 있는 그것과 반대로 한 번 생각을 해야 되는데 그런 것들이 좀 어렵지 않나."
흥미로운 점도 있었는데, 우리 시조를 다룬 국어 영역 문제에서 챗GPT는 오답을 냈지만 딥시크는 훌륭한 추론으로 정답을 맞혔습니다.
[이상근/고려대 정보보호대학원 교수]
"딥시크가 중국 또는 아시아 문화권에 있는 자료는 조금 더 많이 보지 않았을까."
최근 업그레이드된 챗GPT o3 미니 하이에도 같은 문제를 줬더니, 수학은 오답이 줄었지만 국어는 오답이 오히려 늘었습니다.
[이상근/고려대 정보보호대학원 교수]
"수학이나 코딩 능력을 강화하기 위해서 코딩 데이터를 더 많이 보게 되면 언어 능력이 약화될 수도 있는..."
수능 풀이 만으로 성능을 단언하긴 어렵지만, 가성비를 앞세운 딥시크가 전 세계 AI 시장에 큰 화두를 던진 것만은 확실해 보입니다.
[이상근/고려대 정보보호대학원 교수]
"굉장히 성능이 놀랄 정도로 많이 따라왔다, 중국 모델이. 특히 이걸 오픈 소스로 공개를 했기 때문에..."
정아람 기자 aa@jtbc.co.kr
[핫클릭]
▶ 재판장서 김병주 유튜브 틀자…눈 감고있던 윤 대통령 반응
▶ 막판 터져나온 이진우 증언…"그만" 윤갑근, 마이크 빼앗겨
▶ "V님 대국민 연설 전파 시"…계엄 하루 전 이진우 메모장
▶ 곽종근 "윤 대통령, 요원 아닌 의원 끌어내라 지시 맞다"
▶ 비단아씨 "노상원, 군인들 사주 물어보며 배신할지 물어봐"
JTBC의 모든 콘텐트기사는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
Copyright by JTBC All Rights Reserved.
관련링크
- 이전글"47만개 보유 큰손도 매수 중단" 비트코인 비관론 확산? 25.02.04
- 다음글2시간 이어진 AI 회동…손정의 "좋은 논의였다"종합 25.02.04
댓글목록
등록된 댓글이 없습니다.