"문제는 '이루다'가 아닌 개인정보…스캐터랩 위자료 물 수도" > IT/과학기사 | it/science

본문 바로가기
사이트 내 전체검색

IT/과학기사 | it/science

"문제는 '이루다'가 아닌 개인정보…스캐터랩 위자료 물 수도"

페이지 정보

profile_image
작성자 관리자
댓글 0건 조회 681회 작성일 21-01-13 16:41

본문

뉴스 기사
정부 '대화 데이터 수집' 절차 보니…"카톡 상대방 동의도 구해야"
공공기관은 저작권 계약 체결하고 보상도 지급
개인정보위 조사 주목…"개인정보보호법 위반 가능성에 무게"

AKR20210112165000017_04_i.jpgAI 이루다 [스캐터랩 제공. 재판매 및 DB 금지]


(서울=연합뉴스) 이효석 기자 = 인공지능(AI) 챗봇 '이루다'가 서비스를 잠정 중단했지만 이루다 개발에 쓰인 카카오톡 대화 데이터가 위법하게 수집됐다는 문제 제기가 계속되고 있다.

AI 전문가들은 "스캐터랩이 개인정보 및 저작권 동의를 꼼꼼히 받지 않은 책임이 있어 보인다"고 지적한다. 개인정보보호위원회 조사 결과에 따라 스캐터랩이 법적 책임을 질 가능성도 대두되고 있다.

13일 IT업계에 따르면, 스캐터랩은 연애 분석 앱 '연애의 과학'에서 수집한 연인들 대화 데이터 약 100억건으로 AI 챗봇 이루다를 만들었다.

그런데 이 과정에서 스캐터랩은 연애의 과학 이용자들에게 '개인정보가 신규 서비스 개발에 활용될 수 있다'는 정도만 고지해 설명이 부족했다는 지적을 받고 있다.

AI 전문가들은 최근 공공기관이 시행한 대화 데이터 수집 사업과 스캐터랩 사례를 비교해보면 스캐터랩의 개인정보 취급이 어떤 점에서 부족했는지 알 수 있다고 입을 모은다.
AKR20210112165000017_05_i.jpg'연애의 과학' [스캐터랩 제공. 재판매 및 DB 금지]


최근의 공공기관 사례는 과학기술정보통신부와 한국정보화진흥원(NIA)이 지난해 9월 시작한 'AI 학습용 데이터 구축 2차 사업'이다.

사업 주관 기관인 NIA는 카카오톡 이용자를 대상으로 'AI 학습용 한국어 대화 데이터 수집'을 하고 있는데, 이를 위해 이 기관은 44쪽에 달하는 상세한 매뉴얼을 제작해 참여자들에게 제공했다.

신청 절차를 보면 이 사업 참여자는 개인정보 처리 동의서, 저작권 이용 허락 계약서, 크라우드 워커(Crowd Worker) 용역 계약서를 써야 한다.

NIA는 데이터를 제출하는 신청자뿐 아니라, 신청자와 대화를 나누는 카톡 대상도 모두 신청서 및 저작권 계약서를 쓰도록 했다.

전문가들은 스캐터랩이 연애의 과학 이용자들에게서 카톡 대화를 수집하면서 대화 상대방인 제3자에게는 아무런 동의를 얻지 않은 점이 문제라고 지적한다.

스캐터랩이 카톡 대화를 신규 서비스에 쓰려고 했으면 최소한 NIA처럼 제3자 개인정보 활용 동의만큼은 얻었어야 한다는 것이다.


AKR20210112165000017_02_i.jpg한국정보화진흥원(NIA) '인공지능 학습용 한국어 대화 데이터 수집 매뉴얼' 발췌. NIA는 대화 데이터 수집 사업에 참여하는 이들과 대화를 나눈 상대방에게도 개인정보 동의 및 저작권 이용 허락을 구했다. [NIA 매뉴얼 캡처. 재판매 및 DB 금지]


2019년 문화체육관광부와 국립국어원이 벌인 '메신저 대화 자료 수집 및 말뭉치 구축 사업'도 같은 절차를 거쳤다.

국립국어원 역시 NIA처럼 신청자 외 대화방 참여자들에게 개인정보 제공 이용 동의를 받았고, 저작권 이용 허락 계약도 체결했다.

저작권 계약에는 계약 종료일 및 자동 갱신 단위, 저작물의 제공·배포 및 보존·복제·변형·응용 등의 권한을 넘긴다는 구체적인 내용이 적시됐다.

이 사업 위탁업체는 최종 보고서에 "대화를 수집하려면 대화 참여자의 개인정보까지 수집해야 하는데, 이를 위해서는 개인정보 이용 동의가 꼭 필요하다"며 "자료를 활용하려면 저작권 이용 허락도 필요하다"고 적었다.

업체 측은 "메신저 대화처럼 사적이고 일상적인 대화가 저작권 이용 허락 대상인지는 현재 명확한 법적 기준이 없다"면서도 "본 사업에서는 메신저 대화도 어문 저작물에 준하는 것으로 간주해 대화 제공자 전원과 저작권 이용 허락 계약을 체결했다"고 부연 설명했다.

추후 문제가 없도록 현행 법·제도 이상으로 철저히 절차를 밟았다는 것이다.
AKR20210112165000017_03_i.jpg국립국어원 '메신저 대화 자료 수집 및 말뭉치 구축 사업' 역시 대화방 참여자 전원에게 개인정보 제공 이용 동의를 받았고, 저작권 이용 허락 계열도 체결했다. 사업 위탁업체 측은 최종 보고서에서 "대화를 수집하려면 대화 참여자의 개인정보까지 꼭 이용 동의를 받아야 한다 "며 "본 사업에서는 메신저 대화도 어문 저작물에 준하는 것으로 간주해 대화 제공자 전원과 저작권 이용 허락 계약도 체결했다 "고 밝혔다. [사업보고서 캡처. 재판매 및 DB 금지]


NIA와 국립국어원은 데이터 제공자들에게 보상도 했다.

NIA는 대화 조각 1건당 700원(세전)의 보상을 지급하고 있다. 1명당 최대 1만건의 대화 조각을 업로드할 수 있으므로 700만원까지 받을 수 있다.

국립국어원은 대화 길이에 따라 모바일 상품권을 최소 5천원, 최대 5만원까지 지급했다.

스캐터랩은 연애의 과학 이용자들의 카톡 대화를 수집해 신규 서비스에 활용하면서 보상하지 않았다. 오히려 연애의 과학 서비스는 건당 2천∼5천원 정도로 유료였다.

물론 NIA와 국립국어원의 데이터 수집 사업은 자발적인 참여자들이 익명화 작업까지 손수 거친다는 점에서 보상 수준을 스캐터랩과 동등하게 비교하기는 어렵다.

그러나 AI 스타트업 한 관계자는 "데이터가 '쌀이자 원유'라는 시대 아니냐. 카톡 대화처럼 민감한 데이터를 수집하려면 보상을 하는 게 당연하다"며 "동의조차 제대로 받지 않았다니 이해하기 어렵다"고 의견을 냈다.

개인정보 침해 사건을 담당하는 정부 부처 개인정보보호위원회는 한국인터넷진흥원(KISA)과 함께 스캐터랩 조사에 착수했다.

개인정보위 관계자는 "개인정보보호법 위반 가능성에 무게를 두고 있다"고 말했다.

법조계에서는 개보위 조사 결과에 따라 스캐터랩이 상당한 위자료 보상 책임을 질 수도 있다는 관측이 나온다.

개인정보 전문가인 김보라미 변호사(법률사무소 디케)는 "스캐터랩은 개인정보를 마케팅·광고에 쓰겠다는 동의까지 포괄적으로 받은 점, 제3자 개인정보 이용 동의를 안 받은 점 등이 위법 소지가 있어 보인다"고 말했다.

hyo@yna.co.kr
(끝)

[이 시각 많이 본 기사]
이휘재·문정원 층간소음 공개저격…안상태도 구설수
양준일 팬들, 양준일 경찰 고발…무슨 일?
15살 여친 프로필 나체사진으로 몰래 바꾸고 비번까지…
성모 마리아상 박살낸 20대 "화풀이 대상 필요했다"
"간 파열 아동 신고받은 경찰 '결국 잘못된 것 아니잖아''"
드라마 인연이 결혼까지…심은진-전승빈 부부 됐다
부장 못달고 강등된 北김여정 거칠게 남측 비난…왜?
손흥민, 절친 박서준 질문에 "차·박·손 중 최고는…"
녹음기 숨겨 어린이집 보냈더니…학대 정황 드러나
'놀면뭐하니?' 싹쓰리, 세이브더칠드런에 2억원 기부

▶연합뉴스 앱 지금 바로 다운받기~
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>

댓글목록

등록된 댓글이 없습니다.

회원로그인

회원가입

사이트 정보

회사명 : 원미디어 / 대표 : 대표자명
주소 : OO도 OO시 OO구 OO동 123-45
사업자 등록번호 : 123-45-67890
전화 : 02-123-4567 팩스 : 02-123-4568
통신판매업신고번호 : 제 OO구 - 123호
개인정보관리책임자 : 정보책임자명

접속자집계

오늘
184
어제
1,005
최대
2,563
전체
369,749
Copyright © 소유하신 도메인. All rights reserved.