AI 텍스트 분류기 공개..."불완전하다" 인정

오픈AI의 대화형 인공지능(AI) 챗봇 챗GPT. 출처=셔터스톡
오픈AI의 대화형 인공지능(AI) 챗봇 챗GPT. 출처=셔터스톡

대화형 인공지능(AI) 챗봇 챗GPT를 만든 오픈AI는 31일(현지시간) 특정 텍스트가 인간에 의해 작성됐는지, 기계(AI)에 의해 작성됐는지 확인할 수 있는 무료 웹 기반 기능을 도입했다. 

챗GPT 출시와 동시에 학생과 전문가들이 이를 이용해 너무 쉽게 글을 쓸 수 있을 것, 표절이 난무할 것 등에 대한 우려가 제기됐고, 이에 따라 오픈AI가 이런 기능을 출시한 것. 

오픈AI는 이번에 내놓은 'AI 텍스트 분류기'(AI text classifier)는 "불완전하다"고 인정하고 있다. 

오픈AI 얼라인먼트 부문 책임자 얀 레이크는 악시오스에 "새로운 기능은 잘못된 부정(false positives), 잘못된 긍정(false negatives)을 모두 포함하고 있다"며 한 문서를 작성하는 데 있어 여기에만 의존해선 안 된다고 밝혔다. 얼라인먼트 부문은 챗GPT가 인간의 가치와 일치하는지를 확인하기 위한 일을 한다. 

레이크는 새로운 기능을 공개하기로 한 결정은 인간이 AI와 상호작용하는지 알 권리가 있는지에 대한 논쟁에서 비롯됐다고 말했다. 그는 "이 질문은 우리가 여기서 하고 있는 것보다 훨씬 더 크다"며 "사회 전체가 이 질문과 씨름해야 한다"고 강조했다. 

텍스트를 기계가 썼는지 여부를 확인했다는 걸 보여주는 스크린샷. 출처=오픈AI
텍스트를 기계가 썼는지 여부를 확인했다는 걸 보여주는 스크린샷. 출처=오픈AI

AI 텍스트 분류기는 다음과 같은 5가지 척도로 결과를 내놓는다. 

▲AI가 생성했을 가능성이 매우 낮다(Very unlikely) ▲AI가 생성했을 가능성이 없다(unlikely) ▲AI가 생성했는지 여부가 불분명하다(unclear) ▲AI가 생성했을 가능성이 있다(possible) ▲AI가 생성했을 수도 있다(likely)

이 기능을 통해 1000개 단어가 안 되는 텍스트가 AI에 의해 작성됐는지, 아니면 사람에 의해 작성됐는지를 결정하는 건 불가능하다. 이 기능은 1000개 이상의 단어와 영어로 된 텍스트 샘플에서 가장 잘 작동하며, 다른 언어에서는 성능이 현저히 떨어진다고 오픈AI는 밝혔다. 그리고 인간이 작성한 컴퓨터 코드를 구별하는 것엔 작동하지 않는다. 

챗GPT가 가져올 부작용을 우려, 뉴욕시 공립학교들은 이를 사용하지 못하도록 한 상황. 아빈드 나레이야난(Arvind Narayanan) 미 프린스턴대 컴퓨터과학 교수는 챗GPT에 대해 "정확성을 고려하지 않고 응답을 제시하는 '헛소리 생성기'"라 평가하기도 했다. 

현재 턴잇인(Turnitin) 등 일부 회사들이 학생들이 과제를 작성할 때 챗GPT를 썼는지 아닌지를 가려내기 위한 표절 탐지 도구를 적극적으로 연구하고 있다. 프린스턴대 학생 에드워드 투안은 CNN에 "지금까지 교수들 사이에서 엄청난 수요가 있었다"면서 "9만5000명 이상의 사람들이 '제로GPT'라고 불리는 자신만의 챗GPT 탐지 기능의 베타 버전을 이미 시도했다"고 말했다.

관련기사
저작권자 © 스마트투데이 무단전재 및 재배포 금지