최근 기술 업계의 뜨거운 감자로 떠오른 ChatGPT(챗지피티)에 대해 들어보셨나요? 오늘은 ChatGPT와 그와 관련된 여러 이슈에 대해 소개하고자 합니다. ChatGPT(챗지피티)란 무엇인가? ChatGPT는 무엇일까요? 챗지피티에게 직접 물어보았습니다. 즉, ChatGPT는 GPT(Generative Pre-trained Transformer)로 텍스트 빅데이터를 학습한 대화형 인공지능(챗봇)입니다. 우리가 그동안 구글, 네이버 등에 키워드를 검색해서 필요한 것을 찾았다면, 챗지피티에 직접 궁금한 것을 질문해서 답변을 얻을 수 있기 때문에 좀 더 편리하다는 장점이 있죠. 우리의 궁금증을 해소해 줄 뿐만 아니라 스스로 문장을 생성하고, 번역을 하거나 주어진 문단을 요약할 수 있는 기능이 있다고 소개했습니다.실제로 ChatGPT에 질문을 남겼을 때, AI치고는 문장이 매우 매끄러운 편입니다. 기존의 다른 챗봇들보다 기계 같지 않다는 느낌을 받았죠. 그에 대한 답은 ChatGPT가 가진 파라미터(매개변수)의 개수에 있습니다. 파라미터는 무엇일까요? “파라미터(매개변수)는 머신러닝에서 AI가 훈련 중 학습한 값입니다. 이런 값들은 입력된 데이터를 기반으로 AI가 예측이나 결정을 내리는 데에 사용됩니다.”쉽게 말해서, AI의 파라미터는 인간의 뇌에서 뉴런을 연결하여 각종 정보를 전달하고 기억하는 ‘시냅스’와 유사합니다. 현재 ChatGPT는 1750억 개의 파라미터를 가지고 있고, 오픈AI는 2023년에 나올 GPT4는 100조 개의 파라미터를 가지는 것을 목표로 하고 있다고 말했습니다. 현재 버전보다 고도화되어 인간의 지능 수준과 유사할 수 있다는 점을 예측해 볼 수 있죠. ChatGPT, 똑똑한 거 맞아? 1750억 개의 파라미터를 가진 ChatGPT는 대부분의 질문을 이해하고, 대답도 자연스럽게 잘하지만, 사실 확인이 되지 않은 답변을 종종 내놓기도 합니다. 예시를 보여드릴게요. 챗지피티에게 한글의 창시자를 물어보았습니다. 그 결과, 한국인으로서는 충분히 납득되는 답변은 아닌 것 같습니다.간단한 예시를 들었지만, 이보다 전문적인 분야나 사실 여부가 중요한 정보를 물어봤을 때에도 이처럼 잘못된 답변을 나타낼 가능성이 있습니다. 실제로 교육계를 포함한 다양한 분야에서 ChatGPT로 야기될 다양한 문제를 지적하고 있습니다. 당장 크게 닥쳐올 문제는 두 가지로 나눌 수 있습니다.1. 표절, 저작권 등의 윤리 문제챗지피티의 학습 데이터는 바로 인터넷에 존재하는 방대한 양의 문서입니다. 온라인상의 텍스트 데이터 중에는 사실이 아니거나, 지나치게 편향된 정보도 존재합니다.연구자들도 챗지피티가 빅데이터를 별다른 검열 없이 학습한다면, 비윤리적인 지시에 반응하거나 편향된 답을 내놓을 수 있다고 말합니다. 편향성을 줄이기 위해서는 지역별, 국가별 이해에 대한 학습도 필요하다고 주장했습니다.(출처: 지디넷코리아)ChatGPT에 따르면, 챗지피티는 스스로 생성한 문장인지 아니면 인간이 작성한 문장인지 구별할 수 없는 텍스트를 만들어내는 능력이 있습니다. 그만큼 자신이 생성한 문장이 자연스럽다는 점을 강조하는 것이죠. 챗지피티의 이러한 기능에 학술계, 교육계는 긴장할 수밖에 없습니다. 바로 ‘표절’ 때문이죠.챗지피티는 사람과 대화를 나누고, 직접 코딩도 하고, 심지어 주제를 주면 노래 가사를 쓰기도 합니다. 분야를 가릴 것 없이 뭐든 만들어내죠. 그렇다 보니 해외 학생들은 챗지피티에 주어진 형식과 학문에 맞는 정보를 입력하고 나온 결과물을 과제나 논문에 쓰는 경우가 발생하고 있습니다. 뉴질랜드의 한 대학생 집단은 “ChatGPT를 통해 얻은 글을 수정해서 에세이를 제출한 것은 표절이 아니다”라고 주장하고 있고, 권위 있는 인공지능 학회에서도 챗지피티를 사용한 논문을 인정할지에 대한 의견이 엇갈리고 있어요.(출처: 주간조선)2. 학문 수준 저해 우려이미 현재진행형인 학생들의 과제, 논문 대필 논란으로 전 세계 교육계가 떠들썩합니다. 이를 막기 위한 노력들도 있는데요.미국 뉴욕시의 경우에는 공립학교 내의 기기 네트워크에서 ChatGPT의 접근을 차단하겠다고 발표했습니다.(출처: 주간조선) 많은 소프트웨어 회사들도 인간이 작성한 문장과 챗지피티가 생성한 문장을 구별할 수 있는 기술을 개발하겠다고 나섰고요. 하지만 아직 완벽하게 두 영역을 구분할 수 있는 서비스는 없습니다.현재의 챗지피티는 미국 기반으로 한국에 적합한 모델은 아니기 때문에, 아직은 한국에 대한 정보나 한국어에 대해 능숙하지 않은 편입니다. 하지만 한국 관련 학습 데이터를 꾸준히 학습하여 한글도 능숙히 구사하는 버전이 나온다면 우리나라 학생들도 본인의 과제에 챗지피티를 활용할 수도 있겠죠. 이미 챗지피티의 결과를 번역해서 사용하는 사람이 존재할 수도 있고요.궁금한 것을 물어보면 바로 대답해 주는 챗지피티가 있기 때문에 학생들이 스스로 탐구하고자 하는 의지가 떨어져 학습 능력이 저하될 수 있습니다. 특히 글쓰기 능력이 저하될 수 있다는 점이 가장 큰 문제점입니다. 글쓰기는 창의력을 발달시키고, 사고력의 기반이 되는 논리를 정리할 수 있는 수단으로 모든 학습의 기본이 됩니다. 하지만 그 글쓰기를 대체해 주는 존재가 나타났고, 챗지피티가 생성한 문장을 그대로 과제나 논문에 붙여 넣는다면 학생들은 글쓰기의 중요성을 자각하지 못하게 되겠죠. 챗지피티의 글이 사실인지도 확인하지 않을 거고요. ChatGPT로 발생하는 표절 문제에 대한 해결 방안이 있을까? 정리하자면, 현재의 챗지피티는 한글에 익숙한 모델은 아니지만, 방대한 데이터셋으로 학습한다면 곧 한글로도 자연스럽게 구사할 것으로 예상합니다. 아니면 학생이나 연구자가 ChatGPT에 영어로 문답을 하고 논문에 한글로 번역한 문장을 작성한다면 그 문장의 출처를 알아채기 어려울 수 있죠. 결국, 한국의 교육계도 챗지피티의 영향으로부터 자유롭지는 않을 것입니다.그렇다면 한국의 교육계는 이 문제를 어떻게 해결할 수 있을까요? 새로운 국면을 맞이한 만큼, 새롭고 혁신적인 존재의 등장만이 과연 정답일까요? 누구에게나 가깝고 상식적인 표절검사서비스 ‘카피킬러’무하유는 2011년부터 국내 최초의 표절검사 서비스인 ‘카피킬러’를 운영하며 12년째 국내에서 크고 작은 표절, 저작권 문제들을 다루고 해결해왔습니다. 연구 윤리에 앞장서 온 AI 기술 기업으로서 무하유도 현재 ChatGPT로 야기되는 문제들을 모니터링하며 대책을 마련하고 있습니다. 독보적인 빅데이터 처리 기술과 자연어 분석 기술로 안정적으로 서비스를 운영한 경험과 100억 여 개의 비교DB로 ChatGPT가 불러올 새로운 표절 양상에 대응할 예정입니다.