[스마트경제=복현명 기자] 임희석 고려대학교 컴퓨터학과 교수 NLP&AI 연구실의 강명훈, 이정섭, 이승윤 학생 팀이 22일 ‘ICT 챌린지 2023’에서 과학기술정보통신부 장관상을 수상하는 쾌거를 이뤘다.
이로써 고려대 NLP&AI 연구실은 작년에 이어 2년 연속 과학기술정보통신부 장관상을 수상하는 영광을 안았다.
과학기술정보통신부가 정보통신기획평가원(주관), SK텔레콤(후원)과 함께 개최한 ‘ICT 챌린지 2023’는 대학ICT연구센터, 지역지능화혁신인재양성 등 디지털 고급인재양성사업 관련 연구기관의 연구 성과를 제고하고 석·박사생들 간 경쟁, 협업을 통해 실전 역량을 강화하기 위한 팀 아이디어 경연대회로 올해는 ‘디지털로 펼쳐갈 미래로의 도전’이라는 주제로 전국 28개 대학 79개 팀(263명)이 참여했다.
고려대 NLP&AI 연구팀은 ‘KoCheckGPT:사내 보안 강화를 위한 생성형 AI 탐지 기술’이라는 주제로 기업 내에서 ChatGPT와 같은 초거대 언어모델의 활용으로 인해 발생하는 사내 민감정보의 유출을 방지하기 위해 작성자료에 대한 생성 모델의 개입 여부를 판별할 수 있는 한국어 특화모델 KoCheckGPT를 제안해 LLM의 시대에 걸맞은 실용적인 솔루션을 제공했다는 측면에서 우수성을 인정받았다.
연구팀은 기업 문서에 특화된 판별기의 학습을 위해 AI 허브에서 제공하는 행정문서, 요약문 , 레포트 등의 7가지 데이터셋을 기반으로 ChatGPT를 활용해 데이터셋을 구축했다.
KoCheckGPT는 이를 기반으로 문장, 문서, 토큰 단위로 사전학습 모델을 미세조정 해 주어진 글의 생성 여부를 탐지하도록 학습됐다.
그 결과 KoCheckGPT는 한국어 하에서 시중에 알려진 탐지모델인 ‘지피티제로(GPTZero)’의 성능을 큰 폭으로 능가하는 것으로 확인됐다.
연구진은 동일한 검증 데이터셋을 기반으로 ChatGPT의 개입여부를 평가한 결과 지피티제로는 54%의 정확도에 그쳤지만 KoCheckGPT는 84%의 높은 정확도를 달성했다.
임희석 고려대 NLP&AI 연구실, HIAI 연구소장은 “기업관점에서 생성형 AI의 무분별한 사용은 사내 보안성 저해와 저작권 침해의 우려가 높다”며 “민감정보의 유출과 표절을 방지하기 위한 실질적 대응책이 필요한 시점”이라고 말했다.
복현명 기자 hmbok@dailysmart.co.kr