작가사공 스타트업 gpt킬러같은 생성형 AI탐지 무력화 언어모델 솔루션 개발
지난 1월 "작가사공 Chat GPT, 논문 레포트 대필, 표절 원천봉쇄 표절방지 솔루션 적용" (기사보기)을
발표한 스타트업 작가사공팀은 이번 GPT 탐지기술을 완벽히 무력화하는 초대형 언어모델 구현에 성공했다고 밝혔다.
최근 발표된 초대형 언어모델은 GPT Killer와 같은 생성형 AI 탐지 시스템을 완벽히 무력화하는 방식으로 설계되어 주목받고 있다. 이 모델은 자연어 처리(NLP)와 인공지능 이해(NLU) 기술의 한계를 넘어서는 발전된 딥러닝 기반 언어 모델로, GPT 탐지기술의 구조적 결함을 완벽히 이용한다. GPT 탐지기술은 학술적 글쓰기를 장려하는 본래 목적과 달리, 제대로 작성된 글조차 GPT 생성 텍스트로 의심받는 어처구니없는 상황을 자주 초래하여 학생과 학교간의 불화를 조장해왔다. 이는 GPT 탐지기술이 갖는 근본적인 기술적 한계를 여실히 보여준다.
GPT Killer와 같은 생성형 AI 탐지 시스템은 이진분류(Binary Classification) 방식으로 작동하며, 문장을 문맥이나 맥락에 관계없이 분절적으로 평가하는 경향이 있다. 이러한 탐지 방법은 인간이 작성한 텍스트와 AI가 생성한 텍스트를 구분하는 데 있어 필연적으로 오류를 발생시킬 수밖에 없다. 즉, AI가 생성한 문장이 아니라 하더라도 탐지 시스템의 오류로 인해 GPT 생성 문장으로 잘못 분류되는 경우가 많다는 것이다.
이를 해결하기 위해, 이번에 발표된 초대형 언어모델은 텍스트 생성 방식을 변형하여 탐지 시스템의 취약점을 직접 겨냥한 접근법을 채택했다. 이 모델은 고도로 발전된 참조 기반 학습(Reference-based Learning)과 직접 텍스트 입력 방식(Direct Text Input, DTI)을 결합하여 GPT Killer와 같은 탐지 시스템이 완전히 무력화됨을 확인했다. 구체적으로, 텍스트 입력 과정에서 인간과 AI의 협업을 기반으로 한 변형된 패턴을 생성함으로써, 탐지 시스템이 텍스트의 AI 생성 여부를 정확히 파악할 수 없도록 한다.
이 모델은 카피킬러(CopyKiller)와 같은 기존의 표절 탐지 시스템에서 탐지되지 않도록 설계되었으며, 테스팅 결과 GPT Killer조차 이 텍스트를 의심하지 못하게 만들었다. 이는 기존 탐지 시스템이 텍스트 내의 반복 패턴, 문장의 논리적 흐름, 문체를 기반으로 탐지하는 방식을 교묘히 피해가는 전략으로, GPT Killer가 가진 한계를 정확히 공략한 것이다. 이 모델은 AI 탐지 알고리즘의 한계를 극복하고, 한국어 텍스트 생성 AI 탐지 시스템의 기능을 원천 무력화시키는 데 성공했다.
이번에 발표된 초대형 언어모델은 GPT 탐지기술의 근본적 결함을 정확히 파악하고 이를 활용하여 완전히 새로운 텍스트 생성 방식을 구현함으로써, AI 탐지 기술이 더 이상 탐지할 수 없도록 설계된 혁신적인 기술이다.
이를 통해 AI 도구의 한계를 극복하면서도 학술적 진정성을 유지하는 새로운 차원의 AI 솔루션을 제시했다.
기능은 1)표절을 완전히 예방하는 기술 2) AI 생성 텍스트 표절방지와 탐지방지 기능으로
대중 공개는 연내에 이뤄질것으로 보여진다.