제목 | [연구분석] 챗지피티 등장 이후 AI 환각 연구의 문헌 검토 - 아카이브(arXiv)의 논문을 중심으로 |
---|
분류 | 성장동력산업 | 판매자 | 국준아 | 조회수 | 41 | |
---|---|---|---|---|---|---|
용량 | 1.44MB | 필요한 K-데이터 | 7도토리 |
파일 이름 | 용량 | 잔여일 | 잔여횟수 | 상태 | 다운로드 |
---|---|---|---|---|---|
[연구분석] 챗지피티 등장 이후 AI 환각 연구의 문헌 검토 - 아카이브(arXiv)의 논문을 중심으로.pdf | 1.44MB | - | - | - | 다운로드 |
데이터날짜 : | 2024-07-02 |
---|---|
출처 : | 국책연구원 |
페이지 수 : | 36 |
I. 문제제기
2022년 11월 오픈AI(Open AI)의 챗GPT(ChatGPT) 출시 이후 모든 사회 분야에 걸쳐 인공지능 전환(Artificial Intelligence Transformation, AIX)이 일어날 것이라는 전망이 힘을 받고 있다. 디지털 전환, 모바일 전환에 이어 인공지능(Artificial Intelligence, AI)이 사회 전반을 변화시킨다는 것이다.
그러나 이에 대한 우려도 적지 않다. AI를 프로젝트나 의사결정에 활용하려는 시도도 적지 않지만, 이에 적합한 조직 구조나 거버넌스가 마련되어 있는지는 여전히 의문이다(Lee & Nam, 2022; Eun & Hwang, 2020). AI 기술의 발전으로 저작권 등 법적 문제, AI 관
련 윤리 문제, 일자리 감소 등 인류의 미래에 대한 문제 등 다양한 우려도 제기되고 있다(Song & Lee, 2024). 무엇보다 AI의 신뢰성은 개별 도메인(Domain)와 최종 사용자(end-user) 수준에서도 보장되어야 한다(Park, 2023a).
환각(Hallucination) 문제는 도메인별 AI 활용을 주저하게 만드는 요소 중 하나다. 특히 언론과 법과 같이 사회적 영향력이 큰 분야에서는 높은 수준의 신뢰성이 요구된다(Park, 2023a). 이러한 분야에서 AI의 신뢰성을 높이기 위해서는 환각의 원인을 파악하고 이를 탐지(Hallucination Detection) 및 완화(Hallucination Mitigation)하는 연구가 필수적이다.
환각 완화는 인간처럼 텍스트를 생성하는 대규모 언어 모델(Large Language Model, LLM) 개발을 주도하는 빅테크 기업에서도 가장 중요하게 생각하는 문제이다. 예컨대 오픈AI는 이러한 문제를 해결하기 위해 지도식 미세조정(Supervised Fine Tuning, SFT)과 인간 피드백 기반 강화학습(Reinforcement Learning from Human Feedback, RLHF)를 도입한 사례를 소개한다(Ouyang, et al., 2022). 이밖에 검색과 생성을 결합한 검색 증강 생성(Retrieval-Augmented Generation, RAG)이나 생각의 연쇄(Chain of hought, CoT)와 같은 추론 단계의 환각 완화 기법도 주목을 받고 있다. 그러나 오픈AI의 최신 멀티모달(Multimodal) AI인 GPT-4o조차도 환각을 완전히 해소하지는 못한 것으로 알려져 있다. 예컨대 GPT-4o에게 중국어로 “最新 高清无码(최신 비검열 고화질 컨텐츠)”에 대해 설명하라고 요청했을 때, 이와 전혀 관계없는 “밀러-울만 꿈 분석법”을 설명하는 사례가 보고되었다.1) 이는 결함 토큰(glitch token)에 의한 문제로 알려졌다. 오픈AI가 GPT-4o를 토큰화 단계부터 재설계한 것으로 알려졌음에도 불구하고 결함 토큰에 의한 환각이 발생한 셈이다. 그만큼 환각 완화는 여전히 해결해야 할 난제로 남아있다.
------------------------------------------------------------------------------------------------------------------------------------------------------
※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.