제목 [산업분석] 2025년 온디바이스 생성형 AI 최적화 기술과 경량 모델 확산 전망
분류 성장동력산업 판매자 장민환 조회수 146
용량 605KB 필요한 K-데이터 8도토리
파일 이름 용량 잔여일 잔여횟수 상태 다운로드
[산업분석] 2025년 온디바이스 생성형 AI 최적화 기술과 경량 모델 확산 전망.pdf 605KB - - - 다운로드
데이터날짜 : 2025-08-28 
출처 : 국책연구원 
페이지 수 : 16 

I. 서론


불과 2년 남짓한 사이에 생성형 AI는 우리 삶 곳곳에 깊숙이 자리 잡았다. ChatGPT는 이제 검색 대신 대화라는 새 습관을 만들었고

카약 및 익스페디아에서는 사용자의 소셜 미디어 콘텐츠를 기반으로 여행 일정을 자동으로 제시한다[1].

엔지니어 10명 중 9명이 코드 작성에 AI 도구를 쓰며, 깃허브 코파일럿 사용자는 1년 만에 1,500만 명을 넘어섰다
[2]. 갤럭시 S25 등 최신 안드로이드 스마트폰은 제미니 나노를 기본 탑재해 오프라인 환경에서도 사진 요약이나 음성 녹취 정리를

수행한다[3]. 이처럼 생성형 AI는 여행ㆍ개발ㆍ모바일까지 없어서는 안 될 인프라로 비중이 급격히 커지고 있다.

 

II. 트랜스포머 모델 최적화 기술 동향


2017년 구글이 처음 제시한 트랜스포머 모델은 입력 프롬프트의 길이를 획기적으로 늘임과 동시에 병렬 연산에 적합한 구조로

수십억~수조 개의 파라미터로 이루어진 거대언어 모델의 기반이 되었다[9]. 이를 기반으로 생성형 AI의 크기가 기하급수적으로

증가함에 따라 트랜스포머 모델 추론에 소모되는 비용 또한 급격하게 증가하였고, 이를 해결 하기 위해 트랜스포머 모델 최적화

연구가 활발하게 이루어지고 있다. 본 장에서는 트랜스포머 모델에 대한 주요 최적화 기술들에 대해 알아본다.

 

1. 어텐션 최적화 기술


KV(Key/Value) 캐싱은 이미 계산한 어텐션 값은 캐시에 저장해 다시 계산하지 않는 최적화 기법이다[9].

트랜스포머 디코더 내 셀프 어텐션 구조는 토큰을 하나씩 생성할 때 매번 이전 모든 토큰과의 어텐션 값에 대한 계산이 필요하다.

KV 캐싱은 이런 이전 토큰의 KV 행렬을 캐시에 저장해 두었다가 이후에 재사용함으로써 불필요한 연산을 방지한다.

 

 

 

 

 

 

 

 

---------------------------------------------------------------------------------------------------------------------------------------------------------

 

 

 

 

 

 

 

11.jpg

 

 

 

 



※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.

List of Articles
번호 분류 제목 K-데이터 판매자
K데이터 무통장 입금을 통한 충전 방법
9238 성장동력산업 [정부과제제안] 무형문화유산 전승 및 글로벌화를 위한 4D 콘텐츠 생성 및 서비스화 기술 개발 5도토리 국준아
9237 성장동력산업 [정부과제제안] 몰입형 문화체험을 위한 멀티모달 기반 융합형 인터랙티브 서비스 기술 개발 5도토리 국준아
9236 성장동력산업 [정부과제제안] 메가스케일 콘텐츠의 물리 정보 AI 기반 시뮬레이션 및 연출 플랫폼 기술 개발 5도토리 국준아
9235 성장동력산업 [정부과제제안] 대중소 게임기업 협력을 통한 온톨로지 기반 게임 3D 에셋 데이터 관리 AI 기술 및 트레이서빌리티 기술 개발 5도토리 국준아
9234 성장동력산업 [정부과제제안] 다중 미디어용 전통 문화공연 보존 아카이빙을 위한 AI 기반 자유시점 영상 생성 기술 개발 5도토리 국준아
9233 성장동력산업 [정부과제제안] 다중 AI 에이전트 협업 기반 멀티모달 스토리버스 창작 플랫폼 개발 5도토리 국준아
9232 성장동력산업 [정부과제제안] 기능성·인디 게임의 지속적 참여·몰입을 위한 AI NPC 제작 기술 개발 5도토리 국준아
9231 성장동력산업 [정부과제제안] 글로벌 한류 영향력 정량화를 위한 K-컬처 파워 인덱스 생성 및 영향력 분석 서비스 기술 개발 5도토리 국준아
9230 성장동력산업 [정부과제제안] 글로벌 K-콘텐츠 향유를 위한 AI 에이전트 기반 한국적 문화해설 및 다국어 자막 생성 기술 개발 5도토리 국준아
9229 성장동력산업 [정부과제제안] 관객과 상호작용이 가능한 AI 기반 버추얼 아티스트 공연 제작 기술 개발 5도토리 국준아
9228 성장동력산업 [정부과제제안] 관객·공연자 정보 기반 인터랙션이 가능한 참여형 공연 제작 지원 기술 개발 5도토리 국준아
9227 성장동력산업 [정부과제제안] 관객 맞춤형 e스포츠 중계를 위한 실시간 콘텐츠 제작 및 제공 기술 개발 5도토리 국준아
9226 성장동력산업 [정부과제제안] 공간 감각의 지능형 복원 확장 기반 멀티모달 체험 콘텐츠 창작 기술 개발 5도토리 전아람
9225 성장동력산업 [정부과제제안] 게임물 등급분류 및 사후관리 효율화를 위한 AI 기반의 게임등급분류 기술 개발 5도토리 전아람
9224 성장동력산업 [정부과제제안] 개인 맞춤형 국어생활종합상담 서비스를 위한 한국어 지식 연계 AI 에이전트 개발 5도토리 전아람
9223 성장동력산업 [정부과제제안] 가상공간기반 자동생성 및 공간분석 랜더링 기술 개발 5도토리 전아람
9222 성장동력산업 [정부과제제안] ReaLive 행동·생리 반응 신호 인식 기반 실시간 인터랙티브 스트리밍 플랫폼 개발 5도토리 전아람
9221 성장동력산업 [정부과제제안] K-콘텐츠의 가치 확산을 위한 AI 기반 2차 창작 프리프로덕션 기술 개발 5도토리 전아람
9220 성장동력산업 [정부과제제안] K-콘텐츠 기반 치유경험 향상을 위한 감성 컬처세라피 서비스 기술 개발 5도토리 전아람
9219 성장동력산업 [정부과제제안] K-웹툰 신시장 개척을 위한 AI 기반 현지 문화 감응형 웹툰 제작 기술 개발 5도토리 전아람