제목 [산업분석] 2025년 온디바이스 생성형 AI 최적화 기술과 경량 모델 확산 전망
분류 성장동력산업 판매자 장민환 조회수 164
용량 605KB 필요한 K-데이터 8도토리
파일 이름 용량 잔여일 잔여횟수 상태 다운로드
[산업분석] 2025년 온디바이스 생성형 AI 최적화 기술과 경량 모델 확산 전망.pdf 605KB - - - 다운로드
데이터날짜 : 2025-08-28 
출처 : 국책연구원 
페이지 수 : 16 

I. 서론


불과 2년 남짓한 사이에 생성형 AI는 우리 삶 곳곳에 깊숙이 자리 잡았다. ChatGPT는 이제 검색 대신 대화라는 새 습관을 만들었고

카약 및 익스페디아에서는 사용자의 소셜 미디어 콘텐츠를 기반으로 여행 일정을 자동으로 제시한다[1].

엔지니어 10명 중 9명이 코드 작성에 AI 도구를 쓰며, 깃허브 코파일럿 사용자는 1년 만에 1,500만 명을 넘어섰다
[2]. 갤럭시 S25 등 최신 안드로이드 스마트폰은 제미니 나노를 기본 탑재해 오프라인 환경에서도 사진 요약이나 음성 녹취 정리를

수행한다[3]. 이처럼 생성형 AI는 여행ㆍ개발ㆍ모바일까지 없어서는 안 될 인프라로 비중이 급격히 커지고 있다.

 

II. 트랜스포머 모델 최적화 기술 동향


2017년 구글이 처음 제시한 트랜스포머 모델은 입력 프롬프트의 길이를 획기적으로 늘임과 동시에 병렬 연산에 적합한 구조로

수십억~수조 개의 파라미터로 이루어진 거대언어 모델의 기반이 되었다[9]. 이를 기반으로 생성형 AI의 크기가 기하급수적으로

증가함에 따라 트랜스포머 모델 추론에 소모되는 비용 또한 급격하게 증가하였고, 이를 해결 하기 위해 트랜스포머 모델 최적화

연구가 활발하게 이루어지고 있다. 본 장에서는 트랜스포머 모델에 대한 주요 최적화 기술들에 대해 알아본다.

 

1. 어텐션 최적화 기술


KV(Key/Value) 캐싱은 이미 계산한 어텐션 값은 캐시에 저장해 다시 계산하지 않는 최적화 기법이다[9].

트랜스포머 디코더 내 셀프 어텐션 구조는 토큰을 하나씩 생성할 때 매번 이전 모든 토큰과의 어텐션 값에 대한 계산이 필요하다.

KV 캐싱은 이런 이전 토큰의 KV 행렬을 캐시에 저장해 두었다가 이후에 재사용함으로써 불필요한 연산을 방지한다.

 

 

 

 

 

 

 

 

---------------------------------------------------------------------------------------------------------------------------------------------------------

 

 

 

 

 

 

 

11.jpg

 

 

 

 



※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.

List of Articles
번호 분류 제목 K-데이터 판매자
K데이터 무통장 입금을 통한 충전 방법
8936 성장동력산업 [기술동향] 인공지능 학습데이터 신뢰성 확보를 위한 시험 및 평가 기반 접근 방식 동향 11도토리 국준아
8935 성장동력산업 [시장동향] 중국 - AI 인프라 구축을 위한 전략 핵심기술인 SiC 반도체 시장 8도토리 국준아
8934 성장동력산업 [산업분석] 2025년 대전 지역 창업 생태계 분석 11도토리 국준아
8933 성장동력산업 [산업동향] 2025년 중국의 동력 배터리 산업 8도토리 국준아
8932 성장동력산업 [산업동향] 2025년 인도의 영상·연예 산업 5도토리 국준아
8931 성장동력산업 [산업동향] 2025년 러시아 인공지능 산업 정보 8도토리 국준아
8930 성장동력산업 [연구분석](영문) 2025 국내 바이오 산업 실태조사 보고서 20도토리 국준아
8929 생명공학/바이오 [산업분석] 2024년 지역별 바이오산업 현황 5도토리 국준아
8928 성장동력산업 [산업분석] 탄소중립 가속화에 의한 호주 BESS산업 분석 17도토리 국준아
8927 성장동력산업 [산업분석] 독일의 드론산업과 한국기업의 진출 전략 분석 17도토리 국준아
8926 성장동력산업 [정책분석] 인공지능 환각, 위험관리 및 창의적 활용을 위한 정책 대응 11도토리 국준아
8925 성장동력산업 [정책동향] 2025년 11월 인공지능 트랜드 분석 - 해외 인공지능 정책·기술 동향 11도토리 국준아
8924 성장동력산업 [산업분석] AI 윤리·데이터 거버넌스 변화와 기술 산업의 구조적 시사점 11도토리 강정훈
8923 성장동력산업 [산업동향] 제조·방산 현장 중심 AI 융합기술 확산과 산업 적용 변화 20도토리 강정훈
8922 성장동력산업 [산업동향] 미국 차기 행정부의 AI·디지털 규제 재편과 산업 영향 20도토리 정한솔
8921 성장동력산업 [산업분석] 도시광산 산업 활성화와 핵심광물 공급망 재편 전략 11도토리 정한솔
8920 성장동력산업 [산업동향] 중국 차기 중장기 계획이 촉발하는 산업 생태계 재편 흐름 8도토리 정한솔
8919 성장동력산업 [시장분석] 개발도상국 중소기업 ODA 지원 구조 변화와 국제 협력 확대 방향 11도토리 정한솔
8918 성장동력산업 [산업분석] 글로벌 공공연구기관의 과학기술 경쟁력 비교와 협력 생태계 변화 14도토리 정한솔
8917 성장동력산업 [산업동향] 휴머노이드 로봇 기술 고도화와 글로벌 산업 확장 흐름 11도토리 정한솔