제목 [산업분석] 2025년 온디바이스 생성형 AI 최적화 기술과 경량 모델 확산 전망
분류 성장동력산업 판매자 장민환 조회수 81
용량 605KB 필요한 K-데이터 8도토리
파일 이름 용량 잔여일 잔여횟수 상태 다운로드
[산업분석] 2025년 온디바이스 생성형 AI 최적화 기술과 경량 모델 확산 전망.pdf 605KB - - - 다운로드
데이터날짜 : 2025-08-28 
출처 : 국책연구원 
페이지 수 : 16 

I. 서론


불과 2년 남짓한 사이에 생성형 AI는 우리 삶 곳곳에 깊숙이 자리 잡았다. ChatGPT는 이제 검색 대신 대화라는 새 습관을 만들었고

카약 및 익스페디아에서는 사용자의 소셜 미디어 콘텐츠를 기반으로 여행 일정을 자동으로 제시한다[1].

엔지니어 10명 중 9명이 코드 작성에 AI 도구를 쓰며, 깃허브 코파일럿 사용자는 1년 만에 1,500만 명을 넘어섰다
[2]. 갤럭시 S25 등 최신 안드로이드 스마트폰은 제미니 나노를 기본 탑재해 오프라인 환경에서도 사진 요약이나 음성 녹취 정리를

수행한다[3]. 이처럼 생성형 AI는 여행ㆍ개발ㆍ모바일까지 없어서는 안 될 인프라로 비중이 급격히 커지고 있다.

 

II. 트랜스포머 모델 최적화 기술 동향


2017년 구글이 처음 제시한 트랜스포머 모델은 입력 프롬프트의 길이를 획기적으로 늘임과 동시에 병렬 연산에 적합한 구조로

수십억~수조 개의 파라미터로 이루어진 거대언어 모델의 기반이 되었다[9]. 이를 기반으로 생성형 AI의 크기가 기하급수적으로

증가함에 따라 트랜스포머 모델 추론에 소모되는 비용 또한 급격하게 증가하였고, 이를 해결 하기 위해 트랜스포머 모델 최적화

연구가 활발하게 이루어지고 있다. 본 장에서는 트랜스포머 모델에 대한 주요 최적화 기술들에 대해 알아본다.

 

1. 어텐션 최적화 기술


KV(Key/Value) 캐싱은 이미 계산한 어텐션 값은 캐시에 저장해 다시 계산하지 않는 최적화 기법이다[9].

트랜스포머 디코더 내 셀프 어텐션 구조는 토큰을 하나씩 생성할 때 매번 이전 모든 토큰과의 어텐션 값에 대한 계산이 필요하다.

KV 캐싱은 이런 이전 토큰의 KV 행렬을 캐시에 저장해 두었다가 이후에 재사용함으로써 불필요한 연산을 방지한다.

 

 

 

 

 

 

 

 

---------------------------------------------------------------------------------------------------------------------------------------------------------

 

 

 

 

 

 

 

11.jpg

 

 

 

 



※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.

List of Articles
번호 분류 제목 K-데이터 판매자
K데이터 무통장 입금을 통한 충전 방법
8724 성장동력산업 [산업동향] 2025년 상반기 중형조선산업 발주·수주 추세와 시사점 8도토리 국준아
8723 성장동력산업 [정책분석] 미국 트럼프 정부의 AI 행동계획과 글로벌 기술질서 변화 시사점 20도토리 장민환
8722 성장동력산업 [산업분석] 한국 對美 부가가치 수출 현황 진단과 대응 전략 8도토리 장민환
» 성장동력산업 [산업분석] 2025년 온디바이스 생성형 AI 최적화 기술과 경량 모델 확산 전망 8도토리 장민환
8720 성장동력산업 [산업분석] 대기환경 기술개발사업 추진 타당성과 산업적 파급효과 20도토리 장민환
8719 성장동력산업 [산업동향] 한·중 탄소중립 이행 전략 비교와 산업·무역 파급효과 14도토리 장민환
8718 성장동력산업 [산업동향] 미·중 AI 경쟁 구도 심화와 한국 산업의 대응 방향 14도토리 장민환
8717 성장동력산업 [산업전략] 미·중 패권 경쟁 속 한국 조선업의 美 해군 시장 진출 기회 14도토리 장민환
8716 성장동력산업 [산업분석] 2025년 유럽 EV 충전 인프라 전망과 시장 기회 8도토리 장민환
8715 성장동력산업 [산업동향] 2025년 한미 정상회담 합의와 경제·산업 협력 평가 8도토리 장민환
8714 성장동력산업 [정책분석] 2025년 한미 정상회담 이후 산업별 영향과 대미 투자 전략 11도토리 장민환
8713 성장동력산업 [정책동향] 2025년 기후·기상 기술 혁신과 글로벌 환경정책 이슈 11도토리 장민환
8712 성장동력산업 [산업동향] 글로벌 인공지능 시장 전망, 유망 기업·기술, 핵심 수요처 분석 11도토리 장민환
8711 성장동력산업 [산업동향] 2025년 글로벌 경기 둔화와 한국 산업·정책 이슈 분석 20도토리 장민환
8710 성장동력산업 [산업동향] 2025년 데이터 마켓플레이스, 美 수출통제 전환과 스타게이트 진전 7도토리 정한솔
8709 성장동력산업 [산업분석] 2025년 美 철강·알루미늄 관세 확대와 인텔 인수, 반도체 공급망 재편 5도토리 정한솔
8708 성장동력산업 [산업동향] 2025년 벤처·AI·딥테크 투자 확대와 혁신 정책·입법 현황 7도토리 정한솔
8707 성장동력산업 [산업분석] 해외상장 ETF 선호 확대 원인과 국내 제도 개선 과제 5도토리 정한솔
8706 성장동력산업 [정책동향] 2025년 국정과제와 글로벌·국내 경제 및 농업정책 동향 3도토리 정한솔
8705 성장동력산업 [산업동향] 2025년 미국 관세 정책 변화와 기업 실무 대응 가이드 5도토리 정한솔