II. 기술의 개념 및 내용 모바일 단말에서 실시간 AI 추론을 위한 강화학습 기반 모델 경량화 및 최적화 기술 - 기존 경량화 기법은 사람이 네트워크의 크기와 형태를 정해주고, AI가 정해진 네트워크 에 최적인 가중치를 도출하는 과정으로 수행되었음 - 본 제안 기술은 AI가 주어진 태스크(Task)를 성공적으로 수행하기 위해 최적의 네트워 크 선정부터 최적의 가중치까지 도출하는 강화학습 기반의 경량화 및 최적화 기술을 * 본 내용은 김성제 책임연구원(☎ 031-739-7477, sungjei.kim@keti.re.kr)에게 문의하시기 바랍니다. ** 본 내용은 필자의 주관적인 의견이며 IITP의 공식적인 입장이 아님을 밝힙니다. ***정보통신기획평가원은 현재 개발 진행 및 완료 예정인 ICT R&D 성과 결과물을 과제 종료 이전에 공개하는 “ICT R&D 사 업화를 위한 기술예고”를 2014년부터 실시하고 있는 바, 본 칼럼에서는 이를 통해 공개한 결과물의 기술이전, 사업화 등 기술 활용도 제고를 위해 매주 1~2건의 관련 기술을 소개함 모바일 단말을 위한 AI 최적화/ 경량화 알고리즘 및 소프트웨어 Chapter 04 개발목표시기 2023. 12. 기술성숙도 (TRL) 개발 전 개발 후 4 6 결과물 형태 SW-Platform 검증방법 자체 검증, 3자 검증 Keywords 인공지능, 모바일 단말, 최적화, 경량화, 강화학습 AI, mobile device, optimization, compression, reinforcement learning 외부기술요소 Open Source 기반 자체 기술 통합 개발 권리성 특허, SW ICT R&D 동향 정보통신기획평가원 35 개발하는 것임 - 본 제안 기술은 채널 프루닝, 양자화 기술 등 네트워크 경량화 기법에 적용하여 모바일 단말의 컴퓨팅 파워를 고려한 최적의 네트워크를 도출할 수 있는 장점이 있음 III. 국내외 기술 동향 및 경쟁력 1. 기술의 특성 및 성능 모바일향 최적 pre/post processing 및 추론 기술 개발 모바일향 딥러닝 네트워크 경량화 기술 개발 경량 네트워크에 최적화된 학습 기술 개발 양자화 오류를 고려한 재학습 프레임워크 설계 신경망 최적화 및 경량화를 위한 차원 감소 기법 기반 필터 제거법 개발 2. 경쟁기술/대체기술 동향 및 현황 미국 스탠포드 대학은 대용량의 커널 데이터를 압축하기 위해 프루닝, 양자화, 엔트로피 코딩 기법을 기반한 Deep Compression 기술을 제안함