제목 NPU 반도체를 위한 저정밀도 데이터 타입 개발 동향
분류 성장동력산업 판매자 박민혁 조회수 39
용량 809.61KB 필요한 K-데이터 1도토리
파일 이름 용량 잔여일 잔여횟수 상태 다운로드
NPU 반도체를 위한 저정밀도 데이터 타입 개발 동향.pdf 809.61KB - - - 다운로드
데이터날짜 : 2022-02-01 
출처 : 정부산하기관 
페이지 수 : 10 

Ⅰ. 서론 초거대 신경망[1-6]의 등장으로 영상과 언어 를 포함한 모든 인공지능 활용분야의 인식 성능 이 비약적으로 증가했다. 특히 2018년 OpenAI의 GPT[1] 구조를 시작으로 자연어처리 분야는 무한 한 가능성을 맞이하고 있다. 2021년 기준 인공지 능 기반 자연어처리 모델의 학습 규모는 1.6조[6] 에 육박한다. 이는 매년 10배씩 신경망 구조가 커 지고 있으며, 현재와 같은 추세를 따르면 3년 후 초 거대 신경망은 사람의 시냅스 수에 도달할 것으로 예상되는 정도다(그림 1 참조). 그뿐만 아니라 영상 처리 분야도 초거대 신경망의 구조를 따라가고 있 다. ImageNet 사물 인식 대회의 2021년 기준 상위 3 개의 신경망 모델은 모두 초거대 인공신경망의 핵 심 구조(Transformer)[7]를 차용하면서 인식 성능을 경신하는 중이다[8]. 이제 신경망의 학습 규모와 관계없이 종국엔 높 은 인식 성능으로 잘 학습된 신경망을 만들 수 있 다. 신경망은 더욱 전문적이고 구체적인 대답을 하 게 될 것이다. 하지만 문제는 하드웨어이다. 잘 만 든 신경망이 서비스 수준까지 이어지려면 가능한 한 짧은 학습시간과 빠른 처리속도, 그리고 낮은 메모리사용량이 요구된다. 하지만 이 모든 것을 오 롯이 하드웨어의 발전에만 맡기기에는 개발 시간 과 비용이 많이 든다. 결국 신경망의 경량화 알고 리즘 연구가 같이 수반되어야 진정한 고속/저비용 학습 반도체를 구현할 수 있다. 본고에서는 경량화 알고리즘의 한 종류인 양자 화를 통한 저정밀 데이터 타입 및 학습 기법의 연 구 동향과 이를 지원하는 AI 반도체 연구 동향에 대해 소개한다. Ⅱ. 저정밀도 학습의 배경 1. 신경망에서의 저정밀도 연산 신경망의 경량화 연구는 다양한 방식으로 진행 되고 있다. 신경망의 불필요한 파라미터를 제거하 는 기법(Pruning), 비슷한 정확도를 내면서 보다 소 규모의 신경망 구조로 재학습하는 기법(Knowledge Distillation), 신경망 연산을 저정밀 데이터 타입으 로 수행하는 기법(Quantization) 등이 널리 연구되 고 있다. 이 중에 가령 GPU와 같은 실제 연산 하드 웨어와 직접적으로 연결되는 경량화 기법은 양자 화(Quantization)이다. 일반적으로 신경망의 연산함 수 입출력에 양자화 모듈을 추가하여 데이터의 포 맷을 변환한다. 그리고 전용 연산함수를 호출한 뒤 출력 데이터 타입을 캐스팅하는 방식으로 신경망 에 구현된다(그림 2). 양자화 기법의 전제 조건은 하드웨어에 해당 저 정밀도 데이터 타입으로 연산 가능한 연산기능 이 탑재되어 있어야 한다는 것이다. 또한 이러한 저정밀 데이터 연산기는 기존의 단정밀도(FP32) 연산기보다 월등히 높은 초당 연산량과 낮은 전 력사용량 특성을 가져야 한다. 이에 기반하여, NVIDIA A100 GPU의 Tensor Core는 총 5가지의 저정밀도 데이터 연산기를 탑재하고 있다[9]. 부 동소수점 연산으로 FP16과 BF16을 지원하고, 정 수 연산으로 INT8, INT4, 그리고 Binary 타입을 지원한다. 따라서 양자화 분야를 연구하는 많은



※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.

List of Articles
번호 분류 제목 K-데이터 판매자
K데이터 무통장 입금을 통한 충전 방법
2169 성장동력산업 방송 코어 망(BCN) 표준화 동향 1도토리 나혜선
2168 성장동력산업 5G 모바일 네트워크의 Industrial IoT 표준기술 동향 1도토리 류지원
2167 성장동력산업 완전동형암호 연산 가속 하드웨어 기술 동향 1도토리 류지원
2166 성장동력산업 Siamese 네트워크 기반 영상 객체 추적 기술 동향 1도토리 류지원
2165 성장동력산업 고성능 분산 합의 알고리즘 동향 분석 1도토리 박민혁
» 성장동력산업 NPU 반도체를 위한 저정밀도 데이터 타입 개발 동향 1도토리 박민혁
2163 성장동력산업 CCIX 연결망과 메모리 확장기술 동향 1도토리 박민혁
2162 성장동력산업 대규모 디바이스의 자율제어를 위한 EdgeCPS 기술 동향 1도토리 나혜선
2161 성장동력산업 휴먼이해 인지컴퓨팅 기술 연구 동향 1도토리 나혜선
2160 성장동력산업 불법 드론 대응을 위한 저고도 드론 탐지 기술 동향 1도토리 류지원
2159 성장동력산업 멀티모달 센서 기반 실외 경비로봇 기술 개발 현황 1도토리 류지원
2158 성장동력산업 공익사업용 토지 등에 대한 양도소득세 감면 7도토리 박민혁
2157 성장동력산업 기업체의 운동경기부 설치 및 운영에 관한 과세 특례 7도토리 이지훈
2156 성장동력산업 농업/임업/어업용 석유류에 대한 간접세 면제 7도토리 이지훈
2155 성장동력산업 도시철도 건설용역에 관한 부가가치세 영세율 7도토리 이지훈
2154 성장동력산업 우정사업본부 등 차익거래를 통한 증권거래세 면제 7도토리 황세영
2153 성장동력산업 일반택시 운송사업자의 부가가치세 납부세액 감경 7도토리 민준석
2152 성장동력산업 재활용폐자원 등에 대한 부가가치세 매입세액 공제 특례 7도토리 민준석
2151 성장동력산업 정비사업조합 설립인가 등의 취소에 의한 채권의 손금산입 7도토리 민준석
2150 성장동력산업 창업중소기업 등에 대한 세액감면 7도토리 황세영