제목 [기술동향] 임베디드 시스템을 위한 딥러닝 연산 가속 기술 방향
분류 성장동력산업 판매자 조정희 조회수 275
용량 318.67KB 필요한 K-데이터 1도토리
파일 이름 용량 잔여일 잔여횟수 상태 다운로드
[기술동향] 임베디드 시스템을 위한 딥러닝 연산 가속 기술 방향.pdf 318.67KB - - - 다운로드
데이터날짜 : 2022-01-10 
출처 : 한국정보통신기술협회 
페이지 수 :

1. 머리말 최근 IT 기술의 발전으로 이미지 분류 및 글자/객체 인식 등 다양한 분야에서 딥러닝(deep learning) 기술이 활용되고 있다. 아울러 최근 심층신경망(DNN, Deep Neural Network)에 관한 연구가 활발히 이루어짐에 따라 딥러닝을 활용한 다양한 응용이 실생활에서 널리 사용되고 있다. 딥러닝 연산의 대부분은 벡터 또는 행렬 연산으로 구성된다. 이러한 벡터 또는 행렬 연산과 같은 일반적인 선형 대수 연산을 수행하기 위한 루틴 집합으로서 BLAS(Basic Linear Algebra Subprograms)가 존재한다. B LAS는 Netlib에서 정의한 명세(specification)가 일반적으로 사용되지만, CPU 또는 GPU와 같이 각 HW에 최적화된 다양한 BLAS 라이브러리가 존재한다. 아울러, BLAS 라이브러리와 별개로 cuDNN(NVIDIA CUDA Deep Neural Network Library)과 같이 심층신경망을 구성하는 각 계층(layer)에 대해서 GPU 기반 가속 연산을 수행하기 위한 라이브러리가 존재한다. 한편, 최근 스마트폰과 같은 온디바이스(ondevice) 형태의 임베디드 시스템(embedded system)이 대중화됨에 따라, PC/Server 플랫폼뿐만 아니라 임베디드 시스템을 기반으로 딥러닝을 수행하기 위한 연구가 활발히 진행 중이다. 임베디드 시스템은 일반적인 PC/Server 플랫폼에 비해 매우 적은 용량의 메모리와 고정된 크기의 저장 장치, 그리고 저전력의 프로세스를 탑재하고 있다. 또한, 임베디드 시스템은 CPU와 GPU, 그리고 메모리 구조에서 PC/Server 플랫폼과 연산 처리 구조가 상이할 뿐만 아니라, 시스템의 사용 목적에 따라 다양한 종류의 HW 플랫폼이 존재한다. 또한, 대부분의 임베디드 시스템은 CUDA와 같은 NVIDIA GPU 기반의 병렬 처리 언어를 지원하지 않기 때문에, PC/Server 플랫폼 기반의 BLAS 라이브러리 및 GPU 기반 딥러닝 연산 가속 라이브러리를 활용하지 못하는 한계점이 존재한다. 따라서 임베디드 시스템에서 딥러닝 연산을 효율적으로 수행하기 위해서는 임베디드 시스템에 특화된 딥러닝 연산 가속 기술을 활용해야 한다. 따라서 본고에서는 BLAS와 같은 딥러닝 연산가속 기술의 연구 동향을 파악하고, 임베디드 시스템을 위한 병렬 처리 기술 및 딥러닝 연산가속 기술 동향을 살펴본다. Ⅰ 기술표준이슈 ----• ICT Standard Weekly 제1064호 • ---------------------------------------------------------------2 2. 딥러닝 연산 가속 기술 연구 동향 2.1 딥러닝 연산 기본 구조 딥러닝 수행을 위한 심층신경망은 기본적으로 한 개의 입력 계층(input layer), 여러 개의 은닉계층(hidden layer), 그리고 한 개의 출력 계층(output layer)으로 구성된다. 입력 계층은 학습 또는 추론을 수행하기 위한 입력 데이터를 가지고 있으며, 일반적으로 배열 형태의 부동 소수점 자료형이 입력 데이터로 사용된다. 은닉 계층은 입력 데이터에 대한 추론 연산을 수행하며, 이를 위한 가중치(weight)와 편향(bias)을 가지고 있다. 출력 계층은 입력에 대한 추론 확률을 값으로 가진다. 딥러닝의 연산은 기본적으로 순전파(forward propagation) 및 역전파(backward propagation) 로 구성되어 있다. 순전파는 입력 계층에서 출력계층 방향으로 연산을 수행하며, 역전파는 출력계층에서 입력 계층 방향으로 연산을 수행하면서 가중치와 편향을 보정한다. 추론 시에는 순전파만 수행되며, 학습 시에는 순전파 이후 역전파를 수행한다. 역전파에서는 순전파에서 획득한 추론 결과와 실제 값과의 오차를 통해 가중치와 편향에 대한 경사도(gradient)를 계산한다. 역전파에서는 계산된 경사도를 이용하여 추론 결과와 실제 값과의 오차가 최소가 되도록 가중치와 편향을 보정한다. 이와 같이 심층신경망에서 순전파 수행 시에는 입력 데이터와 가중치, 그리고 편향값에 대한 행렬곱이 주로 이루어지며, 역전파 수행 시에는 은닉 계층의 가중치와 편향에 대한 경사도 계산이 주로 이루어진다. 이처럼 심층신경망을 사용하는 딥러닝 연산의 대부분은 벡터 또는 행렬 연산으로 구성된다. 2.2 딥러닝 연산 가속 기술 BLAS는 연산 데이터 형태에 따라 벡터-스칼라 연산 루틴(LEVEL 1), 행렬-벡터 연산 루틴(LEVEL 2), 행렬-행렬 연산 루틴(LEVEL 3)으로 구분된다. BLAS의 각 루틴은 연산의 정밀도에 따라 단정밀도(single precision), 배정밀도(double precision), 단정밀 복소수(complex precision), 배정밀 복소수(double complex precision)로 구분된다. 이중 심층신경망에서는 주로 단정밀도 연산이 사용되며, 단정밀도 연산은 LEVEL 1에 14개, LEVEL 2에 16개, LEVEL 3 에 6개의 연산이 존재한다. 은 딥러닝에서 사용되는 대표적인 BLAS 연산 루틴을 나타내며, [그림 1]은 대표적인 딥러닝 기술인 합성곱 신경망(CNN, Convolutional Neural Network)에서 BLAS 연산이 사용되는 예시를 나타낸다. AXPY는 스케일 계층(scale layer)과 요소곱 계층(eltwise layer), SCAL은 스케일 계층, GEMV는 배치 정규화 계층(batch normalization layer), 그리고 GEMM은 합성곱 계층(convolution layer)과 완전하게 연결된 계층(fully connected layer)에서 주로 사용된다. 한편, GEMV와 GEMM은 행렬의 전치(transpose) 여부에 따라 연산이 구분된다. 즉, GEMV는 행렬 A의 전치 여부(true or false)에 따라 2개의 연산(GEMV_T, GEMV_N)으로 구분되며, GEMM은 행렬 A, B의 전치여부에 따라 4개의 연산(GEMM_NN, GEMM_NT, GEMM_TN, GEMM_TT) 으로 구분된다.



※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.

List of Articles
번호 분류 제목 K-데이터 판매자
K데이터 무통장 입금을 통한 충전 방법
4244 성장동력산업 [산업분석] 은행_호재, 악재, 혼재 5도토리 오민아
4243 성장동력산업 [산업분석] 전기전자분야_2차전지 전기차시대 9도토리 오민아
4242 성장동력산업 [산업분석] 전기전자분야_월간 디스플레이 패널 동향 5도토리 오민아
4241 성장동력산업 [산업분석] 에너지분야_풍력, 부유식 해상풍력 파이프라인 두 배 확대 3도토리 오민아
4240 성장동력산업 [산업분석] 국제유가, 2023년 100~120달러/배럴 전망 7도토리 오민아
4239 성장동력산업 [산업분석] 기계/로보틱스분야_일본 공작기계 통계: 해외 수주의 일시적 반등 3도토리 오민아
4238 성장동력산업 [산업분석] 인터넷/게임분야_Tipping Point 9도토리 오민아
4237 성장동력산업 [기업분석] POSCO홀딩스_새옹지마를 기대해보자 3도토리 한상윤
4236 성장동력산업 [기업분석] SK바이오사이언스_ 3Q22 Preview, 4Q로 연기된 매출과 제한적인 업사이드 1도토리 한상윤
4235 성장동력산업 [기업분석] 카카오게임즈_고 per는 부담, 신작 모멘텀 3도토리 한상윤
4234 성장동력산업 [기업분석] 엔씨소프트_우려 대비 견조한 실적 1도토리 한상윤
4233 성장동력산업 [기업분석] 카카오_이익 반등이 주가 반전의 선결 조건 3도토리 이지훈
4232 성장동력산업 [산업분석] 자동챠분야_Tesla AI Day 2022 : 최고의 AI 회사로의 발돋움 3도토리 이지훈
4231 성장동력산업 [산업분석] 에너지분야_APPEC 2022 싱가포르 참관기 9도토리 이지훈
4230 성장동력산업 [산업분석] 철강분야_22.4Q 전망, 고난 속 행군 7도토리 이지훈
4229 성장동력산업 [산업분석] 반도체분야_메모리 산업 동향 업데이트 1도토리 이지훈
4228 성장동력산업 [산업분석] 모빌리티분야_9월 현대차/기아 판매 실적 3도토리 이지훈
4227 생명공학/바이오 [기업분석] JW중외제약_ 3Q22 Preview, Seize the day 1도토리 정한솔
4226 성장동력산업 [기업분석] 스튜디오드래곤_모든 요소 순항 중 3도토리 정한솔
4225 성장동력산업 [기업분석] 크래프톤_TCP 히트 여부/규모에 대한 판단 및 의사결정 필요 3도토리 정한솔