제목 | [산업분석] 인공지능 학습 데이터 공유 및 활용 동향과 서비스 구축 방향 |
---|
분류 | 성장동력산업 | 판매자 | 장민환 | 조회수 | 68 | |
---|---|---|---|---|---|---|
용량 | 4.64MB | 필요한 K-데이터 | 5도토리 |
파일 이름 | 용량 | 잔여일 | 잔여횟수 | 상태 | 다운로드 |
---|---|---|---|---|---|
[산업분석] 인공지능 학습 데이터 공유 및 활용 동향과 서비스 구축 방향.pdf | 4.64MB | - | - | - | 다운로드 |
데이터날짜 : | 2022-12-26 |
---|---|
출처 : | 국가과학기술데이터본부 |
페이지 수 : | 20 |
- 목차 -
1. 과학기술 인공지능 데이터 공유, 활용 체계의 필요성
2. 인공지능 관련 서비스 및 공유 현황
3. KISTI 인공지능 데이터 공유, 활용서비스 구축 방향
4. 맺음말과 제언
- 요약-
인공지능 기술의 급속한 발전과 보급으로 다양한 분야에서 인공지능 학습데이터, 모델, 소스코드 등을 공유 및 활용하기 위한 노력이 활발하다. 특히, 증가하는 인공지능 수요에 대응하기 위해 기존의 전문가에 의한 모델 개발 중심에서 대규모 데이터 및 AI 개발 중심으로 변화하고 있으며 다양한 학습 데이터셋이 생산 및 공개되고 있다. 하지만, 이러한 학습 데이터셋의 효과적인 활용을 위한 다양한 지원 환경과 체계는 고려하고 있지 않다. 이렇듯 양적 성장이 이루고 있는 인공지능 학습데이터와 인공지능 연구의 산출물(모델, 소스코드 등)에 대하여 통합, 관리, 재현할 수 있는 통합적인 체계의 구축은 매우 의미가 있다. 따라서, 다양한 사회현안 및 과학연구 지원을 위한 인공지능의 수요는 더욱더 폭발적으로 증가할 것으로 예상되며 이를 효과적으로 지원하기 위한 고품질의 학습데이터, 학습모델, 소스코드 등의 효과적인 공유·활용 지원을 위한 지속적인 노력과 인공지능 생태계 구축이 필요하다.
1,
과학기술 인공지능 데이터 공유·활용 체계의 필요성 ● 인공지능 기술은 과학기술과 산업기술 영역의 성장을 가속하는 혁신의 조력자(Enabler) 역할 수행 - 인공지능은 명령어 집합인 모델과 모델의 성능확보·강화를 위해 학습하는 데이터, 대용량 연산에 필수적인 컴퓨팅 자원을 통해 구현 - 장기간 연구가 필요로 하는 분야(물리실험, 신약개발 등)에 AI 기술을 적용하여 시간, 비용 등을 획기적으로 단축하여 신제품 서비스의 연구개발 촉매제 역할 수행 1) 인공지능 도입·운용 시 어려운 점(‘20, KDI): 데이터 부족(36.1%) > 예산·인력 부족(30.6%) 2)NeurIPS(Neural Information Processing systems, 신경정보처리시스템학회)는 ICML, ICLR 등과 함께 세계적인 머신러닝 및 AI 학회다 3)학습용 데이터 이미지가 많을수록 객체 분류 인공지능의 정확도 향상(‘20, 구글)되고, 국내 AI·데이터 기업은 AI 개발시간의 80%, 비용의 75%가 데이터 확보에 소요 된다고 응답(‘20, NIA) - 선진국은 기업·플랫폼을 중심으로 데이터 구축 및 활용이 활성화되고 있으나, 우리나라는 기업과 시장이 태동 중이며 데이터 부족 문제1)를 지속적으로 제기 ● AI 기술은 알고리즘 및 프로그램 개발 중심에서 대규모 학습데이터를 활용한 기술개발 방식으로 전환되고 있음 - 최근 기계학습 연구자들은 AI 시스템의 성능을 높이기 위해 학습 모형 또는 알고리즘 개선보다는 양질의 데이터를 지속적인 수집, 구축, 활용을 주목하고 있음 - 세계적인 AI 학술대회인 NeurIPS2) 2021에서도 data-centric AI 트랙이 신설되었고, 앤드류 응(Andrew Ng) 교수도 AI 시스템 개선을 위해서는 모델(코드) 중심에서 데이터 중심의 MLOps로 전환을 강조함 - 대량의 데이터 학습은 모델 성능 향상으로 직결되나 데이터 확보 및 가공에 많은 시간과 비용이 소요3)되어 다양한 양질의 데이터 확보가 중요한 선결과제임
※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.