제목 | [산업분석] 바이오 및 빅데이터분야_ 국가 바이오 빅데이터 인프라 발전 방향 |
---|
분류 | 성장동력산업 | 판매자 | 강정훈 | 조회수 | 63 | |
---|---|---|---|---|---|---|
용량 | 930.57KB | 필요한 K-데이터 | 5도토리 |
파일 이름 | 용량 | 잔여일 | 잔여횟수 | 상태 | 다운로드 |
---|---|---|---|---|---|
[산업분석] 바이오 및 빅데이터분야_ 국가 바이오 빅데이터 인프라 발전 방향.pdf | 930.57KB | - | - | - | 다운로드 |
데이터날짜 : | 2023-06-28 |
---|---|
출처 : | 국책연구원 |
페이지 수 : | 16 |
1. 국가 바이오 빅데이터 인프라 구축 배경
· 바이오 빅데이터 인프라 개요
· 바이오 빅데이터 인프라 구축의 필요성
2. 국내외 바이오 인프라 투자전략
· 국내 바이오 인프라 투자 전략
· 국내 바이오 데이터 인프라 구축 동향
· 해외 바이오 인프라 투자 전략
· 해외 바이오 데이터 인프라 구축 동향
3. 국가 바이오 빅데이터 인프라 발전 방향
· 데이터 생산 부문 인프라 발전 방향
· 데이터 저장·유통 부문 인프라 발전 방향
· 연구 및 산업 주체별 활용을 위한 인프라
발전방향
4. 시사점 및 제언
바이오 빅데이터 인프라 개요
● (기본 개념) 바이오 빅데이터는 바이오 연구 수행을 통해 생산, 활용되는 모든 빅데이터를 의미하며 주로
다양한 생물체의 실물에서 도출되는 전체 정보를 뜻함
※ 바이오 연구 소재(인체유래물, 동·식물, 미생물, 병원체 등 연구에 활용되는 실물소재)에서 산출되는 유전체,
전사체, 구조 데이터 등과 의료활동 및 시험을 통해 산출되는 임상·전임상 정보, 생활(라이프로그)정보를 포함
하는 개념
※ 생명연구자원법상 바이오 연구 소재와 이로부터 도출된 데이터 및 관련 정보를 생명연구자원으로 규정하여 관리
하고 있음
-바이오 빅데이터 인프라는 국가 차원에서 수집, 보유, 관리되는 바이오 빅데이터를 활용하는데 필요한 기술과 시스템
으로 구성되는 인프라를 의미
-특히 다양한 분야의 바이오 빅데이터를 종합적으로 수집하고 분석하는데 필요한 시스템 및 공유·개방을 위한 데이터
서비스 등 제반 활용 기반을 포함함
● (바이오 빅데이터의 특징) 기존 빅데이터 대비 바이오 빅데이터는 다음과 같은 특징을 지니고 있어 데이터
처리 및 분석을 위한 별도의 인프라 구축이 요구됨
-(데이터 규모와 복잡도) 타 분야 대비 크기 측면에서 대규모의 빅데이터를 다루며 다양한 데이터 형식과 복잡도를
가지고 있음
※ 인간 게놈 데이터는 30억개의 염기쌍, 약 2만 개의 유전자로 구성되어, 단위 샘플당 전장유전체 약 120GB,
전사체 10GB, 메타지놈 20GB가 생산1). 유전체, 단백질, 대사체 등 데이터 차원도 매우 높아 수백만~수십억개의
관측치 및 수천~수백만개의 특성(feature)을 가질 수 있음
※ 연구 목적과 방법에 따라 다르나 유전체 분석의 경우, 100명 이상의 샘플 데이터로 분석하는 것이 신뢰성을 보장하는
최소 규모로 알려져 있음. 일례로 2020년 Nature에 발표된 “Pan-Cancer Analysis of Whole Genomes”
연구에서는 2,658명의 참여자 데이터로 2.4PB 규모의 데이터 분석이 수행된 바 있음
-(데이터 유형의 다양성) 바이오 빅데이터는 분석 대상에 따라 다양한 형태의 정보가 수집될 수 있음. 개인을 기준
으로 볼 때 임상정보, 유전체·오믹스(단백체, 대사체, 전사체) 데이터, 생체 신호, 의료 영상 등 다양한 데이터가 생산
되며 이러한 이종 데이터를 통합하여 분석해야 함. 따라서 데이터 분석에 앞서 데이터 표준화 및 통합 이슈를 선결
해야 하는 경우가 많음
-(고도의 정보보호 수준) 바이오 데이터는 개인정보를 포함하고 있기 때문에 정보 보호를 위한 데이터 보안이 필요
하며 이를 해결하기 위해서 안전한 데이터 저장 및 처리 시스템과 엄격한 보안 프로토콜이 필요
※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.