제목 [산업동향] 대형 멀티모달 모델(LMM) 산업의 현황 보고서
분류 성장동력산업 판매자 국준아 조회수 32
용량 17.01MB 필요한 K-데이터 7도토리
파일 이름 용량 잔여일 잔여횟수 상태 다운로드
[산업동향] 대형 멀티모달 모델(LMM) 산업의 현황 보고서.pdf 17.01MB - - - 다운로드
데이터날짜 : 2024-10-02 
출처 : 국책연구원 
페이지 수 : 23 

대형 멀티모달 모델(LMM) 벤치마크 동향 조사

 

대형 멀티모달 모델(Large Multimodal Model, LMM)은 대형 언어 모델(Large Language Model, LLM)에 시각, 청각 등의

멀티모달 정보를 통합하여 학습한 거대 인공지능 모델을 말한다.

 

LMM은 LLM의 강력한 언어 이해와 생성 능력을 바탕으로 멀티모달 데이터를 대규모로 학습함으로써 다중감각을 아우르는

이해와 생성 능력을 획득하게 된다.

 

LMM은 GPT-3, PaLM 등의 LLM처럼 수십억 ~ 수백억 개의 파라미터를 가진 거대 모델로서 방대한 양의 다중감각 결합 데이터를

사전 학습하고 명령어 조정(Instruction Tuning)이나 맥락 내 학습(In-Context Learning) 등의 기법을 통해 활용된다.

LMM은 다중감각 정보를 포함한 데이터를 대상으로 다양한 과업을 수행할 수 있다.

 

예를 들어, LMM의 대다수를 차지하는 시각-언어모델(VLM: Vision-Language Model)이 수행할 수 있는 과업은 광범위한 분야를

대상으로 한 시각 질의응답(Visual Question Answering), 이미지 캡셔닝(Image Captioning), 비디오 요약(Video Summary),

텍스트 기반 이미지 생성 (Text-to-Image Generation) 등을 포함한다.

 

최근 주요 대형 언어 모델들이 다양한 멀티모달 데이터를 처리할 수 있도록 확장되고 있다. OpenAI의 GPT- 4V02)와 GPT-4o03), Anthropic의 Claude 304), Google의 Gemini 1.505) 등이 대표적인 예이다.

전반적으로 대형 인공지능 모델의 발전 방향은 멀티모달 모델로 빠르게 옮겨가고 있으며, 다양한 산업 분야에서의 활용 가능성을

크게 높이고 있다.

 

LMM 연구가 빠르게 발전하면서 다양한 모델들이 쏟아져 나오고 있지만, 정작 이 모델들의 성능을 종합적으로 평가할 수 있는

벤치마크는 부족한 상황이다.

 

기존의 단순한 이미지 분류나 캡셔닝 데이터셋으로는 LMM의 높은 수준의 시각-언어 이해와 추론 능력을 평가하기에 역부족이다.

또한 각 LMM마다 사전학습에 사용한 데이터가 제각각이라 동일한 조건에서의 공정한 비교가 어려운 문제점도 있다.

새로운 LMM이 기존 모델 대비 어떤 장단점이 있는지, 성능이 실제 응용에 적용 가능한 수준인지 객관적으로 판단하기가
쉽지 않기도 하다.

 

 

 

 

 

 

 

 

 

 

 

 

---------------------------------------------------------------------------------------------------------------------------------------------------------

 

 

 

 

 

 

lmm.jpg

 

 

 

 

 

 

 

 

 

 

 

 



※ 본 서비스에서 제공되는 각 저작물의 저작권은 자료제공사에 있으며 각 저작물의 견해와 DATA 365와는 견해가 다를 수 있습니다.

List of Articles
번호 분류 제목 K-데이터 판매자
K데이터 무통장 입금을 통한 충전 방법
9411 성장동력산업 [시장분석] 싱가포르, 자율주행 시장의 현황과 전략 3도토리 국준아
9410 성장동력산업 [시장동향] 캐나다, 기어박스 부품과 트렌드 3도토리 국준아
9409 성장동력산업 [시장동향] 우즈베키스탄, 전기차 트렌드 3도토리 국준아
9408 성장동력산업 [시장동향] 베트남, 24년 알루미늄 합금 현황 3도토리 국준아
9407 성장동력산업 [산업분석] 베트남, 24년 커피 현황 정보 3도토리 국준아
9406 성장동력산업 [산업분석] 물리정보 신경망의 발견과 현재 현황 및 미래 조사서 5도토리 국준아
9405 성장동력산업 [산업분석] 뉴질랜드, 24년 건설 업계의 현황 보고서 3도토리 국준아
9404 성장동력산업 [산업분석] AI 산업 발전 및 규제 불확실성 해소를 위한 전략 3도토리 국준아
9403 성장동력산업 [산업동향] 캐나다 핀테크, 정부 정책과 기술발전으로 성장하다 3도토리 국준아
9402 성장동력산업 [산업동향] 이미지영상 처리와 인공지능 기술의 사례 현황 및 미래 5도토리 국준아
9401 성장동력산업 [산업동향] 스마트 시티 건설로 확인하는 오만의 전망 3도토리 국준아
9400 성장동력산업 [산업동향] 미얀마, 전력산업의 현재와 미래 3도토리 국준아
9399 성장동력산업 [산업동향] 미얀마, 농업 생산현황과 미래 3도토리 국준아
9398 성장동력산업 [산업동향] 러시아, 건축용 접착제의 수요증가 3도토리 국준아
9397 성장동력산업 [산업동향] 러시아, 24년 자동차업계의 현황 3도토리 국준아
» 성장동력산업 [산업동향] 대형 멀티모달 모델(LMM) 산업의 현황 보고서 7도토리 국준아
9395 성장동력산업 [산업동향] 국내 상장기업의 소유구조와 특징 7도토리 국준아
9394 성장동력산업 [산업동향] 6G 무선 통신 시스템의 포지셔닝과 센싱 7도토리 국준아
9393 성장동력산업 [시장동향] 24년 호주, 의료기기와 의약품 시장업계의 현화과 진출 현황 13도토리 강정훈
9392 성장동력산업 시장동향] 브라질, 대형 브랜드, Z세대 소비에 맞춤 전략 3도토리 강정훈