대규모 멀티모달모델
[large multimodal models, LMM]텍스트와 이미지를 통합적으로 이해하고 처리할 수 있는 대규모 언어 모델.
LMM은 텍스트와 이미지를 모두 학습하여 텍스트와 이미지 사이의 경계를 지우고, 텍스트와 이미지를 통합적으로 이해하고 처리할 수 있다.
이는 기존의 LLM보다 더 복잡한 이미지 분석과 추론 능력을 갖추게 하여 다양한 분야에서 활용될 수 있는 잠재력을 가지고 있다.
관련어
- 참조어멀티모달
-
데미스 하사비스[Demis Hassabis]
영국의 인공지능 과학자이자 구글 딥마인드의 대표. 1976년 7월 27일 영국 북런던에...
-
대표성편견[Representation Bias]
주식의 분석에 있어서 모든 거래 가격의 데이터를 분석하는 것은 불가능하기 때문에 사람들은 ...
-
다목적 차량[multi-purpose vehicle, MPV]
승객수송과 화물수송의 2중 역할을 수행할 수 있도록 설계된 다목적 차량을 말한다. RV, ...
-
독립몰수제[independent confiscation]
범죄자의 해외 도주나 사망 등의 이유로 재판 진행이 불가한 사건 또는 최종 유죄판결이 나오...