대규모 멀티모달모델
[large multimodal models, LMM]텍스트와 이미지를 통합적으로 이해하고 처리할 수 있는 대규모 언어 모델.
LMM은 텍스트와 이미지를 모두 학습하여 텍스트와 이미지 사이의 경계를 지우고, 텍스트와 이미지를 통합적으로 이해하고 처리할 수 있다.
이는 기존의 LLM보다 더 복잡한 이미지 분석과 추론 능력을 갖추게 하여 다양한 분야에서 활용될 수 있는 잠재력을 가지고 있다.
관련어
- 참조어멀티모달
-
도지코인[dodge coin]
2013년 소프트웨어 개발자 빌리 마커스(Billy Markus)와 잭슨 팔머(Jackso...
-
도매물가지수[wholesale price index, WPI]
도매단계에서의 물가수준의 변동을 나타내는 지수. 일정한 시기를 100으로 하며 퍼센트로 나...
-
동일계열기업군 여신한도제
이 제도는 도산위험을 공유하는 동일 계열기업군에 대한 개별은행의 여신취급액이 당해은행 자기...
-
도시형 생활주택
1~2인 가구가 늘어나면서 수요가 증가한 소형주택을 도심에 많이 짓도록 유도하기 위해 도입...