대규모 멀티모달모델
[large multimodal models, LMM]텍스트와 이미지를 통합적으로 이해하고 처리할 수 있는 대규모 언어 모델.
LMM은 텍스트와 이미지를 모두 학습하여 텍스트와 이미지 사이의 경계를 지우고, 텍스트와 이미지를 통합적으로 이해하고 처리할 수 있다.
이는 기존의 LLM보다 더 복잡한 이미지 분석과 추론 능력을 갖추게 하여 다양한 분야에서 활용될 수 있는 잠재력을 가지고 있다.
관련어
- 참조어멀티모달
-
디자인 앤 빌드[design & build]
건설사가 발주 공사의 기획 단계부터 참여, 직접 설계를 실시해 입찰에 참여하고 시공까지 담...
-
다크 이코노미[dark economy]
코로나19 팬데믹(세계적 유행) 이후 매장에서 손님을 받는 방식의 오프라인 운영보다 온라인...
-
둠 스펜딩[Doom Spending]
둠스펜딩은 미래에 대한 불확실성과 경제적 불안감 때문에 일시적 해소를 위해 소비를 하는 심...
-
디지털 포용성 벤치마크[Digital Inclusion Benchmark]
기업이 지속 가능한 경영 관점에서 디지털 기술을 어느 수준으로 연구하고 사회와 얼마나 공유...