경제용어사전

대규모 멀티모달모델

[large multimodal models, LMM]

텍스트와 이미지를 통합적으로 이해하고 처리할 수 있는 대규모 언어 모델.

LMM은 텍스트와 이미지를 모두 학습하여 텍스트와 이미지 사이의 경계를 지우고, 텍스트와 이미지를 통합적으로 이해하고 처리할 수 있다.

이는 기존의 LLM보다 더 복잡한 이미지 분석과 추론 능력을 갖추게 하여 다양한 분야에서 활용될 수 있는 잠재력을 가지고 있다.

관련어

  • 디자인 빌드[design build]

    도시설계부터 자재조달, 시공까지의 모든 건설공정을 한 묶음으로 수주하는 방식

  • 대사성 질환

    비만이나 운동부족, 과잉영양 등 생활습관이 원인이 되는 병으로 당뇨병과 고혈압, 고지혈증,...

  • 디지털 권리장전[Charter of Digital Rights]

    디지털 환경에서 사람들이 가지는 기본적인 권리와 자유를 명시한 문서. 일반적으로 디지...

  • 대체공휴일

    공휴일이 토요일이나 다른 공휴일과 겹치는 경우 그다음 평일을 휴일로 보장하는 제도. 대체공...