경제용어사전

대규모 멀티모달모델

[large multimodal models, LMM]

텍스트와 이미지를 통합적으로 이해하고 처리할 수 있는 대규모 언어 모델.

LMM은 텍스트와 이미지를 모두 학습하여 텍스트와 이미지 사이의 경계를 지우고, 텍스트와 이미지를 통합적으로 이해하고 처리할 수 있다.

이는 기존의 LLM보다 더 복잡한 이미지 분석과 추론 능력을 갖추게 하여 다양한 분야에서 활용될 수 있는 잠재력을 가지고 있다.

관련어

  • 도심재생[urban regeneration]

    인구 감소와 경제 침체, 주거 환경 악화 등으로 쇠퇴하는 도심 지역을 새로운 기능을 도입하...

  • 대수선

    건축물의 기둥, 보, 내력벽, 주계단 등의 구조나 외부 형태를 수선 · 변경하거나 증설하는...

  • 디지털 리터러시[digital literacy]

    인터넷, 스마트폰, 소셜 미디어, 클라우드 컴퓨팅, 빅데이터 등 다양한 디지털 기술과 도구...

  • 대사성 질환

    비만이나 운동부족, 과잉영양 등 생활습관이 원인이 되는 병으로 당뇨병과 고혈압, 고지혈증,...