경제용어사전

멀티모달

[multi modal]

텍스트, 이미지, 음성, 영상 등 다양한 데이터 양식 (modality)을 함께 처리하는 것을 의미한다.

멀티모달 시스템은 텍스트, 이미지, 오디오, 비디오 등 다양한 유형의 입력을 동시에 처리할 수 있는 능력을 가지고 있다.

따라서 멀티모달 AI는 하나의 모달리티를 활용하는 것보다 다양한 작업을 수행할 수 있다.

예를 들어, 이미지로 텍스트 검색을 하거나 텍스트에서 이미지를 검색, 혹은 이미지와 텍스트를 같이 이해하는 멀티모달 검색이 가능하다. 또한 2023년 등장한 대규모멀티모달모델(LMM)은 이미지를 보고 텍스트를 생성하거나 텍스트 기반으로 이미지를 생성하기도 한다.

멀티모달 AI는 인간의 자연스러운 의사소통 방식을 모방한 기술로, 사용자와 컴퓨터 간의 상호 작용을 더욱 자연스럽고 직관적으로 만든다. 또한, 다양한 데이터 모달리티를 활용함으로써 더 많은 정보를 처리하고 더 정확한 결과를 도출할 수 있다.

관련어

  • 망중립성과 프리 라이딩[network neutrality & free riding]

    망중립성은 이동통신사 같은 통신망 제공업자뿐만 아니라 콘텐츠 사업자들도 유 · 무선 인터넷...

  • 멀티플 익스팬션[multiple expansion]

    주가의 수준을 가늠하기위해 주가수익비율 (PER) 등을 종합적으로 감안하는 것. 낮을수록 ...

  • 미국 고속도로교통안전국[National Highway Traffic Safety Administration, NHTSA]

    1970년 설립된 미국운수부산하조직. 자동차 완성품과 에어백 등의 부품은 물론 오토바이 유...

  • 무상주[stock dividend without consideration]

    주주에게 주식대금 납입의무 없이 무상으로 발행하여 나누어주는 주식을 말하며 무상주 발행으로...