경제용어사전

인공지능 정렬

[AI Alignmen]

인공지능(AI) 시스템의 목표와 행동을 인간의 가치 및 의도와 일치시키는 연구 분야다. AI가 주어진 목표를 수행하는 과정에서 인간의 의도를 벗어나 유해한 결과를 초래하거나, 통제 범위를 이탈하지 않도록 설계·관리하는 기술적·제도적 체계를 포괄한다.

구조적으로는 모델 개발 단계에서 가치를 학습시키는 **전방향 정렬(Forward Alignment)**과 배포 후 모니터링 및 거버넌스를 통해 검증하는 **후방향 정렬(Backward Alignment)**로 구분된다. 핵심 기술 지표로는 예외 상황에서의 안정성을 뜻하는 강건성(Robustness), 의사결정 경로의 투명성을 의미하는 해석가능성(Interpretability), 상시 개입과 수정이 가능한 **통제가능성(Controllability)**이 꼽힌다.

최근 금융·의료 등 고위험 분야에서 AI 도입이 가속화됨에 따라, 오작동이나 편향에 따른 경제적 손실 및 사회적 위험을 방지하기 위한 필수 안전장치로 부상했다. 이는 글로벌 규제 당국과 기술 기업이 해결해야 할 당면 과제로 평가된다.

  • 업무상재해

    근로자가 업무의 수행 또는 그에 수반되는 통상적인 활동을 하는 과정에서 입게되는 부상·질병...

  • 연작장애

    일반적으로 한 작물을 같은 장소에 매년 반복해서 재배할 경우 작물의 생육환경이 나빠져 수확...

  • 인덱세이션[indexation]

    물가연동제를 말한다. 임금·금리 등을 정할 때 일정한 방식에 따라 물가에 연동시키는 정책으...

  • 유량변수

    ‘일정 기간’에 측정되는 지표로 소득, 수요량 및 공급량, 국내총생산(GDP), 국제수지 ...