강화학습

경제용어사전

가나다순 색인
ㄱ
ㄴ
ㄷ
ㄹ
ㅁ
ㅂ
ㅅ
ㅇ
ㅈ
ㅊ
ㅋ
ㅌ
ㅍ
ㅎ
ABC

[Reinforcement Learning]

강화학습(Reinforcement Learning)은 컴퓨터(에이전트)가 문제(환경)를 해결하기 위해 스스로 경험하며 학습하는 머신러닝 기법이다. 시행착오를 통해 행동의 결과로 얻는 보상을 최대화하는 방향으로 학습이 진행되며, 명시적인 정답이 주어지지 않고 에이전트가 경험을 바탕으로 최적의 전략(정책)을 스스로 찾아낸다.

게임에서 승리하기 위해 여러 번 도전하고 전략을 개선하듯, 컴퓨터도 잘한 행동에는 보상을 받고, 잘못된 행동에는 페널티를 받으며 점점 더 효율적인 의사결정을 하게 된다.

지도학습과 달리 라벨링된 데이터가 필요하지 않으며, 환경과의 지속적인 상호작용을 통해 최적의 정책을 학습한다. 이 과정에서 이용과 탐험(exploitation vs. exploration)의 균형을 유지하는 것이 중요하다.

강화학습은 게임 AI, 로봇 제어, 자율주행, 추천 시스템, 금융 모델링 등 다양한 분야에서 자율적인 의사결정을 위한 핵심 기술로 자리 잡고 있다.

그린 슈트[Green shoots]
겨울에 얼어붙었던 땅을 뚫고 봄에 새싹(green shoots)이 돋아나듯 경기가 침체에서...
그린 오션[Green Ocean]
환경분야에서 신흥 시장을 창출하자는 새로운 경영 패러다임이다. 경쟁이 치열해져 수익성이 떨...
개인소득[personal income]
모든 소득원천으로부터 개인이 수령하는 경상소득액.정부와 기업으로부터의 이전지급은 포함하나 ...
글로벌자금관리서비스[Global Cash Management Service, GCMS]
글로벌 기업이 유휴자금 최소화를 위해 전세계 영업장에서 발생하는 잉여 부족자금을 한 곳(모...