경제용어사전

캐글

[kaggle]

캐글은 데이터과학 및 머신러닝 경진대회를 주최하는 온라인 커뮤니티. 데이터 사이언스나 머신러닝을 공부하는 사람이라면 누구나 한 번쯤은 풀어봤을 ‘타이타닉 생존자 예측’ 문제다. 성별, 연령, 탑승권 가격, 탑승지, 가족의 숫자 등 다양한 데이터와 생존의 상관관계를 찾은 뒤 이를 나머지 탑승객 정보에 적용해 생존 여부를 예측해야 한다. 이 문제를 두고 전 세계의 아마추어부터 전문가까지 수많은 사람이 자웅을 겨루는 플랫폼이 ‘캐글(kaggle)’이다.

캐글은 호주인 앤서니 골드블룸이 경제 전문지 이코노미스트에서 일하다가 빅데이터 전문가 수요가 급증할 것을 예상하고 2010년 만들었다. 인공지능(AI) 개발자들이 이곳에 모여들자 2017년 구글이 인수했다. 현재 1000만 명에 가까운 데이터 사이언티스트, 머신러닝 전문가 등 연구자들이 이용하고 있다.

캐글의 핵심은 경진대회다. 타이타닉 생존자 예측 문제처럼 이용자들이 플랫폼에 적응할 수 있도록 캐글이 자체적으로 진행하는 대회도 있지만 기업들이 상금을 걸고 내놓은 문제가 상당수를 차지한다. 기업은 쌓아놓은 데이터를 어떤 식으로 활용할 수 있을지 알아보기 위해 캐글 플랫폼을 활용한다.

예를 들어 미국 내셔널풋볼리그(NFL)는 미식축구의 주요 포지션인 라인맨을 평가할 수 있는 새로운 지표를 만들기 위해 상금 10만달러(약 1억4000만원)를 내걸었다. 선수 정보, 경기 내 선수의 움직임, 경기 결과 등 다양한 데이터를 활용해 라인맨이 얼마나 경기에 영향을 미쳤는지 측정할 수 있는 규칙을 찾는 게 목표다. 미국 뉴욕주경마협회(NYRA)는 5만달러(약 7000만원)를 걸고 말의 부상을 예방하고 경마 전략을 개선할 수 있는 방안을 찾고 있다.

이 같은 방식으로 기업들은 캐글에서 AI 기술을 얻고 있다. 구글은 AI의 이미지 인식 정확도를 높이는 기술을 찾았고, 마이크로소프트는 멀웨어(악성 소프트웨어) 감지 수준을 높일 수 있었다.

대회에 참가해 좋은 결과를 받은 사람에게는 메달을 준다. 이를 기반으로 캐글 내 등급 랭킹이 매겨진다. 가장 높은 등급인 그랜드마스터는 262명뿐이다.

  • 칼빈슨호[USS Carl Vinson, CVN-70]

    칼빈슨호는 미국 해군에서 건조한 세번째 니미츠급 항공모함으로 미국 해군 발전에 크게 기여한...

  • 컨트리 펀드[Country Fund]

    투자자들의 자금을 모아 특정국가나 지역의 주식, 채권에 투자하는 기금을 말한다. 일본, 유...

  • 콘크리트 소비자[Concrete Consumer]

    광고가 범람하면서 기업들의 마케팅에 무감각해진 소비자를 말한다. 외부 충격에도 반응이 없는...

  • 캐시바이아웃[Cash Buy-Out, CBO]

    기업구조조정 과정에서 채무재조정에 참여하지 않는 채권을 해당 기업이 일정 할인율을 적용, ...