[SIRI=이수영 기자] 통계; 어떤 현상을 종합적으로 한눈에 알아보기 쉽게 숫자로 나타냄. 또는 그런 것. 집단적 현상이나 수집한 자료의 내용에 관한 수량적 기술.

사회, 경제 환경이 빠르게 변화하고 복잡해짐에 따라 정확한 의사결정을 위한 정보로써 통계의 중요성이 날이 갈수록 높아지고 있다.

보다 정확하고 신뢰받는 국가 통계의 생산과 지역 특성에 맞는 통계 개발 및 확충은 통계청의 오랜 사명이기도 하다.

오늘날 통계의 테두리에서 벗어날 수 있는 분야는 없다. 가령 광고계에서는 광고 기획부터 수익 산출까지 전 과정에 통계 결과가 이용되며, 그 흔하디흔한 주식 시장은 하나부터 열까지 모두 통계다.

흥미로운 건 스포츠도 예외가 아니라는 사실이다. 단순 스코어를 비롯한 경기 내부 통계에서부터 멀리는 인공지능을 통한 결과 예측까지 스포츠에서 통계는 더 이상 숫자놀음이 아니다.

스포츠 팬이라면 한 번쯤은 들어봤을 영화 <머니볼> 속 나타난 빌리 빈의 데이터 추구 ‘머니볼 이론’의 대성공이 이를 대변한다.

그러나 과연 통계를 무조건 믿어도 될까? 객관적 지표인 통계에 의문을 품다니, 다소 아이러니할 수도 있다.

하지만 통계에도 수많은 오류와 함정들이 있다. 특수한 몇몇 경험을 전체적인 사회현상으로 일반화시키는 ‘성급한 일반화의 오류’가 있는가 하면, 통계로 사회를 객관적으로 확인할 수 있지만 결국 해석하는 건 사람이기에 여기서 차이가 나타날 수밖에 없다.

더불어 우리가 학창 시절 수없이 배웠던 평균의 오류; 다시 말해 대푯값으로 평균만을 맹신하기보단 평균, 중앙값, 최빈값 등 여러 지표 중 파악하고자 하는 현상에 가장 부합하는 지표를 대푯값으로 해석해야 한다는 점 역시 통계의 함정을 보여주는 경우다.

축구도 예외는 아니다. 우리는 축구를 보며 다양한 통계를 접하고, 이를 통해 결과를 예측하며 선수와 팀의 가치를 평가한다. 그러나 축구 속 통계에도 여러 함정이 있기 마련이다.

필자는 종종 축구 경기, 나아가 경기 후 실시간으로 업로드되는 각종 결과 지표들을 보면서 과연 이 자료들이 단편적인 정보만을 담아내는 건 아닌가 하는 회의적 반응을 보였다.

특히 기존 지표보다 더 현실적이고 직접적인 경기 흐름을 담아내기 위해 개발된 ‘신 지표’ 역시 해석하는 관점에 따라 어디까지나 의심할 여지가 충분했다.

따라서 이번 칼럼에서는 이런 ‘축구 속 통계의 함정’을 총 세 가지 예를 통해 이야기하고자 한다.

1/ 기댓값의 함정

 

기댓값은 최근 축구계에서 가장 핫 한 경기 결과 지표다.

기댓값은 단순 스코어가 경기 전체를 요약하기에는 비교적 불충분하다고 판단한 축구 전문가들이 새로이 개발한 지표다. 이 지표들은 엄청난 데이터를 기반으로 특정 위치와 특정 상황에서 각각의 확률을 일일이 계산한다.

축구 전문 통계 사이트 옵타(OPTA)가 지난 2017년 소개한 영상에 따르면 xG(기대 득점)의 경우 총 30만 회 이상의 슈팅 데이터로부터 특정 상황과 위치에서 득점으로 연결될 가능성을 계산하며, 이는 좋은 슈팅과 기회 창출을 얼마나 많이 했는지를 반영한다.

기댓값의 등장은 어쩌면 당연했다. 당연하게도 실제 득점과 실점에는 언제나 예기치 못한 운의 요소가 가미되기 마련이고, 만약 이 운의 요소가 경기 승패를 좌우하는 결정타가 된다면 스코어만이 온전히 90분 경기를 요약하기에는 무리가 있을 것이다.

가령 A팀이 B팀에 50개의 슈팅을 퍼부었지만, 무득점에 그치고 수비수의 실책으로 1실점을 헌납해 0-1 패한 경우를 가정해보자. 결과는 돌이킬 수 없겠지만, 그렇다고 B팀이 경기를 주도했다고 말하기에는 다소 어려움이 있을 테다.

그렇기에 실제 경기를 보다 구체적으로 반영하는 기댓값의 존재는 분명 유의미한 지표다.

그러나 필자는 한 걸음 더 생각해봤다. 과연 기대 득점이 상대 팀보다 높다고 해서 언제나 경기를 더 잘 치렀다고 이야기할 수 있을까?

축구에는 결과에는 나타나지 않는 ‘전술’의 요소가 녹아 있다. 만약 승리가 절실한 A팀이 압도적인 경기력으로 선제 득점에 성공한 뒤, 수비 전술로 변화를 단행해 이전보다 많은 공격 기회를 헌납할지언정 실점하지 않겠다는 목표를 세워 결국 승리를 따냈다고 가정해보자.

이 경우 A팀은 초반 전술 성공으로 인해 선제 득점을 뽑아냈고, 이후 단행한 전술 변화 역시 무실점이라는 목표를 달성하며 결과적으로 완벽한 경기를 했다고 볼 수 있다.

그러나 여기서 기댓값을 보게 되면 B팀이 A팀보다 높은 xG값을 가질 가능성이 농후하다. A팀이 수비 전술로 돌린 후 상대적으로 B팀에게는 공격 찬스가 많이 주어졌을 것이기 때문이다.

만약 기대 득점만으로 어느 팀이 경기를 더 잘했는지 판단한다면 경기를 본 사람들 입장에서는 아이러니한 생각이 들 수도 있는 셈이다.

2/ 히트맵의 함정

히트맵(Heat Map)은 열을 뜻하는 히트(heat)와 지도를 뜻하는 맵(map)을 결합한 단어로, 색상으로 표현할 수 있는 다양한 정보를 일정한 이미지 위에 열 분포 형태의 비주얼한 그래픽으로 출력한 지도다.

축구에서는 히트맵을 통해 선수가 어느 위치에서 얼마나 오래 볼을 터치했는지 파악할 수 있다. 공을 잡은 빈도가 높을수록 파란색 > 초록색 > 노란색 > 빨간색 순으로 색상이 변화하며, 히트맵을 통해 팀의 플레이 위치, 방향, 빈도 등을 유추할 수 있다.

그러나 여기서도 한 가지 의문점이 든다. 히트맵 역시 사진 하나로만 표현된다. 만약 A 선수가 우측 윙어로 선발 출장했지만, 전술 변화로 좌측 미드필더로 위치를 바꾸고 급기야 골키퍼의 예기치 못한 퇴장으로 인해 골키퍼로 포지션을 변경하게 되는 극단적인 경우를 생각해보자.

이 선수의 히트맵은 경기장 전체에 찍혀 있을 것이다. 그렇다고 단순히 이 선수가 경기장 전체를 누빌 만큼의 엄청난 활동량을 보여줬다고 판단할 수 있을까?

히트맵 역시 경기장 내부 전술 변화 같은 이차적인 요소를 고려하지 못한다. 단순히 경기 해석의 참고용일 뿐이다. 그래서 요즘은 에버리지 포지션 같은 다른 통계 이미지와 접목해 다차원적인 해석을 선호하는 경향이 짙다.

3/ 스코어의 함정

브라질월드컵에서의 독일 7-1 브라질 경기, 지난 시즌 프리미어리그 14라운드 맨유 9-0 사우샘프턴 경기. 간혹 축구를 보다 보면 충격적일 만큼 예상하지 못한 스코어 참사가 벌어지곤 한다.

특히 전자인 독일과 브라질의 경우, 개최국 브라질의 우세를 점치는 사람도 많았을 정도로 팽팽한 경기가 예상됐기에 브라질의 6점 차 패배는 충격 그 자체였다.

그런데 과연 여기서 6점 차, 더 나아가 9점 차의 경기가 단순히 양 팀의 수준 차가 6점 차, 9점 차만큼 난다는 의미일까? 당연히 재경기를 갖는다면 그런 스코어는 절대 쉽게 나올 수 없다.

많은 사람이 경기 스코어가 팀의 해당 경기 수준을 대변한다고 말한다. 틀린 말은 아니다. 축구에서 남는 건 스코어고, 모든 팀은 승리를 위해 싸우기 때문이다.

그러나 여기서 중요한 점은 팀의 승패를 떠나, 스코어가 팀의 전술 자체를 대변한다는 말은 옳지 않다. 모든 팀은 경기를 앞두고 전술을 들고나온다. 시작부터 전술이 맞아떨어지면 수월하게 풀어가겠지만, 이른 실점이나 준비한 전술이 별 효력을 발휘하지 못한다면 감독은 전술 변화를 가져가게 된다.

바로 이때, 다시 말해 전술과 전술 사이의 공백이 득점과 실점을 좌우하는 결정적인 요소가 된다.

가령 득점이 절실한 A팀이 수비수 한 명을 빼고 공격수를 투입하는 등 리스크 있는 교체를 단행할 때, 변화가 먹혀들어 가면 득점이 되겠지만 벌어진 수비와 공격 사이 간격으로 인해 손쉬운 실점을 허용하는 안타까운 상황이 연출될 수도 있다.

이런 상황은 오직 ‘승리’나 ‘무승부’라는 팀의 목적이 존재하기에 발생한다. 만약 앞선 경우 A팀이 무승부만 거두어도 강등을 모면하는 상황이라면 오히려 공수 밸런스를 유지하지, 공격수를 추가 투입하면서까지 득점을 노리는 의미 없는 선택을 하지 않을 것이다.

득점하기 위해 공격수를 투입한 것이고, 이 선택이 실패로 돌아갔기 때문에 1점, 2점, 그리고 5점을 실점하게 되는 것이다.

만약 A팀이 처음 들고나온 전술을 끝까지 고집하며 공격적으로 나가지 않고 어느 정도 잘 버티다 1실점 후 0-1 패배하고 강등당한다면 앞선 경우보다 비난의 정도는 훨씬 강할 거다. 강등을 코앞에 둔 팀이 공격도 안 하고 뭐 하다가 지냐고 말이다.

다시 말해 경기 스코어는 어느 정도 경기 전체를 대변할 수는 있어도, 이 역시 전술 변화를 온전히 담아내지는 못한다.

#

이렇듯 여타 분야들과 마찬가지로 축구 역시 우리도 모르게 우리를 통계의 함정 속으로 빠트리고 있다.

앞선 세 예시에서 공통점을 찾자면 전부 전체 경기를 보지 않고서야, 충분히 함정에 빠질 가능성이 있다는 점이다. 어쩌면 이게 바로 축구팬들이 없는 시간을 쪼개며 ‘실시간’으로 경기를 시청하고 직관하는 이유일 테다.

어느 분야에서나 통계의 오류와 함정은 언제나 유념하며 비판적인 시각을 잃지 말아야 한다.

이수영 기자(sdpsehfvls@naver.com)

[2022.04.19. 사진=후스코어드닷컴, 언더스탯닷컴, 옵타, FIFA]

 

LEAVE A REPLY

Please enter your comment!
Please enter your name here