일반적인 팬의 입장이라면 야구는 타자들이 치고 달리는 모습을 보며 열광하고 투수들의 투구와 야수들의 수비를 마음졸이며 응원하다 최종적으로 팀의 승리를 지켜보면 되는 것이다. 그런데 그 이면에는 다양한 기록들이 차곡 차곡 쌓여가고 있는데 이런 기록들을 사회과학적으로 접근하여 선수들을 좀더 객관적이고 정확하게 평가하기 위해 발전된 이론이 바로 세이버메트릭스이다. 그렇다면 세이버메트릭스는 구체적으로 무엇이며 어떻게 활용된다는 것일까
세이버메트릭스의 어원은 SABR(The Society for Averican Baseball Research, 미국야국연구협회) + Metrics(지표) 에서 왔다. 야구연구협회라는 단체명에서 알수 있듯이 야구를 연구하는곳으로 초기활동이 주로 이뤄진 무대이기도 한데서 그이름을 따왔다. 1980년에 세이버메트릭스의 대부 격인 빌 제임스는 세이버메트릭스를 "야구를 객관적으로 이해하려는 연구"라고 정의 하였다. 1980년대 빌 제임스의 글들이 인기를 끌고 21세기 들어 그 유명한 빌리 빈의 '머니볼'에 의해 세계적인 반향을 일으키기 전부터 야구를 과학적이고 좀더 객관적으로 접근하려는 시도는 항상 있어 왔다. 다만 본격적으로 세이버메트릭스라는 말과 각종 지표들이 개발되고 쓰여진것은 1980년대부터라고 할수 있다.
그렇다면 야구를 객관적으로 이해한다는건 무엇일까? 간단하게 예를 들어보면 행운의 안타를 친선수와 홈런을 친선수 모두 타석수 같다면 타율은 같을 것이다. 그러나 그 두개의 가치는 완전히 다른것임은 우리 모두가 알고 있다. 그러므로 타율은 선수의 실질적인 가치를 객관적으로 파악하는 지표가 될수 없는것이다. 타율보다는 출루율(타율+사사구) 이나 장타율이 훨씬 더 객관적인 지표라 할수 있다. 이런식으로 좀더 통계학적이고 수학적으로 야구에 접근하여 선수를 객관적으로 파악하는것이 세이버메트릭스의 목표라고 할수 있다.
그렇다면 세이버 메트릭스 지표에는 무엇이 있을까? 필자의 경우 KBO 팬이기 때문에 KBO 리그에 대한 가장 방대한 통계를 가진 사이트 STATIZ 에서 제공하는 지표를 중심으로 알아보고자 한다. 또 지표를 보고 이해 하는것을 목표로 하는것이니 산식은 생략하도록 하겠다. 필자는 편의상 공통 지표(투수/야수), 투수 지표, 공격력 지표 세가지로 나누어 다뤄보고자 한다. MLB의 경우 Fangraphs, Baseball-Reference, BaseballAmerica 등이 대표적인 사이트이니 참고하시길 바란다.
1. 공통 지표
BABIP(Batting Average on Balls in Play)
바빕신이 도우셨다!의 그 바빕, 타자가 친 공이 페어 영역으로 향할때의 타율을 의미한다. 홈런과 사사구는 페어영역에서 제외된다. BIPA(Balls in Play Average)라고 표현되기도 한다.
BABIP은 그 정의상 투수에게서 떠난 공을 타자가 쳤는데 그공이 또 페어 영역에 떨어지는 경우 안타가 될 확률을 의미하기 때문에 유의미한 표본만큼 공을 던진 투수라면 그 투수가 A급이든 C급이든 수치상의 큰 차이 없이 리그 평균에 수렴하는 특성을 보인다. 쉽게 말해 투수의 손을 떠난 공이 어떻게 될지는 타자와 수비에게 달려있다는 것이다. 다만 플라이볼 투수가 땅볼투수보다 좀더 낮은 경향을 보이며 몇몇 에이스급 투수들은 특별히 낮은 BABIP을 보여주기도 한다.
반대로 타자의 경우 타자의 라인드라이브 비율, 주력, 타구방향 등이 좀더 수치에 개입할 여지가 많기 때문에 통산적으로 봤을때 투수에 비해 타자 고유의 BABIP을 갖는 경우가 많다. 특히 라인드라이브 비율이 높을수록 BABIP이 올라가는 경향이 보이는데 상식적으로 생각해봐도 쭉뻗어나가는 공이 야수가 잡기 더 어려운것은 당연한 이치이다. 물론 통산 BABIP이 높을수록 훌륭한 타자일 가능성이 높지만 BABIP이 낮다고 하여 꼭 나쁜타자라고 단정 지을수 없다(홈런 비율이 높고, 선구안이 좋지만, 컨택은 떨어지는 선수라면 BABIP은 낮지만 생산성은 높을수 있다.)
따라서 투수의 경우는 리그 평균의 BABIP 에 비교하여 낮을 경우 운이좋고 높을 경우 운이 안좋다고 생각하면 되겠고 타자의 경우는 그 선수의 통산 BABIP과 비교하여 높은 경우는 운이 좋고 낮을 경우 운이 안좋다고 이해하면 될것이다.
다음은 KBO리그 타석수 상위 20의 타자들과 이닝수 상위 20의 투수들의 BABIP이다. 참고로 KBO 통산 BABIP 평균은 0.295이다.
앞서 말했듯이 타자의 경우 통산적으로 고유한 BABIP을 갖는 경우가 많기 때문에 투수에 비해 편차가 높은편이다. 특히 김태균의 경우 라이너성 공을 잘치기로 유명한데 덕분에 느린발에도 불구하고 통산 BABIP이 꽤나 높은편이다. 그렇다면 BABIP은 어떻게 활용될수 있을까? 한번 예를 들어보자. 김태균이 시즌중 0.270의 타율과 0.300의 BABIP을 기록중이이라고 한다. 그의 통산 BABIP(0.363)으로 봤을때 굉장히 운이 안좋은편이므로 앞으로 시즌이 진행됨에 따라(혹은 다음시즌에) 타율이 올라갈 가능성이 높다고 할수 있다.
그렇다면 투수쪽은 어떨까? 투수들은 대체적으로 평균치에 근접한 수치들을 보이는 가운데 몇몇 에이스 급 선수들이 눈에 띄게 낮은 수치를 보이고 있다. 특히 선동열의 BABIP은 0.241로 리그평균(0.295)에 비해 현저히 낮은 수치를 보이고 있다. 만약 선동렬이 특정 한시즌만 이런 수치를 보였다면 단순히 운이 좋은 시즌이라고 평가 할수도 있을것이다. 그러나 선동렬의 이 기록은 통산기록이다. 이와 같이 특별히 낮은 BABIP을 보이는데는 첫째, 압도적인 구위로 공을 맞추더라도 제대로 뻗지 못하게 한다. 둘째, 뛰어난 컨트롤로 타자가 제대로된 컨택을 못하게 한다 등을 이유로 들수 있을것이다. 다시 말해 선동열은 타자가 페어영역으로 공을 보내더라도 이지플라이 혹은 평범한 땅볼타구를를 많이 양산해내는 투수라는 것이다. 이렇게 평균에 비해 특별히 낮은 BABIP을 전성기 또는 커리어내내 보여줄수 있는 선수가 피홈런 조차 적다면 시대를 평정한 투수라 불러도 손색이 없다.
WAR(Wins Above Replacement) : 대체 선수(수준) 대비 승리 기여도
지표값은 곧 승수를 의미한다. 대체 선수에 비해 몇 승을 더 기여했는지를 나타내는 말이다. 선수의 타격, 주루, 피칭, 수비 등을 모두 고려하여 계산한 값이기 때문에 선수의 가치를 직관적으로 파악하기가 쉬우며 포지션이 다른 선수들간의 비교도 용이하게 해준다. 그렇다면 여기서 대체 선수에 대한 정의가 필요할 것 같다. 메이져리그 기준으로 말해보자면 대체선수는 특정 포지션의 주전선수가 부상으로 이탈했을시 그의 공백을 임시로 메우기 위해 최저비용으로 데리고 올수있는 선수(AAA 콜업, 웨이버 공시 선수 주어오기 등)를 의미한다. 이들의 대체 수준(WAR=0)은 평균적인 메이져리거에 비해 20점정도 생산성이 낮다. 통상적으로 10점=1승의 가치를 갖는다고 하니 WAR이 2인 선수는 리그 평균의 선수라고 할수 있다.
살펴본 개념을 이용하여 KBO 리그 포스트시즌 진출을 위한 최소 승수를 알아보자. 표본이 적긴 하지만 144경기로 개편된 2015년부터 5위팀의 승수를 보면 2015년 69승, 2016년 70승, 2017년 75승으로 그 중간값이 72승으로 50% 정도의 승률이면 포스트 시즌 진출을 기대할만하다.
- 메이져리그에서 162경기 기준 대체선수로만 이루어진 팀은 1년에 45~50승을 올릴것으로 기대된다. 이를 단순(짱개식)계산을 통해 144경기로 치환해보자면 KBO리그에서 대체선수로만 이뤄진 팀은 40~44승이 기대가 되는데 중간값은 42승이다. 다시말해 KBO 리그의 어느팀이 WAR=0인 선수들로만 구성한다고 했을때 42승을 거둘수 있다는 것이다.
- KBO리그는 25명 출장인데 이중 주전 선수들을 구분해보자면 야수 7~8명, 선발투수 4~5명, 셋업, 마무리로 15명 내외라고 할수 있다. 모팀의 주전 선수들(15명)이 모두 리그 평균적인 선수(WAR=2)일때 그팀의 기대 승수는,
기대 승수 = 42승(기본값, 모든 선수들이 대체선수일때) + 15승 × 2 = 72승
으로 KBO리그는 한팀의 주전 선수들이 리그 평균적인 퍼포먼스만 발휘하면 포스트시즌에 진출할 수 있다. (사실 10개 팀중 5위이니 당연한 이치이다.)
- 2017년 KBO리그 포스트시즌 막차를 탄 SK와이번즈는 총 75승을 거뒀는데 TOP 15의 WAR은 다음과 같다.
주전선수들의 WAR 합은 36.03으로로 대체선수로 이뤄진 팀의 기대승수 42승을 더하면 78.03승으로 실제보다 대략 3승이 더 높지만 WAR이 선수의 가치와 팀의 성적을 가늠하기에 꽤나 직관적이면서도 정확하다는걸 알수 있다.
"돈츄의 Super Save"