세이버매트릭스에 대한 오해

내 기억에 한국에 세이버매트릭스라는 것이 전도된 것은 그리 오래된 일이 아니었다. 아마 00년대 초반의 일로 기억하는데 혹시 그 전에 세이버매트릭스에 대해 한국에서 들어본 분이 있으시면 말해 주시라. 물론 나도 그땐 별 관심이 없었고 거기에 제대로 관심을 가지게 된건 2002~2003년 사이에 벌어진 일이니 세이버매트릭스에 대해 이것저것 떠든다고는 해도 나 자신도 거기에 대해 완벽히 이해하지 못하긴 하지만, 여기 저기에 있는 세이버매트릭스에 대한 오해를 몇개 풀어보고자 키보드를 두드려 본다.


1. 세이버매트릭스는 데이터 야구가 아니다.

흔히 세이버매트릭스에서 다루는 스탯들로 인해 세이버매트릭스에 대해 잘 모르는 야구 팬들이 가장 많이 하는 착각 중 하나다. 그러나 세이버매트릭스는 절대 데이터 야구가 아니다. 세이버매트릭스의 대부인 빌 제임스는 세이버매트릭스에 대해 이렇게 정의했다.(Bill James defined sabermetrics as 'the search for objective knowledge about baseball - '세이버매트릭스는 야구를 객관적으로 이해하려는 연구이다')

데이빗 그라비너는 Sabermetric Manifesto에서 세이버매트릭스가 무엇인지에 대한 예를 제시했다. sabermetrics attemps to answer objective questions about baseball, suchas "which player on the Red Sox contributed the most to the team's offense?" or "How many home runs will Ken Griffey Jr hit next year?" It cannot deal with the subjective judgments which are also important to the game such as "Who is your favorite player?"

세이버매트릭스가 데이터야구라고 잘못 이해되게 된 이유는 아마 세이버매트리션들이 주로 통계를 이용하기 때문일거다. 그러나 그건 절대 세이버쟁이들이 통계를 사랑해서나 통계에 중독되어서, 혹은 통계가 진리라고 생각해서가 아니고 단지 야구에서 통계 이상으로 객관적인 지표가 없기 때문이다. 만약 통계보다 더 객관적인 지표가 발견된다면 그 다음날로 세이버매트리션들은 거기에 몰두할 거다. 아무리 열심히 객관적인 증거 자료를 가져다 줘도 다른소리를 하는 사람에 비하면 그들은 훨씬 열린 마인드를 가진 사람들이다. 이미 그들은 기존에 가졌던 미신을 깨보았던 사람이기 때문들이기도 하다.

어찌되었건 다시 본론으로 돌아와보자. 일단 데이터야구의 정의 자체도 애매모호 하다. 도대체 데이터야구가 뭔데? 라고 물어보면 당신은 어떻게 대답하겠는가. 만약 선수들의 기록을 살펴보는걸 데이터야구라고 생각한다면 현장에서건 팬들이건 데이터야구를 하지 않는 사람은 없다. 타율은 데이터가 아니고 다승은 데이터가 아닌가? 오히려 A선수 만루에서 8타수 3안타. 어익후 만루타율이 무려 0.375네요. 아 이 선수는 만루에 강하구나! 라고 우겨대는 사람들은 세이버매트릭스와는 정 반대에 서있는, 오히려 세이버매트리션들은 개소리좀 그만하세요 라고 대답할만한 사람들이다. 그런데 만루에서 8타수 3안타 라는 기록은 분명히 데이터이다.


2. 통계의 오류

얼마 전 재 발간된 야구 역사에 길이 남을만한 위대한 책인 '야구란 무엇인가'에서 레너드 코페트는 말한다. '통계는 앞으로 해낼일의 능률을 재는 잣대가 아니라 이미 지나간 일의 효능을 잰 부산물에 지나지 않는다는것, 앞날에 대한 예측이 아니라 과거에 대한서술이라는 것, 그리고 무엇보다도 살아 움직이는 야구라는 경기에서 일부만을 임의로 뽑아내 숫자로 옮겨놓은 것에 지나지 않는다.'라고 말했다. 맞는 말이다. 그리고 레너드 코페트가 지적한 통계의 오류는 오히려 타율이나 타점 혹은 다승과 같은 스탯들을 열심히 쳐다보는 사람들에게 더 해주고 싶은 말이다. 여담이지만 메이저리그의 팬이건, 국내야구를 즐겨보는 팬이건 레너드 코페트가 쓰고, 故 이종남 기자님께서 번역한 '야구란 무엇인가' 라는 책은 정말 추천하는 책이다.

통계의 오류 혹은 통계의 허상이라는 이유로 세이버매트릭스를 무작정 거부하는 사람들은 그냥 세이버매트릭스에 대해 모르는 사람들이다. 세이버매트릭스는 어떻게 생겨나게 되었을까? 세이버매트릭스 지표로 가장 처음 등장한 지표는 빌 제임스가 고안한 RC다. 그리고 이 RC는 매우 간단한 원리로부터 탄생한다. 바로 타자가 타석에 들어서는 목표는 점수를 내기 위해서라는 것이고, 점수를 내는데 있어서 가장 중요한건 출루와 진루라는 것이다. 기존에 숭배받던 타율이나 타점과 같은 스탯의 문제점이 무엇인지를 파악하고, 그 통계의 오류와 허상을 고쳐가는 사람들에게 통계의 오류와 허상에 대해 이야기 하며 세이버매트릭스를 부정하는건 세이버매트릭스에 대한 이해가 부족하다는 말 밖엔 할 말이 없다. 세이버매트릭스는 야구 통계를 분석하는 여러가지의 방법중 하나일 뿐 그 자체가 야구 통계가 아니기 때문이다.

Baseball statistics are useful only if they enhance yourunderstanding of the game. Therefore, they should be judged by how wellthey measure what actually happens in the game. Meaningless statisticsshould be ignored or replaced; deficient statistics should beimproved.  And well-designed statistics should be used as an importantpart of discussion about the game and its players - by David Grabiner
야구 통계는 당신에게 경기에 대한 이해력을 더 높여줄때만 유용하다. 그러므로 그 통계들은 게임에서 일어나는 현상들을 얼마나 잘 평가할수 있느냐에 따라 평가받아야 한다. 의미없는 통계들은 무시당하거나 다른것으로 바뀌어야 한다. 결함이 있는통계들은 발전되어야 하며, 잘 만들어진 통계는 야구와 선수들에 대한 토론을 할때 유용하게 쓰여야 한다. - 데이빗 그라비너


3. 그들은 현장이나 기존 야구계, 스탯을 무시한다.

여담인데 난 세상에서 안한 말을 지어내는 사람을 제일 싫어한다. 같이 말 섞는것 자체가 답답하기 때문이다. 거기에 마음에 안드는 사람이 있다면 상대가 누구건간에 대놓고 짜증내는 나는 온라인이건 오프라인이건 싸가지 없다는 말을 참 많이 듣기도 한다. 뭐 싸가지 없는건 나도 잘 아니까 굳이 지적 안해줘도 되는데 난 당신이 내가 가장 증오하는 안한 말을 지어내는 사람은 아니길 바란다.

어찌되었건 다시 본론으로 돌아가자. 아마 이렇게 생각하는 바람에 무작정 세이버매트릭스에 대한 거부감을 가지게 된 사람들이 제일 많을거다. 그런데 문제는 세이버매트리션들은 현장이나 기존 야구계를 무시한 적이 없다. 단지 그들이 숭배해왔던 우상들에 대한 부정을 해왔을 뿐이다. 기독교와 조로아스터교의 유사성을 이야기하며 기독교는 조로아스터교의 영향을 많이 받은 종교라고 이야기 하는 것이 기독교도들을 무시하는 것 일까?

만약 그들이 숭배해왔던 우상인 타율이나 타점, 다승과 같은 지표들이 야구를 이해하는데 충분하다면 굳이 거기에 대해 부정 할 이유가 있었을까? 성모 마리아가 정말 동정녀이며 예수가 정말 부활했다면 성경에 예수를 믿지 않으면 지옥에 간다고 써있다고 주장하면서 교회에 나오라는 기독교도들의 말에 넘어갔을지도 모르겠지만 현실은 그렇지가 않다.

자 여기에서 나올만한 반론이 하나 있다. 난 오류덩어리 스탯을 믿지 않고 내 눈만을 믿을 뿐이다. 그러면 굳이 세이버매트리션이네 뭐네 하면서 싸울 이유가 없다. 위에 데이빗 그라비너가 말한 문장을 다시 가져와보자. 'Itcannot deal with the subjective judgments which are also important to the game such as "Who is your favorite player?"' 내가 볼땐 누구 스윙이 짱이라서 앞으로 존나 잘할거 같다. 혹은 아 난 이놈 체격을 보니까 장차 슬러거로 성장할 확률이 커보인다. 혹은 아 난 롯데팬이라 이대호가 닥치고 짱이다 내가 볼때 존내 잘하더만. 이라고 말하는 것과 세이버매트릭스는 이명박과 오바마의 공통점 만큼이나 서로 관계가 없다.

그러나 적어도 이미 지나간 일을 가지고 가능성이 아닌(만약 이랬다면 더 좋지 않았을까?) 확신을 가진다면 적어도 어느정도 통계의 도움을 받지 않아야 할까? 본인의 셀렉티브 메모리로 인해 잘못된 기억을 가지고 있을수도 있는 노릇이 아닌가? 그리고 그런 통계의 도움을 받는걸 가지고 세이버매트리션이라고는 하지 않는다. 예를 들어 난 롯데팬이라 이대호가 닥치고 짱이다 내가 볼때 존내 잘하더만. 에서 그치지 않고 내가 보니까 작년에 김별명보다 훨 잘했더만! 이라고 우기는 사람에게 작년 시즌 김태균과 이대호의 스탯을 가져 와서 김태균이 이대호보다 더 나은 타자였다고 설명해주는걸 가지고 누가 세이버매트리션이라고 할 일은 없다는 거다.


4. 그들은 경험이나 멘탈을 무시한다.

오히려 경험이나 멘탈을 무시하는건 세이버매트리션들이 아닌 사람들이라고 생각한다. 경험이 많다고 야구 하는데 있어서 유리하다는 증거를 가져온다면 모를까. 누구나 동의할만한 확실한 증거도 없이 단순히 셀렉티브 메모리만으로 아무때나 경험 이야기를 꺼내는게 오히려 경험에 대한 무시가 아닐까? 세이버매트리션들은 포스트시즌에 출전한 모든 선수들의 기록을 분석해낸 결과 오히려 포스트시즌에 처음 출전한 선수들의 스탯이 여러번 출전한 선수들보다 더 뛰어나다는 결과를 찾아냈다. 만약 포스트시즌 경험이 정말 작용되는 것이라면 있을 수 없는 결과다. 스탯이 되었건 무엇이 되었건간에 누가 봐도 확실한 증거를 가져다 놓고 경험에 대한 이야기를 꺼내는 것이 경험에 대한 예의라고 생각하는 입장에서 오히려 난 역으로 묻고 싶은 말이 바로 경험을 무시한다는 말이다.

멘탈도 그렇다. 만약 승부처에서 타자와 투수의 멘탈로 인해 결과가 달라진다면 그 결과는 기록에 나타날 것이다. 그러나 현실은 승부처라고 해서 더 잘치는 선수는 없었다. 클러치히터를 부정한다고 야구라는 종목에 미치는 멘탈의 중요성을 무시하는것은 아니다. 우산효과는 없다며 우산은 비올때나 쓰라고 주장하는 세이버매트리션이 멘탈을 무시하는 것은 아니다. 단지 수집한 자료의 결과가 우산효과 따위는 없다고 말해줄 뿐이다. 릭 엔키엘이 꼴아박은걸 가지고 멘탈 때문이 아니라고 주장하는 세이버매트리션을 본 적이 있는가? 결혼을 하고 나서 더 잘 던지는 선수를 두고 심리적으로 안정 되었다 라는 말에 대해 입에 침 튀겨가며 반박하는 세이버매트리션을 본 적이 있는가? 오히려 그동안 멘탈이라는 말이 듣기에 그럴듯해 보이면 무조건 다 가져다 붙였다고 생각해 본 적은 없는가?


5. 세이버매트리션들은 숫자만 보지 야구는 보지 않는다.

말도 안되는 소리지만 참 많이 들어보기도 했다. 세이버매트리션들이 어떤 종류의 스탯을 이용하는지를 안다면 도저히 할 수 있는 말이기에 굳이 대답하기도 귀찮은 노릇이다. 타구의 라인드라이브 %와 같은 질, 낙구 위치에 따른 포구, 한베이스를 더 갔는지 못 갔는지를 어떻게 야구를 보지 않고 알 수 있는지 대답해줄수 있는가? 그리고 변태가 아닌이상에 설마 야구도 안보는데 숫자만 디립다 파고있는 사람이 있을거라고 생각할수 있는걸까? 이건 상식적으로 생각해보면 답이 나오는것 아닌가. 세이버매트릭스 한다고 어디서 돈 주는 것도 아닌데 야구를 안보는 사람이 도대체 여기에 관심을 가질 이유가 있기나 할까? 뭐 요즘은 시대가 달라져서 미국에선 세이버매트릭스 덕에 밥벌어 먹는 사람도 있긴 한데 그정도로 답이 없는 야덕후들이 야구를 안본다구요??? 그 사람들이 돈을 버는 이유가 야구를 보기 위해 돈을 번다라는 말이 수백배는 더 설득력 있는 말이지 말입니다.



사람은 모르는것에 대한 공포감을 가지고 있는 동물이다. 그렇기에 일단 모르는것에 대해선 거부감을 가지게 되며, 세이버매트릭스와 같이 만들어진지 그리 오래 되지 않아 널리 퍼지지 않은 것이라면 더욱 그렇다. 그리고 어떤 이유에서건 거부감을 가지게 되는것이 틀린건 아니다. 우린 자기 마음대로 생각할수 있고, 자기 마음대로 표현할수 있는 사회에 살고 있지 않은가? 그러나 잘못 알고 있어서 거부감이 생기는 경우가 크게 유리하게 작용한 사례는 본 적이 없다. 좋아하고 싫어하고, 받아들이고 받아들이지 않는 것은 그 사람의 자유 의지에 달린거다. 그러나 기왕이면 제대로 된 이유를 가지고 그러는게 더 현명한 행동이 아닐까?





by Anakin | 2009/03/13 01:08 | Sabermetrics | 트랙백 | 덧글(27)

트랙백 주소 : http://redsox.egloos.com/tb/2296168
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Commented by Ace조바 at 2009/03/13 01:46
이렇게 보는 사람도 있으면 저렇게 보는 사람이 있는게 당연한거고 누가 옳은 지는 아무도 모르는거고ㅋㅋ나야 통계쪽에 무게를 두긴하지만 그렇다고 통계가 짱 나머지는 구림 이건 또 아닌것같음.

그러고 보니 디씨에서 세이버가 여신이다 아니다로 떳다던 전설의 현피영상이 떠오르네여

Commented by Anakin at 2009/03/13 02:05
ㅋㅋ 아 이거 어쩌다 검색엔진을 통해 달빠들이 죄다 몰려와서 개판되는건 아닌가 모르겠슴. 걔들은 세이버쨩 좀만 까도 무섭게 달려들던뎅
Commented by 덕후인더다크 at 2009/03/13 03:47
세이버찡 까는건 봐줘요..

사쿠라 까면 팔다리중 하나 분질러 지는거 각오해야죠..
Commented by Anakin at 2009/03/13 12:32
나의 사쿠라쨩은 그렇지 않다능!!!
Commented by 음... at 2009/03/13 02:35
구*님과 넘*님 관련 포스팅인가요?....
Commented by Anakin at 2009/03/13 12:32
관련있다고 생각하고 보면 그렇게 보일테고 아니라고 생각하고 보면 별 관련 없겠죠.
태생부터가 타고난 싸움꾼이라 그런지 1 : 다수의 키보드 워리어는 즐겨도 다대다의 키보드 워리어는 별로 즐기지 않습니다.
Commented by 빌리밥 at 2009/03/13 08:21
돈많은 테오가 머니볼 하는게 아니다고 우기는거랑 통계 보는 세이버 매트리션들은 현장을 무시한다는 이야기랑 별반 차이가 없죠. 더욱이 그들이 처음 RC와 OPS 개념을 만들어낸 이유가 정말 잘 치고 효율적인 타자가 누구인지, 누가 더 야구를 잘 하는지에 대한 기본적인 의문에서 나왔다는 것을 감안하면 말입니다. 타구의 질이나 투구 하나하나 마저 기록한 시초 또한 그들입니다. 말씀하신대로 그들에게 통계는 야구를 더 잘 알기 위한 하나의 도구일 뿐이죠. 하지만 한국 네티즌 사이에서 세이버 매트리션은 본적이 없는 듯 합니다. 그냥 메이져서 만들어낸 통계 측정 방법으로 깔짝깔짝 하는 모습만 있다고 할까요.
Commented by Anakin at 2009/03/13 12:35
테오가 머니볼을 하는게 아니라고 우기는것 역시 머니볼에 대한 이해가 부족해서죠. 머니볼은 '적은 돈으로 높은 승률을 기록하기 위한 것'이 아니라 '가지고 있는 자원으로 최대한의 효율을 내는 것'이니 말입니다.
어차피 저 스스로도 스스로를 사이비매트리션이라고 생각하는데 예전에 랍 네이어가 그랬던가요? 윈쉐어를 구할줄 모른다 해서 세이버매트리션이 될수 없는건 아니고 단지 그게 무슨 이야기를 하는지만 이해하면 된다고. ㅋ
Commented by 미노 at 2009/03/13 09:45
원래 사람이라는게 자기쪽이 옳다고 그렇게 믿어 버리면 다른쪽이야기는 전혀 귀에 들어오지 않는게 보통이죠...


조금 거리를 두고 양쪽을 바라보면 그저 둘다 똑같아 보이는데...
Commented by Anakin at 2009/03/13 12:36
어떻게 야구를 보던간에 결국엔 같은 야구를 보고 있기 때문이져.
Commented by 바른손 at 2009/03/13 09:50
좋은 글 잘 봅니다.
Commented by Anakin at 2009/03/13 12:39
대슥 감사감사.
Commented by 발걸음 at 2009/03/13 11:40
지금은 일간스포츠에 있는 최민규 기자가 1998년쯤부터 세이버매트릭스의 방법론을 도입해서 글을 써오긴 했죠. 더 빠르게는 1980년대 중반쯤에 SABR을 흉내낸 SKBR이 만들어져서 그쪽의 방법론을 도입했다고 하는데...
Commented by Anakin at 2009/03/13 12:42
그러고보니 최민규 기자님이 쓰신 글을 예전에 쭈욱 찾아봤던 기억이 나네요. 스포츠 2.0에서도 좋은 기사를 많이 써주셔 많이 읽었던 기억이 있습니다. 1980년대 중반의 SKBR에 대해선 처음 알게 되었는데 거기에 대해서도 공부를 해봐야 겠네요. 감사합니다.
Commented by 발걸음 at 2009/03/13 16:01
SKBR의 흔적은 중앙일보 이태일 기자가 쓴 글(http://article.joins.com/article/article.asp?Total_ID=2129517)에도 나와있네요.
Commented by tribetime at 2009/03/13 12:02
저 책 사야겠네요
Commented by Anakin at 2009/03/13 12:43
예전엔 1,2부로 있던 책이 하나로 합쳐져서 더 소장하기 편하게 나왔죠. 강추드림 ㅋㅋ
Commented by rumic71 at 2009/03/13 12:18
요컨대 '실증사학' 이라는 것이로군요.
Commented by Anakin at 2009/03/13 12:48
댓글 하나 달때마다 로그인이 계속 풀려서 미치겠네요 -_-;

암튼 분야가 다르니만큼 꼭 싱크로가 일치하는건 아니다만 그렇게 볼수도 있겠군요. 그나저나 실증사학 하면 재야사학에 환빠부터 생각나는데 지긋지긋하게 시달린 성과가 있간 하네여.
Commented by Lucid at 2009/03/13 12:23
1990년대 후반부터 PC통신에 글을 쓰시던 분들이 있는 것으로 알고 있습니다. 그 무렵에 쓴 주제들을 보면 우즈와 이승엽, 임창용과 김현욱을 비교하는 글 같은 것들이 있지요. OPS나 RC와 같은 지표를 소개하고 도루의 효용을 논하는 초창기였던 것으로 알고 있습니다.
Commented by Anakin at 2009/03/13 12:48
아 생각해보니 하이텔이었던가요? 거기에서도 이야기가 나왔던게 기억나네요.
Commented by 발걸음 at 2009/03/13 15:55
최민규(현 일간스포츠, 옛 스포츠2.0) 기자도 그중 한 분입니다. 김형태(OSEN) 기자도 그 멤버셨고...
Commented by Me at 2009/03/13 13:58
아나킨님도 책 쓰셔 될듯;;;

간만에 좋은 글 보고 갑니다^^
Commented by Anakin at 2009/03/13 15:04
너무 과찬하시네여. 매번 쓰면서 필력 부족을 절실히 느끼는게 현실입니다 ㅠㅠ
Commented by 사이버메트릭스 at 2009/03/26 11:36
통계는 구랄치지 않지만 해석 하는 인간은 구라를 내뱉지요. 통계는 잘 못 해석하면 독이 될 수 밖에는 없는데 스탯 가져와서 말 갖지도 않는데 가져다 붙이는 사이비메트리션들 때문에 이런 저런 오해가 생기는 걸 겁니다. 통계를
훌륭하게 사용하는 사람도 있지만 꼰대질에 악용하는 인간들도 많습니다.
Commented by Anakin at 2009/03/26 17:39
근데 특정 자료를 곡해해서 해석하는건 굳이 통계뿐 아니라 다른데서도 종종 볼수 있는법이져..
Commented by didofido at 2009/08/25 01:42
'1980년대 중반쯤에 SABR을 흉내낸 SKBR이 만들어져서'라는 구절이 마음에 걸려 몇 자 적습니다. 그 시절 SABR이 어떤 활동을 하고 어떤 연구 결과를 발표했는지는 아마 지금 그 분야에 대해 관심있는 사람이 더 잘 알 것입니다. 지금은 마음만 먹으면 SABR의 리서치를 온라인으로 구할 수 있지만 그때는 불가능했습니다. SABR에서 그런 데이터를 만들지 않았고, 만들었다 하더라도 SKBR에서도 받기는 불가능했습니다. KBO에 컴퓨터가 없던 시절이었습니다. SKBR이 영속성을 가진 조직이었다고 보기는 어렵지만 그때 사람들의 열정이 간단하게 폄훼되는 것 같아, 쓰신 분은 그런 의도가 아니셨겠지만, 아쉽습니다.

:         :

:

비공개 덧글

◀ 이전 페이지 다음 페이지 ▶