Curt Schilling reites

"This party has officially ended. After being blessed to experience 23 years of playing professional baseball in front of of the world's best fans in so many different places, it is with zero regrets that I am making my retirement official." - March 23, 2009. Curt Schilling.


Good bye Schill. Thanks for the memories and thanks for the game six of ALCS. You will be remembered forever.





by Anakin | 2009/03/24 01:17 | Red Sox | 트랙백 | 덧글(11)

WBC 준결승. 다이스케 마쓰자카 투구 분석.

월드 베이스볼 클래식 준결승, 일본과 미국전에서 일본은 에이스 다이스케 마쓰자카를 선발투수로 내보냈다. 레드삭스의 선수이기에 유일하게 일본 경기 챙겨볼때는 마쓰자카가 나오는 경기만 봤는데 정작 이번엔 자느냐고 게임은 못봤지만 그래도 투구 데이터 분석정도는

마쓰자카는 오늘 총 투구수 100개를 기록했다. 그중 60개는 패스트볼, 21개는 슬라이더, 11개는 체인지업, 6개는 커터였다. 지난 시즌 메이저리그에서 마쓰자카의 구질 구사도는 다음과 같았다.
패스트볼 52.2%, 슬라이더 23.3%, 커터 15%, 커브볼 4.1%, 체인지업 3.8%, 스플리터 1.8%

오늘의 구속 분포도.

마쓰자카의 오늘 로케이션. 네모 안의 구역이 스트라이크존이다.

대체로 일정한 릴리스포인트. 미세하게 패스트볼은 약간 아래에서, 슬라이더를 위에서 던지고 커터는 그 사이에서 던지는데 저정도를 타석에서 구분해내는건 쉽지 않으리라 본다.
오늘 게임에서의 무브먼트. 구질별로 구역을 구분하기 쉽다. 파란색 동그라미 점은 패스트볼, 빨간색 동그라미는 슬라이더, 초록색 네모는 커터, 보라색 네모는 체인지업을 나타낸다. 위에선 다 빨간색이 커터, 초록색이 슬라이더였는데 그래프 그리면서 실수를.
위에서 봤을때의 공의 무브먼트.
옆에서 봤을때의 공의 무브먼트


Special Thanks to. 내가 많이 사랑하는 여자친구, Randoll(클릭), 엑셀 개발자들





by Anakin | 2009/03/23 19:13 | Red Sox | 트랙백 | 덧글(4)

정말로 일본야구는 분석의 야구일까?(1)

국제대회에서 일본을 만날때나, 혹은 이승엽의 부진에 대해서 설명할때나 한국 언론이나 야구팬들이 매번 쓰는 단어는 바로 '분석' 이라는 단어이다. 그러면서 이승엽이 미국에 갔더라면 분석에 의지하지 않고 정면승부하는 메이저리그의 특성상 20홈런은 매년 쳤을거다 라는 말도 안되는 헛소리를 늘어놓는판에 매번 답답해 미칠노릇인데 기왕이면 이 글이 멀리 퍼져나가 일본야구는 분석에 능한 분석의 야구다 라는 말도 안되는 헛소리 하나가 이나라 야구판에서 뿌리뽑혔으면 싶다. 꼭 이런 글을 쓰면 달리는 댓글들이 있어 이번에도 미리 예상 질문에 대한 답변을 먼저 달고 시작하는데 이말은 일본이 분석을 안한다는 말이 아니다.

노무라(현 라쿠텐 감독)감독으로 인해 일본야구의 분석은 ID야구로도 불리기도 한다. Input Data의 야구. 즉 데이터로 상대를 분석한다는 뜻이다. 그러나 적어도 내가 알기로, 데이터로 상대를 분석하는것도 미국이 일본보다 훨씬 능할뿐더러 한국에 데이터 야구라면서 알려진 데이터를 이용하는것은 제대로된 데이터를 이용하지도 못하고 있다. 방송에서 대놓고 주자 1,2루 상황 타자 누구는 10타수 4안타를 쳐 타율이 4할이니 이 타자는 주자 1,2루시에 강하다! 라는 헛소리를 늘어놓으면서 제시하는 자료를 과연 제대로된 데이터라고 할수나 있을까? 그건 내가 볼때 전혀 신뢰할만한 데이터가 아니다. 일단 표본이 너무 적기 때문이다. 저렇게 나눠놓은 스탯을 두고 스플릿 스탯(Split Stat)이라고 하는데 특별한 경우를 제외하곤 결국 스플릿 스탯도 표본이 많이 쌓이다 보면 통산 성적에 수렴하게 된다.

물론 내가 가지고 있는 데이터와 그들이 가지고 있는 데이터는 다를거다. 일반적으로 일본은 극단적인 스몰볼을 펼치는 것으로 유명한데 이번 WBC에도 나왔던 하라 감독의 원아웃 이후 번트는 하라 뿐 아니라 NPB내에서 나름대로 자주 나오는 작전이기도 하다. 굳이 원아웃 이후 번트가 아닌, 노아웃 상황에서의 번트는 셀 수도 없고. 그런데 한번 오른쪽의 자료를 보자. 저 자료는 기대 득점에 대한 자료이다. 만약 노아웃 주자 1루의 찬스가 있다면 당신은 0.90024점을 기대할수 있다는 것이다. 번트 성공률을 100%로 잡아 번트가 성공했다고 쳐서 원아웃 2루의 찬스가 되었다고 하자. 그러면 오히려 당신이 기대할 수 있는 득점은 0.69465로 줄어든다. 하라 감독의 원아웃 이후 번트도 한번 보자. 원아웃 주자 1루에서 기대할 수 있는 득점은 0.52842점이다. 그런데 투아웃 주자 2루의 경우는 0.33485점으로 줄어든다. 그나마 이건 번트 성공률이 100%라고 가정했을때의 일이고 현실은 번트 성공률은 우리가 생각한거마냥 그렇게 높지도 않다. 도대체 맨날 번트질을 하는 애들이 데이터 야구를 한다면, 그들이 가지고 있는 데이터는 무엇인지 정말로 궁금하다. 혹시 각 팀의 데이터 분석원은 모두 다 다른팀에서 파견된 스파이인지라 더 불리한 데이터를 제공하는걸까?

이번엔 한번 다른 데이터를 살펴보자. 한국 언론에선 흔히 특정 투수가 어떤 구질을 어떤 코스로 던졌는지에 대한 미국에선 삼척동자도 1분의 시간만 투자하면 찾을 수 있는 데이터를 가지고 대단한 데이터라도 가지고 있는거 마냥 보도하는데. 오늘 한국 vs 일본의 선발 장원삼이 던진 투구 데이터 기록을 한번 찾아보자. 1분도 안되어 이런 데이터는 쉽게 찾을 수 있다. 물론 난 게임을 보지 않았기에 직접 적었을리가 없다.
어떤 구질의 공을 몇개를 던졌고, 평균, 최고 구속은 얼마였으며, 상하좌우로 얼마나 꺾였는지, 몇개의 공이 스트라이크로 판정되었는지에 대한 자료도 나온다. 특정 구질이 홈플레이트까지 도달하는데 몇초가 걸렸는지에 대한 정보도 있다.

위 도표는 얼마나 오프스피드 피치를 했는지 쉽게 보여주는 도표이다.
이건 위에서 봤을때 각 구질이 얼마만큼의 무브먼트를 가졌는지를 보여준다.
이건 옆에서 봤을때 각 구질이 얼마만큼의 낙차를 가졌는지를 보여준다. 여담이지만 흔히 한국에선 어떤 선수의 Fastball의 위력을 단순히 그 공의 구속으로 평가하는 경향이 강하다. 왜 그런 일이 벌어지게 되었냐면 내 추측엔 Fastball을 '직구'라고 옮겨서 그런게 아닐까 한다. 공이 그냥 작대기로 날아간다는 생각이 머릿속 한 구석에 있다보니 그 공의 움직임으로 그 공을 평가하기보단 단순히 속도에 의지하게 되는게 아닐까? 아무리 살펴봐도 그 어떤 투수의 투수의 Fastball이라 해도 공은 직선으로 날아가지 않는다. 직구라는 말도 일본의 스트레또를 그대로 한국말로 옮기다 보니 나온말인데 데드볼 대신 몸에 맞는 공과 같이 일본식 야구 용어가 점점 사라지는 추세에서 방송에서 먼저 속구라는 말을 써야 하지 않을까?


물론 위 정도의 데이터는 빙산의 일각일 뿐이다. 각 카운트별로 릴리스포인트가 어떻게 달라지는지, 각 카운트별로 어느 코스로 어느 유인구를 던지는지, 각 카운트별로 특정 타자는 어떤 공이 올때 방망이가 나가는지 등 각종 세부 데이터에 대해 다 찾아낼 수 있다. 그리고 메이저리그에 대한 저정도의 데이터는 정말로 1분 안에 모두 구할 수 있다. 몇몇 인터넷 사이트의 경우(내가 참조한 곳은 brooksbaseball.net) 메이저리그 문자중계 시스템인 게임데이에 찍히는 데이터를 자동으로 변환하여 저런 자료로 나타내 준다. 물론 남의 도움을 받기 싫고 나 혼자 할래! 라고 한다면 http://gd2.mlb.com/components/game/mlb/ 이곳에서 직접 데이터를 추출 한 후, 엑셀에 넣어 직접 구할 수도 있다.

일반인이 저 정도의 자료를 1분안에 찾아낼 수 있는데 하물며 구단측이 가지고 있는 분석 자료의 양은 어떨까? 혹시 미국엔 선수 분석만 전문적으로 해서 그 자료를 팔아 돈을 버는 '회사'가 있다는걸 알고 있는가? 흔히 한국에선 일본야구는 오히려 미국보다 분석에 더 능하고, 약점을 파는데 있어서도 메이저리그보다 훨씬 더 집요하게 약점을 판다고 생각한다. 그러나 내가 볼땐 그 분석의 양과 질, 그리고 약점을 파는 정도에 있어서도 NPB가 MLB보다 나은 점이 있다고는 딱히 생각하지 않는다는 거다. 즉 내가 볼때 이승엽이 일본에서 부진한 이유가 일본 특유의 현미경 야구로 낱낱히 분석되어, 약점만을 파고들어서 그런거다. 미국에 가면 더 잘할거다 라는 말은 '아무런' 근거가 없는 소리라는 거다.

물론 나의 이 포스팅은 일본야구에선 분석을 안한다는 이야기가 아니다. 어느 나라 야구에서건 요즘 분석을 안하는 야구는 없고 약점을 안파고 들어가는 야구는 없다. 단지 일본이 분석은 더 잘하고, 약점을 더 파고 들어간다는데에 대한 근거가 전혀 없다는 거다. 까놓고 말해 분석의 수준도 리그의 수준과 비례한다고 보는데 분석도 분석에 투자하는 돈이 많아야 더 잘 할수 있는거고, 돈이 많은 리그가 현재 수준 높은 리그가 아닌가? 글 내용은 별로 없지만 사진들덕에 글이 너무 길어져 일단 데이터 분석에 대한 1편은 여기에서 끊고 다음에 마음내키면 2편으로 이어가련다. 사실 분량탓은 훼이크고 스타리그 보러. 오늘 야구는 안봤지만 스타리그는 봅니다. 물론 야구 개막하면 스타리그따윈 아오안이져.





by Anakin | 2009/03/20 18:31 | Sabermetrics | 트랙백 | 덧글(14)

◀ 이전 페이지 다음 페이지 ▶