So você quer ser um nerd do basebol.
Opção sábia. De todos os tipos de totós que já experimentei, o totó do basebol tem sido o mais gratificante. De qualquer modo, é definitivamente o máximo daquela vez em que me interessei por porcos.
Mas para ser um nerd do basebol, é preciso conhecer a sabermetria. Esse é o campo de estudo que Bill James caracterizou uma vez, via SABR, como sendo “a busca de conhecimento objectivo sobre o basebol”. É mais precisamente caracterizado como a resposta do basebol à ciência do foguete. É material complicado.
O nosso objectivo é torná-lo menos complicado, tomando em consideração três tópicos: as melhores formas de avaliar a tacada e o lançamento, e o que fazer com o sabre-stat favorito de todos: WAR.
Se me seguirem desta forma…
As melhores formas de avaliar os rebatedores
Não se vê apenas média, homers e RBI quando as transmissões de basebol introduzem rebatedores. Tendem agora a incluir o OPS, que é o mais básico sabre-stat de necessidade de conhecimento existente.
Para aqueles que não sabem, o OPS é “on-base plus slugging”, ou a percentagem de um batedor on-base (OBP) mais a sua percentagem de slugging (SLUG). Bruto como é, é um reflexo melhor do talento de um batedor do que o trio tradicional de média, homers e RBI.
Hitters existem para pontuar runs. As corridas de pontuação têm a ver com chegar à base e contornar as bases. O primeiro talento é encapsulado em OBP. Porque mede como os rebatedores usam o poder para contornar as bases, o segundo é encapsulado em SLUG.
O que falta ao OPS, no entanto, é o contexto. Dá uma boa fotografia do talento de um batedor, mas não lhe diz quão bom é o seu talento comparado com o dos outros.
É aí que o OPS+ vem a calhar.
Por Baseball-Reference.com-um site para saber-OPS+ pega no OPS de um batedor e ajusta-se a duas coisas: as taxas médias de OBP e SLUG da liga e o estádio de basebol do batedor.
Todos os resultados são numa escala de 100, sendo que acima de 100 constitui uma produção “acima da média” e abaixo constitui uma produção “abaixo da média”.
Para o ver em acção, recordemos a corrida de 1997 da Liga Nacional de MVP entre Mike Piazza e Larry Walker:
Player | AVG | OBP | SLG | OPS | OPS+ | |
Piazza | .362 | .431 | .638 | 1.070 | 185 | |
.366 | .452 | 1.172 | 178 |
Por média, OBP, slugging e OPS, Walker foi o melhor atirador. Sendo o melhor batedor ajudou-o a ganhar o MVP porque os eleitores adoram bater.
Mas se os eleitores estivessem a olhar para o OPS+, talvez tivessem escolhido Piazza em vez disso.
Não é difícil encontrar a fonte da conclusão do OPS+. Enquanto o Walker jogava no campo de Coors-friendly, o Piazza jogava no Estádio Dodger-friendly. Neutralizar os dois parques domésticos usando OPS+, e Piazza teve a época mais impressionante.
É assim que o OPS+ pode ser usado para comparar os rebatedores contemporâneos. Mas em virtude do OPS+ também se ajustar às taxas médias de OBP e SLUG da liga, também é bom para neutralizar diferentes ambientes de run-scoring.
Assim, é útil na comparação de jogadores de diferentes épocas.
Podemos usar OPS+ para ver que a produção de Miguel Cabrera em 2013, uma época extremamente amiga do lançador, foi na realidade melhor que a de Jason Giambi em 2000, uma época extremamente amiga do lançador:
Se tudo o que quer é uma rápida fotografia do talento de um batedor, o OPS está bem. Mas se quiser comparar os batedores, o OPS+ é o seu huckleberry.
Mas se quiser ficar realmente nerd, há uma estatística que faz o trabalho do OPS+ ainda melhor do que o OPS+. Isso seria uma série ponderada criada mais (wRC+).
Para conhecer esta, no entanto, é preciso conhecer primeiro a média ponderada na base (wOBA).
p>Embora eu esteja geralmente bem com ela, o OPS tem uma falha fundamental. Ao simplesmente adicioná-las, assume que OBP e SLUG são iguais.
Por FanGraphs-um outro site a conhecer-OBP é na realidade cerca do dobro do valor do SLUG. Depois há como o SLUG assume que os duplos são duas vezes mais valiosos do que os solteiros e assim por diante. Na realidade, é mais complicado do que isso.
O que o wOBA faz é correcto para estas imperfeições ao ponderar aspectos de percursos involuntários, HBPs, singles, duplas, triplas, homers- “em proporção ao seu valor real de percurso”.
Existe alguma feitiçaria que vai na determinação do “valor de corrida”, mas o conceito básico é que cada um dos eventos acima mencionados influencia as hipóteses de uma equipa de pontuar até um grau específico. São estes graus específicos que a wOBA incorpora que a OPS não incorpora.
É melhor pensar em wOBA como uma versão mais precisa do OPS, o que está relacionado com a forma como o wRC+ é mais preciso do que o OPS+.
Como o OPS+, o wRC+ funciona numa escala acima da média/abaixo da média de 100. A diferença é que o wRC+ é uma espécie de cruzamento entre uma estatística de taxa e uma estatística de contagem, uma que é concebida para obter o valor ofensivo de um jogador medindo-o em corridas.
É uma coisa complicada, mas a ideia básica é pegar no wOBA de um jogador, fazer alguns ajustes na liga e no parque e mais feitiçaria para o converter em quantas corridas totais vale o wOBA do jogador. Então esse número é tomado e dividido pela média da liga e multiplicado por 100 para criar wRC+.
Para o ver em acção, vamos comparar o que Josh Donaldson e Robinson Cano fizeram em 2013:
Se parássemos na OPS, estaríamos a olhar para Cano como o batedor superior.
mas wOBA favorece a temporada que Donaldson teve, e não é difícil identificar o porquê. Uma vez que a wOBA não se preocupa com caminhadas intencionais, ele recebeu um impulso de 74 caminhadas não intencionais ao Cano’s 49.
O que a wRC+ faz é factor de como Donaldson jogou no O.co Coliseum amigo do lançador enquanto Cano jogou no estádio Yankee amigo do rebatedor. A vantagem para Donaldson ajuda a explicar o seu wRC superior+.
Aqui no final, direi que se pode escapar bem sabendo apenas OPS e OPS+. Mas se quiser sentir-se em casa entre os super-nerds do basebol, precisa de saber wOBA e wRC+.
Agora, então, o que diz a falarmos de pitching?
As melhores formas de avaliar pitchers
Ainda não chegámos ao ponto em que as transmissões de beisebol são tão iluminadas com as estatísticas de pitching como deveriam ser. Ainda se trata principalmente de vitórias, derrotas e ERA.
Parto do princípio de que já se tem uma compreensão básica dos motivos pelos quais as vitórias e as derrotas são falsas. A ERA, felizmente, é menos falsa.
Mas ainda está longe de ser perfeita.
Como as vitórias e as derrotas, a ERA pode ser influenciada por coisas fora do controlo de um lançador, particularmente o nível de talento da sua defesa. Mesmo que uma defesa não cometa muitos erros, pode ainda assim lutar para converter bolas batedoras em outs, o que pode prejudicar a ERA de um lançador.
É por isso que temos o lançamento independente de campo (FIP), o lançamento independente de campo esperado (xFIP) e a ERA (SIERA), que estima o que a ERA de um lançador deve ser baseada nas coisas que ele pode controlar.
FIP é o mais simples do grupo, pois concentra-se em apenas quatro resultados controláveis: strikeouts, caminhadas, HBPs e homers. Este vídeo amigo da família ajudará a explicar porque é que apenas estes quatro:
Uma queixa com FIP é que os lançadores só têm tanto controlo sobre os homers, o que é verdade.
É aqui que xFIP vem a calhar, uma vez que substitui o total de um jarro de homers com uma estimativa de quantos homers ele deveria ter permitido. Isto é adquirido multiplicando a taxa média de home run-to-fly-ball da liga (HR/FB) pela taxa de fly-ball do lançador (FB%).
A próxima reclamação é que os lançadores devem ter algum controlo sobre as bolas batedoras. Especificamente, uma vez que as bolas moídas são boas, os lançadores que recebem muitas delas não devem ser recompensados?
Enter SIERA. Concentra-se nas mesmas coisas em que o FIP e o xFIP se concentram, mas na realidade tenta fazer algo de bolas batidas.
Notably, Baseball Prospectus-yet ainda outro site a saber – diz que reconhece é como “a prevenção da corrida melhora à medida que a taxa de bolas moídas aumenta”. Isto faz sentido dado que as bolas moídas A) raramente vão para batidas extra-base, B) são facilmente convertidas em outs e C) recebem jogadas duplas.
P>Let’s stop and consideremos os dois campeões da ERA do ano passado: Clayton Kershaw e Anibal Sanchez.
Parece ridículo, mas é preciso considerar para que olham essas estatísticas.
Com FIP, trata-se de strikeouts, caminhadas, homers e HBPs. Kershaw teve a menor taxa de caminhadas, mas Sanchez teve a maior taxa de strikeout. Noutros lugares, não há grande diferença na quantidade de batedores que atingem e nenhuma diferença nas suas taxas de HR/FB.
Com xFIP, trata-se de neutralizar o total de home runs de um lançador com base no seu FB%. Quando se olha para o FB% de ambos os arremessadores, não se vê grande diferença. Kershaw’s foi ligeiramente inferior, daí o xFIP ligeiramente inferior.
Quando se trata de SIERA, a chave é a percentagem de bola de terra (GB%). Kershaw tinha apenas uma vantagem modesta em GB%, o que ajuda a explicar a sua vantagem meramente modesta em SIERA.
Então, se não o seu pitching, qual era a diferença real entre os dois?
P>Primeiro, era a defesa.
Kershaw lançou para uma defesa extremamente superior, uma vez que o Prospecto de Basebol tinha os Dodgers no nº 9 em eficiência defensiva, o que mede simplesmente o ritmo a que as bolas em jogo são convertidas em outs. Sanchez, entretanto, arremessou para a defesa nº 27.
Mais uma pergunta antes de avançarmos: O que podemos usar para comparar lançadores de diferentes parques e/ou diferentes ligas?
No mínimo, existe a ERA+. Faz o mesmo que o OPS+ faz para o OPS na medida em que toma ERA e ajusta-se para as ligas e parques. Mais uma vez, qualquer coisa acima de 100 está acima da média e menos de 100 está abaixo da média.
Usando esta estatística, podemos ver que Kershaw’s 1.83 ERA de 2013 é risivelmente inferior à de Pedro Martinez 1.74 ERA de 2000:
Player | Ano | ERA | |
2000 | 1.74 | 291 | |
Kershaw | 2013 | 1.83 | 196 |
Com respeito aos estimadores da ERA, outra grande coisa sobre o SIERA é que, por defeito, é ajustado pela liga e pelo parque. O FIP e o xFIP não existem, razão pela qual o FIP- e xFIP- existem.
Como o ERA+, FIP- e xFIP- funcionam numa escala de 100. A diferença é que, como o menos indica, tudo o que está abaixo de 100 está acima da média e tudo o que está acima está abaixo da média.
p>Peguemos nestas duas estatísticas e apliquemo-las a Kershaw e Sanchez.
Player | FIP- | xFIP- |
Kershaw | 76 | |
Sanchez | 59 | 74 |
Aqui a vantagem é com Sanchez em ambas as categorias. Isto deve-se a como, por factores do parque FanGraphs, Comerica Park foi um ambiente menos amigável do que o Estádio Dodger.
Então sim. Não só se pode argumentar que Sanchez era igual a Kershaw em 2013, como também se pode argumentar que ele era realmente melhor. Porque sabermetrics!
(Declaração de exoneração de responsabilidade: Não leve tudo isto a significar que eu sou anti-Kershaw. Na verdade, eu o amo muito.)
Por este ponto, você deveria estar a sentir-se devidamente nerd. Da próxima vez que se reunir com os seus amigos no estádio, vai ser capaz de os impressionar com a conversa não só de OPS+, wOBA e wRC+, mas também de FIP, xFIP, SIERA, ERA, FIP- e xFIP-.
Mas também precisa de ser capaz de falar WAR.
…O que não é fácil.
O que fazer de WAR
Se perder o debate sobre o MVP da Liga Americana de 2012, WAR representa vitórias acima de substituições e é uma bobagem de um conceito.
Nas palavras de FanGraphs, WAR tenta “resumir as contribuições totais de um jogador para a sua equipa numa estatística”. Faz isso quantificando quantas mais vitórias uma equipa obteve de um jogador do que teria obtido de um jogador substituto, tal como um aquecedor de bancada ou um scrub de liga menor.
Para os lançadores, encontrar WAR resume-se principalmente aos innings arremessados e aos runs permitidos. A parte do turno é fácil, mas descobrir a parte das corridas é uma questão de preferência. Baseball-Reference.com analisa as corridas totais permitidas, enquanto FanGraphs usa FIP como base.
Como tal, FanGraphs WAR (fWAR) é mais sobre corridas hipotéticas permitidas e, portanto, valor hipotético. Baseball-Reference.com WAR (rWAR), por comparação, é mais sobre o valor real.
Independentemente, penso pessoalmente que WAR funciona bem para os lançadores. Ao concentrar-se principalmente nos lançamentos e corridas permitidas, certamente realça mais o valor de um lançador para a sua equipa do que o seu recorde.
Gosto também de como não desvaloriza a importância dos turnos. Valoriza legitimamente os iniciadores sobre os aliviadores, e também pode dar aos comedores de turno o crédito que merecem.
A batalha entre Justin Verlander e David Price para o AL Cy Young de 2012 dá um bom exemplo:
Player | IP | Corridas Permitidas | ERA | rWAR | FIP | fWAR |
Verlander | 238.1 | 81 | 2,64 | 2,94 | 7,0 | |
Preço | 211.0 | 63 | 2.56 | 3.05 | 4.8 |
Verlander’s edge in innings pitched era notavelmente maior do que a vantagem do Price em corridas permitidas, e os seus ERAs e FIPs eram aproximadamente iguais. Verlander fez basicamente o que Price fez em mais innings. Mais um caso de voterscewedupus.
É a minha opinião sobre o WAR para os lançadores: É tão simples como eficaz. Tem de ter em mente qual a GUERRA que prefere, mas deve sentir-se livre para usar a GUERRA quando falar de lançadores.
Com jogadores de posição, no entanto, recomenda-se cautela.
Em teoria, a GUER é ainda mais ideal para jogadores de posição do que para lançadores. Enquanto que a pancada, o baserunning e o fielding são preocupações secundárias para os lançadores, os rebatedores devem fazer os três. Uma vez que WAR tenta abranger quantas corridas os rebatedores produzem com o seu rebatimento e baserunning, e quantas levam com a sua defesa, deve ser a estatística perfeita para eles.
Não é. Nem por isso, de qualquer forma.
As partes de acerto e baserunning da GUERRA são sólidas. Tanto o Baseball-Reference.com como o FanGraphs usam wOBA como base para o valor de acerto, e um sistema de créditos e débitos em bases específicas de jogadas-roubadas, apanhados-roubados, primeiro a terceiro, tag-ups, outs nas bases etc.- para o valor de baserunning.
Mas defesa? Essa é a parte complicada.
Para começar, Baseball-Reference.com e FanGraphs baseiam as porções de defesa dos seus cálculos de WAR em diferentes métricas. O Baseball-Reference.com utiliza corridas defensivas guardadas (DRS). FanGraphs utiliza a classificação de zona final (UZR).
Como estas duas estatísticas funcionam é mais do que complicado, mas o Gabe Kapler da Fox Sports resumiu bem o DRS aqui:
UZR funciona de forma semelhante, e tanto o UZR como o DRS acabam por tentar calcular a mesma coisa: quantas “runs” acima ou abaixo da média um jogador está na defesa.
Mas como tem dois sistemas diferentes, tem o potencial para dois resultados diferentes. E isso acontece muitas vezes. De facto, é raro que o DRS e o UZR de um jogador pareçam exactamente iguais, o que significa que é raro que o rWAR e o fWAR de um jogador pareçam exactamente iguais.
Então, há os tempos em que os dois sistemas discordam completamente, como aconteceu com Jhonny Peralta em 2012:
DRS tinha Peralta como um shortstop defensivo abaixo da média, o que influenciou a sua rWAR saindo apenas para 1.1. A UZR, contudo, teve-o como um defensor acima da média, o que influenciou o seu fWAR a sair para 2.5.
A situação do Peralta destaca não só como o rWAR e o fWAR vão frequentemente discordar, mas também como os próprios sistemas DRS e UZR são imperfeitos. Por mais cuidadosamente trabalhados que sejam, são subjectivos – seguramente mais subjectivos do que as outras estatísticas que entram no cálculo de WAR, o que é um problema.
Isto não significa que WAR seja totalmente inválida como pau de medição para os jogadores de posição. Significa apenas que WAR não pode ser o início e o fim dos debates. Deve ser parte de um argumento, não o argumento.
Penso que essa é a nossa deixa para lhe chamar um dia. Desde que eu tenha feito o meu trabalho e que estivesses a prestar atenção, agora és mais cromo do basebol do que eras antes. Parabéns.
Uma palavra de aviso, no entanto. Isto pode começar a acontecer-lhe agora:
Apenas um aviso.