So you want to be a baseball nerd.
Scelta saggia. Di tutti i tipi di nerd che ho sperimentato, quello del baseball è stato il più gratificante. Sicuramente supera quel periodo in cui ero appassionato di pog, comunque.
Ma per essere un nerd del baseball, bisogna conoscere la sabermetrica. Questo è il campo di studio che Bill James una volta ha caratterizzato, tramite la SABR, come “la ricerca di una conoscenza oggettiva sul baseball”. È più precisamente caratterizzato come la risposta del baseball alla scienza missilistica. È roba complicata.
Il nostro obiettivo è quello di renderla meno complicata dando uno sguardo semplice a tre argomenti: i modi migliori per valutare i battitori e i lanciatori, e cosa fare della statistica preferita da tutti: WAR.
Se volete seguirmi da questa parte…
I migliori modi per valutare i battitori
Non si vedono solo media, homer e RBI quando le telecronache del baseball presentano i battitori. Ora tendono a includere l’OPS, che è la più fondamentale delle statistiche saber esistenti.
Per chi non lo sapesse, OPS è “on-base più slugging”, ovvero la percentuale di on-base (OBP) di un battitore più la sua percentuale di slugging (SLUG). Per quanto rozzo, è un miglior riflesso del talento di un battitore rispetto al tradizionale trio di media, homer e RBI.
I battitori esistono per segnare corse. Segnare corse significa andare in base e fare il giro delle basi. Il primo talento è racchiuso nell’OBP. Poiché misura come i battitori usano il potere per aggirare le basi, il secondo è incapsulato in SLUG.
Quello che manca a OPS, tuttavia, è il contesto. Dà una buona istantanea del talento di un battitore, ma non vi dice quanto sia buono il suo talento rispetto a quello degli altri.
Ecco dove OPS+ viene in aiuto.
Per Baseball-Reference.com – un sito da conoscere – OPS+ prende l’OPS di un battitore e lo aggiusta per due cose: i tassi OBP e SLUG nella media della lega e il ballpark di casa del battitore.
Tutto finisce su una scala di 100, con sopra 100 che costituisce una produzione “sopra la media” e sotto che costituisce una produzione “sotto la media”.
Per vederlo in azione, ricordiamo la gara di MVP della National League del 1997 tra Mike Piazza e Larry Walker:
Giocatore | AVG | OBP | SLG | OPS | OPS+ |
Piazza | .362 | .431 | .638 | 1.070 | 185 |
Walker | .366 | .452 | .720 | 1.172 | 178 |
Con media, OBP, slugging e OPS, Walker era il miglior battitore. Essere il miglior battitore lo ha aiutato a vincere l’MVP perché gli elettori amano colpire.
Ma se gli elettori avessero guardato OPS+, forse avrebbero scelto Piazza invece.
Non è difficile trovare la fonte della conclusione di OPS+. Mentre Walker ha giocato nel Coors Field, favorevole ai battitori, Piazza ha giocato nel Dodger Stadium, favorevole ai lanciatori. Neutralizziamo i due home park usando OPS+, e Piazza ha avuto la stagione più impressionante.
Ecco come OPS+ può essere usato per confrontare i battitori contemporanei. Ma in virtù del fatto che OPS+ aggiusta anche i tassi di OBP e SLUG nella media della lega, è anche buono per neutralizzare i diversi ambienti di punteggio.
Quindi, è utile per confrontare giocatori di epoche diverse.
Possiamo usare OPS+ per vedere che la produzione di Miguel Cabrera nel 2013, una stagione estremamente favorevole ai lanciatori, è stata effettivamente migliore di quella di Jason Giambi nel 2000, una stagione estremamente favorevole ai battitori:
Giocatore | Anno | AVG | OBP | SLUG | OPS | OPS+ |
Cabrera | 2013 | .348 | .442 | .636 | 1.078 | 191 |
Giambi | 2000 | .333 | .476 | .647 | 1.123 | 187 |
Se tutto quello che vuoi è una rapida istantanea del talento di un battitore, OPS è bene. Ma se volete confrontare i battitori, OPS+ è il vostro huckleberry.
Ma se volete diventare davvero nerd, c’è una statistica che fa il lavoro di OPS+ anche meglio di OPS+. Questa sarebbe la corsa ponderata creata più (wRC+).
Per conoscere questa, però, dovete prima conoscere la media ponderata in base (wOBA).
Mentre io sono generalmente d’accordo con essa, OPS ha un difetto fondamentale. Sommandoli semplicemente, presuppone che OBP e SLUG siano uguali.
Per FanGraphs-un altro sito da conoscere-OBP è in realtà circa il doppio del valore di SLUG. Poi c’è come SLUG presuppone che i doppi siano due volte più preziosi dei singoli e così via. In realtà, è più complicato di così.
Quello che fa wOBA è correggere queste imperfezioni pesando gli aspetti del colpire – passeggiate involontarie, HBP, singoli, doppi, tripli, homer – “in proporzione al loro effettivo valore di corsa”.
C’è un po’ di magia nel determinare il “valore della corsa”, ma il concetto di base è che ognuno degli eventi di cui sopra influenza le possibilità di una squadra di segnare in una misura specifica. Sono questi gradi specifici che il wOBA incorpora e l’OPS no.
È meglio pensare a wOBA come una versione più accurata di OPS, che è collegata a come wRC+ è più accurata di OPS+.
Come OPS+, wRC+ lavora su una scala sopra la media/basso la media di 100. La differenza è che il wRC+ è una specie di incrocio tra una statistica di tasso e una statistica di conteggio, una che è progettata per ottenere il valore offensivo di un giocatore misurandolo in corse.
È roba complicata, ma l’idea di base è quella di prendere il wOBA di un giocatore, buttare dentro alcune regolazioni di lega e parco e più magie per convertirlo in quante corse totali il wOBA del giocatore vale. Poi questa cifra viene presa e divisa per la media della lega e moltiplicata per 100 per creare il wRC+.
Per vederlo in azione, confrontiamo ciò che Josh Donaldson e Robinson Cano hanno fatto nel 2013:
Giocatore | PA | AVG | OBP | SLG | OPS | wOBA | wRC+ |
Donaldson | 668 | .301 | .384 | .499 | .883 | .384 | 148 |
Cano | 681 | .314 | .383 | .516 | .899 | .384 | 142 |
Se ci fermassimo a OPS, staremmo guardando Cano come il battitore superiore.
Ma il wOBA favorisce la stagione di Donaldson, e non è difficile capire perché. Dal momento che wOBA non si preoccupa delle passeggiate intenzionali, ha ottenuto una spinta dal disegno di 74 passeggiate involontarie a 49 di Cano.
Quello che wRC+ fa è il fattore in come Donaldson ha giocato al pitcher-friendly O.co Coliseum mentre Cano ha giocato al hitter-friendly Yankee Stadium. Il bordo per Donaldson aiuta a spiegare il suo superiore wRC+.
Qui alla fine, dirò che si può andare via bene con la conoscenza solo OPS e OPS+. Ma se volete sentirvi a casa tra i super-nerd del baseball, dovete conoscere wOBA e wRC+.
Ora, che ne dite di parlare di lanci?
I migliori modi per valutare i lanciatori
Non siamo ancora arrivati al punto in cui le telecronache di baseball sono illuminate dalle statistiche dei lanciatori come dovrebbero essere. Sono ancora principalmente su vittorie, sconfitte e ERA.
Presumo che abbiate già una comprensione di base del perché vittorie e sconfitte sono fasulle. L’ERA, fortunatamente, è meno fasulla.
Ma è ancora lontana dalla perfezione.
Come le vittorie e le perdite, l’ERA può essere influenzata da cose al di fuori del controllo di un lanciatore, in particolare il livello di talento della sua difesa. Anche se una difesa non fa molti errori, può ancora lottare per convertire le palle battute in out, il che può danneggiare l’ERA di un lanciatore.
Questo è il motivo per cui abbiamo il fielding independent pitching (FIP), l’expected fielding independent pitching (xFIP) e lo skill-interactive ERA (SIERA), che stimano quale dovrebbe essere l’ERA di un lanciatore in base alle cose che può controllare.
FIP è il più semplice del gruppo, poiché si concentra su solo quattro risultati controllabili: strikeout, passeggiate, HBP e homer. Questo video per famiglie vi aiuterà a spiegare perché solo questi quattro:
Una lamentela con la FIP è che i lanciatori hanno solo tanto controllo sugli homer, il che è vero.
Ecco dove xFIP è utile, in quanto sostituisce il totale degli homer di un lanciatore con una stima di quanti homer avrebbe dovuto permettere. Questo si ottiene moltiplicando il tasso di home run-to-fly-ball medio della lega (HR/FB) per il tasso di fly-ball del lanciatore (FB%).
La prossima lamentela è che i lanciatori devono avere un certo controllo sulle palle battute. In particolare, dato che le palle a terra sono buone, non dovrebbero essere premiati i lanciatori che ne ricevono molte?
Entrare nel SIERA. Si concentra sulle stesse cose su cui si concentrano FIP e xFIP, ma in realtà cerca di fare qualcosa delle palle battute.
In particolare, Baseball Prospectus – un altro sito da conoscere – dice che riconosce è come “la prevenzione delle corse migliora con l’aumento del tasso di palla a terra”. Questo ha senso dato che le palle a terra A) raramente vanno per i colpi extra-base, B) sono facilmente convertiti in outs e C) ottenere doppi giochi.
Fermiamoci a considerare i due campioni ERA dell’anno scorso: Clayton Kershaw e Anibal Sanchez.
Giocatore | K/9 | BB/9 | HR/FB | HBP | GB% | FB% | ERA | FIP | xFIP | SIERA |
Kershaw | 8.85 | 1.98 | 5.8 | 3 | 46.0 | 31.3 | 1.83 | 2.39 | 2.88 | 2.99 |
Sanchez | 9.99 | 2.67 | 5.8 | 2 | 45.4 | 32.7 | 2.57 | 2.39 | 2.91 | 3.03 |
Sembra ridicolo, ma bisogna considerare cosa guardano quelle statistiche.
Con la FIP, si tratta di strikeouts, walks, homers e HBPs. Kershaw aveva il tasso di walk più basso, ma Sanchez aveva il tasso di strikeout più alto. Altrove, non c’è grande differenza nel numero di battitori colpiti e nessuna differenza nei loro tassi HR/FB.
Con xFIP, si tratta di neutralizzare il totale di home run di un lanciatore basato sulla sua FB%. Quando si guarda la FB% di entrambi i lanciatori, non si vedono grandi differenze. Quella di Kershaw era leggermente più bassa, da cui la xFIP leggermente più bassa.
Quando si tratta di SIERA, la percentuale di palla a terra (GB%) è la chiave. Kershaw ha avuto solo un modesto vantaggio in GB%, che aiuta a spiegare il suo solo modesto vantaggio in SIERA.
Quindi, se non il loro lancio, qual era la vera differenza tra i due?
Primariamente, era difesa.
Kershaw ha lanciato a una difesa enormemente superiore, come Baseball Prospectus aveva i Dodgers al n. 9 in efficienza difensiva, che misura semplicemente il tasso in cui le palle in gioco vengono convertite in out. Sanchez, nel frattempo, ha lanciato al No. 27 defense.
Un’altra domanda prima di andare avanti: Cosa possiamo usare per confrontare i lanciatori da diversi parchi e/o diverse leghe?
Almeno, c’è ERA+. Fa la stessa cosa che OPS+ fa per OPS in quanto prende ERA e regola per leghe e parchi. Ancora una volta, qualsiasi cosa sopra 100 è sopra la media e meno di 100 è sotto la media.83 ERA del 2013 è ridicolmente inferiore al 1.74 ERA di Pedro Martinez del 2000:
Giocatore | Anno | ERA | ERA+ |
Martinez | 2000 | 1.74 | 291 |
Kershaw | 2013 | 1.83 | 196 |
Per quanto riguarda gli stimatori dell’ERA, un’altra cosa grandiosa di SIERA è che è aggiustato per la lega e il parco per default. FIP e xFIP non lo sono, ed è per questo che esistono FIP- e xFIP-.
Come ERA+, FIP- e xFIP- lavorano su una scala di 100. La differenza è che, come indica il meno, tutto ciò che è sotto 100 è sopra la media e tutto ciò che è sopra è sotto la media.
Prendiamo queste due statistiche e applichiamole a Kershaw e Sanchez.
Giocatore | FIP- | xFIP- |
Kershaw | 66 | 76 |
Sanchez | 59 | 74 |
Qui il vantaggio è con Sanchez in entrambe le categorie. Questo è dovuto a come, per i fattori di parco di FanGraphs, Comerica Park era un ambiente di lancio meno amichevole del Dodger Stadium.
Quindi sì. Non solo si può sostenere che Sanchez è stato uguale a Kershaw nel 2013, ma si può sostenere che sia stato effettivamente migliore. Perché la sabermetrica!
(Disclaimer: non prendete tutto questo per dire che sono anti-Kershaw. In realtà lo amo molto.)
A questo punto, dovreste sentirvi adeguatamente nerd. La prossima volta che vi riunite con i vostri amici al campo da baseball, sarete in grado di impressionarli/infastidirli parlando non solo di OPS+, wOBA e wRC+, ma anche di FIP, xFIP, SIERA, ERA, FIP- e xFIP-.
Ma bisogna anche saper parlare di WAR.
…Il che non è facile.
Cosa fare della WAR
Se vi siete persi il dibattito sull’MVP dell’American League 2012, WAR sta per wins above replacement ed è un concetto molto interessante.
Nelle parole di FanGraphs, WAR cerca di “riassumere il contributo totale di un giocatore alla sua squadra in una statistica”. Lo fa quantificando quante vittorie in più una squadra ha guadagnato da un giocatore rispetto a quante ne avrebbe ottenute da un giocatore di livello sostitutivo, come un panchinaro o uno scarto della lega minore.
Per i lanciatori, trovare WAR si riduce principalmente a inning lanciati e corse concesse. La parte degli inning è facile, ma capire la parte delle corse è una questione di preferenze. Baseball-Reference.com guarda al totale delle corse concesse, mentre FanGraphs usa la FIP come base.
Come tale, FanGraphs WAR (fWAR) riguarda più le corse ipotetiche concesse e, quindi, il valore ipotetico. Baseball-Reference.com WAR (rWAR), in confronto, è più sul valore reale.
In ogni caso, personalmente penso che la WAR funzioni bene per i lanciatori. Concentrandosi principalmente su inning lanciati e corse concesse, mette certamente in evidenza il valore di un lanciatore per la sua squadra più di quanto non faccia il suo record.
Mi piace anche come non sminuisce l’importanza degli inning. Valorizza giustamente i partenti rispetto ai rilievi, e può anche dare ai mangiatori di inning il credito che meritano.
La battaglia tra Justin Verlander e David Price per il 2012 AL Cy Young è un buon esempio:
Giocatore | IP | Runs Allowed | ERA | rWAR | FIP | fWAR |
Verlander | 238.1 | 81 | 2.64 | 7.8 | 2.94 | 7.0 |
Price | 211.0 | 63 | 2.56 | 6.9 | 3.05 | 4.8 |
Il vantaggio di Verlander nei lanci è stato notevolmente più grande di quello di Price nelle corse concesse, e le loro ERA e FIP sono più o meno uguali. Verlander fondamentalmente ha fatto quello che prezzo ha fatto su più inning. Ancora un altro caso di voterscewedupus.
Questa è la mia opinione sulla WAR per i lanciatori: È tanto semplice quanto efficace. Bisogna essere consapevoli di quale WAR si preferisce, ma ci si dovrebbe sentire liberi di usare WAR quando si parla di lanciatori.
Con i giocatori di posizione, però, si raccomanda cautela.
In teoria, WAR è ancora più ideale per i giocatori di posizione che per i lanciatori. Mentre per i lanciatori il colpire, il baserunning e il fielding sono preoccupazioni secondarie, i battitori devono fare tutte e tre le cose. Dal momento che WAR cerca di comprendere quante corse i battitori producono con i loro colpi e baserunning, e quante ne tolgono con la loro difesa, dovrebbe essere la statistica perfetta per loro.
Non lo è. Non del tutto, comunque.
Le parti di battuta e di baserunning di WAR sono solide. Sia Baseball-Reference.com che FanGraphs usano il wOBA come base per il valore di battuta, e un sistema di crediti e debiti su specifiche giocate – basi rubate, rubate catturate, prime a terzi, tag-up, outs sulle basi, ecc – per il valore di corsa in base.
Ma la difesa? Questa è la parte difficile.
Per cominciare, Baseball-Reference.com e FanGraphs basano le porzioni di difesa dei loro calcoli di WAR su metriche diverse. Baseball-Reference.com usa le corse difensive salvate (DRS). FanGraphs usa l’ultimate zone rating (UZR).
Come funzionano queste due statistiche è più che complicato, ma Gabe Kapler di Fox Sports ha riassunto bene DRS qui:
UZR funziona in modo simile, e sia UZR che DRS alla fine cercano di calcolare la stessa cosa: quante “corse” sopra o sotto la media è un giocatore in difesa.
Ma poiché avete due sistemi diversi, avete il potenziale per due risultati diversi. E questo succede spesso. Infatti, è raro che il DRS e l’UZR di un giocatore siano esattamente uguali, il che significa che è raro che il rWAR e il fWAR di un giocatore siano esattamente uguali.
Poi ci sono le volte in cui i due sistemi sono completamente in disaccordo, come hanno fatto con Jhonny Peralta nel 2012:
DRS | rWAR | UZR | fWAR |
-1 | 1.1 | 11.5 | 2.5 |
DRS aveva Peralta come un interbase difensivo sotto la media, che ha influenzato il suo rWAR che esce a solo 1.1. UZR, tuttavia, lo aveva come un difensore sopra la media, che ha influenzato il suo fWAR che esce a 2.5.
La situazione di Peralta evidenzia non solo come rWAR e fWAR sono spesso in disaccordo, ma come i sistemi DRS e UZR stessi sono imperfetti. Per quanto accuratamente realizzati, sono soggettivi – sicuramente più soggettivi delle altre statistiche che entrano nel calcolo della WAR, il che è un problema.
Questo non significa che la WAR sia totalmente invalida come misura per i giocatori di posizione. Significa solo che la WAR non può essere l’inizio e la fine dei dibattiti. Deve essere parte di un argomento, non l’argomento. A condizione che io abbia fatto il mio lavoro e che tu abbia prestato attenzione, ora sei più nerd del baseball di prima. Congratulazioni.
Una parola di avvertimento, però. Questo potrebbe iniziare a succederti ora:
Solo un avvertimento.