愛台灣棒球•看台灣棒球•了解台灣棒球
2005-06-14
得分機率、得分期望值,以及與戰術使用的關聯
作者介紹
曹士昌•師法Bill James, 盼能以棒球統計的觀點提供另一種欣賞棒球的趣味
>>目前發表篇數:37篇
所有作品列表
各種戰術的使用是否過多的爭議在中華職棒層出不窮,贊成與反對者均大有人在。這個問題是否能用數據來分析呢?答案既是肯定的也是否定的。肯定是因為仍然有多種方法評估一些戰術對於得分造成的影響,而否定則是因為這些分析方法用來評估整體趨勢較為有用,但由於戰術執行時的臨場狀況不同,並不能適用於每一個情況。可是,就因為這個否定的原因我們就說數據分析戰術無用嗎?非也非也。其實這個否定的理由幾乎適用於所有數據,就拿大家都知道的打擊率來說好了,如果球員甲一年下來累積打擊率三成,某乙一年下來累積打擊率兩成,幾乎每個人都會說某甲有比較好的實力常常打出安打吧?如果只看一兩球,球員甲可能有幾支安打是不小心打到棒頭變成不太營養的安打,而某乙也可能有幾個出局數是準確地打到球心可是卻被對方的美技演出接殺出局。但是長期比賽下來,我們相信運氣不太可能會只站在某一邊,所以當兩人數據有“明顯“差距時,用數據來評斷實際能力還是相當可靠的。至於怎樣才算是“明顯“差距,這就關係到統計了,等一下再來考慮這個問題。

接下來回到主題:戰術。要怎麼用數據來評估戰術效應呢?方法不只一種,這篇所要介紹的,是去計算在各種出局數以及壘包狀況下的得分機率以及期望值,然後看看一些戰術執行前後對於機率以及期望值所造成的變化。在開始談戰術之前,先要給大家講解得分機率以及期望值的基本觀念。

以下的資料要感謝 ptt2 BBS 網友bluehand, lamento, sweetJ 的幫忙記錄,我們自行整理了大約兩百場完整比賽的比賽過程,總共是 3565 個半局,其中包含了兄弟進攻的局數共 1171 局,其他五隊各約 500 局。這些局數涵蓋了去年兄弟隊參與的全部一百場比賽,以及今年到 5/29 為止的所有比賽。由於計算上的原因(容後解釋),這邊捨棄了後攻球隊未完成一個半局的部份(也就是把出現再見安打之類結束比賽的那些半局去掉),首先統計每一個有打完的半局裡頭,各種出局數以及壘上跑者狀況,以下所有的表格中,左邊用 X, Y, Z, W 四個字母分別代表0, 1, 2, 3人出局,而第一排的數字(0, 1, 2, …, 123這些)代表八種壘上跑者佔了哪幾個壘。在三人出局之前,這八種壘包狀況都可能發生,所以有 3*8=24 種不同的出局數及壘包狀況。這 24 種狀況的發生次數列於以下的表格

0123121323123
X3653105524148210883850
Y25331147650158412243161127
Z19981072735283487257152174


也就是說,X與12交會之處的數字是 210,就代表在我們已統計的局數當中,一共出現過 210 次無人出局一二壘有人的情況,以此類推。

為了解釋得分機率與期望值的意義,這邊以 5/28 的蛇象戰七局下為例,該局蛇隊一共得到兩分,比賽過程是

第四棒一壘安打,一壘有人。
第五棒全壘打,二分打點。
第六棒游擊飛球接殺,一出局。
第七棒中外野飛球接殺,二出局。
第八棒游擊反彈球封殺,三出局。

這局在三人出局之前,一共產生了五個出局數及壘包狀況,依序為 X0、X1、X0、Y0、Z0。這局一開始無人出局無人在壘,所以對應到 X0 這格,在第四棒安打之後變成無人出局一壘有人,對應到 X1,以此類推。所謂的得分期望值,是考慮在那些狀況之後,在該局結束之前還會再得幾分。這局有兩次 X0,第一次 X0 時是這局剛開始,這局還會再得兩分,第二次 X0 時是在全壘打之後了,該局沒有再繼續得分。所以如果只算這個半局,那麼在 X0 狀況下得分機率是 1/2,而得分期望值則是 (2+0)/2 = 1,其他的狀況也可如法泡製。上面的表格是我們算出這三千五百多個半局的每種狀況各發生了幾次,每一次有無得分,得了幾分,依此計算出得分機率與期望值矩陣。計算過程中或有少許疏漏及錯誤,但已盡量減到最少,對於主要結果趨勢應不至於影響太大。

前面說由於計算上的原因,捨棄了後攻球隊未完成一個半局的部份,理由在於這些半局都沒有全部打完,在三人出局之前就都結束了,所以若對這些局數中也去算得分期望值,其實意義上略有不同。不過由於這些狀況發生頻率甚少,真的算進去的話也影響不大,讀者們可以忽略這邊的差異性。

接下來首先看得分期望值矩陣,結果是

0123121323123
X0.480.861.031.461.671.682.183.26
Y0.250.490.690.990.931.141.611.45
Z0.110.240.320.390.520.640.550.83


這些數字的大小變化趨勢幾乎都蠻符合直覺的,比如說每一欄的三個數字中,愈往下愈小,而直覺中如果已知道壘上跑者,那麼出局數愈多就應該會得分愈少。再看每一列,固定出局數的話,如果壘包上的人愈多或位置愈接近本壘,那麼得分照理說就應該愈多,所以表格裡幾乎是愈往右數字愈大,除了三壘有人與一二壘有人這兩個狀況比較難說哪個狀況較容易得分。

講到這裡,如果您有順著前一段的觀察去看看那些數字,那麼很容易就可以看到兩個比較奇怪的地方。首先比較一出局時二三壘有人與滿壘這兩個狀況(Y23與Y123),滿壘時假如進攻順利的話,得分應該會多一些;不過換個角度來看,滿壘時防守方製造雙殺的機會大了很多,所以雖然一壘上多了一個人,但得分也未必真的會比較多。

真正奇怪的其實是兩出局時一三壘有人與二三壘這兩個狀況(Z13與Z23),二三壘有人時不但比一三壘有人還要靠近得分位置,而且少了滾地球封殺二壘這個可能性,結果居然是兩出局二三壘有人時的得分期望值只有 0.55, 明顯比兩出局一三壘有人時的 0.64 分要少,比兩出局一二壘有人時的 0.52 分高不了多少。

我的推測理由是,由於中職過分重視打點輕忽上壘率,所以打者上場時,如果二三壘有人,會想一棒打回來賺兩分打點,而不太會想選球上壘,把更好的攻擊機會留給下一棒,也因此容易被投手的壞球吊到。一二壘有人跟一三壘有人時,保送相對來講比較有用,反而有好好選球打。

上個月底有機會與曾文誠先生談了一下這個問題,我問他多年來是否有注意到打者在這兩種情況下有什麼不同,是不是二三壘容易被投手吊,反正投手萬一投出保送比較無所謂,而打者又過於積極進攻。他說這結果蠻意外的,應該拿給各隊總教練看也會蠻意外的吧,至於原因並不是很清楚,很可能與上面猜測的很有關係,大概因為中華職棒打者沒那麼成熟,在急於建功之時,反而容易失手。另外,他也說知道有些打者明明了解二三壘有人時投手不急著投好球,可是還是常常一兩球就憋不住出棒,然後就掛了。也許要有機會接觸一些教練或球員才能更了解這個問題的癥結所在。

(談到這裡,如果您學過一些統計,或許會想到樣本數多寡或信賴區間之類的問題。這裡由於我並不打算引入更深的統計名詞,所以只列出那兩種狀況下的標準差,以供有興趣者參考。兩出局一三壘有人那 257 的樣本的得分標準差是 1.172,兩出局二三壘有人是 1.129。另外,每一隊的狀況也未必都完全相同,這就需要進一步的分析了。)

接下來我們看一些戰術考量,這裡考慮的是觸擊和盜壘這兩種可以明顯看出戰術前與戰術後的出局數及壘包狀況改變的戰術,而不考慮打帶跑、虛觸實打等等。使用觸擊(先不考慮強迫取分)的場合有數種,都列在底下

觸擊前狀況得分期望值觸擊成功後狀況得分期望值
X10.86Y20.69
X21.03Y30.99
X121.67Y231.61
Y10.49Z20.32
Y20.69Z30.39
Y120.93Z230.55


這裡拿第一個情況加以解釋。無人出局一人在壘時的期望期望值是 0.86分,如果此時採用觸擊而且成功,則會演變成一人出局二壘有人的狀況,得分期望值減為 0.69分。各個狀況雖然數字不同,但相同的一點是,右邊的數字都比左邊的小,所以若以這些數據來評估觸擊對總得分的影響,則觸擊“平均來說“會造成得分期望值下降,而這還是假設觸擊必定成功的結果,事實上呢,觸擊成功率當然不是百分之百, 所以觸擊戰術對得分造成的負面效應就更大了。

為什麼要說“平均來說“呢?理由正如同本文一開始提到的,這些數據用來評估一般的趨勢較為有用,但單一情況就未必了。舉個極端的例子,在無人出局一壘有人時,如果下一棒輪到的人被三振率百分之百,也就是說,如果讓他自己打而被三振,那麼得分期望值將從 0.86 降到 0.49(狀況從X1變成 Y1),那麼雖然觸擊通常對得分不利,但在這個時機使用還是可以把損失減少,因此仍然是有用的。這個例子其實蠻像是大聯盟比賽中,如果壘上有人又輪到打擊不好的投手打擊時,除了換代打,就是讓投手使用觸擊戰術了。

中華職棒採用投手指定代打,不會有這麼極端的情形。不過,如果輪到打者很弱時使用觸擊戰術成功,再讓下一棒較強的棒次進攻,或許也能夠收到觸擊的功效。可惜的是,事實上並非如此。比賽中常常在前幾局就讓並非很弱的棒次觸擊,甚至讓強棒觸給弱棒打,這實在是令人不曉得該說什麼的舉動。

另外,無人出局一壘有人時盜壘成功會把期望值從 0.86 提高到 1.03,若失敗則降為 0.25,所以成功率平均要達到 59/78= 76% 才有正的效應。這個百分比似乎高的有點出乎意料,應該還有其他因素涉及在內。比如說盜壘時有可能造成防守方失誤可以不只多前進一個壘,所以實際上需要的成功率比 76% 略低一些,這也需要更詳細的分析才能更清楚。

這時候或許又會有人問了,雖然在前幾局可能讓打者自由揮擊較好,但如果是比賽後段的緊要關頭呢?如果已經到了最後一局還是平手,那麼只要再拼一分,就很可能贏得該場球賽,再多得一分跟再多得四五分的差別不大,所以這個時候看得分的機率應該要比看得分期望值更有用一些。所以我們也來看看得分機率矩陣

0123121323123
X0.260.430.580.810.660.820.840.86
Y0.150.270.400.700.430.660.710.58
Z0.070.140.230.270.290.330.260.36


因為這裡看的是有得分的機率,而不去計較還會得多少分,所以數字大小的趨勢跟之前也不太相同了。相同的部份是,仍然是愈往下愈小。不同的部份是,會不會得分主要是看最接近本壘的那個跑者站在哪裡,跟其他跑者關係較小。比方說,在無人出局時,二壘有人(0.58)跟一二壘有人的得分機率差不多;三壘有人(0.81)、一三壘有人(0.82)、二三壘有人(0.84)、以及滿壘(0.86)的得分機率差不多。剛剛考慮得分期望值注意到的兩出局一三壘有人與兩出局二三壘有人這兩個狀況在這裡依舊奇怪。兩出局一三壘有人得分機率是 0.33,而兩出局二三壘有人時卻低到 0.26。奇怪奇怪真奇怪~

再看觸擊對得分機率的效應

觸擊前狀況得分機率觸擊成功後狀況得分機率
X10.43Y20.40
X20.58Y30.70
X120.66Y230.71
Y10.27Z20.23
Y20.40Z30.27
Y120.43Z230.26


現在有些狀況觸擊成功後得分機率提高了,尤其是無人出局二壘有人時。但是別忘了,這仍然是假設了“觸擊成功率百分之百“。當對一個打者下觸擊戰術時,應該要對該打者的觸擊能力以及當時的對方防守能力加以評估,才能更準確地估計觸擊造成的效應。另外,最常使用觸擊的狀況是無人出局一壘有人,觸擊前有 43% 的機會得分, 觸擊成功後變成一人出局二壘有人,得分機率微降到 40%,若考慮觸擊失敗的可能性就損失更多了。所以,即使是在比賽尾聲只拼一分,一般來說,觸擊仍然沒有什麼價值,除非

1. 投手明顯壓過打者,而且最好是使用觸擊的打者明顯比下一棒弱。如果是下一棒明顯比下下一棒強則禁用觸擊,否則即使戰術成功,投手也可以選擇保送下一棒以便抓下下一棒,看他會不會來個雙殺打。經典例子是去年十月二十二日象牛戰七局上象隊的進攻,奇妙的觸擊戰術造成了有趣的結果:

第一棒林明憲四壞球保送
第二棒馮勝賢左外野一壘安打,一二壘有人
第三棒陳致遠成功短打,一出局,二三壘有人
第四棒彭政閔故意四壞球,滿壘
第五棒陳懷山二壘方向雙殺打,三出局

2. 打者有常常觸擊成內野安打的實力。上面的計算都只考慮犧牲打者推進跑者的觸擊,極少數的打者可以偶爾在觸擊成功的時候還附帶自己上壘,對於這類打者,上面的計算就不是那麼管用了。

這篇文章只是個開始,並不是結束。有許多的問題值得探討,諸如之前提到的各隊的分析,或是不同類型投打對決的分析。不過,想要分析得愈細,也需要更多的比賽紀錄,否則樣本數太少反而更沒有參考價值。這邊提供了一個整體趨勢,只是希望以後不要再常常看到比賽開始沒多久兩邊教練就急著幫對方製造出局數。畢竟,

棒球的勝負比的是誰得分多,而不是誰的戰術多。
分類 : TWB專欄 | 發表人 : 曹士昌 | 0 留言
Database error: Invalid SQL: SELECT * FROM `twb_data`.`articles_reply_word` WHERE 1 AND c_date != '2010-02-09' ORDER BY `c_date` DESC
MySQL Error: 1030 (Got error 127 from table handler)