[計量]棒球投手表現與身高的關係(以中職 … - 經濟

By Tom
at 2008-06-10T19:18
at 2008-06-10T19:18
Table of Contents
※ [本文轉錄自 Elephants 看板]
作者: ashugh (hugh) 看板: Elephants
標題: [心得][計量]棒球投手表現與身高的關係(以中職為例)
時間: Tue Jun 10 16:50:56 2008
研究顯示身高與投手表現沒有顯著的關係
但是身高卻與投手投球局數呈現顯著正相關
這顯示教練對投手有身高上的迷思
會給予身高高的投手更多的機會 儘管身高高的投手表現沒有比較好
-----------------------------------------------------------------------------
壹、 緒論
1. 研究背景
近年來,因為王建民在美國職棒有傑出的成績,以及近幾次國際賽事的舉行,還有許多國
內年輕好手往國外發展的人數也逐漸增多,使棒球運動再度受到國人注目;而王建民超過
190公分的身高也受到媒體的關注。
一般來說,普遍都認為投手的身高要高,站上投手丘後,能帶給打者較大的壓力,並且球
從較高的角度掉落,對打者來說也比較難攻擊。許多少棒以及青棒的教練,在一開始都偏
好選擇隊上身高較高的選手,來負責投球的工作。
而在職棒場上,許多傑出的投手身材都相當高大,在MLB如︰
Randy Johnson,六呎十吋的身高約為208.28公分
Chien-Ming Wang,六呎四吋,193公分
在國內的則有︰
林恩宇,188公分
潘威倫,182公分
然而在這之中也存在著反例如︰
黃武雄,168公分
郭進興,174公分
另外近年來的投手如蕭任汶、吳俊億、謝承勳等這些傑出的選手身高卻都不到180公分,
是否身高是影響投手表現的因素之一呢?這是我們值得研究的一個課題。
2. 研究範圍以及限制
本文以中華職棒的官方網站 上資料為準,因為職棒19年尚在進行之中,許多當年度的資
料並未上網登錄,故而只蒐集至職棒18年的資料。
另外,許多投手的表現不佳,投球局數過少,導致其ERA 數值都過大;比方說職棒18年兄
弟象隊投手Andre Simpson在上場後沒有解決任何一名選手就被球團開除,其ERA無限大,
在此情況下即使幾百份樣本平均下去仍然造成相當大的影響,因此我選擇投滿三局的投手
資料來當做研究的範圍。
貳、 相關文章探討 (跳過)
參、 研究方法與步驟 (跳過)
肆、 模型設定
要研究投手的身高與其投手表現,首先要先判定哪一項資料較能反映投手表現。
ERA是最傳統也最廣為人知的一種,但是長久以來也不斷有人詬病,認為ERA會受到背後隊
友防守的影響。一位投手背後站的七名防守球員擁有金手套級的守備,明顯跟一名投手背
後站著七名普通的防守球員有差,因此衍生出下列的數據,但仍然各自有其缺點。
WHIP是計算除了失誤外,投手每局讓打者上壘的數目。相較於傳統的ERA,WHIP更能顯示
出一名投手的壓制能力。但是WHIP卻有一項缺點,那就是沒有將長打與一般的一壘安打做
區分,皆視為安打。第二個缺點是WHIP沒能像ERA一樣直覺看出其對一支球隊在一場比賽
中的影響。
而在陳俊璋(民95)的研究中使用的FIP以及DERA,這兩者的數據除了沒法給予直覺上的解
釋,一般人也很難會去接觸到這兩項數據;再者我也沒有找到關於這兩數據的理論基礎,
因此在考慮到我已經有K/9值、HR/9值、WHIP這三項數據,與FIP以及DERA等在計算上用到
相同的原始資料,如SO、BB、HR、IP等,故不予考慮。
最後我仍然選擇傳統的ERA當做代表,因為它可以提供直覺上的解釋,也是廣為一般大眾
所知的數據。
接下來開始設定模型,利用Two-Stage Least Squares Model(2SLS),其SAS語言為︰
proc syslin data=baseball 2sls;
Endogenous era avep ip;
instruments l fr fl h k9 hr9 age bmi whip;
model era=l fr fl h bmi age k9 hr9 whip;
model avep=l fr fl h bmi age k9 whip;
model ip=l fr fl h bmi age era avep;
run;
其中內生變數為era(防禦率)、avep(平均每局投球數)、ip(每年投球局數)。
外生變數為l(本土左投)、fr(外籍右投)、fl(外籍左投)、h(身高)、bmi(身體質量指數)
、age(年齡)、k9(K/9值)、hr9(HR/9值)、whip(WHIP)。
l、fr、fl這三項變數設為Dummy Variables,本土右投手就設定為(0,0,0),本土左投手
設定為(1,0,0),外籍右投手設定為(0,1,0),外籍左投手(0,0,1)。
利用BMI指數是因為身高與體重之間存在共線性的問題,將體重用BMI代替後解決共線性問
題,並且一樣能反映出投手的體型。
WHIP是用來代表投手的壓制能力,但因為用來代表投手表現的話仍有不足,故將它放入影
響ERA的變數之一。
ERA設定為與投手基本資料和WHIP有關外,更設定了K/9值代表投手的類型,HR/9值代表投
手被打長打的機會。
每局投球數量設定為與投手基本資料和WHIP有關外,再加上K/9值代表投手的類型,一般
來說三振型的投手會比滾地球或飛球型投手花更多的球數;我以此來檢視此說法的正確性
。
每年投球局數設定為與投手基本資料有關外,尚設定和ERA與每局投球數量有關。一來表
現好的投手機會應該較多;而每局投球數量較少的,也能用較為節省的體力來解決打者,
續航力應該較強,投球局數應該較多。
伍、 結果分析
The SAS System 41
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model era
Dependent Variable era
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 9 5559.540 617.7267 328.63 <.0001
Error 1038 1951.112 1.879684
Corrected Total 1047 7510.652
Root MSE 1.37102 R-Square 0.74022
Dependent Mean 4.57429 Adj R-Sq 0.73797
Coeff Var 29.97219
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 -4.40394 1.631743 -2.70 0.0071
l 1 -0.38034 0.182956 -2.08 0.0379
fr 1 -0.21067 0.112419 -1.87 0.0612
fl 1 -0.24540 0.158677 -1.55 0.1223
h 1 0.012637 0.008120 1.56 0.1200
bmi 1 -0.01279 0.021024 -0.61 0.5430
age 1 0.002761 0.010581 0.26 0.7942
k9 1 -0.03881 0.021035 -1.85 0.0653
hr9 1 0.855895 0.061178 13.99 <.0001
whip 1 4.387406 0.105342 41.65 <.0001
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model avep
Dependent Variable avep
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 4065.610 508.2013 360.81 <.0001
Error 1039 1463.439 1.408507
Corrected Total 1047 5529.049
Root MSE 1.18681 R-Square 0.73532
Dependent Mean 16.14234 Adj R-Sq 0.73328
Coeff Var 7.35213
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 5.887001 1.408972 4.18 <.0001
l 1 0.139677 0.158323 0.88 0.3779
fr 1 0.201931 0.096747 2.09 0.0371
fl 1 0.525662 0.136486 3.85 0.0001
h 1 0.008928 0.007013 1.27 0.2033
bmi 1 0.025618 0.018166 1.41 0.1588
age 1 -0.00941 0.009156 -1.03 0.3042
k9 1 0.312663 0.018194 17.18 <.0001
whip 1 4.216344 0.084746 49.75 <.0001
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model ip
Dependent Variable ip
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 724689.4 90586.17 33.31 <.0001
Error 1039 2825821 2719.751
Corrected Total 1047 3375196
Root MSE 52.15123 R-Square 0.20411
Dependent Mean 65.55993 Adj R-Sq 0.19798
Coeff Var 79.54741
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 32.74820 62.54071 0.52 0.6006
l 1 -9.90730 7.035363 -1.41 0.1594
fr 1 -11.3524 4.442158 -2.56 0.0107
fl 1 -15.9554 6.479334 -2.46 0.0140
h 1 0.609332 0.307580 1.98 0.0478
bmi 1 -0.85887 0.806867 -1.06 0.2874
age 1 -0.18078 0.400465 -0.45 0.6518
era 1 -11.7365 1.546406 -7.59 <.0001
avep 1 0.653514 1.860667 0.35 0.7255
我們可以看出︰
1. 身高對於投手的表現來說,並沒有顯著的相關性。有顯著相關的變數是本土左投
、外籍右投、K/9值、HR/9值以及WHIP。第一式的Adj R-Sq 為0.73797。
2. 身高對於每局投球數量也並沒有顯著的相關性。有顯著相關的變數是外籍右投以
及左投、K/9值以及WHIP。第二式的Adj R-Sq為0.73328。
3. 身高跟每年投球局數呈現顯著相關,其他與每年投球局數呈現顯著相關的是外籍
左投與右投、ERA﹔令人意外的還有每局投球數量與每年投球局數的相關性不顯著。第三式
的Adj R-Sq為0.19798。
一般來說,教練應該給予投球表現良好的選手多一點的上場機會,投球局數應該較多,但
是明明身高與投球表現沒有顯著相關,但是投球局數卻跟身高呈現顯著的正相關。身高高
10公分,每年平均多投6局。
這結果意味著在中華職棒中,存在著身高的迷思;教練會給予身高較高的投手更多的機會
,儘管其投球表現並沒有更為出色。
--
作者: ashugh (hugh) 看板: Elephants
標題: [心得][計量]棒球投手表現與身高的關係(以中職為例)
時間: Tue Jun 10 16:50:56 2008
研究顯示身高與投手表現沒有顯著的關係
但是身高卻與投手投球局數呈現顯著正相關
這顯示教練對投手有身高上的迷思
會給予身高高的投手更多的機會 儘管身高高的投手表現沒有比較好
-----------------------------------------------------------------------------
壹、 緒論
1. 研究背景
近年來,因為王建民在美國職棒有傑出的成績,以及近幾次國際賽事的舉行,還有許多國
內年輕好手往國外發展的人數也逐漸增多,使棒球運動再度受到國人注目;而王建民超過
190公分的身高也受到媒體的關注。
一般來說,普遍都認為投手的身高要高,站上投手丘後,能帶給打者較大的壓力,並且球
從較高的角度掉落,對打者來說也比較難攻擊。許多少棒以及青棒的教練,在一開始都偏
好選擇隊上身高較高的選手,來負責投球的工作。
而在職棒場上,許多傑出的投手身材都相當高大,在MLB如︰
Randy Johnson,六呎十吋的身高約為208.28公分
Chien-Ming Wang,六呎四吋,193公分
在國內的則有︰
林恩宇,188公分
潘威倫,182公分
然而在這之中也存在著反例如︰
黃武雄,168公分
郭進興,174公分
另外近年來的投手如蕭任汶、吳俊億、謝承勳等這些傑出的選手身高卻都不到180公分,
是否身高是影響投手表現的因素之一呢?這是我們值得研究的一個課題。
2. 研究範圍以及限制
本文以中華職棒的官方網站 上資料為準,因為職棒19年尚在進行之中,許多當年度的資
料並未上網登錄,故而只蒐集至職棒18年的資料。
另外,許多投手的表現不佳,投球局數過少,導致其ERA 數值都過大;比方說職棒18年兄
弟象隊投手Andre Simpson在上場後沒有解決任何一名選手就被球團開除,其ERA無限大,
在此情況下即使幾百份樣本平均下去仍然造成相當大的影響,因此我選擇投滿三局的投手
資料來當做研究的範圍。
貳、 相關文章探討 (跳過)
參、 研究方法與步驟 (跳過)
肆、 模型設定
要研究投手的身高與其投手表現,首先要先判定哪一項資料較能反映投手表現。
ERA是最傳統也最廣為人知的一種,但是長久以來也不斷有人詬病,認為ERA會受到背後隊
友防守的影響。一位投手背後站的七名防守球員擁有金手套級的守備,明顯跟一名投手背
後站著七名普通的防守球員有差,因此衍生出下列的數據,但仍然各自有其缺點。
WHIP是計算除了失誤外,投手每局讓打者上壘的數目。相較於傳統的ERA,WHIP更能顯示
出一名投手的壓制能力。但是WHIP卻有一項缺點,那就是沒有將長打與一般的一壘安打做
區分,皆視為安打。第二個缺點是WHIP沒能像ERA一樣直覺看出其對一支球隊在一場比賽
中的影響。
而在陳俊璋(民95)的研究中使用的FIP以及DERA,這兩者的數據除了沒法給予直覺上的解
釋,一般人也很難會去接觸到這兩項數據;再者我也沒有找到關於這兩數據的理論基礎,
因此在考慮到我已經有K/9值、HR/9值、WHIP這三項數據,與FIP以及DERA等在計算上用到
相同的原始資料,如SO、BB、HR、IP等,故不予考慮。
最後我仍然選擇傳統的ERA當做代表,因為它可以提供直覺上的解釋,也是廣為一般大眾
所知的數據。
接下來開始設定模型,利用Two-Stage Least Squares Model(2SLS),其SAS語言為︰
proc syslin data=baseball 2sls;
Endogenous era avep ip;
instruments l fr fl h k9 hr9 age bmi whip;
model era=l fr fl h bmi age k9 hr9 whip;
model avep=l fr fl h bmi age k9 whip;
model ip=l fr fl h bmi age era avep;
run;
其中內生變數為era(防禦率)、avep(平均每局投球數)、ip(每年投球局數)。
外生變數為l(本土左投)、fr(外籍右投)、fl(外籍左投)、h(身高)、bmi(身體質量指數)
、age(年齡)、k9(K/9值)、hr9(HR/9值)、whip(WHIP)。
l、fr、fl這三項變數設為Dummy Variables,本土右投手就設定為(0,0,0),本土左投手
設定為(1,0,0),外籍右投手設定為(0,1,0),外籍左投手(0,0,1)。
利用BMI指數是因為身高與體重之間存在共線性的問題,將體重用BMI代替後解決共線性問
題,並且一樣能反映出投手的體型。
WHIP是用來代表投手的壓制能力,但因為用來代表投手表現的話仍有不足,故將它放入影
響ERA的變數之一。
ERA設定為與投手基本資料和WHIP有關外,更設定了K/9值代表投手的類型,HR/9值代表投
手被打長打的機會。
每局投球數量設定為與投手基本資料和WHIP有關外,再加上K/9值代表投手的類型,一般
來說三振型的投手會比滾地球或飛球型投手花更多的球數;我以此來檢視此說法的正確性
。
每年投球局數設定為與投手基本資料有關外,尚設定和ERA與每局投球數量有關。一來表
現好的投手機會應該較多;而每局投球數量較少的,也能用較為節省的體力來解決打者,
續航力應該較強,投球局數應該較多。
伍、 結果分析
The SAS System 41
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model era
Dependent Variable era
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 9 5559.540 617.7267 328.63 <.0001
Error 1038 1951.112 1.879684
Corrected Total 1047 7510.652
Root MSE 1.37102 R-Square 0.74022
Dependent Mean 4.57429 Adj R-Sq 0.73797
Coeff Var 29.97219
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 -4.40394 1.631743 -2.70 0.0071
l 1 -0.38034 0.182956 -2.08 0.0379
fr 1 -0.21067 0.112419 -1.87 0.0612
fl 1 -0.24540 0.158677 -1.55 0.1223
h 1 0.012637 0.008120 1.56 0.1200
bmi 1 -0.01279 0.021024 -0.61 0.5430
age 1 0.002761 0.010581 0.26 0.7942
k9 1 -0.03881 0.021035 -1.85 0.0653
hr9 1 0.855895 0.061178 13.99 <.0001
whip 1 4.387406 0.105342 41.65 <.0001
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model avep
Dependent Variable avep
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 4065.610 508.2013 360.81 <.0001
Error 1039 1463.439 1.408507
Corrected Total 1047 5529.049
Root MSE 1.18681 R-Square 0.73532
Dependent Mean 16.14234 Adj R-Sq 0.73328
Coeff Var 7.35213
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 5.887001 1.408972 4.18 <.0001
l 1 0.139677 0.158323 0.88 0.3779
fr 1 0.201931 0.096747 2.09 0.0371
fl 1 0.525662 0.136486 3.85 0.0001
h 1 0.008928 0.007013 1.27 0.2033
bmi 1 0.025618 0.018166 1.41 0.1588
age 1 -0.00941 0.009156 -1.03 0.3042
k9 1 0.312663 0.018194 17.18 <.0001
whip 1 4.216344 0.084746 49.75 <.0001
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model ip
Dependent Variable ip
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 724689.4 90586.17 33.31 <.0001
Error 1039 2825821 2719.751
Corrected Total 1047 3375196
Root MSE 52.15123 R-Square 0.20411
Dependent Mean 65.55993 Adj R-Sq 0.19798
Coeff Var 79.54741
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 32.74820 62.54071 0.52 0.6006
l 1 -9.90730 7.035363 -1.41 0.1594
fr 1 -11.3524 4.442158 -2.56 0.0107
fl 1 -15.9554 6.479334 -2.46 0.0140
h 1 0.609332 0.307580 1.98 0.0478
bmi 1 -0.85887 0.806867 -1.06 0.2874
age 1 -0.18078 0.400465 -0.45 0.6518
era 1 -11.7365 1.546406 -7.59 <.0001
avep 1 0.653514 1.860667 0.35 0.7255
我們可以看出︰
1. 身高對於投手的表現來說,並沒有顯著的相關性。有顯著相關的變數是本土左投
、外籍右投、K/9值、HR/9值以及WHIP。第一式的Adj R-Sq 為0.73797。
2. 身高對於每局投球數量也並沒有顯著的相關性。有顯著相關的變數是外籍右投以
及左投、K/9值以及WHIP。第二式的Adj R-Sq為0.73328。
3. 身高跟每年投球局數呈現顯著相關,其他與每年投球局數呈現顯著相關的是外籍
左投與右投、ERA﹔令人意外的還有每局投球數量與每年投球局數的相關性不顯著。第三式
的Adj R-Sq為0.19798。
一般來說,教練應該給予投球表現良好的選手多一點的上場機會,投球局數應該較多,但
是明明身高與投球表現沒有顯著相關,但是投球局數卻跟身高呈現顯著的正相關。身高高
10公分,每年平均多投6局。
這結果意味著在中華職棒中,存在著身高的迷思;教練會給予身高較高的投手更多的機會
,儘管其投球表現並沒有更為出色。
--
Tags:
經濟
All Comments

By Tom
at 2008-06-10T21:16
at 2008-06-10T21:16

By Anonymous
at 2008-06-13T06:30
at 2008-06-13T06:30

By Quintina
at 2008-06-14T12:25
at 2008-06-14T12:25

By Kama
at 2008-06-17T04:52
at 2008-06-17T04:52

By Anthony
at 2008-06-17T12:18
at 2008-06-17T12:18

By Ina
at 2008-06-20T07:27
at 2008-06-20T07:27

By Jake
at 2008-06-24T08:43
at 2008-06-24T08:43

By Daph Bay
at 2008-06-28T00:35
at 2008-06-28T00:35

By Gilbert
at 2008-07-02T15:34
at 2008-07-02T15:34
Related Posts
流動性陷井和貨幣理論

By Christine
at 2008-06-10T13:47
at 2008-06-10T13:47
油價泡沬

By Olivia
at 2008-06-10T10:44
at 2008-06-10T10:44
與政治學對話的經濟學家

By Oliver
at 2008-06-10T10:06
at 2008-06-10T10:06
流動性陷井和貨幣理論

By Sarah
at 2008-06-09T23:24
at 2008-06-09T23:24
流動性陷井和貨幣理論

By Enid
at 2008-06-09T21:05
at 2008-06-09T21:05