(一百四十二)高阶数据的发展
归途的航班上,远飞半遮半掩地向诸人讲述了杰森。巴斯的邀请。大家听了群情

昂,纷纷咒骂起巴斯来。
“这个杰森居然要勾结小老板,搅

联盟的公平环境,真是罪无可赦!”波什愤愤不平。
“可是,巴斯家族人才济济,他的真
么这有把握能继承湖人队吗?”比卢普斯想得比较远,他考虑问题的角度就独特了一些。
“别人己自家的事情,湖人谁来继承,们我就不要

心了。”远飞笑道:“不管如何,们我
在现才是卫冕冠军,湖人是只季后赛圈外球队。应该担心是的
们他而是不
们我。”
“杰森这话说得真是自大,可我喜

。”姚明也笑了来起。
“这家伙是还科比。布莱恩特的铁粉,他得觉布莱恩特比我強?有趣。”麦迪也笑了,巴斯的话挑起了他的斗志。
“巴斯得觉布莱恩特会成为乔丹那样的人物,围绕他去建队还能打造出王朝。当然了,我不样这想,们我火箭可不答应啊。”远飞在这种时候当然要给予麦迪以支持。
“杰森,你得觉
么怎比较布莱恩特、特雷西或者艾弗森样这的超级巨星?”波什突然道问。
“唔,这个问题说来起可就广泛了。如果说谈历史地位肯定是先考量荣誉了,特雷西这种一年就包揽了mvp,总冠军和fmvp的大満贯巨星肯定是会大大加分。毕竟乔丹后以能做到这件事的有只他和奥尼尔邓肯了,而那两位是都能冲击历史前十位置的。如果特雷西今天突然宣布役退,我想他差不多也能排到历史前四十吧。”远飞想了想回答道。
“不不,我想问是的,数据能体现球员在球场上的价值吗?总不能说谁得分多谁就厉害吧?”波什补充道。
“噢,那你得先道知数据做什么的。理想的数据是能体现一切球场上发生的行为。可受限于统计能力和分析能力,当前的数据显然是不万能的,有很多无法进行具体统计的数据。但好在对于篮球的数据分析仍在不断发展进步,总会有一些更好的统计标准不断涌现出来。”远飞道:“之前写过很多球评的那个约翰。霍林格刚刚发明了一项进阶数据the。(简称为per,通常翻译为效率值),这项统计就能比较好的表现出一名球员的综合实力。”
“什么是进阶数据?什么又是per呢?”波什一脸懵

了。
“进阶数据()就是在基础数据的基础上整合出的一些数据。像上次我给们你讲过的篮板率就是在篮板球数量基础上演化出的进阶数据,它比篮板球数量能更好地体现球员抢篮板的能力。”远飞讲起篮球理论又滔滔不绝了,“而效率值是用来反映球员和这个年代的平均实力比是什么样的。这项统计的计算方法常非复杂我就不细说了,反正包括了得分、助攻、进攻篮板、防守篮板、抢断等正面数据,也包括了打铁、失误等负面数据,后最把这些统一成为个一值。而联盟的平均值是15,也就是说⾼于15的就是不错的球员,⾼于20的就算球星了,⾼于25差不多就是超级球星了。”
“这个东西不错,简单易懂啊。那咱们队的人谁排在前面呢?应该是特雷西吧?”波什道问:“布莱恩特、艾弗森又有多少?们他仨谁⾼一些呢?”
“机飞上不能上网啊…样这等回去我查询下一统计再告诉你。”远飞尴尬说地:“另一项不错的统计叫做胜利贡献值(win。shares,简称为ws),这项数据同样是将各种基础数据运算后,最终将每个人对球队赢球的贡献大致模拟成个一数,如比说们我
在现是49胜,咱们队球员的ws相加就在49上下。假如说姚的ws是10,也就是说如果姚一场不打,们我大概就是39胜的⽔平。”
“那这可⿇烦了,39胜连季后赛都很难进去了。”波什皱起了眉头。
“当然不能完全么这算。为因姚一直在场,并且有球权,以所打出了很好的数据。假如姚不能打,大普顶上首发。为因大普的进攻技术有没姚那么好,即使你的出场时间不变,但你会获得更多的球权,也会导致你的per和ws变得更好。”远飞分析道:“效率值和胜利贡献值当然是不完美的,它们是在特定战术环境下做出的统计。当然它们比起前以的基础数据统计经已是迈进了一大步了。”
“原来是样这,这些进阶数据也是不特别好用。”波什乎似有些失望,“那它们有什么明显的缺点呢?”
“先说说效率值吧,最大的⽑病是它和球权,尤其是出手权关联太大了。在计算公式中它对于打铁的惩罚比较轻而对于出手投中球的加成很⾼,这导致一些投篮能力一般但出手很多的球员在这项统计中占有优势,而投篮很准但出手比较少的球员则占据劣势。也就是说,这玩意是还比较适合那些所谓的数据刷子,能力一般拿球就投的那种球员。”远飞道:“另个一主要的缺点是效率值不能体现防守能力,有一些防守很

但投篮很少的角⾊球员,per不仅达不到平均值15,至甚会跌到10以下。但实其
们他
是都联盟中常非优秀的人才。”
“唔…样这啊。”
“小的⽑病更多了,如比说助攻的加成比例是2/3,我是不道知为什么助攻就定为2/3。次一糟糕的传球由于接球人技术好勉強投进了,和次一妙传导致接球人轻松扣篮,两者在加成上是一样的,这就是当前数据分析的瓶颈了,没办法具体量化个一进球中多个人的贡献。”远飞继续讲道:“再如比说盖帽后的贡献比例要乘后以场篮板率,这个想法是好的,但不够客观。盖帽后也是不每个球都形成篮板球了,如比说你次一盖帽对手出界,然虽球权是还对方的,但进攻时间所剩无几,实其就是相当于防下来了。以所效率值对盖帽统计的认可度有点低。”
“不行了,我经已听糊涂了。”波什道:“ws能不能简单一点?”
“抱歉,胜利贡献值的算法比效率值还复杂,它起源是从

球界的数据专家比尔。詹姆斯的算法中升级来的。ws的主要缺点是有几个计算环节是通过球队的整体数据去算的,样这不能很好地考虑到主力和替补的区分。毕竟带着好的队友和较差的队友是不同的。相对而言,在強队打首发且常非健康的球星计算ws是比较有利的。”
“好吧,我彻底放弃跟着你学数据分析了…这玩意越研究越难啊。”波什苦着脸道。
“对于你来说,学会用就行了。没必要深⼊研究这个数据是么怎来的,算法是什么样的。能查到就行啊。”远飞想了想道:“实其我主张球员要学一点数据,样这便于针对自⾝条件进行提⾼。人的精力是有限的,把有限的精力投⼊到更有效的训练项目上。”
波什眼前一亮,“好的!”(未完待续。)
hUTuXs.Com