数据革命带动足球运动发展 弗格森被误导卖掉斯塔姆
南方都市报
艺术家雷维尔(G ilesRevell)运用数据分析公司Prozone采集到的独家比赛数据,创作出了一系列以今年欧冠决赛为主题的图画。 这是决赛下半场两队活动的图示。大突起表示进球;较高的脊状物表示触球;较短的脊状物表示传球。
这张图展示了决赛中一切活动在场上发生的地点。左边是曼联,右边是巴萨。右边密集的突起表示巴萨的活动比曼联要频密得多。
利物浦和阿森纳访华,他们的球员在训练和比赛后脱下外衣,露出缠绕在胸部的黑色背带,那是一个测试心率的高科技设备。对于欧洲俱乐部来说,采集球员的各项身体指数,统计球员在比赛中各项数据,已成为评判球员的重要依据。
这是一场被称为“足球数据革命”的划时代变革,它从未真正在你面前发生,而是在各家俱乐部的实验室里和电脑上完成。它从什么时候开始,又将走向怎样的未来?欧洲第一足球记者西蒙·库珀走访了体育数据的诞生地美国和多家英超俱乐部,揭示了这段历史。
1
数据左右球员交易
曼城雇用了庞大数据团队
曼城首席球员数据分析师凯文·弗雷格为我做了一些专业的分析,就如同来自投行的那些“数据狂”。最近令他兴奋不已的一件事是,曼城已经获得了英超每个球员的数据。
最近,我拜访了曼城位于卡灵顿村安静的训练基地。那是一个阳光明媚的早晨,雇员们在门外清洗球员们的SU V和跑车。
阿布扎比财团如今是曼城的老板,他们买下俱乐部之后所做的一件事就是雇用了一个庞大的数据分析团队。在大楼里我邂逅了弗雷格,卡灵顿之外很少有人听说过他的名字,但弗雷格却是英格兰足球数据革命的一位主要推手。在公众和媒体尚未觉察之时,俱乐部的决定早已被球员数据分析所左右———特别是在球员交易上。许多俱乐部正是由这些隐匿在小黑屋里的统计学家,来绘制这个夏天转会市场的蓝图。
想想,当你想签下一名攻击型中场,这人传球成功率得高于80%,上场次数有保证,弗雷格在他的笔记本电脑里敲入这两项条件,英超球员里符合这个标准的球员肖像就跳上电脑屏幕。有两个显而易见:阿森纳的法布雷加斯和利物浦的杰拉德,你不用数据分析都知道他们是很棒的。但在他们之外还有几个令人意外的面孔:纽卡斯尔的凯文·诺兰。这些数字不足以说服你立马抢签他,但会促使进一步深入观察。
近几年,在多次失败的尝试之后,英超大俱乐部终于发现真正有效的球员数据分析方法。弗雷格举例说:“T O P4球队前场最后1/3区域内有更高的传球成功率,在本队买入特维斯、大卫·席尔瓦、亚当·约翰逊和亚亚·图雷之后,过去六个月,我们在最后1/3区域的传控球能力提高了7.7%。”
而数据分析并非他们加盟球队的必要条件,弗雷格声明。事实上,也不排除有其他俱乐部比曼城更依赖数据分析。
“我们现在大约收集了12000场到13000场比赛里的3200万份数据点。”今年二月在斯坦福桥空荡荡的看台上,迈克·福德,切尔西的球员数据分析总监告诉我。
2
数据革命先行者
弗格森被误导卖掉斯塔姆
弗雷格说:“我们会观察,如果后卫将界外球解围,球会落到哪里?好,这里就是球最经常落入的区域。没错,那我们就会安排自己球员站在那里。”
也许从第一台个人电脑诞生开始,就有足球领域的先行者尝试用数据评判球员,其中一个当属后来阿森纳的主教练温格,他有经济学学位和敏锐的数字嗅觉。1980年代末,温格作为摩纳哥的主教练已经开始用一款由他的朋友发明的叫“TopScore”的电脑程序;另一位不太显眼的先行者是伟大的、嗜饮伏特加酒的乌克兰主教练洛巴诺夫斯基,我1992年到基辅时,洛巴诺夫斯基的御用科学家,阿纳托利·泽伦特索夫教授让我玩了一些基辅迪纳摩开发的用来测试球员的电脑游戏。当时洛巴诺夫斯基说过一席话,大意是“一支犯错率不超过15%-18%的球队是不可击败的”。
更大的突破发生在1996年,当O PTA指数公司开始搜集英超联赛的“比赛数据”之后———德国作家克里斯托弗·比尔曼在他所著的足球与数据先锋性著作《足球矩阵(D ie Fussball-M atrix)》一书中这样阐述。第一次,俱乐部得知球员每场比赛跑多少米、铲多少次球、传多少次球。其他数据公司也逐渐进入市场,足球教练开始看这些数据。2001年8月,曼联主教练弗格森突然把后卫斯塔姆卖给拉齐奥,令人觉得诧异。有人揣测弗格森是对荷兰人刚出版的那本愚蠢自传做出处罚,实际上,尽管弗格森没有公开谈论过,但这次转会部分原因正是出于比赛数据分析。通过分析,弗格森认为斯塔姆的拦截能力大不如前,他断定这位29岁的后卫已经在走下坡路,所以决定卖掉他。
后来弗格森承认这是一个失误,就像最初许多研究比赛数据的足球人一样,教练们也被数据误导了。斯塔姆一点没有滑坡,他在意大利又踢了几年好球,这桩交易是足球历史的里程碑之一:很大程度上被数据驱使的一次转会。
在阿森纳,温格接受了新的比赛数据。他曾说,在一场比赛后的第二天早晨,他就像一个需要嗑药的瘾君子:必须拿到电子数据表。大约从2002年开始,他总是在比赛末段替换下前锋博格坎普,博格坎普当然要找温格抱怨。“然后他就摆出数据。”博格坎普后来透露,“‘看,丹尼斯,70分钟之后你的跑动少了,速度也降低了。’温格真是个足球教授。”
很少人会把数据分析和西汉姆联队的新任主帅“大山姆”阿勒代斯联系到一起,然而,他石器时代的长相下隐藏着专业的头脑。球员时代,阿勒代斯在佛罗里达的坦帕湾待过一年,在那里他被美国体育界运用科学方法和数据分析的方式迷住了。1999年他成为博尔顿主帅,由于买不起最好球员,他转而聘请优秀的统计人员。他们挖掘出了一项让阿勒代斯欣喜不已的统计数字。“平均每场比赛,皮球会在两队之间易手400次。”切尔西的福德说,当年他正是在阿勒代斯手下开始自己的足球事业。这句话直接体现了失去球权后迅速回防到位的重要性。
数据让阿勒代斯找到简单易行的进球来源:角球、界外球和任意球———博尔顿有45%-50%的进球来自定位球,相比之下联赛里的平均比率约为1/3.
3
足球将变成科学
《魔球》令足球人茅塞顿开
在数据的帮助下,小球队运动家的表现远超想象。波士顿红袜队运用“魔球”方法赢得两次职棒大联盟冠军,而它的老板亨利就是个在商品交易中发家的“数字男”。
2003年,足球的数据革命从大西洋彼岸获得了新的动力。迈克尔·刘易斯发表了关于棒球的创造性著作《魔球(M oneyball)》,英国足球圈的一些人读后茅塞顿开。《魔球》叙述了奥克兰运动家队总经理比利·比恩如何运用新的数据统计来评估棒球运动员。
今年二月,我在奥克兰体育场拜访了比恩。比恩很乐于谈论足球数据革命———很快,我们就能在电影《魔球》中看到由布拉德·皮特扮演的他了。正如过去十年的许多美国人一样,比恩以一种宗教狂热式的热情接受了这项盛行于欧洲的运动。
比恩坚信,足球会和棒球一样变得“更像一门科学”:“假设率性而为可以保证30%的时候是对的,若你能找到取得35%的正确率的方式,那么你就创造了5%的差额。而在体育界,这5%将足以影响胜负。”比恩的想法是,如果运用数据能让你占优,那所有人都不得不这么做。
2005年,温格的前任助手、法国人达米安·科莫利成为热刺的足球总监,并在那里开始运用数据。他在热刺的三年是数据革命早期许多纷争的一个缩影。英国足球对于学院派总持怀疑态度,典型的足球教练应是16岁就辍学的前球员,像独裁者一样管理俱乐部。他依靠的应该是“血性”,而不是数字。他不会听从一个从未踢过职业足球,满脑都是数据表格的法国人。科莫利总是不得不去打一场场“书呆子V S运动员”的战役。凭借先见之明,他为热刺发掘了数位优秀球员:莫德里奇、贝尔巴托夫、戈麦斯以及17岁的贝尔。然而,最终科莫利还是被解职。
4
书呆子VS运动员
被关在电脑房里的分析人员
即使雇30个统计人员,每年可能也只需150万英镑,这仅相当于英超球员的平均年收入,你会觉得付钱给一群书呆子去研究这些问题或许是物有所值的。但不管怎样,对此的怀疑某种程度上总是存在的。
传统主义者会说,统计数据在棒球这样有停顿的运动可能奏效。投手投球,打击手击球,这一过程给书呆子们提供了大量可研究的清晰数据。但足球果真就因为比赛太流畅而难以测量吗?
福德回应:“不错,我觉得这是个确实存在的问题,我们也时刻在问自己。”然而,书呆子们能回答。首先,好的数学家能应付复杂的体系。比如在切尔西,福德手下的统计人员之一就曾从事保险建模工作。足球是项22人在一块有限的场地上、根据既定规则进行的运动,其复杂程度并不是高不可攀。
其次,近年来数据分析在流畅性同样强的篮球中得到很好的应用。比恩说:“如果数据在那里能用,在足球场上也就能用。”第三,足球场上三分之一的进球都不是发生在运动战中,而是来自角球、任意球、点球和界外球———这些停顿就像分析棒球的击球那样能让你来分析。
新一代书呆子还能够指出足球的许多明显的不合理行为,尤其是在转会市场中,在许多领域精明的俱乐部还是可以改进的。例如:守门员的职业生涯比前锋更长,但赚得更少,转会费也低得多。俱乐部经常签下高个球员,但在意识到其个头的价值被高估后,实际上又倾向于使用个头较小的球员。甚少有俱乐部自问过这样的基本问题:当某些特定球员登场时,球队是否抢到更多的分数?
“即使是一个顶级的统计学家,把他和一个更倾向保守的教练放一块也不合适。”福德曾告诉我。在许多俱乐部,书呆子们得到放权的进度很缓慢。可能现在每家英超俱乐部都雇用了分析人员,但这些人里的一部分只被关在电脑房里,从未和主帅谋面。
这便是为何引领数据革命的俱乐部,其主帅必定是数字的信徒。阿森纳和阿勒代斯的博尔顿早已开始像金融投资者对待牛肉期货一样评估球员,以2004年收购34岁的中场球员斯皮德为例,纸面上,斯皮德似乎太老了,但“通过观察他的体力数据,和当时同位置的顶级年轻球员如杰拉德、兰帕德等进行比较。对于一个34岁的球员来说,他体能状况持续与顶级球员处于同一水平,对比之前两个赛季没有下滑迹象,你完全可以底气十足地说,‘知道么,年龄不是什么大问题。’”弗雷格说。之后斯皮德一直为博尔顿效力到38岁。
5
眼见不一定为实
看低马克莱莱成为大笑话
足球界最精明的数据分析人员一直牢记这一点:数据只能作为辅助手段来支持对某一名球员的决策,而不能全面决定。
比尔曼讲述了温格在2004年是怎样给体力充沛的中场维埃拉寻找接班人的。温格需要一个覆盖面积大的球员,他通过搜索欧洲不同联赛的数据,注意到马赛队一个名不见经传的年轻人———场均奔跑14公里的弗拉米尼。单靠这项数据是不够的。弗拉米尼的跑位是否正确?他的技术如何?温格得去现场观摩,确定他能,便廉价签下了他。弗拉米尼在阿森纳获得了成功。
相反地,那些靠“血性”而不是数据的俱乐部开始吃到苦头。2003年,皇马以1700万英镑的价格把马克莱莱卖给切尔西。对于一名低调的30岁防守型中场来说,这笔转会费很高。“我们不会想念马克莱莱。”皇马主席弗洛伦蒂诺当时说,“他技术一般,缺乏带球过人的速度和技巧,他的传球90%都是回传或横传。他头球不好,而且传球距离很少超过3米……”
弗洛伦蒂诺的评价并非完全没有道理,然而皇马犯下了一个巨大的错误。马克莱莱在切尔西继续了5年出色的表现,当今足坛甚至还有个位置是以他来命名的———“马克莱莱角色”。只要皇马研究过数据,他们可能就会发现马克莱莱的独特之处。福德解释说:“在高强度运动中,多数球员都是在进攻时才显得活跃,反之者很少。如果观察马克莱莱,你会发现他进行高强度运动时84%都是在对方控球的时候,这相当于队里其他球员的两倍之多。”
当你看比赛时,会把马克莱莱忽略。而如果看数据,他便脱颖而出。同理,如果只看曼城队亚亚·图雷懒散的跑动方式,你可能会觉得他速度很慢;如果看到数据,你就知道他并不慢。比恩说:“统计数据可以让你不会单从表面来评判事物。对那种认为亲眼所见比统计数据更可靠的想法我从不买账,因为我看过魔术师从帽子里掏出兔子来,而我知道兔子不在那里面。”
6
有些数据没有用
马尔蒂尼两场才拦截一次
拦截数看起来也是个乏善可陈的指数,在伟大的意大利后卫马尔蒂尼身上有个尴尬事,他每两场比赛才有一次拦截。马尔蒂尼站位实在太好,根本不需要铲球。这对于用拦截数判断后卫的方式提出了有力质疑。
然而到了2000年代中期,足球数据分析人员开始不安地觉察到,许多自己信任了多年的统计数字其实毫无用处。在任何一个行业里,从业者所采用的都是他们已有的数据。数据公司最初计算的是每个球员的传球、拦截和跑动公里数,而俱乐部也就用这些数字来对球员作出评判。可是,这些未经加工的统计数据———也就是现在电视直播大型赛事时所显示的那些数字———意义不大。福德记得早期对跑动距离数据的意义的探求:“我们能否找出跑动距离和胜利的关联?答案始终都是N o。”
福德说道,“我在博尔顿参加了许多会议,而现在我回顾过去会想‘噢,我们打造球队时所依据的都是我们现在觉得不相干的东西。’”回顾早年的数据,弗雷格总结道:“我们本该关注一些更重要的东西。”
如今事情正是这样发展。足球“数据狂”们正在提炼出那些重要的数据。“很多数据都是私有的。”福德告诉我,“俱乐部对这一特定领域非常支持,所以我们要有所保留。”但数据狂们也会讨论已成常识的一些发现。比如,相比跑动公里数,俱乐部现在更看重全速奔跑的距离。“冲刺的次数和胜利之间存在着某种相关性。”A C米兰的首席体能教练丹尼埃尔·托格那奇尼2008年向我透露。
这便是为何弗雷格关注“球员高强度产出”。不同数据公司对此项素质有着不同的测算方式,他说:“但它最终还是要取决于球员将速度提升到每秒7米这个临界值的能力。”如果你重视这项素质,你或许就不会犯尤文图斯1999年把亨利卖给阿森纳那样的错误。“对亨利来说,每秒7米只是小菜一碟。”弗雷格很赞赏,法国人几乎每次启动都能达到那个速度。
另一项同等重要的素质是反复冲刺的能力。曼城的小个子前锋特维斯有点像个上了发条的人偶:他冲刺,停顿,又开始冲刺。弗雷格说:“如果我们想采用前场压迫打法,我们可以看看特维斯的体力支出,然后就会知道他能保持90分钟以上的连续冲击。”
在俱乐部已懂得将冲刺和其他跑动区分开来的同时,他们也懂得了将有效传球与无意义的倒脚区别看待。弗雷格调出一份曼城的球员名单,一个名字鹤立鸡群:席尔瓦传出的机会球比其他队友都要多出至少三分之一。
7
进球概率增加值
比如:苏亚雷斯0.60,卡罗尔才0.56
新一轮数据洗牌使得人们更容易进行球员之间以及俱乐部之间的比较,比如威根因对手传中而失球的比例比英超任何其他球队都要高。当对阵威根时,知彼能助你克敌。俱乐部们越来越多地根据数据行事。
一个数据狂已经在阿森纳掌权15年,而去年秋天,数据人员又接管了另一家英超豪门。曾在2002年试图雇用比恩的波士顿红袜队老板约翰·亨利买下利物浦,并立即雇用比恩的朋友科莫利,开始打造“足球版魔球”。
科莫利经常与相距5000英里之外的魔球之父谈话,他在利物浦掌有实权,他曾表示在俱乐部花6000万英镑购入卡罗尔和苏亚雷斯的交易中,数据提供了参考。
而足球数据革命才刚刚起飞。弗雷格未来球场上将有一个令人兴奋的球员关系图:谁把球传给谁,谁将发动最有威胁的进攻?如果你知道他习惯传出关键球的区域,你就可以尝试去阻止他。
在足球统计数据的远景应用问题上,有一个人比大多数人做出更多的思考———奥克兰运动家队的棒球运营总监法汉·扎伊迪。扎伊迪的工作是研究棒球统计数据,他知道棒球数据革命的发展过程,也可以对足球数据革命作出预言。他认为,体育的圣杯在于一项被他称为“进球概率增加值”的统计数据里。这项数据会显示每个球员在其职业生涯中的活动影响球队进球数的增加(比如一个球员在中线处成功传出一记距离五码的球),或是降低(比如他的传球没有成功)。我问扎伊迪,是否有一天专家会这样说:“苏亚雷斯的进球概率增加值是0 .6 0,而卡罗尔只有0 .56.”扎伊迪回答:“我觉得那是会发生的,因为这已在棒球界发生了。我们现在谈论球员的方式是我们在10年或15年前做梦也不会想到的。”
作者《金融时报》西蒙·库珀
编译:黄嘉鑫



