新浪体育 综合体育

大数据 | 威莎决引发做签疑云,美网签表到底有没有猫腻?

体育综合

关注

万众瞩目的“威莎决”将在北京时间明早八点重磅登场。从签表产生的那一刻起,联想到两年前莎娃在大满贯复出战中抽到哈勒普,批评美网靠“做签”博关注的声音便不绝于耳,那么这一猜测到底有没有实锤?鲜为人知的是,早在1996年,美网就出现过重新抽签这一网球史上前无古人的操作。而到了2011年,ESPN则在一份大数据报告中发现了美网签表中的猫腻。今天我们就来重温这篇文章,八年过去,诸多细节仍然值得玩味。

一份名为“Outside the Lines”的报告对2001到2010年的美网签表进行了统计分析。结果显示,总体来看,美网男女单前两号种子遇到的首轮对手,比真正意义上的随机打乱的签表,难度要低很多。

无论是男子还是女子比赛,美网的签表似乎严重偏离了真正的“随机”二字,而使用另一份签表制作系统的澳网和温网,则没有出现这种倾向性。在同一研究时间段内,法网女单前两号种子首轮对手的难度,则比随机签表的要大得多,男单则在平均水平线上。

布莱恩·艾尔雷(右)出席抽签仪式

美国网协职业巡回赛的主管布莱恩·艾尔雷(Brian Earley),自1992年起就在美网担任赛事裁判,同时也负责管辖签表。他表示,自己非常信任这套系统。然而他也很关心,分析报告里提出的有关签表随机性的问题。

“我非常信赖自己的团队成员。如果这套系统有不公平的地方,我想,在外界发现并指出之前,很可能就早已被我和赛事组委会意识到了。”艾尔雷说道,“但我们总是乐于倾听意见。”

三天前,大坂直美出席抽签仪式

"Outside the Lines”报告以球员们的世界排名为依据,分析了十多年间四大满贯男女TOP2种子的平均签运难度。他们将实际签表与1000种随机生成的模拟签表进行对比,发现只有3个模拟签表产出的首轮对手,和十多年来美网男单TOP2种子的真实签运一样容易。而女单方面,1000种模拟情况中,竟然没有一个和实际情况那般极端得容易。

安德鲁·斯威夫特(Andrew Swift)博士是美国统计协会的体育数据部门前主席,也是内布拉斯加州立大学的数学助理教授,表示这份报告的分析逻辑是合理的:“无论你从哪种角度看实际的签表,都能很明显地发现,它们并不是随机生成的。”

这份报告结果同样也在前职业球员斯科维尔·詹金斯(Scoville Jenkins)的意料之内,他在2004年排名第1433位时,收获了美网正赛外卡,成为128人的签表中排名垫底的球员。他的首轮对手是谁呢?2号种子,卫冕冠军罗迪克。“当时你会想,好吧,这也太不走运了。”詹金斯说道:“签表里明明有那么多人可以和我比赛。”

而根据美国网协的官方承诺,一份真正随机的签表,对于詹金斯这种非种子球员来说,应该有三分之二的概率抽到另一位非种子球员、有大约31%的概率遇到除前两号种子以外的其他种子球员。而抽到前两号种子的概率,只有2.08%。

詹金斯

2004年首轮抽到罗迪克后,詹金斯在2007年又被“安排”给了头号种子费德勒,根据OTL的分析,当时他的排名在128人里排第125位。当然,他两场比赛都输了。“有时我觉得,他们按照自己的意愿来安排球员对阵。”詹金斯抱怨道。退役后,他在肯尼索州立大学当网球助理教练,“如果有人明天跳出来说,一直以来我们都不是随机安排签表,而是人为挑选的,那一点也不会让我感到惊讶。”

在看到“Outside the Lines”分析报告后,斯威夫特教授自己动手进行了一项针对前二号种子首轮对手的研究,发现在一百万个模拟签表里,只有4个签表,和2001-2010年间男女单打TOP2种子实际碰到的难度相同或者更容易。

詹金斯

“就它自身的数据而言,美网的签表是相当怪异的。”斯威夫特教授表示,“如果和其他三个大满贯相比,它也显得很奇怪。这样一来你就有了双重的疑惑。有些奇怪的事情正发生着。”

所以究竟是什么地方不对劲呢?

“如果有人想要自告奋勇修复这个签表的话(这对我而言很滑稽),那个人肯定不会来自于我的团队、美国网协或是美网的团队里面。”作为美国网协职业巡回赛的主管,艾尔雷坦言。

他表示,电脑随机生成的签表,是在一个房间举行的一场小仪式里完成的,并且通常情况下,美国网协的代表、男子网协和女子网协的代表、大满贯赛事监督的主席都会在场。在场的其中一人按下按钮,电脑就会生成非种子球员的签表,展现在屏幕上并立刻打印出来。“所以你可能会想说,哦,有某个程序员想要决定或修改签表,或是有人黑进系统了。但我并没有看到这两种情况的发生。”

罗迪克与艾尔雷

艾尔雷表示,他会咨询Information & Display Systems,也就是制作这套产生随机签表的公司。

IDS已经为美网和澳网提供了十多年的随机签表制作技术,产品经理里奥·莱温(Leo Levin)表示,这套程序并没有问题。在"Outside the Lines”把报告结果发给美国网协一周后,美国网协把邮件转发给IDS的总裁拉里斯·帕帕斯(Rallis Pappas),但双方都没有对现实签表的怪异之处作出解释,而是回应道,这一切的发生都是偶然。

美国网协交流部的主管克里斯·维德迈尔(Chris Widmaier)声称,美国网协是站在IDS这一方的,并相信程序确实能够自动产生随机的签表。

克里斯·维德迈尔

“如果我们拿10000届美网的签表来分析,那可能会看到所谓真正的平均数据是什么;但如果只看10年的、每年一届的签表,那么能得到的只是数字,而非具有统计意义的数据。”维德迈尔说道:“除此之外我们不知道还能说什么了。”他还表示,美国网协没有再进行深入调查的打算,那年的美网签表制作也不会做任何改变。

“我相信谜题的答案就是那句老生常谈的话:签表的运气问题。”IDS的产品经理莱温在邮件里写到,“美网的签表制作和其他巡回赛并无差异。因此,既然过程是相同的,那么答案就是,签表本身就是这么来的。”

但斯威夫特博士似乎对这个回应并不买账。“是的,奇怪的现象确实是有可能发生的,但你告诉我,这种现象同时在男子签表和女子签表里出现?双倍的小概率事件发生?”

艾尔雷(右一)

网球迷曾经质疑过美网的男单签表。据艾尔雷回忆,2010年美网一场比赛结束后,两位男球迷带着签表并非随机的证据找到了他,但他根本不相信他们的结论。这两位球迷又把他们的数据,拿给转播美网抽签仪式和美网比赛的ESPN电视台,ESPN检查了数据,并选取了四大满贯的男女签表数据,做了一个更广更全面的分析,结果产生了同样的结论——签表并非随机产生的。

艾尔雷则称,“Outside the Lines”报告是第一个质疑女单签表的机构。“所以问题的重点就在于那些排名90-100间的选手,对吧?我的意思是,是不是这些球员导致了最终签表有歪曲性的结论?”

理论上说,签表的前两号种子,在首轮可能遇到排名33位-128位的球员。过去十年,美网女单签表的这个数字是第98.5名,男子签表是第97.2名,而一份真正随机的签表得出的数字应该接近于80.5名。

“正常情况下,结果出现如此大的数据偏差,是不可能的。”斯威夫特博士说:“如果你看同时期另外三个大满贯的数据,这个数字就接近于80,而且偏差可以小到忽略不计。”

还有一位受到美网奇怪签表影响的球员,则是昔日的天才少女范德维格。2008年,排名第518位的她拿到了美网外卡,当时她的排名在128位选手里排在第126位。有天,这位16岁的女孩刚从训练场下来,一位朋友问她是否看了签表。“我的朋友说,你肯定不相信你抽到了谁。”范德维格回忆,“我问,是谁?”朋友回答道:“扬科维奇。”塞尔维亚人是赛会的2号种子。“我以为他们在开玩笑。”范德维格说。

范德维格和扬科维奇的比赛被安排在首日的夜场,用她本人的话来形容:“太疯狂了。”最后她以3-6/1-6输掉比赛。“能够和如此高水平的球员比赛,我确实是很高兴的,和她交手可以检验我到达了哪种水平。”范德维格说,“我把它当成一次历练的机会。当时我想,我肯定能够给她造成一些麻烦。”

范德维格在同年拿到了青少年组女单冠军

当听到美网签表可能并不是随机产生的时候,范德维格表示,这让她想起了自己在别的赛事当头号种子的经历。“如果头号种子能拿到相对轻松的签表,那对他们来说是好事。这数据听上去有点意思,毕竟我也参与其中过。”

入选2009年美网男单正签时,德文·布里顿(Devin Britton)是128人里排名最低的一位,结果他在首轮抽中了费德勒。年仅18岁的他,职业生涯刚刚起步,总共才赢过一盘比赛。“我有点希望能抽到另外一张外卡,好赢下一场比赛。但能和罗杰同场竞技,绝对是我的福气。”布里顿回忆,“在别的地方你可感受不到这种氛围。”

德文·布里顿

尽管首盘太过紧张让他扭伤了脚,但这位新人在次盘破掉了费德勒的发球局,一度以3-1领先。“人群开始响起一阵欢呼,当时我想,我的妈呀,这里人好多。”布里顿说。

假如真的因为某些原因,低排名选手被安排给了高排位种子,比如詹金斯、布里顿和范德维格,这些低排名选手也可能不会难过。尽管他们原本是有更大机会进入第二轮、拿到更多奖金的。

布里顿表示,自己可以理解低排名选手抽中高种子后的心情,但他仍然很珍惜那次与费德勒交手的经历,并从中获益匪浅。“我知道很多低排位球员伤心的点在哪里,所以这件事有两面性。”

艾尔雷

至于1号种子和2号种子本人,他们是如何看待这件事的呢?费德勒和纳达尔等人在接受采访时拒绝发表意见,女子顶级球员如扬科维奇、小威、沃兹尼亚奇和克里斯特尔斯也拒绝评论。(tennispie注:以上为2009-2011年间的排位)

1996年美网,数位顶尖球员集体抵制美网,控诉美国网协暗箱操作签表以便给美国本土选手开小灶,迫使后者重新制作了签表。当时,其中一个造成大家极度不满的原因是,在种子排位还没有正式公布的情况下,签表竟然就已经产生了。美国网协最后重新抽了签,这在男子网坛历史上还是头一遭。

2001年,美网将种子席位增加到32个,意味着种子球员们在前两轮不用面对排名高于33位的选手。温网在当年也将种子修改为32个,法网和澳网在次年跟随了这一步伐。

2017年,莎娃首轮击败哈勒普

尽管美网的前两号种子会倾向于抽到相对容易的对手,但比起其他三大满贯TOP2种子的表现,“开挂的签运”对比赛结果影响不大。这些异常的首轮对阵安排,似乎对赛事的其他部分也没有带来什么影响。“这么做是为了给顶尖球员顺水推舟?好让他们晋级得更顺利?他们的签本来就很顺利了。”斯威夫特博士说。自2001年至2011年,前两号男单种子首轮抽中的最高排名球员为41位,女单则是37位,这两场比赛都是大种子赢了。

“暗自操纵签表能对美网有什么好处呢?我觉得美网不会得到任何好处。”艾尔雷一脸无奈,“这个险是美网绝对不会去冒的,永远不会。”

文:Paula Lavigne &Alok Pattani

【本文来自微信公众号“tennispie网球派”】

加载中...