足球直播内容

数据帝告诉你英超边锋的两种习惯

时间: 浏览:266
标签:法甲

我们的“一张图”系列已经跟新了4期,在获得不少朋友认可的同时,也有另一个声音即“研究这些数据有什么用”。今天刚好借着这个机会,给大家举一个具体例子。

长篇引言:研究这些数据有什么用?如何从多个数据网站整理整合数据?

其实我刚开始萌生写这篇文章的想法,是因为看到了某知名解说的一条微博:

关于防守端那些语焉不详甚至趋近于玄学的神论比如“平均而非高效”,这里暂且不提,只说4231的两翼配置,是不是决定了两个边锋无法长期向禁区里靠拢?按说推翻这个结论并不难——穆里尼奥在皇马打的就是标准的4231,C罗进入禁区抢点还少了?但是具体到这场比赛,情况就不一样了。因为观察佩佩的风格容易,马丁内利这个年仅18岁、英超出场时间连500分钟都不到的小将,对很多人而言就比较陌生了。

事实上原博主也提到了,阿森纳能取得进球,就是马丁内利进入禁区抢点的结果。这本身就是对“阵型限制”理论的自我否定:

其实全过程中,马丁内利就一直在禁区内物色机会,这是一个相当标准的禁区内纯无球作业,阵型与此并无关系——最终解放马丁内利的是边后卫萨卡的前插,也没规定4231阵型边后卫不能前插助攻吧?

我们用两张静态图看一下进球全过程中,阿森纳球员的站位:

第一步,注意用阴影部分标注出来的阿森纳前场4人组,其实3-1站位还是存在的。只不过拉卡泽特、马丁内利和10号三人换位了而已。马丁内利从一开始就准备进入禁区抢点了。当然,此时按道理来说边路是必须有人接应的,但10号和拉卡泽特并不需要两个人一直留在外围,因为此时持球的是已经压上来的萨卡,边路是有人的。这意味着边锋完全可以被解放出来,参与抢点——4231阵型没这个问题吧?

拉卡泽特兜到外围接应,和萨卡做配合,帮助萨卡下底传中。此时10号进入了禁区,马丁内利也进去了——我们结合第一张图的站位,其实10号是临时站在了左边锋的位置上,马丁内利则是一开始看到拉卡泽特回撤之后,主动往禁区里靠,填补禁区内的接应人数,说白了,这还是相当典型的4231阵型下的边锋无球内切抢点。

换言之:你有没有人进入禁区抢点,很大程度上取决于球员的无球习惯,而不是阵型。

这就需要我们对马丁内利和佩佩的风格有所了解,他们到底喜欢在边路持球干,还是喜欢去禁区内抢点?这也是足球解说的赛前必备功课。然而目前绝大多数从业者其实都做不到。其实这也是传统方法论存在的根本性问题:佩佩倒也罢了;马丁内利你不盯着看几场比赛,很难得出系统结论,然而又有谁有这个精力呢?

好消息是:人做不到,数据可以。

比如接下来我就会告诉你,数据足以证明,马丁内利比佩佩更喜欢在禁区内活动。

为了解释这个问题,我想了两个办法:

第一,如果一名边锋的所有触球中,禁区内触球的占比很高,那么毫无疑问,他更喜欢去禁区内活动。

第二,如果一名边锋尝试盘带次数,占触球比重很高,那么这也能说明,该边锋在触球后更倾向于自己拿球单干。

但这里又有个问题:英超边锋如此之多,有些人时而打边锋时而打其他位置,我们该如何筛选出符合条件的边锋?这就需要多个数据网站结合应用。

我之前多次提过,whoscored这家大家耳熟能详的网站,其实多数人对它的用法都存在巨大误区——应用最广的那套打分系统,实际上是一个相当“垃圾”的系统,几乎不存在参考价值,因为只是做到了“客观”,但其自身数据库却极度青睐有球与进攻,系数设置也一塌糊涂(当然没人能做到完美诠释各项数据之间的系数),甚至连结合控球率对数据做进一步处理这个足球数据分析最基本的环节都没有。whoscored真正的好处除了“免费”之外,在于比赛日至做的非常精细,你甚至在每一场比赛的页面,精确到每一分钟来查看数据变化。而且whoscored会即时跟进阵型与球员位置变化。

这意味着我们可以利用这个网站,大致确定每个球员打每个位置的时间!

举例来说:我们不难查到孙兴慜本赛季的出场时间是1479分钟(这个时间是不计算伤停补时的,这也是所有采用opta数据的网站,包括各大中文APP,所存在的通病),但他有多长时间在打边锋呢?whoscored设置位置之后可以查到:1086分钟。

这样一来,我们就可以筛选出本赛季英超联赛中,所有打过边锋位置的球员,并且计算出他们在边锋位置上的出场时间占比——为什么要计算时间占比呢,因为有些球员打边锋的时间虽长,但却是因总出场时间多导致的,比如奥巴梅杨。

下一个问题是:我们如何确定他们的触球数以及禁区内的触球数?

在《高阶数据:一张图看懂英超谁是禁区之狼》这篇文章里,我第一次用到了提供opta英超数据的fantasy football hub网站,这是一家付费网站,而且需要科学上网。opta数据一个月大约10英镑,其实真正有用的就是详细触球数和禁区内触球数。结合whoscored筛选出的符合条件的边锋,我们就可以通过这家网站,用10英镑的价格,计算出他们各自禁区内触球的占比。

再然后,我们需要利用wyscout数据库,找到他们的盘带次数,并同球员的触球次数做比。这是我目前应用最多的数据库,中文网站价格很贵,但如果能科学上网就比较便宜了,一个月10-20欧元不等。这家网站提供的“盘带”,尽管也叫“dribbles”,但筛选标准比Opta的要宽的多。Opta的那个“dribbles”,实际上指的是“过人”,是和“抢断”共存的,数据样本实在太小了。就反映持球操作次数而言,我个人更推荐wyscout的这个“dribbles”。不过这需要一个一个球员的查,确实比较麻烦:

简言之:任何数据网站都只负责提供给你符合一定标准的数据统计,这些数据几乎都需要你自己进行处理;如果一家网站不够,那么就去再找一家。为了写这篇文章,我前后对这些数据进行了4、5道处理,方法如前所述,并不难;但也恐怕不至于巧合到还有人这么做吧。

这里也请大家不要再怀疑我是原创还是翻译了,足球数据应用真不是老外的专利,只不过我们国内的足球媒体人乃至职业足球人,一直以来都太过缺乏这种起码的科学精神,导致长期以来我们只能从外媒文章接触经过处理的足球数据,而中文足球评论充斥着语焉不详的“强侧转弱侧”、“宽度带动纵深”这样的词汇,最终乃至无限趋近于兵法甚或玄学,遇到解释不了的问题则诉诸于没法搞到证据的“心态”或“体力”。我从不反对你花大量精力研究技战术、看录像,但这和数据应用是相辅相成的,即便我写这篇文章,最开始也是专门用两张静态图分析了阿森纳的进攻跑位——数据是很重要的工具,它不需要门槛,只是太渴望尊重。

英超边锋触球习惯图

以下为图例说明:

横轴为持球盘带占触球总数的比重,越靠近右边,表明该球员越喜欢在触球后持球操作;

纵轴为禁区内触球占触球总数的比重,越考上,表明该球员越喜欢在禁区内寻觅机会(尽管不一定是直接射门);

圆点大小表示出场时间,圆点越大表明出场时间越长;

颜色深浅表示该球员打边锋的时间占比,颜色越深,打边锋时间占比越长,比如颜色最深的斯特林,打边锋的时间超过99%。

选取对象包括英超所有打边锋时间排名前30的球员,并剔除掉了奥巴梅杨等9名边锋时间占比不足60%的球员。

为避免再被怀疑为翻译,部分球员名称采用中文。

我们能从上图看出什么?

第一,传统强队不太强调边锋持球操作。本身这些球队边后卫插上助攻非常频繁,边锋是可以解放到禁区里去抢点的;即便不进入禁区,在外围触球后也可以更多寻求同队友打一些传切配合。反倒是中下游球队,因为非常倚重边锋在快速推进中的个人单打,时不时贡献一些非常喜欢尝试盘带的边锋。比如诺维奇的埃尔南德斯。

此处和埃尔南德斯数据类似,但情况不同的是狼队的特劳雷。埃尔南德斯在某种意义上是诺维奇进攻的发动机,经常在触球后二话不说直接选择持球向前推,他自己习惯这么做之外,诺维奇也确实只能让他这么做。这队进攻端办法确实不多,靠埃尔南德斯一路持球怼也是突然提速的策略之一,比如这样:

相比之下,特劳雷的持球就要靠谱的多——事实上二人盘带成功率也存在不小差距,论说埃尔南德斯的55.1%已经不错了,特劳雷的69.7%却堪称恐怖。狼队也确实能给特劳雷制造更好的盘带空间,并借此收获更好结果。比如这样:

狼队本赛季打到现在能够跻身前6,跟特劳雷的出色表现显然分不开。

第二,利物浦的两名超级边锋非常喜欢在禁区内作业,而不很倾向于自己持球推进,这也是克洛普一贯的做法——一定要在对方禁区内堆砌足够多的抢点人数。萨拉赫最终成为英超最倾向于禁区内抢点的边锋,禁区内触球占比遥遥领先其他人。此人无球习惯相当出色,经常在禁区内寻觅机会抢点,尤其是抢前点的意识非常强。比如这样:

当然,这并不是说萨拉赫就转型为无球打法了。还是那句话,萨拉赫的技术非常全面,而且各方面都比较成熟,需要他持球打的时候他一样能打出高质量持球。事实上萨拉赫本赛季53.3%的盘带成功率,相较于上赛季的38.4%而言,还是巨大进步。

第三,斯特林非常喜欢在禁区内抢点。这在一定程度上其实是瓜迪奥拉的一个无奈之举——曼城为了维系高压传控体系,以及增加传球渗透威胁,在前场囤积了大量小快灵式的球员,按道理来说这些人的提醒并不适合抢点;但抢点工作又总要有人做,于是斯特林便不得不在极为灵活的阵型移动体系下,频繁进入禁区抢点。效果吗……肯定有成功的地方,但也不乏暴露其体型劣势的画面:

我用鼠标标注出了斯特林的移动轨迹——相当标准的无球内切抢点。而且由于曼城投入大量进攻兵力,完全将对手注意力吸引到中路和右侧,加之盯防他的边后卫突然摔倒,斯特林最终争顶时其实是无人防守的,这球顶到了几乎就是必进球,然而他的个子……

而且吧……斯特林这人有一个声名在外的毛病——太快乐……这赛季打到现在,他的“真实射门得分率”(不明白这个概念的朋友可以点击三张高阶数据图告诉你:本赛季三大联赛,谁的射门有质又有量)是不算好的0.67%。作为对比,他的队友阿圭罗是10.60%(超高)。他去禁区内抢点,个别时候确实会有点尴尬:

这次又是,斯特林从头到尾没打算近距离接球再自己推进,就是准备好了抢点,队友也确实传过来了,然后,射门被封堵了……

类似情况其实不胜枚举,比如下面这球,预期进球数高达0.58,愣是被斯特林近距离推的连球门范围内都没打中:

从我们的散点图看,斯特林实际上是目前英超最倾向于禁区内抢点的边锋之一,在萨拉赫之外,他的禁区内触球占比独占第二档。在这种情况下,能否告别“快乐足球”,很大程度上决定着斯特林能不能再次实现自我突破,更上层楼。

第四,曼联边锋尤其是拉什福德(whoscored的统计是68.2%的时间在打边锋)的禁区内触球占比,有点太低了。这个问题我们之前也多次说过,我很不理解为什么索尔斯克亚会有意识的设计大量让拉什福德拉到外围策应的战术。此人本赛季43.6%的盘带成功率并不出色,在外围持球突破未见得是多好的选择。考虑到博格巴长期缺阵,曼联中场也缺乏能频繁进入禁区抢点的高手,此时再让拉什福德频繁向外牵扯,势必严重影响禁区内接应点。

当然,拉什福德确实在外围送出了不少近距离的渗透性传球,也在一定程度上帮助球队在边路,靠着传切配合实现了一些推进。但曼联本赛季每90分钟禁区内触球16.71次,仅仅排名英超第7。缺乏禁区内接应点,使得拉什福德的这种“策应”,显得有些“买椟还珠”了。

第五,回到刚开头的案例:阿森纳的两名边锋确实风格不一样:马丁内利明显更喜欢在禁区内游走,其禁区内触球占比远超佩佩,而且马丁内利还是英超禁区内触球占比最高的边锋之一。所谓4231阵型影响边锋进入禁区,从这里也能看出来是扯淡。除了开头给出的案例之外,我们再通过两个动图,对比一下马丁内利和佩佩的跑位风格:

这是马丁内利禁区内抢点的进球,从头到尾他都在中路等着抢点,从其跑动风格上也不难看出其禁区内抢点的习惯。

再看看佩佩:

由于画面没显示出佩佩的跑动轨迹,我们以两张静态图做一解析:

undefined

第一步,阿森纳前场呈标准3-1站位,马丁内利此时没有进入禁区抢点,其实是对的,因为边后卫没上来助攻,他必须在边路保证一个接应点。但此时,佩佩是不大可能接到球的,在那边等着横传转移意义也不大,不如直接进入禁区抢点。

undefined

但佩佩在4秒钟的时间内移动的距离非常近,最终皮球确实传到他脚下了,但他射门的位置,距离球门还是比较远的。这就是他的无球习惯问题——他的第一选择还是在禁区外顺利接球,然后自己持球操作,而不是进入禁区内抢点。

结语:

尽管我们利用了大量的动图和静态图,最终它们仍旧是为了补充说明那张散点图给出的信息。动图也好,静态图也罢,都只是对一两个瞬间做的解析,都是个案。然而数据却是无数个案的汇总,是全覆盖的。这也就是数据的说服力所在。

其实,掌握这些数据,并用它们得出一些结论并不难,我目前买数据的开支,一年下来大约2000多块钱。如果致力于做足球研究,这些代价是值得付出的。而且它确实有用。至少这么长的一篇文章下来,我们可以在做赛前准备时清晰的通过一张图知道:萨拉赫、斯特林喜欢在禁区内抢点,马丁内利和佩佩这两名阿森纳边锋的风格不同。当然,这些人所在球队关注度较高,可能你通过解说多场比赛也不难得出这些结论。但如果现在你面对的是诺维奇VS狼队的比赛呢?数据可以很清晰的提前告诉你,特劳雷和埃尔南德斯作为边锋,风格和英超其他边锋是不同的。

我们没法进入更衣室,没法跟球员聊天,没法知道他们在比赛中的心跳速率、激素分泌情况等球队保密信息。但摄像机可以帮你抓取场上球员的外在信息,数据公司可以给它汇总过来。数据的意义在于,你可以因此让自己的技战术认知更为丰富。同时不用遇到解释不了的问题,就搪塞以“心态崩了”、“体能不足”。

回到顶部