长期以来,橄榄球数据分析师很难量化进攻锋线的表现。除了看比赛录像用肉眼评判外,常用的衡量标准通常是被擒杀总数或者是擒杀占所有传球进攻的比例。
换句话说,进攻锋线的表现完全取决于他们所保护的四分卫被擒杀的次数。这样的标准在评价历史上的四分卫时往往会出现偏差。拿乔-纳马思(Joe Namath)做例子。他生涯绝大部分时间效力于纽约喷气机,和他同时代的四分卫比起来,他的被擒杀数很少可是传球被抄截率偏高。以调整后传球均码数这样的数据衡量,他的传球效率非常出色。然而外界对他的影响却是:纳马思的传球能力一般,因为他的被抄截数很多;可是他面前的进攻锋线很强力,因而他能呆在干净的口袋里传球,所以说他还是能交出很漂亮的传球成绩。随着数据党对擒杀率这样数据的研究更深入,他们发现实际情况恰恰相反:数据分析结果发现,较之被抄截率,擒杀率和四分卫的关系更大。因而现代数据党认为擒杀数往往和四分卫相关。这彻底改变了对纳马思的既有观感,让我们重新认识了这名名人堂级四分卫。
因此,我们不能用擒杀数评价进攻锋线的表现。佩顿-曼宁(Peyton Manning)可以说是有史以来最难被擒杀的四分卫。若依照擒杀率评判进攻锋线,那他到什么球队,那支球队的进攻锋线便会得到脱胎换骨的升级;反观像马库斯-马里奥塔(Marcus Mariota)这样的四分卫,他职业生涯5年的被擒杀率都很高,因而即便他躲在PFF系统评价很好的泰坦进攻锋线后,他还是容易被擒杀。
若我们不用擒杀作为衡量进攻锋线赛季以前进攻锋线的表现我们便找不到依据进行评判。2006年,PFF才开始完整地收集相关数据。
除了PFF每场比赛会在每档进攻对每个球员进行评分之外,它记录了四分卫遭施压的情况。只要四分卫面临即将被擒杀的危险,使得他后续动作被打断,不得不选择逃离口袋或者匆忙将球出手,这就被算作1次成功的施压。
承压百分比显然是更好评估进攻锋线的指标,因为这更能衡量进攻锋线击败对手冲传的能力。然而,根据最新Eric Eager的研究,承压数依然不是最好衡量进攻锋线的指标。在Eager的研究中,直观地可以发现四分卫在口袋里呆的时间是相关数据最直接的影响因素。因而ESPN的数据分析团队创造了保护/冲传成功率(pass-block/pass-rush win rate)这个数据,衡量进攻锋线秒的冲击。
在本文中,我们所做的分析方法类似,但我们要考虑四分卫所有可能的出球时间,并将所有有助于或不利于传球保护的变量纳入考虑范围。
自2012年以来,PFF记录了四分卫每次持球的过程。从他拿到球到将球传出、被擒杀或者跑出口袋自己持球推进,期间所用时间PFF都以图表的方式呈现出来。同时在防守组施压的情况下,我们也记录了防守组施压所需要的时间。后一组时间非常重要,因为这直接将两种不同情况区分开来。有的四分卫开球后2秒便遭到防守组施压,他得逃出防守组的扑抢,调整脚步,在开球后4秒后将球传出;有的四分卫则能在赶紧的口袋里待上4秒,等到防守组压力上来后再将球出手。上述两种情况,第一种情况进攻锋线得负很大的责任;而第二种情况里四分卫(可能还要追责没跑出空位的外接手)所承担的责任更大。
为区分这两种情况的区别,我们对联盟的进攻锋线做生存分析。这分析将着重关注进攻锋线的保护效率(即存活率)。当球开出后,随着时间的流逝,只要四分卫不出球,我们便会持续估计四分卫不被对手防守组冲击的概率。自然,刚开球时进攻锋线%,随着时间的流逝,锋线成功的生存率会自然稳步下降,毕竟进攻锋线不可能永远能挡住对手的冲击。在开球后的某个时间点,进攻锋线秒四分卫面对对手施压的概率高达99.5%,即生存率降到了接近于0,因而7秒是合适的终止时间点。
事不宜迟,上图便是是2019年的联盟平均进攻锋线的生存曲线(黑色虚线)。为了更好联盟进攻锋线的生存曲线分布,图上分别有联盟里位列表现最糟糕的进攻锋线(迈阿密海豚队)和最好的进攻锋线(绿湾包装工队)的生存曲线,分别位于联盟平均水平的上下两侧。
不出所料的是,开球后1.5秒内四分卫基本上不会遇到防守组太大的压力。自此以后,防守组施压的概率随着时间的增加而变大。曲线倾斜度最大的时候是处在2到3秒之间,这也是四分卫最喜欢出手的时候:所有的传球中,53%是在2.5秒以前便出手的,49%出手的时间是在2到3秒之间。3.5秒时,若四分卫还没有出手,那防守组的施压在所难免,据数据统计防守组施压的概率超过了80%。
这个结论可能会引起误读,在这里需要予以澄清。这不是说只要四分卫持球3.5秒,他遭到施压的概率达到80%。从历史数据来看,当四分卫后退接球,在3.5到4秒后才出手传球时,他们面对施压的比例只有56%。这似乎和先前我们得到的结论矛盾,出现这一分歧的原因是:如果你发现四分卫能一直稳稳持球,那意味着进攻锋线的保护非常得力。如果进攻锋线出现纰漏,那四分卫早就会仓促出手或被对手擒杀。计算3.5秒进攻锋线的存活率时,我们必须包含四分卫2秒后遭遇对手施压仓促出手的情况。这样的情况显然四分卫的持球时间没有达到3.5秒,因而进攻锋线秒。所以说关于存活率正确的解读是,如果四分卫打算持球3.5秒,他有超过80%的可能会面对防守组施压。
从存活曲线个角度观察到包装工和海豚进攻锋线的差距:开球后的固定时间内(例如2.5秒),包装工给四分卫留下干净口袋的概率要比海豚多出28%(73%对45%)。或者,以进攻锋线存活率作为参考基准(例如60%),包装工的进攻锋线能比海豚多坚持接近半秒的时间。Eager发现,口袋完整的时间和进攻最后的成功率成正比,进攻锋线能挡住对手冲传的时间越长,四分卫传球成功率就越高。这也是这条曲线所包含的重要意义。
由此,我们可以说包装工的进攻锋线比海豚的好吗?进攻锋线存活率还和攻防很多其他因素有关。等于说一条平均水平的进攻锋线的生存曲线不一定是联盟平均水平。在各种各样的情况下,随着生存率的变化四分卫所得到的的期望出球时间也会相应变差或变短。我们的目标是算出相应的期望值,并将期望和实际情况作比较。因而我们做了用广义可加模型(generalized additive model (GAM))做逻辑回归(logistic regression)。一般建模过程的细节非常枯燥,不过这个模型里相关变量都很有意义。从中可以得出不少有趣的结论。
我们已经知道,看四分卫后退有没有遭受施压,最重要的衡量指标就是时间。下一个和存活率有关的变量当属二线突袭(进攻锋线存活率应该和冲传的人数有关系)。
毫无疑问,冲传的人数越多,施压的速度也越快。当然,进攻可以在四分卫保护网里派更多的球员作为应对。而且保护网里的人越多,四分卫口袋能持续的时间也越长。
我们研究发现的结果证实如此。不能说进攻锋线个人,存活曲线都非常类似,这个模型里各个因素都会互相影响,如果进攻锋线名球员,那基本是为了应对对手的突袭。现实的数据也能支持这一点。如果光靠进攻锋线人保护,那他们面对四分卫突袭的比例是16%;若有跑卫或者近端锋参与保护,他们面对对手突袭的比例达到了51%。这就解释了为什么两种情况下的存活曲线非常类似,即便多一人保护四分卫的口袋也能提供四分卫更多的决断时间。当然我们的模型能同时反映这两个变量的关系。
有意思的问题是当进攻锋线的人数比冲传手要多的情况下,进攻锋线的存活率会有怎样的变化。这样的情况一般发生在面对5人进攻锋线人冲传以保护二线防守,还包括进攻方为了应对对手突袭,在四分卫保护网里多留一名进攻球员。
我们的研究结果发现,进攻锋线里留更多的球员并不能彻底抵消防守组突袭的效应。比较标准的4对5的对阵,5对6或者6对7的情况下,防守组能更快地施压对手。有个非常直观的结论:要施压四分卫,只要有一个冲传手能冲破保护网就可以了。因而冲传手的人数越多,最终施压的概率也就越大。这结论和Josh Hermsmeyer在路面推进的研究中得出的结论类似:防守组在前线的人越多,阻止对手路面推进的效果越好;反观进攻组增加开路的人数所带来的效应并没有防守组那么大;简而言之,进攻前线的实际人数远比纸面上锋线挡人评分要重要得多。
我们得出了关于冲传者和保护网人数对进攻锋线存活率及施压存活时间的影响后,我们将继续研究其他进攻组有关的影响因素。
我们发现,四分卫跑出口袋或者其他非传统进攻套路能提高四分卫保护效率,给传球者更多阅读对手防守的时间。当然,四分卫跑出口袋的副作用是他可能只能观察一半球场的情况,经常得仓促传球。因而这只是权衡之计。
整个研究里,我们最后一个要讨论的变量是假交递的因素。很多人都会问为什么假交递后的传球比其他传球效率更高——不管球队的路面进攻有没有成型——我们总是提到冲球的假动作会吸引开球线前的防守球员,不管比赛里球队这个战术用过多少次,防守球员总会上当。
我们注意到,假交递和跑出口袋这两者都会同时发生,所以我们只选取了开球后退进行假交递的情况。作为参照,四分卫跑出口袋时我们也排除了假交递的情况,因而这两个效应的互相作用效果被降到了最低。
我们还可以查看假交递对路面进攻所产生的影响。我们可以选取两支球队,一支球队的路面推进占比超过一半,另外一支小于一半。假交递后,我们可以对比一下两队存活曲线的影响。样本所选取的比赛场景限定在双方分差只在一个球权之内,为的是去除了领先球队假交递成功率更高的影响因素。
研究结果中,我们的确发现假交递的效果很显著。然而和给予四分卫更多时间观察比起来,假交递对路面进攻的帮助就小得多。Ben Baldwin的研究里还有一个发现,假交递在比赛开始阶段使用效果更好。
我们可以复制Baldwin的研究方法,研究假交递降低对手冲传速度所带来的的影响。得到的结论也是类似,传球方面的效应远远要大于路面推进。这再一次让我们得出类似的结论:假交递越早用越好,用得次数越多越好。
建立了模型,讨论了模型中的变量,现在便可以用到现实情况分析中了。我们拿预期的进攻锋线存活率和实际作比较,我们就拿公羊作为例子。如图所示,2018赛季洛杉矶公羊的进攻锋线在路面推进开路方面做得非常好,同时麦克维在进攻战术设计方面也帮助到了进攻锋线。从传球保护上我们能看出端倪。
肖恩-麦克维在进攻时叫了很多假交递(36%,联盟平均水平是24%)和四分卫跑出口袋(10%对6%),因而四分卫得到的预期窗口时间高于联盟平均水平。同时公羊的进攻锋线保护也比联盟平均水平号不少,因而2018赛季公羊的传球进攻在全联盟排进前8.实际上,2018年公羊进攻锋线年统计开始的最高值,第二到第五名的分别是绿湾包装工2014、2016、2018和2019赛季进攻锋线赛季公羊的进攻锋线的期望存活率依旧非常高,可实际他们在保护贾里德-高夫传球的表现有了明显的下滑。
这也部分解释了为什么公羊的接球群的实力依旧出色,可本赛季公羊的传球进攻只能在全联盟排在第18,(按照每次传球进攻的累计期望得分(EPA/pass play)排行)。我们的成果非常契合PFF传球保护的排名,公羊的传球保护在2018年能排进前五,而2019年掉到了倒数第三。
这一部分,我们要分析存活率这一数据,并将他和PFF现有的评分体制作比较。为了检验每个时间点存活率的属性,我们将生存曲线通过加权平均各时段时间的形势浓缩成单个数字,将他和PFF现有评分做回归分析,得出相应的拟合优度(即R平方值)。加权的依据取决于四分卫出手时间的分布情况。例如,自从2013年开始,开球后2.3秒出手的占比是5.2%,因而2.3秒存活率的权重便是0.052。我们将得到的数据成为进攻锋线的存活指数。通过预期存活率,我们可以得到预期存活指数还有超预期存活指数。
下图可见,进攻锋线存活率和实际和期望存活率之差每半个赛季间不会发生太大的变化(拟合优度上,上半赛季存活率和下半赛季有关联)。期望存活率是通过我们之前提到的模型给出的数据。
刚刚开球后存活率基本是随机的,不过在2到4秒这个区间存活率有意义,此时拟合优度处于0.30区间上下。有意思的发现:进攻锋线保护网被立刻冲破显然会受到各种外界因素的影响,但是进攻锋线保持一定时间的口袋干净就不是纯粹偶然可以解释了。因为曲线过了拐点后斜率的绝对值明显要比之前小。
更让人兴奋的结果是超过期望值的数据稳定性更高,可能因为考虑了相关影响因素后这条曲线更能贴近实际,反应各条进攻锋线的实力。产生的结果和生存曲线非常类似(如上所述,生存曲线已被变形为一个数字)。当衡量生存曲线的稳定性时,拟合优度值是0.32,而超预期生存曲线,就在图表局部最大值的范围之内。
同时我们还检验了新数据和PFF传球保护评分的关系,评分和生存指数之间的拟合优度有0.37;与超预期指数的值有0.38,由此证明了PFF评分对进攻锋线未来的表现有参考价值。预期生存指数的稳定性相对偏低(拟合优度值0.25),主要的原因是预期值还会受到对手防守的影响,这一部分已超过了进攻方的掌控范畴。
存活率和传球效率作对比时,我们发现传球效率达到局部最高值的时间大约在开球后3秒左右。
不过这两者的相关性非常低,拟合优度值只有0.10左右,和进攻锋线保护评分的情况类似。这也间接证明了相关的结论,虽然进攻锋线在场上很重要,可是在传球进攻中他们的重要性不如四分卫和接球手群。
不过纯粹存活率和传球效率之间的关系稍微高一些,因为不管是战术涉及还是进攻锋线表现出色,存活率高意味着四分卫的传球窗口就大,这也能提高球队传球进攻的效率。
经过之前大量的理论研究,我们当然也对目前各支球队的进攻锋线表现很感兴趣。相较于针砭,赞歌总是更悦耳,因而我们参照生存指数评出了联盟前6的进攻锋线。数据截止NFL赛季第15周。
所有球队的传球保护都远高于预期,而包装工和维京人额外还受到了球队战术的照顾,同时他们面对对手突袭的次数也更少,因而柯克-考辛斯和阿隆-罗杰斯也有比联盟其他四分卫更长的出手时间。考辛斯本赛季充分利用了这一优势,他在PFF四分卫传球评分上仅次于拉塞尔-威尔逊,维京人每档传球进攻的累积期望得分也高居联盟第二。
别忘了PFF的评分很大程度上会预测存活率未来的走势。由于维京人的进攻锋线在传球保护评分上排在联盟第24,因而未来他们存活率有很大的下修空间。当季后赛维京人客场挑战对手时,进攻锋线得承担起保护考辛斯的重任。主场面对包装工的比赛里,维京人的进攻锋线被包装工的前线冲得七零八落,他们需要重新证明自己。