SSAC25文章《一种关于职业极限飞盘运动中球员价值评估和决策制定的机器学习方法 》
️Max大郭(备注:郭佰鑫)
一位运营着公众号体育科学和AI大模型爱好者,喜欢刷科技资讯的大学生
联系我:MaxGBX (欢迎科研、产品、自媒体合作交流)
有更多
SSAC25即第19届麻省理工学院斯隆体育分析会议,于2025年3月7 - 8日在海恩斯会议中心举办。作为体育分析领域的重要年度活动,它汇聚了体育界、科技界和学术界的专业人士、学者与爱好者。会议期间,通过演讲环节,行业知名人士分享见解;众多研究论文展示涵盖棒球、篮球、足球等多个体育项目的前沿成果,为体育行业提供创新思路与科学决策依据,促进体育分析学术研究发展与国际交流合作,对提升体育赛事各方面水平意义重大 。
更多相关本会议的论文,进入我公众号首页搜索 #SSAC25
各位有问题的加微信:MaxGBX
在过去十年里,极限飞盘(通常被称为 “飞盘”)已经从一项以业余为主的运动转变为一个拥有专职运动员和多个联赛的职业领域,这些联赛包括极限飞盘协会、超级极限飞盘联赛以及西部极限飞盘联赛。与那些拥有复杂分析框架(如棒球的赛伯计量学或橄榄球的新一代统计数据)的成熟职业体育项目不同,极限飞盘在历史上一直依赖于进球数、助攻数和阻挡数等基础计数统计数据,其分析也往往局限于事后由志愿者追踪的指标。职业联赛的出现对于推动更全面的数据收集至关重要,如今新的追踪系统能够捕捉到前所未有的细节 —— 记录每一次投掷的各个方面,包括投掷者和接球者的位置、投掷结果以及比赛时间。尽管有这些进步,极限飞盘的数据分析仍然不够完善,为评估球员贡献和球队策略的更精细方法留下了发展空间。
▼ 图1:数据集描述 (A) 示例得分过程,展示了2次失误和1次得分 (B) 径向直方图,展示投掷者最常使用的投掷角度 (C) 径向图,展示相对于投掷者位置最常被作为目标的接球位置 (D) 示例数据
下面是思维导图
文章比较长,希望各位有耐心阅读!
️如果您认可我的内容的话,我非常希望您可以帮我转载/传播一下,让更多人了解前沿的文献/产品相关资讯!大郭在这里抱拳了
️我联系方式放在文末了!
欢迎各位关注一下我的抖音、小红书、等平台!
作者:
️- 埃伯哈德,布雷登
️- 布雷登・埃伯哈德是哈佛医学院的机器学习工程师,专注于临床数据分析和预测建模。
- 他热衷于将机器学习应用于极限飞盘运动,认为在这个快速发展但尚未充分发挥其潜力的运动项目中,有独特的机会利用数据分析。
- 作为一名职业球员,布雷登曾代表盐湖城碎骨队和波士顿荣耀队参加极限飞盘协会(UFA)的比赛,帮助盐湖城碎骨队赢得了西部赛区冠军,并在2023年获得了全国亚军。
- 在比赛之外,布雷登通过执教青年队回馈社区,带领犹他蜂群U20队在2022年和2023年获得了全国冠军头衔。
- 在业余时间,布雷登喜欢下棋、阅读,并在波士顿社区做志愿者。
️- 米勒,雅各布
- 雅各布是Qualtrics公司的数据科学家,也是极限飞盘协会(UFA)的职业极限飞盘运动员,目前与盐湖城碎骨队签约。
- 他在2023年获得了UFA全联盟第三阵容的荣誉,并在过去两个赛季中在类似曲棍球助攻数(最重要的计数统计数据)方面领先联盟。
- 在2022年和2023年,他执教犹他蜂群U20男子队连续获得全国冠军头衔。
- 他在杨百翰大学获得了统计学学士和硕士学位。
- 当他不进行训练或工作时,他的业余时间常常用于下一个体育数据分析项目,同时观看篮球或橄榄球比赛。
-️桑德霍尔茨,内特
- 内特・桑德霍尔茨是杨百翰大学统计学系的助理教授。
- 他在西蒙弗雷泽大学获得了统计学博士学位。
- 内特的大部分研究集中在利用统计学为体育领域的战略决策提供依据,应用范围涵盖篮球、足球、橄榄球、网球和轮椅橄榄球。
- 在加入杨百翰大学之前,内特是多伦多大学机械与工业工程系的博士后研究员。
- 在攻读博士学位期间,他还曾担任萨克拉门托国王队的篮球运营分析师。
职业极限飞盘:机器学习重塑运动分析新格局
在众多体育项目中,极限飞盘近年来逐渐崭露头角,从原本的休闲娱乐活动,发展成为拥有专业赛事的竞技运动。但在数据分析领域,它还处于探索阶段。今天要探讨的这篇论文,就为极限飞盘的数据分析带来了全新的思路和方法,借助机器学习技术,深入剖析球员价值和比赛决策。这不仅能让我们更了解极限飞盘这项运动,也为教练、球员和爱好者们提供了科学分析比赛的有力工具。
一、研究背景:极限飞盘的变革与数据分析的困境
极限飞盘,在过去十年经历了巨大的转变。曾经,它主要是业余爱好者在公园、草坪上的休闲活动,但如今,已经发展出了多个专业联赛,像极限飞盘协会(Ultimate Frisbee Association)、超级极限飞盘联赛(Premier Ultimate League)以及西部极限飞盘联赛(Western Ultimate League)。随着这些职业联赛的兴起,越来越多的专业运动员投身其中,使得极限飞盘的竞技水平不断提高。
然而,和那些已经发展成熟的传统体育项目相比,极限飞盘在数据分析方面还远远落后。以棒球的赛伯计量学(sabermetrics)和橄榄球的新一代统计数据(Next Gen Stats)为例,它们拥有复杂而完善的分析框架,能够深入挖掘球员和比赛的各种数据信息。但极限飞盘长期以来,仅仅依赖一些基础的计数统计数据,比如进球数、助攻数和阻挡数。这些数据虽然能反映一部分比赛情况,但非常有限。而且,以往的分析大多是在比赛结束后,由志愿者进行数据追踪和统计,这种方式不仅效率低,还容易出现误差,导致分析结果不够准确和全面。
随着职业联赛的发展,情况有所改善。新的数据追踪系统开始应用,它能够记录下比赛中每一次投掷的详细信息,包括投掷者和接球者的位置、投掷的结果以及具体的比赛时间。尽管如此,极限飞盘的数据分析体系仍然不够成熟,缺乏一套科学、系统的方法来准确评估球员在比赛中的贡献,以及制定合理的球队策略。这就为相关研究提出了新的挑战和机遇。
专业术语
术语 | 含义 |
---|---|
极限飞盘 | 一种从业余发展到职业的运动,有特定比赛规则和多个职业联赛 |
CP模型 | Completion Probability Model,用于估计传球成功完成的概率 |
FV模型 | Field Value Model,预测一次进攻以进球结束的概率 |
xCP | Expected Completion Probability,基于CP模型得出的传球完成概率预测值 |
CPOE | Completion Percentage Over Expected,实际完成率与xCP的差异值 |
EC | Expected Contribution,考虑传球对得分机会影响的预期贡献指标 |
aEC | Adjusted Expected Contribution,对EC优化后,使得分进攻回合总贡献标准化的指标 |
ETV | Expected Throw Value,结合CP和FV模型,综合衡量传球战略价值的指标 |
Figure 2:Discrimination vs Stability: Combined Metrics
️图表类型与内容:这是一张散点图,横坐标为“Discrimination”(区分度),纵坐标为“Stability”(稳定性),图中展示了多个指标的分布情况,其中包括CPOE等新指标和一些传统指标。
️解读:该图用于对比新指标和传统指标在区分度和稳定性上的表现。从图中可以看出,新指标在这两个维度上与传统指标的表现相近,意味着新指标在区分不同球员真实表现差异,以及在不同时间对球员表现预测的可靠性方面,和传统指标效果相当,能够稳定且有效地评估球员表现,不会因短期波动或随机因素产生较大偏差,为评估球员提供了可靠的替代方式。
️图表类型与内容:推测为柱状图(根据文本描述猜测 ),展示了不同新指标的独立性得分。其中,aEC、CPOE、xCP等指标各自对应一个柱子,高度代表其独立性得分数值,如aEC得分较高,而ETV得分相对较低。
️解读:该图通过独立性得分衡量不同指标提供独特信息的能力。大部分新指标表现出较强的独立性,像aEC能提供独特视角,与其他指标信息重叠少。但ETV独立性较弱,这表明ETV主要反映球员整体参与度和投掷频率,在衡量投掷质量或决策方面缺乏独特见解,不过在团队策略的投掷选择和优化上仍有效果。
️图表类型与内容:层次聚类树形图,图中展示了新指标(如R-EC、R-aEC、T-EC、T-aEC、ETV、CPOE、xCP )和传统指标(如进攻控球数“Offensive Possessions: P”等)之间的关系,不同指标根据相似性被聚类到不同分支。
️解读:通过该图可以看出不同指标间的关联程度。R-EC和R-aEC与基于接球者的传统指标(如进球数,图中未明确列出但根据解读推测 )紧密相关,说明它们能很好地反映接球者贡献;T-EC和T-aEC与效率指标联系更紧密,体现投掷者对团队整体表现的影响;ETV靠近传统的数量指标(如投掷次数),侧重于传球分布;CPOE和xCP与完成率、进攻效率指标有一定关联,但又有独特之处,可深入分析传球决策和执行。
️图表类型与内容:推测是场地区域相关的可视化图(根据文本描述推测 ),可能是在展示不同区域的ETV(预期投掷价值)数值分布,或许以颜色深浅或等高线等形式呈现。其中Figure 5展示了飞盘在球场中间时的ETV情况,Figure 6展示飞盘在边线附近时的ETV情况。
️解读:Figure 5表明在球场中间位置,ETV显示向边线附近传球更有利于推进飞盘,这与实际比赛中很多队伍采用的“vertical stack”战术相符,即球员在球场中间站位,利用边线创造进攻空间。Figure 6显示当飞盘靠近边线时,将飞盘传回球场中心比强行向得分区推进更有效,这符合极限飞盘比赛中教练强调的战术原则,为球队在不同场地区域的决策提供数据支持 。
️图表类型与内容:是一系列散点图,横坐标代表不同的特征值(如投掷距离、比赛小节剩余时间等),纵坐标为SHAP值,每个点对应数据集中的一次投掷。
️解读:通过这些图可以分析不同因素对ETV的影响趋势。以投掷距离为例,在一定范围内,投掷距离与ETV呈正相关,但超过某个阈值后,随着距离增加,ETV的收益逐渐递减,反映出投掷距离过长可能导致传球准确率下降或失误风险上升。而比赛小节剩余时间的图则显示,随着时间流逝,ETV明显下降,体现了球员疲劳对比赛的影响,帮助球队了解不同因素如何影响得分概率和传球完成情况。
️图表类型与内容:是对投掷者x位置的SHAP值散点图,通过颜色梯度展示其他特征(如投掷距离、场地区域位置等)的变化情况。
️解读:该图展示了不同特征之间的相互作用。在球场中间位置,长距离传球和向得分区的传球能获得更高的ETV;在边线附近,短距离传球和不指向得分区的传球ETV更高。这量化了球场中央位置的战略优势,即投掷者在中央位置有更多选择,能更好地控制比赛节奏,发起更具攻击性的进攻;而边线位置限制较多,更适合横向短传。此外,当投掷者和接球者处于球场两端时,传球的ETV会增加,进一步说明了中央位置对进攻的积极影响 。
二、研究基础:数据与规则的基石(一)珍贵的数据宝藏
这项研究的开展,得益于极限飞盘协会提供的一个庞大而丰富的数据集。这个数据集涵盖了2025年到2024年四个完整赛季的职业比赛数据,包含了604场比赛中的327,179次投掷记录。如此大规模的数据,在极限飞盘领域是前所未有的。它不仅数量多,而且涵盖范围广,涉及到联赛中的所有球队,能够全面反映不同球队、不同球员在多个赛季中的表现。
更重要的是,这些数据包含了丰富的空间和比赛情境信息。每一次投掷记录都精确记录了投掷者和接球者在场上的位置,这对于分析球员的跑位、传球线路以及团队配合非常关键。同时,比赛状态变量,比如比分差、剩余时间等信息的记录,让我们能够了解到在不同比赛局势下球员的表现和决策,为深入研究比赛提供了宝贵的线索。
(二)极限飞盘规则科普
为了更好地理解这项研究,我们先来熟悉一下极限飞盘的基本规则。在职业比赛中,极限飞盘的场地是一个长方形,长80码,宽53⅓码,两端各有一个20码长的得分区。每支参赛队伍由7名球员组成。当球员接到飞盘后,必须在7秒钟内将飞盘传出,同时要确定一个轴心脚,以保证传球的合法性。比赛分为四个小节,每个小节时长12分钟。在每小节开始时,两队会通过抛硬币等方式决定谁先开球。
比赛采用“连续比赛”模式,除非出现进球、犯规或者球队叫暂停的情况,比赛会一直进行下去,这使得比赛节奏非常紧凑。当出现传球失误,比如飞盘掉落、出界或者被对方球员拦截,以及在7秒内未能成功传出飞盘(称为stall)时,球权就会转换给对方球队。对方球队将在失误发生的地点立即获得球权,并开始向相反方向进攻,试图将飞盘传入对方的得分区得分。当一支球队成功将飞盘传入对方得分区时,就算完成一次进球,此时该球队得1分。得分之后,得分球队会发起一次“pull”,类似于橄榄球比赛中的开球,标志着下一个得分回合的开始。如果在常规比赛时间结束时,两队比分相同,则会进行5分钟的加时赛。若第一个加时赛仍然平局,第二个加时赛将采用“突然死亡法”,即哪支球队先得分,哪支球队就赢得比赛的胜利。
(三)前人研究的回顾与不足
在极限飞盘数据分析的发展历程中,前人也做出了一些探索。其中,Weiss和Childers的研究成果较为突出。他们的“Maps for Reasoning in Ultimate”一文,为理解球员在比赛中的表现奠定了重要基础。他们通过引入先进的指标和方法,比如创建完成地图和得分地图,尝试从不同角度解读球员的表现。同时,还提出了像预期得分结果(Expected Point Outcome)和有效贡献(Effective Contribution)这样的概念,试图量化一次投掷的预期价值以及球员的行为对比赛结果的影响。
然而,这项研究存在一些明显的局限性。首先,其使用的数据集相对较小,仅仅包含了10场展览俱乐部比赛中的3,195次投掷数据。较小的样本量可能无法全面反映职业比赛的真实情况,导致研究结果的代表性不足。其次,这些数据来源于业余比赛,与职业比赛在比赛强度、球员水平等方面存在较大差异,使得研究成果难以直接应用到职业赛事中。此外,该研究主要关注投掷者和接球者的位置,没有充分考虑到比赛中的其他重要因素,比如比赛的比分情况、剩余时间以及场上其他球员的位置等,也没有对整个得分过程进行全面的建模和分析。
除了Weiss和Childers的研究,还有一些在博客和网络应用上的分析,但这些分析在严谨性和深度上参差不齐,大多只是简单地对比赛数据进行表面分析,无法形成一套系统、科学的理论体系。这也凸显了进一步深入研究极限飞盘数据分析的必要性。
三、核心模型:解锁比赛奥秘的钥匙
为了更深入、准确地评估球员在比赛中的表现以及球队的战略决策是否合理,研究团队开发了两个关键的模型:完成概率(CP)模型和球场价值(FV)模型。这两个模型就像是两把精准的钥匙,帮助我们打开了深入理解极限飞盘比赛的大门,让我们能够从数据的角度洞察比赛中的各种奥秘。
(一)模型特征:多维度数据支撑
这两个模型的构建依赖于多个维度的数据特征,这些特征从投掷者、接球者、投掷动作本身以及比赛情境四个方面进行收集和整合。在投掷者方面,通过投掷者的X坐标(Thrower X)和Y坐标(Thrower Y)来精确确定其在场上的位置。接球者的位置同样通过接球者的X坐标(Receiver X)和Y坐标(Receiver Y)来确定。对于投掷动作,研究考虑了多个关键因素。投掷距离(Throw distance)反映了投掷者与接球者之间的空间距离,这一距离的长短会直接影响传球的难度和成功率;投掷角度(Throw angle)则以度为单位进行衡量,规定0°为向前投掷的方向,180°为向后投掷的方向,向右为正角度,向左为负角度,它体现了传球的方向和线路;Y坐标差(Y differential)和X坐标差(X differential)分别表示投掷者和接球者在Y轴和X轴方向上的坐标差值,这些差值有助于更细致地分析投掷动作的空间特征。在比赛情境方面,模型纳入了比赛小节(Game quarter)信息,明确当前比赛处于哪个小节;小节内得分点序号(Quarter point)记录了在当前小节中是第几个得分点;比分差(Score differential)反映了两队之间的得分差距,这一因素会影响球员在比赛中的决策和战术选择;小节剩余时间(Time)则体现了比赛的时间进度,随着时间的推移,球员的体能、心理状态以及比赛策略都可能发生变化。这些丰富多样的数据特征相互结合,为模型提供了全面、准确的输入信息,使得模型能够更真实地模拟和预测比赛中的各种情况。
(二)模型定义:精准预测比赛走向
️FV模型:FV模型主要聚焦于预测一次进攻最终能够以进球结束的概率。在实际比赛里,一次进攻能否得分受到众多因素的影响,而FV模型将这些因素进行整合考量。它把投掷者在场上的具体位置以及比赛当下的情境等关键信息作为重要依据。比如说,当投掷者位于靠近对方得分区的位置时,结合此时的比分差距、比赛剩余时间以及双方球员的站位分布等比赛情境,FV模型能够计算出这次进攻得分的可能性。这一模型的构建,为球队在制定进攻策略时提供了极具价值的参考。教练和球员可以依据FV模型的预测结果,更加科学地判断在不同情况下,采取何种进攻方式更有可能实现得分。如果FV模型显示在某个位置和比赛情境下,进攻得分的概率较高,球队就可以尝试在该区域发起更具攻击性的进攻;反之,如果得分概率较低,球队则可能需要重新调整战术,寻找更有利的进攻机会。
️CP模型:CP模型则把重点放在估计一次传球成功完成的概率上。传球是否成功,并非只取决于投掷者的技术,接球者的位置、投掷时的动作以及比赛的整体情境都起着重要作用。CP模型全面整合了这些因素,通过复杂的算法和数据分析,给出一个相对准确的传球成功概率预测值。举例来说,当投掷者准备传球时,CP模型会综合考虑他与接球者之间的距离远近、传球的角度是否合适、当时比赛的紧张程度(这可以通过比分差和剩余时间来体现)以及双方球员在场上的位置分布情况等因素,进而预测这次传球成功的可能性。这一模型对于评估球员的传球能力和在比赛中的决策质量具有不可忽视的意义。教练可以借助CP模型的预测结果,指导球员在不同的比赛情境下做出更为合理的传球选择。如果CP模型预测某次传球成功的概率较低,教练可能会提醒球员谨慎选择传球时机或寻找更合适的传球目标,以避免失误。
为了确保所构建的模型具有较高的准确性和可靠性,研究人员采用了一系列严谨的验证方法。在模型训练阶段,运用5折交叉验证法。这种方法的原理是将整个数据集平均分成五份,每次训练时选取其中四份作为训练集,剩下的一份作为验证集。通过多次重复这个过程,让模型在不同的数据子集上进行训练和验证,从而充分利用数据信息,有效避免过拟合现象的发生。过拟合是指模型在训练数据上表现得非常好,但在新的数据上却表现不佳的情况。通过5折交叉验证,可以使模型在训练过程中更好地学习数据的特征和规律,提高模型的泛化能力。
在模型验证阶段,研究人员使用了三个不同的测试集。第一个测试集是基于50名投掷次数超过200次的球员的数据集。选择这样的测试集,是因为这些球员具有较多的投掷数据,能够更全面地反映不同球员在大量投掷情况下的表现差异,检验模型对不同球员个体的适应能力。第二个测试集是包含最近10场比赛的时间序列数据集。这个测试集主要用于模拟对未来比赛的预测,通过观察模型在近期比赛数据上的表现,评估模型在时间维度上的稳定性和适应性。随着比赛的进行,球队的战术、球员的状态以及比赛的环境都可能发生变化,一个稳定且适应性强的模型应该能够在不同时间的比赛数据上都保持较好的性能。第三个测试集是一个随机选取的20%数据子集。通过在这个随机子集中进行验证,可以进一步检验模型在不同数据分布情况下的性能,确保模型的有效性不受数据选取方式的影响。
经过在这些测试集上的严格验证,CP和FV模型在多个评估指标上都展现出了优异的性能。在曲线下面积(AUC)、准确率(Accuracy)、阳性预测值(PPV)和阴性预测值(NPV)等关键指标上,CP和FV模型都显著优于使用Weiss和Childers方法构建的基线模型。曲线下面积(AUC)衡量的是模型在所有可能的分类阈值下的性能,AUC值越接近1,说明模型的分类性能越好;准确率(Accuracy)表示模型预测正确的样本数占总样本数的比例,反映了模型整体的预测准确性;阳性预测值(PPV)是指模型预测为正例且实际也为正例的样本数占模型预测为正例的样本数的比例,用于评估模型对正例预测的准确性;阴性预测值(NPV)则是指模型预测为负例且实际也为负例的样本数占模型预测为负例的样本数的比例,用于评估模型对负例预测的准确性。这些指标的良好表现充分证明了新模型在预测比赛结果方面具有更高的准确性和可靠性,能够为后续的数据分析和决策提供坚实的支持。
四、创新指标:深度解读比赛与球员表现
基于前面所介绍的CP和FV模型,研究团队进一步开发出了一系列创新的指标。这些指标从多个独特的角度,对球员在比赛中的贡献以及比赛决策的质量进行量化分析。与传统的统计指标相比,这些创新指标能够更深入、全面地揭示比赛背后的信息,为我们理解极限飞盘比赛提供了全新的视角,让我们看到那些隐藏在传统数据背后的球员价值和比赛策略的微妙之处。
(一)CP相关指标:衡量传球实力
️预期完成概率(xCP):预期完成概率(xCP)是基于CP模型得出的一个关键指标,它代表了在当前比赛情境下,一次投掷成功完成的预测概率。例如,在某次传球时,模型计算出xCP值为0.7,这就意味着根据模型的预测,在当时的比赛状况下,这次传球有70%的可能性会成功完成。xCP为我们评估球员在不同比赛情境下的传球决策提供了重要参考。如果一名球员经常选择在xCP值较低的情况下传球,这可能暗示他在传球决策上比较冒险,或者对传球难度的判断不够准确;相反,如果球员总是倾向于选择xCP值较高的传球方式,说明他更注重传球的稳定性,在决策时较为谨慎。
️完成率超过预期(CPOE):完成率超过预期(CPOE)是另一个与CP模型紧密相关的重要指标,它用于衡量实际完成率与xCP之间的差异。具体的计算方式是CPOE等于实际传球完成情况(传球成功记为1,失败记为0)减去xCP。CPOE与橄榄球中评估四分卫的类似统计指标有着相似的作用,在极限飞盘比赛中,它能够直观地评估投掷者的表现。如果一名球员的CPOE值较高,说明他在实际比赛中经常能够完成超出模型预期难度的传球,这体现了他具备出色的传球能力和在压力下稳定发挥的水平;反之,如果CPOE值较低,可能意味着该球员在传球的决策或者执行过程中存在一些问题,需要进一步改进。比如,某位球员在一场比赛中的xCP值平均为0.6,但他的实际完成率只有0.5,那么他的CPOE值就是0.5 - 0.6 = -0.1,这表明他在这场比赛中的传球表现没有达到预期水平,可能需要调整传球方式或决策思路。
️预期贡献(EC):预期贡献(EC)是在借鉴前人研究的基础上进行改进的一个指标,它的设计初衷是更全面地评估一次传球对球队得分的实际贡献。与传统的只关注传球码数的统计方式不同,EC不仅考虑了传球在场上所获得的实际码数,还充分结合了球场位置以及比赛情境等因素对球队进攻得分机会的影响。对于一次传球,如果成功完成,EC的计算方式是传球终点的球场价值(FVₑ)减去传球起点的球场价值(FVₛ);如果传球失败,EC则等于对手在传球终点位置的球场价值(FVₒ)的相反数。例如,在比赛的关键区域,一次成功的长距离传球如果能够帮助球队大幅提升得分概率,那么它的EC值就会相对较高;而在一些风险较大但收益也可能较高的传球尝试中,如果传球失败,EC值会相应地受到较大影响,反映出这次传球失败对球队的负面作用。通过这种计算方式,EC能够更全面、准确地反映一次传球在整个得分过程中的价值。
️调整后的预期贡献(aEC):调整后的预期贡献(aEC)是对EC的进一步优化和改进。在实际比赛中,不同的得分进攻回合起点的球场价值可能不同,这会导致EC在衡量不同回合中传球贡献时存在一定的不公平性。aEC通过对得分事件的贡献进行标准化处理,使得每个得分进攻回合中所有传球的总贡献恰好为1,从而消除了对进攻回合起点球场价值的依赖,让不同进攻回合之间的比较更加公平和合理。对于成功传球,aEC的计算方式是(传球终点的球场价值减去传球起点的球场价值)除以(1减去该进攻回合起始传球的球场价值);如果传球失败,aEC的计算与EC中传球失败时相同,即等于对手在传球终点位置的球场价值的相反数。通过aEC指标,我们可以更直观地理解每个球员在得分过程中的具体贡献。例如,在一次得分进攻中,如果一名球员的aEC值较高,说明他在这次进攻中的传球对球队最终得分起到了关键作用;反之,如果aEC值较低,则可能需要在后续的比赛中调整自己的传球策略,以提高对球队得分的贡献。
预期投掷价值(ETV)巧妙融合了CP和FV模型的优势,是一个综合性极强的指标。它全面考虑了传球成功的概率以及传球终点的潜在球场价值,能够更精准地衡量一次传球在比赛中的战略价值。ETV的计算方式为:用xCP乘以传球终点的球场价值(FVₑ),再减去(1减去xCP)乘以对手在传球终点位置的球场价值(FVₒ)。这一计算方式的逻辑在于,既考虑了传球成功时所能带来的积极影响(通过xCP和FVₑ体现),又兼顾了传球失败时对手可能获得的机会(由1减去xCP和FVₒ衡量)。
ETV的取值范围在 -1到1之间,这一范围有着明确的实际意义。当ETV值为1时,代表这次传球有100%的概率成功完成,并且能够直接导致球队进球,这无疑是最理想的传球情况;而当ETV值为 -1时,则表示这次传球肯定会被对手在防守得分区截断,是最糟糕的传球结果。在实际比赛场景中,教练和球员可以依据ETV值来判断一次传球的风险和收益。例如,在比赛的关键时刻,如果一次传球的ETV值较高,说明这次传球在成功概率和得分潜力方面都表现出色,是一个值得尝试的传球选择;反之,如果ETV值较低,就需要谨慎考虑是否进行这次传球,或者及时寻找其他更有利的进攻机会。ETV为球队在比赛中的决策提供了重要的量化依据,帮助球队在复杂多变的比赛局势中做出更合理的选择。
五、指标分析:可靠性与独特性的双重检验
为了确保这些创新指标能够真正有效地应用于极限飞盘比赛的分析中,研究团队对这些指标进行了全面而深入的分析。他们从区分度、稳定性、独立性以及与传统指标的关系等多个关键方面进行评估,旨在检验这些指标的可靠性和独特性,为其在实际比赛中的应用提供坚实的理论依据。
(一)区分度与稳定性:精准衡量球员表现
区分度是衡量一个指标能否准确区分不同球员真实表现差异的重要标准。在极限飞盘这样充满变化的运动中,不同球员在技术水平、比赛风格和对球队的贡献方式上各不相同。一个具有良好区分度的指标,应该能够敏锐地捕捉到这些差异,清晰地展现出每个球员的独特价值。例如,在评估投掷手时,区分度高的指标可以准确区分出那些擅长精准短传的球员和善于长距离冒险传球的球员,以及他们在不同比赛情境下的表现差异。
稳定性则关注指标在不同时间对球员表现预测的可靠性。由于在实际比赛中,球员的表现可能会受到多种因素的影响,如比赛的对手实力、比赛场地的条件以及球员自身在不同比赛阶段的身体和心理状态等。一个稳定的指标能够在不同的比赛环境和时间跨度内,持续、准确地评估球员的表现,减少因偶然因素导致的评估偏差。比如,一名球员可能在某一场比赛中因为对手防守较弱而表现出色,但在其他比赛中面对更强的对手时表现有所下滑。稳定的评估指标不会因为这种短期的波动而对球员的能力做出错误判断,而是能够综合考虑多个比赛场景,给出更客观、准确的评价。
研究人员将新开发的指标与传统的计数统计指标进行了对比分析。传统的计数统计指标,如进球数、助攻数等,在评估球员表现方面已经被广泛应用了很长时间,但它们存在一定的局限性,无法全面反映球员在比赛中的综合贡献。进球数只能体现球员在得分环节的成果,却不能说明这些进球是在怎样的比赛情境下取得的,也无法反映球员为创造这些进球机会所做出的其他努力。通过对比发现,新指标在区分度和稳定性上与传统指标相当。这意味着新指标能够像传统指标一样,可靠地评估球员在比赛中的表现,而且不会受到短期波动或随机因素的过度影响。新指标在评估球员时,会综合考虑多种比赛因素,通过复杂的算法和大量的数据训练,更准确地把握球员的真实水平,为球队的人员评估和战术安排提供更可靠的依据。
(二)独立性:提供独特分析视角
独立性主要用于考察一个指标所提供的信息,在多大程度上不与其他指标重复,是否能为数据分析带来独特的见解。研究人员运用高斯copula模型来衡量各个指标之间的依赖程度,进而计算出每个指标的独立性得分。这个得分以数值的形式,直观地展现出每个指标所蕴含的独特信息的多少。
经过分析发现,除了ETV之外,大部分新指标都展现出了很强的独立性。这表明这些指标在评估球员表现和比赛决策时,能够提供彼此不同、且不依赖于其他指标的独特视角。以aEC为例,它比EC的独立性更高,这意味着aEC在评估球员对得分的贡献时,能够挖掘出一些EC所无法体现的信息,为分析比赛提供了更为独特的角度。aEC通过对得分事件贡献的标准化处理,能够更公平地比较不同进攻回合中球员的贡献,揭示出那些在传统EC指标下可能被忽视的球员价值。
再看CPOE和xCP,它们专注于传球执行和选择的特定方面。CPOE侧重于评估球员实际完成传球与预期完成概率之间的差异,xCP则聚焦于预测传球成功的可能性,两者相辅相成,为深入分析球员的传球表现提供了新的维度,而这些信息在传统的统计指标中是难以获取的。不过,ETV的独立性相对较弱。这说明ETV在反映球员的投掷质量或比赛决策方面,并没有提供特别独特的见解,它更多地体现了球员在比赛中的整体参与度以及投掷的频率。尽管如此,ETV在团队策略的投掷选择和优化方面,仍然具有一定的价值。教练可以通过分析ETV,了解球队在不同区域的投掷选择是否合理,从而调整战术,提高进攻效率。
(三)与传统指标的关系:验证指标相关性
为了探究新指标与传统指标之间的内在联系,明确新指标在整个评估体系中的位置和作用,研究人员采用了层次聚类分析的方法,并通过绘制树形图来直观地展示它们之间的关系。
从树形图中可以清晰地看到,R - EC和R - aEC与基于接球者的传统指标(如进球数等,虽然图中未明确列出,但根据分析可推测 )紧密相关。这充分表明R - EC和R - aEC这两个指标,能够很好地反映接球者在比赛中的贡献。在实际比赛中,接球者的主要职责是成功接到传球,为球队创造得分机会,而这两个指标恰好从预期贡献的角度,量化了接球者在这方面的表现,与传统的基于接球者贡献的指标相呼应。例如,如果一名接球者在比赛中经常能够在关键位置接到高难度传球,为球队创造得分机会,那么他的R - EC和R - aEC值往往会比较高,这与他在传统指标(如进球数)上的表现也会呈现出一定的正相关关系。
T - EC和T - aEC则与效率指标的关联更为紧密。投掷者在比赛中的作用不仅仅是简单地传球,更重要的是通过合理的传球,帮助球队高效地推进进攻,创造得分机会。T - EC和T - aEC这两个指标综合考虑了传球的效果、球场位置以及比赛情境等因素,能够很好地体现投掷者对球队整体进攻效率的影响,揭示了投掷者的有效性与球队整体表现之间的紧密联系。比如,一名投掷者如果总是能够在合适的时机,将球准确地传给处于有利位置的队友,帮助球队快速推进并创造得分机会,那么他的T - EC和T - aEC值会较高,同时球队的进攻效率也会相应提升。
ETV与传统的传球数量等指标聚类相近,这意味着ETV更侧重于反映传球的整体分布情况。它虽然不能精确地衡量单个传球的质量,但可以帮助教练和分析师了解球队在比赛中各个区域的传球频率和选择倾向,为制定整体的进攻策略提供参考。例如,如果在一场比赛中,球队在某个区域的ETV值较高,但实际传球次数较少,这可能暗示球队在该区域有更多的进攻潜力未被挖掘,教练可以考虑调整战术,增加在该区域的传球尝试。
CPOE和xCP与完成率和进攻效率指标存在一定的相关性,但又有着独特之处。它们在一定程度上反映了球员在传球完成率和进攻效率方面的表现,但又不仅仅局限于此。通过考虑传球的难度、比赛情境等因素,CPOE和xCP能够深入分析球员在传球决策和执行过程中的具体表现,为评估球员的传球能力提供了更为细致和全面的视角。比如,一名球员的完成率可能较高,但如果结合xCP和CPOE分析发现,他的xCP本身就很高,且CPOE并没有明显优势,这说明他可能更多地选择了容易完成的传球,在面对高难度传球时的能力还有待提高。
六、实际应用:赛场决策与球员评估的得力助手
这些创新指标在职业极限飞盘的实际比赛场景中,有着极为广泛且重要的应用。无论是球队在制定战术策略时,还是对球员进行全面、精准的评估时,这些指标都能发挥关键作用,为球队的决策提供有力的数据支持,帮助球队提升整体竞争力。
(一)赛场决策:实时策略优化
在瞬息万变的比赛过程中,球队需要根据场上的实际情况,迅速做出最优的决策,选择最有效的进攻策略。通过绘制每次投掷的预期结果,球队能够以可视化的方式,清晰地看到在不同的比赛状态和场地区域下,哪种传球方式最有可能带来积极的结果。研究发现,当飞盘位于球场中间区域时,向边线附近传球往往更有利于推进进攻。这一发现与许多球队在实际比赛中采用的“vertical stack”战术不谋而合。在这种战术中,球员们在球场中间站位,通过向边线创造空间,实现更高效的进攻推进。这是因为在球场中间,球员的视野相对开阔,传球选择更多,而向边线传球可以利用边线的空间,拉开防守,为接球者创造更好的接球机会,从而推进进攻。
而当飞盘靠近边线时,将飞盘传回球场中心,通常比强行向得分区推进更为明智。这是因为在边线附近,传球的空间相对狭窄,防守压力较大,强行向得分区传球容易导致失误,而将飞盘传回中心区域,可以重新组织进攻,寻找更好的得分机会。这些基于数据的发现,为球队在比赛中的实时决策提供了科学依据,帮助球队优化进攻策略,提高得分效率。例如,在一场比赛中,当球队发现飞盘处于边线附近且进攻受阻时,根据数据反馈,及时将飞盘传回中心区域,重新调整进攻节奏,可能会创造出更有利的得分机会。
利用Shapley Additive Explanations(SHAP)方法,研究人员深入分析了影响投掷价值的关键因素。通过这种方法,能够精确地确定在众多因素中,哪些对ETV的影响最为显著,以及它们之间是如何相互作用的。研究发现,投掷距离和Y坐标差在一定范围内,与ETV呈正相关关系。也就是说,在这个范围内,随着投掷距离的增加和Y坐标差的增大,ETV也会相应提高,这意味着传球更有可能为球队带来积极的收益。这是因为在一定范围内,适当增加投掷距离可以更快地推进进攻,而Y坐标差的增大可能意味着创造了更有利的进攻空间。
然而,当超过某个阈值后,继续增加投掷距离,ETV的收益反而会逐渐递减。这是因为随着投掷距离的不断增加,传球的准确性会受到影响,失误的风险也会相应提高,从而导致整体的战略价值下降。例如,当投掷距离过长时,接球者可能难以准确判断球的落点,防守球员也更容易进行拦截,使得传球成功的概率降低,进而影响ETV值。此外,研究还发现比赛剩余时间也是一个重要的影响因素。随着比赛时间的逐渐流逝,球员的体能会逐渐下降,疲劳感增加,这会导致他们在比赛中的表现受到影响,ETV也会明显下降。这是因为疲劳会影响球员的反应速度、传球准确性和接球能力,使得进攻效率降低。这些发现让球队更加清楚地了解不同因素对得分概率和传球完成情况的具体影响,从而在比赛中能够更加合理地安排战术,根据比赛的进程和球员的状态,及时调整进攻策略。比如,在比赛的后期,当球员体能下降时,球队可以适当缩短传球距离,增加传球的成功率,以保持进攻的有效性。
通过给SHAP值散点图上色,研究人员巧妙地展示了不同特征之间的相互作用及其对模型预测结果的综合影响。以分析投掷者x坐标的SHAP散点图为例,图中的颜色梯度能够直观地展示出其他特征(如投掷距离、场地区域位置等)的变化情况。从图中可以明显看出,在球场中间位置,长距离传球和向得分区的传球往往能够获得更高的ETV。这是因为在球场中间,球员的视野更开阔,有更多的传球选择,而且能够更好地利用球场的空间,发起更具攻击性的进攻。相比之下,在边线附近,短距离传球和不指向得分区的传球ETV更高。这是由于边线附近的空间有限,防守较为密集,长距离传球和向得分区的传球难度较大,而短距离传球更容易控制,风险相对较低。此外,当投掷者和接球者分别处于球场的两端时,传球的ETV会有所增加。这进一步证明了球场中央位置在进攻中的优势,中央位置能够为球员提供更多的进攻选择,增强进攻的灵活性,更有利于发起向前推进、高价值的进攻战术;而边线位置由于空间受限,更适合进行横向的短传配合。这些发现为球队在比赛中的战术布置提供了重要的参考,教练可以根据球员的位置和场上的情况,指导球员选择最合适的传球方式,提高进攻的效率和成功率。例如,当球员处于球场中间位置时,教练可以鼓励他们尝试长距离传球或向得分区传球;而当球员在边线附近时,则提醒他们选择更安全的短距离传球。
(二)球员评估:全面了解球员能力
在评估球员在比赛中的贡献时,EC和aEC指标展现出了明显的优势,相比传统的基于码数的统计指标(如投掷码数和接球码数),它们能够更全面、准确地反映球员的实际价值。通过EC和aEC指标,我们能够发现一些在传统统计中容易被忽视的优秀球员。例如,在按总EC排名的前5个球员赛季中,2025年的MVP Ben Jagt以及其他四位来自不同赛季的全UFA队球员都名列前茅。这表明EC指标能够很好地捕捉到那些对球队得分贡献较大的球员,与传统的MVP评选等认可的精英表现具有很强的一致性。这是因为EC综合考虑了传球的效果、球场位置和比赛情境等因素,能够更全面地评估球员在得分过程中的实际贡献。
此外,通过对比投掷者的T - EC和接球者的R - EC,教练可以深入了解球员的角色特点。如果一名球员的R - EC较高,但T - EC较低,这说明他在接球方面具有较强的能力,是球队中出色的“cutters”(主要负责跑位接球的球员);相反,如果一名球员的T - EC较高,则表明他在传球组织方面更有优势,是球队中的“handlers”(主要负责控球和传球的球员)。教练还可以根据球员在每个进攻回合中的贡献情况,合理安排球员的上场时间和比赛任务。对于那些拥有较多控球机会,但每次控球贡献较低的球员,可以适当减少其上场时间;而对于那些虽然控球机会较少,但每次贡献都很高的球员,则可以给予更多的上场机会,从而优化球队的阵容配置,提高球队的整体表现。例如,在一场比赛中,如果一名球员在多次控球中,T - EC值都较低,说明他在传球组织方面的效率不高,教练可以考虑减少他的控球时间,让更有组织能力的球员来主导进攻;而对于一名R - EC值较高的接球手,可以增加他的跑位机会,为球队创造更多得分可能。
CPOE和xCP为评估球员的传球表现提供了更为细致和全面的视角。xCP能够反映出球员在传球时的决策倾向。例如,Gus Norrbom的xCP较高,这表明他在传球时更倾向于选择安全、成功率高的传球方式,注重保持球权,为球队稳定地推进进攻;而James Pollard和AJ Merriman的xCP较低,说明他们更愿意尝试一些风险较高的传球,这种传球方式虽然可能伴随着更高的失误风险,但一旦成功,往往能够为球队创造出更好的得分机会。CPOE则侧重于评估球员在实际比赛中,超出或未达到预期传球完成率的能力。像Matt Jackson,他不仅xCP较高,而且CPOE也很强,这意味着他在完成高成功率传球方面表现出色,能够稳定地发挥自己的水平;Jonathan Nethercutt虽然xCP相对较低,但CPOE却保持在较高水平,这充分展示了他在完成高难度传球方面的卓越技巧。教练可以根据这些指标,为不同特点的球员安排合适的任务。对于xCP较高的球员,可以让他们在比赛的关键时候,承担处理关键重置传球的任务,确保球权的稳定;而对于那些xCP较低但CPOE较强的球员,可以安排他们在需要
七、研究展望:突破局限,探索更多可能(一)研究局限性
尽管这项研究为极限飞盘的数据分析带来了创新性的成果,但不可避免地存在一些局限性。在实际的极限飞盘比赛中,一次成功的进攻往往是投掷者和接球者紧密协作的结果,然而,现有的研究方法难以精确界定两者在成功进攻中各自的贡献比例。这就可能导致在评估球员时出现偏差,无法精准衡量每个球员在比赛中的真实价值。例如,在一次精彩的得分进攻中,很难确定投掷者精准传球和接球者巧妙跑位接球这两个环节对最终得分的贡献各占多少,这对于准确评估球员的表现和能力造成了一定阻碍。
不同的极限飞盘联赛,如极限飞盘协会、超级极限飞盘联赛和西部极限飞盘联赛,在比赛规则、时间设置以及场地尺寸等方面存在差异。这些差异会对球员的比赛表现和相关性能指标产生影响,使得使用统一的数据集和分析方法难以准确反映不同联赛中球员的真实水平。比如,某些联赛场地较小,球员的活动空间受限,传球和跑位策略可能与场地较大的联赛不同,现有的分析可能无法完全适应这些差异。
成功传球和失败传球的落点位置存在偏差。比赛中,传球失败时飞盘常出界或被拦截,其落点与成功传球的落点不同,这种偏差可能给数据分析带来潜在误差,影响研究结果的准确性。例如,若仅依据落点数据评估球员表现,可能会因这种偏差高估或低估某些球员的能力。
(二)未来研究方向
针对当前研究的局限,未来极限飞盘数据分析有诸多可探索的方向。一方面,可以拓展数据集,纳入更多情境数据,如持球时间倒计时(stall count)、队友和防守球员位置等。持球时间倒计时能反映球员传球时的时间压力,影响其决策;队友和防守球员位置信息有助于研究球员在复杂局势下的传球选择和跑位,以及防守对进攻的影响。通过整合这些数据,可提升指标准确性和实用性,更全面评估球员表现和球队策略。比如,分析持球时间倒计时与传球成功率的关系,能帮助教练指导球员在时间压力下做出更好决策。
另一方面,目前极限飞盘数据分析中防守指标研究较少,未来可整合防守位置、防守压力和造成失误等数据,开发完善的防守指标体系。这能更全面评估球员防守贡献,不仅突出进攻优势,还展现防守影响力,实现对球员综合表现的平衡评估。例如,通过量化防守球员对进攻球员传球路线的干扰程度,评估其防守效果,为球队在人员配置和战术安排上提供更有价值的参考。
八、研究总结:开启极限飞盘数据分析新篇章
这篇关于职业极限飞盘的研究论文,借助创新的模型和指标,为极限飞盘比赛分析带来了全新视角,开启了该领域数据分析的新篇章。研究团队利用丰富数据集和先进建模技术,开发出CP和FV模型,分别从传球完成概率和得分概率角度,精准预测和分析比赛关键环节。基于这两个模型,创建了EC、aEC、CPOE、xCP和ETV等创新指标,从多维度评估球员表现和比赛决策质量,突破了传统统计方法的局限。
通过对这些指标的深入分析和实际应用验证,发现它们可靠性高、稳定性强,能提供独特见解。在赛场决策方面,帮助球队优化战术,把握进攻时机;在球员评估方面,全面了解球员能力,合理安排上场时间和任务,提升球队整体竞争力。
尽管目前研究存在局限性,但也为未来研究指明了方向。随着研究不断深入和数据持续完善,极限飞盘的数据分析将在提升球队表现、推动赛事发展等方面发挥更大作用。它将助力球队更好地理解比赛,制定科学训练计划和比赛策略,也能让观众更深入欣赏比赛,感受极限飞盘运动的魅力。期待该领域未来取得更多突破创新,为这项充满活力的运动注入新发展动力。