データのドラマ

681
データのドラマ

データは嘘をつかない

6年間、PythonとOptaデータでスポーツ予測モデルを構築。ブラジル・セリエB第12節の混乱は単なるドラマではなく、パターン化された不安定さだった。3週間にわたる30試合で見られた得点ドライ、逆転劇、そして4得点を記録するチームと4試合無得点に終わるチーム。

これはサッカーではない。シューズに包まれた時系列変動である。

感情と確率の交差点

フェロビアリア対ミナスジェライスの4-0やシャペロ対ボタレンドアの4-2勝利。紙面では不思議だが、シュート数とxG(期待得点)にポアソン分布を適用すればほぼ予測可能だった。しかし驚くべきは、これらの結果が「異常値」ではなく、広範なトレンドの一環だったことだ。

ゴイアスやクリシウマ、フェロビアリアは継続的に支配率に見合わぬ成績。xGは安定しているのに実際の得点は平均0.8以上下回っている。運の悪さではない。システム的な精度不足だ。

正直言おう:決定力不足が昇格夢を葬っている。

意外ではなかった守備崩壊

中盤戦での守備的脆弱性——上位進出への静かな殺し屋だ。半数以上の試合で75分以降に失点している理由は何だろう? シンプルだ:疲労+高圧+トランジション防御の弱さ=空いたスペース。 特にゴイアス対クリシウマ(1-1)では後半攻撃三行目のパス成功率が55%未満——プレッシャー強度モデルにとって赤信号だった。

今季全ラウンドで70分以降のゴールについてロジスティック回帰分析を行った結果:攻撃三行目でのパス成功確率が60%未満のチームは10分以内に失点する確率が73%——そしてその基準を満たしたのはこのラウンドで敗れた上位5チーム全員だった。

偶然ではない。数学なのだ。

ファンの心拍数 vs モデル予測

ここで明言しよう:アルゴリズムは、奇跡的な追加タイムゴールや、選手2名離脱の中での監督の大声叫びを感じられない。 誰もが知っている瞬間——観客が沸き立ち、映像が一瞬凍結するあのときだけ……でもデータだけが次の展開を見える:

  • ゴール後の盛り上がり時間平均+92秒延長
  • 家族応援者エンゲージメント37%増加
  • 平衡ゴール後5分以内初得点確率→48%(通常19%)

数字は『チャンス』と言うけれど、ファンには『希望』を感じさせる。

ChiStatsGuru

いいね80.23K ファン1.85K
クラブワールドカップ