Entries

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
この記事にトラックバックする(FC2ブログユーザー)
http://gamerkerlon.blog.fc2.com/tb.php/39-56cfc80a

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

ホームとアウェーを線形回帰(FM2016)

お久しぶりです。
FM2016をプレーするにあたって行ったデータ解析についての記事を書きたいと思います。


FMにおいて、ホームでの勝点とアウェーでの勝点の間に相関関係があり、それを考慮するとホームやアウェーで勝点を得しているとか損しているとか計算できるのではないかと考えた。
現実のサッカーでも同様なことが考えられるかもしれないが、今回扱ったデータがFM2016でのデータなのでFMの話と限定しておく。


前提条件として、FMではホームとアウェーで試合の様相やら結果などは大きく異る、俗にいうアウェー補正があると考えている。


今回は単回帰分析を用いた。
つまり、ホームとアウェーの間に1次的な相関があるんじゃないのっていう話。
そんな複雑な相関ではないでしょっていう話。
簡単に言うと、データを図示したものの真ん中にそれっぽい直線を引く話だと思ってください。


私は予防線を張るのが大好きである。
まず、この記事を書いている今、私は酔っ払っている。
また、回帰分析は久しぶりだから、知識が相当頭から抜けている。
記事を書こうと思ったら、知識が抜けすぎてて死にたくなった。
所属していた研究室の先生に顔向け出来ない。

まぁ、前置きはこれくらいにして本題に入りたいと思う。


色々と理論とか書いてもしょうがないので、いきなり結果。(いきなりステーキとかけているつもり)

lreg_pic.png


図の見方を説明します。

この図は、私がプレーしたFM2016の初年度シーズンにおける、クラブごとのホームとアウェーの勝点の散布図である。
横軸にホーム、縦軸にアウェーである。
当然だけど、リーグ戦の順位はホームとアウェーの勝点を足したもの。
なので、だいたい右上のクラブが順位が上で、左下のクラブが順位が下。

赤線は回帰直線。
この線は、ホームに対してアウェー、アウェーに対してホームの勝点はこれくらいが妥当なんじゃないのって言う線。
今回は一応、ホームでアウェーを説明しているというのが、解析のやり方のもとでは正確な言い方。
赤線より上だとホームにしてはアウェーでも頑張っていて、下だと残念という感じ。
入れ替えて言うと、上だとアウェーにしてはホームもうちょっと頑張れよ、下だとホームでは善戦したねっていう感じ。
傾きが約0.557で切片が約3.841だよ。
回帰直線の妥当性の指標である決定係数は0.43なので、わりと回帰直線の当てはまりいいんじゃないの。

黒い方の線は誤差。
赤い線の上下約3.833。
回帰直線を引いたと言っても、世の中って色々あって理論通り行かないもんじゃないですか。
というわけで回帰直線からの誤差を考える。
50%の確率で黒線より赤線側のほうに入るよ(結構狭くとった)。
ピッタリ半分の数のチームが入るという意味ではないぞ!実際に今回は中8外12だぞ!
つまり、黒線の内側は正常で、外側は異常。
異常は言いすぎかな。
外側ならホームかアウェーで問題がある方の戦術を修正するべきかも。
リヴァプールどうした。

順位が上のクラブを個別で見ると、上位4つのクラブは回帰直線より上。
まぁトップの方のクラブはホームはほぼ全勝だし、これ以上勝てっていうのは酷ですし。
同様に下位クラブのアウェーの負けっぷりなどもあり、つまり、上位や下位の端の方は当てはまりが少し悪いというお話。


一応、今回解析に使ったデータをはっておく。

lreg_data.png


見た感じやっぱアウェー補正あるよね。
ボーンマスどうした。


今回の解析に寄って得られたそれぞれの統計量は、解析に使ったデータに依存する。
データ量が多ければどの場合でもこうなると胸を張って言えるけど、今回はどうなんでしょうという感じ。
プレミアリーグの1年目の指標として限定すればそんなに悪くはないかも。
傾きにホームの勝点をかけて、切片を足してみよう!有効性は保証しないぞ!


ちなみに、私がプレーしたクラブはニューカッスル。
最初に、ゲーム画面でぱっと見たデータとか、プレーしていた体感だと、アウェーにおいて、アウェーという条件を考慮しても、それ以上に凄く苦戦していた印象だった。
でも、解析してみると、確かに苦戦していなくはないけど、誤差の範囲だった。
客観性マジ大事。
この文章では、ゲームやってから解析と書いたが、実は行間があって、その間にアウェー用の戦術をメッチャ試行錯誤した。
時間返せ。


理論面の話を少しするよ。
単回帰分析とその回帰直線の話は、ネット上にもたくさん転がっているので割愛して、誤差の話。
誤差は正規分布に従っているとした。
誤差は残差誤差の偏差に標準正規分布の上25%点の値をかけて求めたよ。
誤差の考え方ってこれで本当に大丈夫なのかな?
偏差は不偏分散のルートを利用。
今調べたら、不偏分散のルートは偏差の不偏推定量じゃないのね。


丸め誤差とか有効数字、誤字脱字はばっちこいっていう感じです。


googleスプレッドシートが思ったより使えなかったので、フリーの統計解析ソフトRを使った。
修士論文の発表が終わったから一生使わないと思ってたのに。


語調が安定しない上に、フザケているけど論文じゃないから許して☆
内容に間違いがあったら指摘してください。
論理的にボコボコにされるのは、長年やっていた研究室のゼミでなれています。


動画の方は…
入社前研修を消化してから…
修論関係のことをやっていた時に、入社前研修は全く放置していたから大変なことに…
なんか記事の一部の内容とこの話が矛盾する気がするし、終わっても新しい言い訳をすると思うのでよろしくお願いします。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://gamerkerlon.blog.fc2.com/tb.php/39-56cfc80a

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

Appendix

プロフィール

Kerlon

Author:Kerlon
twitter:https://twitter.com/kerlon_fm

最新トラックバック

アクセスカウンター

オンラインカウンター

現在の閲覧者数:

検索フォーム

ブロとも申請フォーム

この人とブロともになる

QRコード

QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。