1試合当たりのシュート数と勝点 リーグ別に、シュート数と勝点の相関関係を見てみる。 データは、ここから入手。 https://www.whoscored.com/ シュート数が載ってなかったリーグは、こちらのサイトのデータを集計。 www.football-data.co.uk ドイツ Bundesl…
1試合当たりの得失点差と勝点 リーグ別に、得失点差と勝点の相関関係を見てみる。 データは、ここから入手。 https://www.whoscored.com/ ドイツ Bundesliga スペイン La Liga フランス Ligue 1 イタリア Serie A イングランド Premier League ポルトガル L…
1試合当たりの失点と勝点 リーグ別に、失点と勝点の相関関係を見てみる。 データは、ここから入手。 https://www.whoscored.com/ ドイツ Bundesliga スペイン La Liga フランス Ligue 1 イタリア Serie A イングランド Premier League ポルトガル LigaNOS …
1試合当たりの得点と勝点 リーグ別に、得点と勝点の相関関係を見てみる。 データは、ここから入手。 https://www.whoscored.com/ ドイツ Bundesliga スペイン La Liga フランス Ligue 1 イタリア Serie A イングランド Premier League ポルトガル LigaNOS …
一試合当たりの得点と失点 Top 5 League その他 支配率とパス成功率 一試合当たりのシュート数と被シュート数
Team Stats 編 さまざまな指標と勝点との相関関係を視覚化 得点と勝点 失点と勝点 得失点差と勝点 シュート数と勝点 被シュート数と勝点 得点/シュート数と勝点 失点/被シュート数と勝点 ポゼッションと勝点 ドリブル数と勝点 ドリブル成功数と勝点 ドリブル…
もたもたしてる間に 2018/19 シーズン終わっちゃったけど...ggplot2によるデータの視覚化: Ligue 1 2017/18作者: 山岡直樹発売日: 2019/05/18メディア: Kindle版この商品を含むブログを見るggplot2によるデータの視覚化: Premier League 2017/18作者: 山岡直…
ヨーロッパ top 5 league の 2017/2018 シーズンのそれぞれ top 2 team のデータから、レーダーチャートを作ってみた コードは以下の通り # Font を準備 windowsFonts(HGKAI=windowsFont("HG正楷書体-PRO")) windowsFonts(COURIER=windowsFont("Courier New"…
「サッカー データ分析」シリーズ半年ぶりの新刊 ggplot2によるデータの視覚化作者: 山岡直樹発売日: 2018/11/30メディア: Kindle版この商品を含むブログを見る既刊もよろしく少年サッカー データ分析: R言語を用いたネットワーク分析作者: 山岡直樹発売日: …
「Copa do Mundo de Futebol FIFA Brasil 2014」「Чемпионат мира по футболу 2018」を 分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statisticsこんな風な tab 区切りファイルに保存 Team Rank Rating Shotsconceded Shots Tackles …
データは、ここから入手。 https://www.e-stat.go.jp/ gist0d6818283c015b43abb2535a4c2478f9
データは、ここから入手。 https://www.e-stat.go.jp/ こんな風な tab 区切りファイルに保存して 区分 都道府県 人口総数 15歳未満人口 15歳未満人口÷人口総数 15~64歳人口 15~64歳人口÷人口総数 65歳以上人口 65歳以上人口÷人口総数 1 北海道 5381733 608…
「Copa do Mundo de Futebol FIFA Brasil 2014」を 散布図 で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks…
「Copa do Mundo de Futebol FIFA Brasil 2014」を 特異値分解 (SVD) で分析してみた。 こちらの記事を参考にさせていただきました。 Running PCA and SVD in Rデータは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイ…
「Copa do Mundo de Futebol FIFA Brasil 2014」を t-SNE(t-distributed stochastic neighbor embedding) で分析してみた。 こちらの記事を参考にさせていただきました。 puyokw.hatenablog.comデータは、ここから入手。 https://www.whoscored.com/Statisti…
「Copa do Mundo de Futebol FIFA Brasil 2014」を多次元尺度法で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Bl…
「Copa do Mundo de Futebol FIFA Brasil 2014」を多次元尺度法で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Bl…
「Copa do Mundo de Futebol FIFA Brasil 2014」をクラスター分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks…
「Copa do Mundo de Futebol FIFA Brasil 2014」を主成分分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks Int…
ダウンロード www.anaconda.com インストール 起動 Jupyter で R を使えるようにする ↓こちらの記事を参考にさせていただきました JupyterでRを使う。 install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'diges…
Rでクラスター分析 この前のを、もう少し丁寧に。 # データファイルのあるフォルダを指定して setwd("e:/data") # データ読み込み (header=T は、先頭行が項目名であることを示す) d <- read.table("stats.txt", header=T) # 平均が0、分散が1となるよう正規…
Rでクラスター分析 ggplot で、樹形図を描いてみる。 setwd("C:/data") d <- read.table("stats_mean.txt", header=T) d_dist_euclidean <- dist(d, method="Euclidean" ) d_clust_ward <- hclust(d_dist_euclidean, "ward.D") d_dendr <- dendro_data(d_clu…
Rでクラスター分析 距離の計算方法とか、分類方法とか色々あって、何を選択すればよいのか、アルゴリズムの説明ではピンと来ない。 ちなみに、ここの説明が詳しい www.albert2005.co.jpまずは、色々ためしてみる。 setwd("C:/data") d <- read.table("stats.…
「少年サッカー データ分析」シリーズ 一気に4巻発売少年サッカー データ分析: Rでヒストグラム作者: 山岡直樹発売日: 2018/04/28メディア: Kindle版この商品を含むブログを見る少年サッカー データ分析: Rで箱ひげ図・バイオリン図作者: 山岡直樹発売日: 20…
open color を参考に色を指定する yeun.github.io RED_5 <- "#ff6b6b" PINK_5 <- "#f06595" GRAPE_5 <- "#cc5de8" VIOLET_5 <- "#845ef7" INDIGO_5 <- "#5c7cfa" BLUE_5 <- "#339af0" CYAN_5 <- "#22b8cf" TEAL_5 <- "#20c997" GREEN_5 <- "#51cf66" LIME_5 …
グラフを並べられる facet_wrap というのを使ってみた setwd("e:/data") d <- read.table("stats_all.txt", header=T) # ggplot2 パッケージを使用 library(ggplot2) g <- ggplot(d) g <- g + geom_histogram( aes( x=d$"自チーム.10分あたりのTOUCH数", col…
データ読み込み setwd("e:/data") d <- read.table("stats_all.txt", header=T) 度数分布を得る d_win <- subset(d, 勝敗=="勝") h_win <- hist(d_win$"自チーム.TOUCH数", breaks=seq(0, 600, 50)) > h_win $breaks [1] 0 50 100 150 200 250 300 350 400 4…
個人別の指標と、チームの得失点との間に相関があるか調べてみた setwd("e:/data") d <- read.table("stats.txt", header=T) library(ggplot2) library(GGally) ggpairs( d[, c( "山岡_タッチ", "山岡_パス出", "山岡_パス受", "山岡_保持", "山岡_奪取", "…
windowsFonts(HGKAI = windowsFont("HG正楷書体-PRO")) # ggplot2 パッケージを使用 library(ggplot2) # ヒストグラムを描画 g <- ggplot(d) g <- g + geom_histogram( aes( x=d$"自チームの10分あたりのTOUCH数", y= ..density.., colour= d$"勝敗", fill=d…
library(reshape2) d.melt <- melt(d, measure.vars = c("自チームの10分あたりのTOUCH数", "相手チームの10分あたりのTOUCH数"), variable.name = "チーム", value.name = "TOUCH数" ) library(ggplot2) g <- ggplot( d.melt, aes( x=d.melt$"チーム", y=d.…