ONLY DO WHAT ONLY YOU CAN DO

こけたら立ちなはれ 立ったら歩きなはれ

ggplot2によるデータの視覚化 - 2018/19 シーズンを振り返って (5) シュート数と勝点

1試合当たりのシュート数と勝点 リーグ別に、シュート数と勝点の相関関係を見てみる。 データは、ここから入手。 https://www.whoscored.com/ シュート数が載ってなかったリーグは、こちらのサイトのデータを集計。 www.football-data.co.uk ドイツ Bundesl…

ggplot2によるデータの視覚化 - 2018/19 シーズンを振り返って (4) 得失点差と勝点

1試合当たりの得失点差と勝点 リーグ別に、得失点差と勝点の相関関係を見てみる。 データは、ここから入手。 https://www.whoscored.com/ ドイツ Bundesliga スペイン La Liga フランス Ligue 1 イタリア Serie A イングランド Premier League ポルトガル L…

ggplot2によるデータの視覚化 - 2018/19 シーズンを振り返って (3) 失点と勝点

1試合当たりの失点と勝点 リーグ別に、失点と勝点の相関関係を見てみる。 データは、ここから入手。 https://www.whoscored.com/ ドイツ Bundesliga スペイン La Liga フランス Ligue 1 イタリア Serie A イングランド Premier League ポルトガル LigaNOS …

ggplot2によるデータの視覚化 - 2018/19 シーズンを振り返って (2) 得点と勝点

1試合当たりの得点と勝点 リーグ別に、得点と勝点の相関関係を見てみる。 データは、ここから入手。 https://www.whoscored.com/ ドイツ Bundesliga スペイン La Liga フランス Ligue 1 イタリア Serie A イングランド Premier League ポルトガル LigaNOS …

ggplot2によるデータの視覚化 - 2018/19 シーズンを振り返って

一試合当たりの得点と失点 Top 5 League その他 支配率とパス成功率 一試合当たりのシュート数と被シュート数

ggplot2によるデータの視覚化 - ヨーロッパリーグ 2018/19 シーズンを振り返って

Team Stats 編 さまざまな指標と勝点との相関関係を視覚化 得点と勝点 失点と勝点 得失点差と勝点 シュート数と勝点 被シュート数と勝点 得点/シュート数と勝点 失点/被シュート数と勝点 ポゼッションと勝点 ドリブル数と勝点 ドリブル成功数と勝点 ドリブル…

ggplot2によるデータの視覚化

もたもたしてる間に 2018/19 シーズン終わっちゃったけど...ggplot2によるデータの視覚化: Ligue 1 2017/18作者: 山岡直樹発売日: 2019/05/18メディア: Kindle版この商品を含むブログを見るggplot2によるデータの視覚化: Premier League 2017/18作者: 山岡直…

ggplot2 で レーダーチャート

ヨーロッパ top 5 league の 2017/2018 シーズンのそれぞれ top 2 team のデータから、レーダーチャートを作ってみた コードは以下の通り # Font を準備 windowsFonts(HGKAI=windowsFont("HG正楷書体-PRO")) windowsFonts(COURIER=windowsFont("Courier New"…

サッカー データ分析

「サッカー データ分析」シリーズ半年ぶりの新刊 ggplot2によるデータの視覚化作者: 山岡直樹発売日: 2018/11/30メディア: Kindle版この商品を含むブログを見る既刊もよろしく少年サッカー データ分析: R言語を用いたネットワーク分析作者: 山岡直樹発売日: …

「2014 FIFA World Cup」「2018 FIFA World Cup」を 分析

「Copa do Mundo de Futebol FIFA Brasil 2014」「Чемпионат мира по футболу 2018」を 分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statisticsこんな風な tab 区切りファイルに保存 Team Rank Rating Shotsconceded Shots Tackles …

自治体データをいろいろ分析

データは、ここから入手。 https://www.e-stat.go.jp/ gist0d6818283c015b43abb2535a4c2478f9

自治体データをいろいろ分析

データは、ここから入手。 https://www.e-stat.go.jp/ こんな風な tab 区切りファイルに保存して 区分 都道府県 人口総数 15歳未満人口 15歳未満人口÷人口総数 15~64歳人口 15~64歳人口÷人口総数 65歳以上人口 65歳以上人口÷人口総数 1 北海道 5381733 608…

「2014 FIFA ワールドカップ Brasil」を 散布図 で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を 散布図 で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks…

「2014 FIFA ワールドカップ Brasil」を SVD で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を 特異値分解 (SVD) で分析してみた。 こちらの記事を参考にさせていただきました。 Running PCA and SVD in Rデータは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイ…

「2014 FIFA ワールドカップ Brasil」を t-SNE で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を t-SNE(t-distributed stochastic neighbor embedding) で分析してみた。 こちらの記事を参考にさせていただきました。 puyokw.hatenablog.comデータは、ここから入手。 https://www.whoscored.com/Statisti…

「2014 FIFA ワールドカップ Brasil」を多次元尺度法で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を多次元尺度法で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Bl…

「2014 FIFA ワールドカップ Brasil」を多次元尺度法で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を多次元尺度法で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Bl…

「2014 FIFA ワールドカップ Brasil」をクラスター分析

「Copa do Mundo de Futebol FIFA Brasil 2014」をクラスター分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks…

「2014 FIFA ワールドカップ Brasil」を主成分分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を主成分分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks Int…

Jupyter notebook を 試してみた

ダウンロード www.anaconda.com インストール 起動 Jupyter で R を使えるようにする ↓こちらの記事を参考にさせていただきました JupyterでRを使う。 install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'diges…

Rでクラスター分析~少年サッカー データ分析~

Rでクラスター分析 この前のを、もう少し丁寧に。 # データファイルのあるフォルダを指定して setwd("e:/data") # データ読み込み (header=T は、先頭行が項目名であることを示す) d <- read.table("stats.txt", header=T) # 平均が0、分散が1となるよう正規…

Rでクラスター分析~少年サッカー データ分析~

Rでクラスター分析 ggplot で、樹形図を描いてみる。 setwd("C:/data") d <- read.table("stats_mean.txt", header=T) d_dist_euclidean <- dist(d, method="Euclidean" ) d_clust_ward <- hclust(d_dist_euclidean, "ward.D") d_dendr <- dendro_data(d_clu…

Rでクラスター分析~少年サッカー データ分析~

Rでクラスター分析 距離の計算方法とか、分類方法とか色々あって、何を選択すればよいのか、アルゴリズムの説明ではピンと来ない。 ちなみに、ここの説明が詳しい www.albert2005.co.jpまずは、色々ためしてみる。 setwd("C:/data") d <- read.table("stats.…

少年サッカー データ分析

R

「少年サッカー データ分析」シリーズ 一気に4巻発売少年サッカー データ分析: Rでヒストグラム作者: 山岡直樹発売日: 2018/04/28メディア: Kindle版この商品を含むブログを見る少年サッカー データ分析: Rで箱ひげ図・バイオリン図作者: 山岡直樹発売日: 20…

R で ヒストグラム ~少年サッカー データ分析~

open color を参考に色を指定する yeun.github.io RED_5 <- "#ff6b6b" PINK_5 <- "#f06595" GRAPE_5 <- "#cc5de8" VIOLET_5 <- "#845ef7" INDIGO_5 <- "#5c7cfa" BLUE_5 <- "#339af0" CYAN_5 <- "#22b8cf" TEAL_5 <- "#20c997" GREEN_5 <- "#51cf66" LIME_5 …

R で ヒストグラム ~少年サッカー データ分析~

グラフを並べられる facet_wrap というのを使ってみた setwd("e:/data") d <- read.table("stats_all.txt", header=T) # ggplot2 パッケージを使用 library(ggplot2) g <- ggplot(d) g <- g + geom_histogram( aes( x=d$"自チーム.10分あたりのTOUCH数", col…

R で ピラミッド図 ~少年サッカー データ分析~

データ読み込み setwd("e:/data") d <- read.table("stats_all.txt", header=T) 度数分布を得る d_win <- subset(d, 勝敗=="勝") h_win <- hist(d_win$"自チーム.TOUCH数", breaks=seq(0, 600, 50)) > h_win $breaks [1] 0 50 100 150 200 250 300 350 400 4…

R で 散布図行列 ~少年サッカー データ分析~

個人別の指標と、チームの得失点との間に相関があるか調べてみた setwd("e:/data") d <- read.table("stats.txt", header=T) library(ggplot2) library(GGally) ggpairs( d[, c( "山岡_タッチ", "山岡_パス出", "山岡_パス受", "山岡_保持", "山岡_奪取", "…

R で フォント指定 ~少年サッカー データ分析~

windowsFonts(HGKAI = windowsFont("HG正楷書体-PRO")) # ggplot2 パッケージを使用 library(ggplot2) # ヒストグラムを描画 g <- ggplot(d) g <- g + geom_histogram( aes( x=d$"自チームの10分あたりのTOUCH数", y= ..density.., colour= d$"勝敗", fill=d…

R で 色指定 ~少年サッカー データ分析~

library(reshape2) d.melt <- melt(d, measure.vars = c("自チームの10分あたりのTOUCH数", "相手チームの10分あたりのTOUCH数"), variable.name = "チーム", value.name = "TOUCH数" ) library(ggplot2) g <- ggplot( d.melt, aes( x=d.melt$"チーム", y=d.…