ONLY DO WHAT ONLY YOU CAN DO

こけたら立ちなはれ 立ったら歩きなはれ

2018-01-01から1年間の記事一覧

サッカー データ分析

「サッカー データ分析」シリーズ半年ぶりの新刊 ggplot2によるデータの視覚化作者: 山岡直樹発売日: 2018/11/30メディア: Kindle版この商品を含むブログを見る既刊もよろしく少年サッカー データ分析: R言語を用いたネットワーク分析作者: 山岡直樹発売日: …

「2014 FIFA World Cup」「2018 FIFA World Cup」を 分析

「Copa do Mundo de Futebol FIFA Brasil 2014」「Чемпионат мира по футболу 2018」を 分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statisticsこんな風な tab 区切りファイルに保存 Team Rank Rating Shotsconceded Shots Tackles …

自治体データをいろいろ分析

データは、ここから入手。 https://www.e-stat.go.jp/ gist0d6818283c015b43abb2535a4c2478f9

自治体データをいろいろ分析

データは、ここから入手。 https://www.e-stat.go.jp/ こんな風な tab 区切りファイルに保存して 区分 都道府県 人口総数 15歳未満人口 15歳未満人口÷人口総数 15~64歳人口 15~64歳人口÷人口総数 65歳以上人口 65歳以上人口÷人口総数 1 北海道 5381733 608…

「2014 FIFA ワールドカップ Brasil」を 散布図 で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を 散布図 で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks…

「2014 FIFA ワールドカップ Brasil」を SVD で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を 特異値分解 (SVD) で分析してみた。 こちらの記事を参考にさせていただきました。 Running PCA and SVD in Rデータは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイ…

「2014 FIFA ワールドカップ Brasil」を t-SNE で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を t-SNE(t-distributed stochastic neighbor embedding) で分析してみた。 こちらの記事を参考にさせていただきました。 puyokw.hatenablog.comデータは、ここから入手。 https://www.whoscored.com/Statisti…

「2014 FIFA ワールドカップ Brasil」を多次元尺度法で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を多次元尺度法で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Bl…

「2014 FIFA ワールドカップ Brasil」を多次元尺度法で分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を多次元尺度法で分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Bl…

「2014 FIFA ワールドカップ Brasil」をクラスター分析

「Copa do Mundo de Futebol FIFA Brasil 2014」をクラスター分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks…

「2014 FIFA ワールドカップ Brasil」を主成分分析

「Copa do Mundo de Futebol FIFA Brasil 2014」を主成分分析してみた。 データは、ここから入手。 https://www.whoscored.com/Statistics こんな風な tab 区切りファイルに保存して Team Rank Rating Shotsconceded Shots Tackles CaughtOffside Blocks Int…

Jupyter notebook を 試してみた

ダウンロード www.anaconda.com インストール 起動 Jupyter で R を使えるようにする ↓こちらの記事を参考にさせていただきました JupyterでRを使う。 install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'diges…

Rでクラスター分析~少年サッカー データ分析~

Rでクラスター分析 この前のを、もう少し丁寧に。 # データファイルのあるフォルダを指定して setwd("e:/data") # データ読み込み (header=T は、先頭行が項目名であることを示す) d <- read.table("stats.txt", header=T) # 平均が0、分散が1となるよう正規…

Rでクラスター分析~少年サッカー データ分析~

Rでクラスター分析 ggplot で、樹形図を描いてみる。 setwd("C:/data") d <- read.table("stats_mean.txt", header=T) d_dist_euclidean <- dist(d, method="Euclidean" ) d_clust_ward <- hclust(d_dist_euclidean, "ward.D") d_dendr <- dendro_data(d_clu…

Rでクラスター分析~少年サッカー データ分析~

Rでクラスター分析 距離の計算方法とか、分類方法とか色々あって、何を選択すればよいのか、アルゴリズムの説明ではピンと来ない。 ちなみに、ここの説明が詳しい www.albert2005.co.jpまずは、色々ためしてみる。 setwd("C:/data") d <- read.table("stats.…

少年サッカー データ分析

R

「少年サッカー データ分析」シリーズ 一気に4巻発売少年サッカー データ分析: Rでヒストグラム作者: 山岡直樹発売日: 2018/04/28メディア: Kindle版この商品を含むブログを見る少年サッカー データ分析: Rで箱ひげ図・バイオリン図作者: 山岡直樹発売日: 20…

R で ヒストグラム ~少年サッカー データ分析~

open color を参考に色を指定する yeun.github.io RED_5 <- "#ff6b6b" PINK_5 <- "#f06595" GRAPE_5 <- "#cc5de8" VIOLET_5 <- "#845ef7" INDIGO_5 <- "#5c7cfa" BLUE_5 <- "#339af0" CYAN_5 <- "#22b8cf" TEAL_5 <- "#20c997" GREEN_5 <- "#51cf66" LIME_5 …

R で ヒストグラム ~少年サッカー データ分析~

グラフを並べられる facet_wrap というのを使ってみた setwd("e:/data") d <- read.table("stats_all.txt", header=T) # ggplot2 パッケージを使用 library(ggplot2) g <- ggplot(d) g <- g + geom_histogram( aes( x=d$"自チーム.10分あたりのTOUCH数", col…

R で ピラミッド図 ~少年サッカー データ分析~

データ読み込み setwd("e:/data") d <- read.table("stats_all.txt", header=T) 度数分布を得る d_win <- subset(d, 勝敗=="勝") h_win <- hist(d_win$"自チーム.TOUCH数", breaks=seq(0, 600, 50)) > h_win $breaks [1] 0 50 100 150 200 250 300 350 400 4…

R で 散布図行列 ~少年サッカー データ分析~

個人別の指標と、チームの得失点との間に相関があるか調べてみた setwd("e:/data") d <- read.table("stats.txt", header=T) library(ggplot2) library(GGally) ggpairs( d[, c( "山岡_タッチ", "山岡_パス出", "山岡_パス受", "山岡_保持", "山岡_奪取", "…

R で フォント指定 ~少年サッカー データ分析~

windowsFonts(HGKAI = windowsFont("HG正楷書体-PRO")) # ggplot2 パッケージを使用 library(ggplot2) # ヒストグラムを描画 g <- ggplot(d) g <- g + geom_histogram( aes( x=d$"自チームの10分あたりのTOUCH数", y= ..density.., colour= d$"勝敗", fill=d…

R で 色指定 ~少年サッカー データ分析~

library(reshape2) d.melt <- melt(d, measure.vars = c("自チームの10分あたりのTOUCH数", "相手チームの10分あたりのTOUCH数"), variable.name = "チーム", value.name = "TOUCH数" ) library(ggplot2) g <- ggplot( d.melt, aes( x=d.melt$"チーム", y=d.…

R で 散布図行列 ~少年サッカー データ分析~

library(psych) psych::pairs.panels(d[,c( "自チームの10分あたりのTOUCH数", "相手チームの10分あたりのTOUCH数", "自チームと相手チームのTOUCH数比率", "自チームの10分あたりの得点", "自チームの10分あたりの失点", "自チームの10分あたりの得失点" )]…

R で 散布図 確率密度図 ~少年サッカー データ分析~

散布図 g <- ggplot(d4, aes(x=d4$"奪取",y=d4$"X10分あたりの得失",color=d4$"勝敗",fill=d4$"勝敗")) g <- g+geom_point(size=1, alpha=0.5) plot(g) 回帰直線を引いてみる g <- ggplot(d4, aes(x=d4$"奪取",y=d4$"X10分あたりの得失")) g <- g + geom_poi…

R で バイオリン図 ~少年サッカー データ分析~

g <- ggplot(d4,aes(x=d4$"勝敗",y=d4$"TOUCH比",color=d4$"勝敗",fill=d4$"勝敗")) g <- g + geom_violin(scale="count") g <- g + xlab("勝敗") g <- g + ylab("自チームのタッチ数 / 自チームのタッチ数 + 相手チームのタッチ数") plot(g) g <- ggplot(d4…

R で ヒストグラム 箱ひげ図 ~少年サッカー データ分析~

得失点と、やや相関のみられた項目について、勝敗別のヒストグラム、箱ひげ図 を書いてみる g <- ggplot(d4) g <- g + geom_histogram(aes(x=d4$"TOUCH比",fill=d4$"勝敗"), binwidth=2, alpha=0.2, position="identity") g <- g + scale_fill_manual(values…

R で 相関係数を算出 ~少年サッカー データ分析~

得失点差と、やや相関がありそうな項目について、詳しくみてみる。 自チームのタッチ数 > cor.test(d4$"自チーム.10分あたりのTOUCH数", d4$"X10分あたりの得失") Pearson's product-moment correlation data: d4$自チーム.10分あたりのTOUCH数 and d4$X10分…

R で 散布図行列 ~少年サッカー データ分析~

自分用のメモ(後で整理する) setwd("C:/pass/data") d <- read.table("stats4.txt", header=T) > colnames(d) [1] "年度" "日付" [3] "大会" "時間" [5] "自チーム名" "相手チーム名" [7] "自チーム.10分あたりのTOUCH数" "相手チーム.10分あたりのTOUCH数…