ONLY DO WHAT ONLY YOU CAN DO

こけたら立ちなはれ 立ったら歩きなはれ

R で バイオリン図 ~少年サッカー データ分析~

g <- ggplot(d4,aes(x=d4$"勝敗",y=d4$"TOUCH比",color=d4$"勝敗",fill=d4$"勝敗"))
g <- g + geom_violin(scale="count")
g <- g + xlab("勝敗")
g <- g + ylab("自チームのタッチ数 / 自チームのタッチ数 + 相手チームのタッチ数")
plot(g)

f:id:fornext1119:20180129123245p:plain

g <- ggplot(d4,aes(x=d4$"勝敗",y=d4$"KEEP比",color=d4$"勝敗",fill=d4$"勝敗"))
g <- g + geom_violin(scale="count")
g <- g + xlab("勝敗")
g <- g + ylab("自チームのキープ数 / 自チームのキープ数 + 相手チームのキープ数")
plot(g)

f:id:fornext1119:20180129123835p:plain

g <- ggplot(d4,aes(x=d4$"勝敗",y=d4$"奪取",color=d4$"勝敗",fill=d4$"勝敗"))
g <- g + geom_violin(scale="count")
g <- g + xlab("勝敗")
g <- g + ylab("奪取")

plot(g)f:id:fornext1119:20180129124024p:plain

バイオリン図の方が、箱ひげ図より、データの広がり、偏りがよくわかる。
ただ、四分位数は分からないので、バイオリン図と箱ひげ図を重ねて表示できるとうれしいかも

g <- ggplot(d4,aes(x=d4$"勝敗",y=d4$"TOUCH比",color=d4$"勝敗",fill=d4$"勝敗"))
g <- g + geom_boxplot(color="black", alpha=0.5)
g <- g + geom_violin(scale="count", alpha=0.5)
g <- g + xlab("勝敗")
g <- g + ylab("自チームのタッチ数 / 自チームのタッチ数 + 相手チームのタッチ数")
plot(g)

f:id:fornext1119:20180129125058p:plain