1
/
5

データ分析

R(ggplot2パッケージ)できれいな棒グラフを作図してみる(S. Kubota)

ggplot2を使うと,作図がエクセルよりもとてもきれいに仕上がる.3ヶ月間に顧客が購入した額を性別別に棒グラフで出力してみる.データはこんな感じ.でもって早速Rで作図.> library(ggplot2) #ggplot2パッケージの読み込み> library(Rmisc) #Rmiscパッケージの読み込み これはデータの基本統計量(平均値等や標準偏差,標準誤差,信頼区間)を算出して図作成に使うため.> dat<-read.delim("clipboard") #エクセルなんかの表計算ソフトからデータのコピー> head(dat) #確認のためデータの頭部分だけ打ち出してみた mon...

反復測定二元配置分散分析をR(carパッケージ)でやってみる(S. Kubota)

例えば,業務ソフトAとBを3カ月ずつ使用し,どちらが業務効率が良かったかを検証したいとする.つまり,業務ソフト違いによる業務効率の影響と使い続けることでの時系列での業務効率の変化を検討する.このとき,業務ソフトの違い,時系列の変化をそれぞれ要因という.また,この検証を同一の社員で,AとBのソフトをそれぞれ3か月ずつ使い検証したこととする.この場合は,同一の社員で2つの要因について検証を行ったことになるので,反復測定二元配置分散分析というのを行う.今回はRとcarパッケージを使ってみる.データの並びは以下の通り.エクセルにあるデータを読みこんでいく前提で記述する.データは行に被験者,列に要...

混合計画の分散分析

混合計画(混合モデルではない)の二元配置分散分析。要するに被験者間、被験者内計画。car packageでMANOVAで実行してみる。詳細は下記の通り。> dat<-read.delim("clipboard") #データ読み込み> head(dat) #データの冒頭部だけ見せるとこんな感じ.データの中身はこんな感じ. gender trial1 trial2 trial31 male 10.0121 14.0931 15.87682 male 16.1474 15.9080 20.84173 male 57.0574 47.2407 75.45794 male ...

Rを使うために入れておくべきソフトとパッケージ

データサイエンスにRを使うのに便利なソフトとパッケージを挙げておく.Rはフリーで高度な統計学的手法を用いることができるのが特徴.なお以下は最小限の構成.・Rstudio Rのための統合開発環境 一度使うとやめられなくなる.・dplyrとtidyr データラングリングにはかかせないパッケージ.・ggplot2 作図のためのパッケージ.このパッケージを使って作図するときれいな図が作れる.Written by S. Kubota

dplyrでデータを整えてみる (S. Kubota)

実験で得られた被験者の時系列の生体情報の必要な箇所を抜き出す。1名の被験者のデータであっても、必要な箇所を抜き出すというのはなかなか大変。dplyrパッケージを使って必要なデータの抽出を試みた。ちなみに、コードは下記の通り。今までエクセルとマクロを組み合わせて作業していたが、これもまた超便利。#まずはパッケージ読み込み.> library(dplyr)#今回はheader情報のついていないCSVデータをコピーしてみた.> dat<-read.csv("clipboard",header = FALSE,sep = " ")> head(dat) V1 V2 V3 V...

相関行列の分析をしてデータの見通しを立てる-Hmisc,PerformanceAnalytics パッケージを使用- (S. Kubota)

相関行列の見通しを立てるのに,corrplotを用いるのもいいが,他の方法も記述しておく.まずはデータ,以下のようなデータをエクセルから読み込んだ(corrplotのメモと同じデータ).dat<-read .delim=("clipboard")dat EMG1 EMG2 EMG3 EMG4 time force fatigue comfort1 0.020 0.007 0.015 0.020 1.70 361.132 68.6 60.62 0.039 0.008 0.010 0.012 1.36 293.362 65.0 48.23 0.0...

ezパッケージで簡単に反復測定分散分析-一元配置と二元配置- (S. Kubota)

まずはezパッケージをインストールしておく.データの読み込み.Excelなんかでデータを成形しておき,読み込む.データは以下の通り.同一被験者で2つの要因について組み合わせて実験を行った,という設定のデータである. subjectsは被験者,factor1と2が要因,valueが値.twoway<-read.delim("clipboard")twoway subjects factor1 factor2 value1 a A N 4.152 b A N 4.083 c A...

データの行削除

今更基本的なことだが書いておく.手順としては…削除したい任意の行の数値・文字をNAに変更.そのあたにNAの行を削除.ではさっそくコードは…data[8,]<-NA この意味は,dataっていうデータの8行目をすべてNAに変更するってこと.でもって,NAを下記のコードで削除する.data<-na.omit(data)