統計解析フリーソフト R

R について

より実践的な統計解析を行う上でコンピュータは不可欠である。本講義では統計解析用のフリーソフト R に多少慣れ親しんでもらうために、R を用いての復習課題も用意する。是非、挑んでもらいたい。参考文献は 「Rで学ぶ確率・統計」辻谷将明/和田武夫 (共立出版) である。

R のインストール

R の本家ホームページはこちらである。そのページからソフトウェアのダウンロード、マニュアルなどにアクセスができる (ただし、全て英語だが)。R は有名なソフトウェアなので、日本語の説明や本なども多くでているので、google で検索するなり、図書館で本を探すとよい。

ソフトウェアは Windows, Mac そして Linux とほぼ全ての OS に対応している。こちらの日本の R ミラーサイトから自分のコンピュータの OS に合ったものをダウンロードし、インストールする。インストールが完了すると、Windows の場合はデスクトップに R のショートカットが、Mac の場合は アプリケーションフォルダーに R のアプリケーションが作られる。ショートカットやアプリケーションをダブルクリックする事で R のプログラムを開始する。Linux の場合はターミナルから R (大文字) と打つと R が開始する。

Windows の場合

何も考えずに (デフォルトのまま) インストールすると、デスクトップに以下のアイコン (32 bit 用と64 bit 用の2つ) が作られる。自分のマシンに応じて、適切な R のアイコンをクリックする。

32 bit の R:
R_win_32bit.png

64 bit の R:
R_win_64bit.png

R のアイコンをクリックすると、以下のような R のコンソール (R Console) が立ち上がる。

R_win_term.png

Mac の場合

Application フォルダーに

mac_R.png

というアイコンがインストールするとあるはずなので、このアイコンをダブルクリックする。以下のような R のコンソールが立ち上がる。

Mac_R_terminal.png

Linux の場合

インストールがされていれば、ターミナルから R と打つと以下のように R が開始される。

R_linux_term.png

R の基本的な使い方

R は R を起動した時に立ち上がる R コンソールに様々な命令を入力すると、それに応じて R がその命令に対する答えを返すというインタラクティブなプログラムである。R コンソールの プロンプト > の後に命令を入力する。

基本演算

四則演算や初等関数を用いて、計算ができる(計算機/関数電卓として使用できる)。

> 1+4
[1] 5
> sqrt(3)
[1] 1.732051

R で使用できる四則演算や初等関数を以下にまとめる。

R_math_function.png

データ入力

代入

<- が代入記号で、例えば、x に 100 を代入したい時は x<-100 とする。

> x<-100
> x
[1] 100
> x<-1+5
> x
[1] 6
> (x<-1+5)
[1] 6

ベクトル

関数 c() を用いて、数値や文字のペクトルを定義できる。

> c(10,12,13)
[1] 10 12 13
> x<-c("A","b")
> x
[1] "A" "b"

行列

関数 matrix() を使う。nrow は行数、ncol は列数。

> matrix(c(1,2,3,4,5,6,7,8,9,10),nrow=5,ncol=2)
[,1] [,2]
[1,] 1 6
[2,] 2 7
[3,] 3 8
[4,] 4 9
[5,] 5 10

表列の表 (データフレーム)

関数 data.frame() を用いる。

> A<-c(1,2,3,4,5)
> B<-c(6,7,8,9,10)
> C<-c("No.1","No.2","No.3","No.4","No.5")
> data.frame(C,B,A)
C B A
1 No.1 6 1
2 No.2 7 2
3 No.3 8 3
4 No.4 9 4
5 No.5 10 5
> data.frame(A,B,C)
A B C
1 1 6 No.1
2 2 7 No.2
3 3 8 No.3
4 4 9 No.4
5 5 10 No.5

データファイルの入力/出力

テキストで作ったデータファイル data1.txt があるとする。data1.txt のファイルの中身は以下のようになっていて、1行目にそれぞれの列の意味が分かるように一行目にヘッダー (X1 X2 Y) がついている。2行目以降がデータである。

X1 X2 Y
23 56 102
19 35 201
22 35 306
17 26 406
33 17 99

このテキストデータを R で読み込ませる時は read.table() 関数を用いる。data1.txt データがある場所 (ディレクトリ) を確認して置く事。Linux で data1.txt ファイルが /Users/tsakamoto/Desktop の下にある場合は以下のようにする。header=TRUE とするとファイルの一行目にヘッダーがある事を示し、ヘッダーがない場合は header=FALSE とする。

> data1<-read.table("/Users/tsakamoto/Desktop/data1.txt",header=TRUE)
> data1
X1 X2 Y
1 23 56 102
2 19 35 201
3 22 35 306
4 17 26 406
5 33 17 99

また、data1 の内容を例えば data2.txt という名前のテキストファイルに出力したい場合は write.table() 関数を用いる。

> write.table(data1,"/Users/tsakamoto/Desktop/data2.txt")

Linux でできた data2.txt というファイルを cat コマンドで見てみると、

> cat /Users/tsakamoto/Desktop/data2.txt
"X1" "X2" "Y"
"1" 23 56 102
"2" 19 35 201
"3" 22 35 306
"4" 17 26 406
"5" 33 17 99

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License