
2008年05月26日
2005年5月26日 R code
sample data file
### 回帰木の生成と分類ルールの作成
x <- iris
library(mvpart)
result <- rpart(Species ~ ., data=x, control=rpart.control(cp=.01))
plot.new() # デバイスを開く
par(xpd=T) # 文字が切れないための命令
plot(result, uniform=T, branch=0.7, margin=0.05)
text(result, use.n=T, all.leaves=F)
### テキストで分類ルールを見る
summary(result)
### 木の枝数を指定する
result <- rpart(Species ~ ., data=x,
control=rpart.control(nsplit=12, cp=.001, minsplit=1))
plot(result, uniform=T, branch=0.7, margin=0.1)
text(result, use.n=T, all.leaves=F)
### 最適な葉の数を調べる
plotcp(result)
result <- rpart(Species ~ ., data=x,
control=rpart.control(cp=.1))
plotcp(result)
plot.new() # すでにデバイスウィンドウ(グラフ)が開いているときは不要
par(xpd=T) # 文字が切れないための命令
plot(result, uniform=T, branch=0.7, margin=0.05)
text(result, use.n=T, all.leaves=F)
### 分類ルール:カテゴリデータの中身の確認
y <- data.frame(STATUS=c(rep("既婚",84),rep("未婚",116)),
GROUP =c(rep("購入",73),rep("購入しない",127)),
SEX =c(rep(2, 2),rep(1,72),rep(2, 6),
rep(1, 4),rep(2,92),rep(1,24)))
y$SEX <- factor(y$SEX)
levels(y$STATUS) # 結果の左から順に a, b, c, ... となる
# a が "既婚",b が "未婚"
### 回帰木による判別
set.seed(77777)
tmp <- sample(1:150, 100)
x <- iris[ tmp,] # 分類ルール作成用データ 100 個
y <- iris[-tmp,] # 予測をおこなうためのデータ 50 個
table(x$Species) # x の内訳
result <- rpart(Species~., data=x)
result2 <- predict(result, y, type="class")
table(y$Species, result2)
### 各データの分類結果
result <- rpart(Species~., data=x)
result2 <- predict(result, y, type="class")
result2
### 回帰木の生成と分類ルールの作成
x <- iris
library(mvpart)
result <- rpart(Species ~ ., data=x, control=rpart.control(cp=.01))
plot.new() # デバイスを開く
par(xpd=T) # 文字が切れないための命令
plot(result, uniform=T, branch=0.7, margin=0.05)
text(result, use.n=T, all.leaves=F)
### テキストで分類ルールを見る
summary(result)
### 木の枝数を指定する
result <- rpart(Species ~ ., data=x,
control=rpart.control(nsplit=12, cp=.001, minsplit=1))
plot(result, uniform=T, branch=0.7, margin=0.1)
text(result, use.n=T, all.leaves=F)
### 最適な葉の数を調べる
plotcp(result)
result <- rpart(Species ~ ., data=x,
control=rpart.control(cp=.1))
plotcp(result)
plot.new() # すでにデバイスウィンドウ(グラフ)が開いているときは不要
par(xpd=T) # 文字が切れないための命令
plot(result, uniform=T, branch=0.7, margin=0.05)
text(result, use.n=T, all.leaves=F)
### 分類ルール:カテゴリデータの中身の確認
y <- data.frame(STATUS=c(rep("既婚",84),rep("未婚",116)),
GROUP =c(rep("購入",73),rep("購入しない",127)),
SEX =c(rep(2, 2),rep(1,72),rep(2, 6),
rep(1, 4),rep(2,92),rep(1,24)))
y$SEX <- factor(y$SEX)
levels(y$STATUS) # 結果の左から順に a, b, c, ... となる
# a が "既婚",b が "未婚"
### 回帰木による判別
set.seed(77777)
tmp <- sample(1:150, 100)
x <- iris[ tmp,] # 分類ルール作成用データ 100 個
y <- iris[-tmp,] # 予測をおこなうためのデータ 50 個
table(x$Species) # x の内訳
result <- rpart(Species~., data=x)
result2 <- predict(result, y, type="class")
table(y$Species, result2)
### 各データの分類結果
result <- rpart(Species~., data=x)
result2 <- predict(result, y, type="class")
result2
Posted by ryu908 at 11:27│Comments(5)
この記事へのコメント
5月26日
Posted by e061308
at 2008年05月26日 14:28

情報処理演習Ⅲ
Posted by e061246
at 2008年05月26日 14:29

情報処理課題
Posted by e071322
at 2008年05月28日 20:50

2008年05月28日
Posted by e061472ga
at 2008年05月28日 20:53

コード
x<-read.table("n:/oecd1997.dat",header=T)
x<-read.table("n:/oecd1997.dat",header=T)
Posted by e0123456 at 2008年05月28日 21:00