- 追加された行はこの色です。
- 削除された行はこの色です。
|このページについて|
''概要'':このページでは、統計言語Rを使う上で有益なプログラムを蓄積します。主に[[SUGIYAMA Shunsuke]]が作ったプログラムを公開します。ご使用は自己責任で。
''概要'':このページでは、統計言語Rを使う上で有益なプログラムを蓄積します。ご使用は自己責任で。
(今後、随時updateしていく予定)
''親ページ'':このページの親ページは[[R]]です。
//Topページのサイトマップの適切な位置に、このページへのリンクを貼ってください。
//出来れば、あなたの名前(ハンドルネーム歓迎)、ページをつくった日、更新履歴などをかいてください。
|目次|
#contents
----
*基本統計量 [#p459e2e2]
**収益率 [#y4f84dd8]
xに株価系列を入れると対数階差で近似した収益率を返してくれる。
diff(log(x))
以下でも同じ結果を返す。
#収益率
#yの増加率diff(log(y))で近似可能。
profitrate <- function(x)
{
z <- log(x[-1])-log(x[-length(x)])
z
}
**歪度 [#g5de44c9]
#歪度
skew <- function(x){
z1 <- mean(z(x)^3)
z1
}
**尖度 [#u022aea6]
#尖度
kurt <- function(x){
z2 <- mean(z(x)^4)
z2
}
**異常値の数 [#rd2e9957]
#異常値の数(標準偏差の±2 倍、± 3 倍、± 4 倍を超えた標本数))
abnormal.number2 <- function(x){
z <- length(x[x>2*sd(x) | x< -2*sd(x)])
z
}
abnormal.number3 <- function(x){
z <- length(x[x>3*sd(x) | x< -3*sd(x)])
z
}
abnormal.number4 <- function(x){
z <- length(x[x>4*sd(x) | x< -4*sd(x)])
z
}
上記を一般化すれば、以下となる。
#異常値の数(標準偏差の±k 倍を超えた標本数)
abnormal.number <- function(x,k){
z <- length(x[x>k*sd(x) | x< -k*sd(x)])
z
}
**標本分散,標本共分散 [#w22b8751]
#標本分散
sample.variance<-function(a) var(a)*(length(a)-1)/length(a)
#以下でも同じ。
#sample2.variance<-function(x) mean(x^2)-(mean(x))^2
#標本共分散
sample.covariance<-function(x,y) mean(x*y)-mean(x)*mean(y)
**相関係数 [#lb51a792]
#相関係数 cor(x,y)という組み込み関数があるが、一応練習も兼ねて作成。
sugi.soukan<-function(x,y){
sample.covariance<-mean(x*y)-mean(x)*mean(y) #標本共分散を定義
variance1<-function(a) var(a)*(length(a)-1)/length(a) #標本分散を定義
#xの標準偏差を求める
x1<-variance1(x)
sdx<-sqrt(x1)
#yの標準偏差を求める
y1<-variance1(y)
sdy<-sqrt(y1)
#最後の相関係数を計算
soukan<-sample.covariance/(sdx*sdy)
soukan
}
**基本統計量を一式まとめて求める [#adb8d57f]
######################################################
# 基本統計量
######################################################
#xに1変量株価データ(つまりベクトル)を入れると収益率の基本統計量を返してくれるプログラム。
sugi.basic<-function(x){
x1<-diff(log(x)) #まずは対数階差をとって収益率データに変換
variance1<-function(a) var(a)*(length(a)-1)/length(a) #標本分散を定義
sdx<-sqrt(variance1(x1)) #標本標準偏差を定義
#異常値の数を返すプログラムを定義
abnormal.number <- function(p,k){
z <- length(p[p>k*sd(p) | p< -k*sd(p)])
z
}
T<-length(x1)
R<-mean(x1)
x2<-(x1-R)/sdx #x2を標準化
s<-mean(x2^3) #歪度
k<-mean(x2^4) #尖度
max<-max(x1)
min<-min(x1)
a2<-abnormal.number(x1,2)
a3<-abnormal.number(x1,3)
a4<-abnormal.number(x1,4)
#ここまで計算した基本統計量をまとめて返す。
return(list ("T"=T,"R"=R,"SD"=sdx,"skew"=s,"kurt"=k,"max"=max,"min"=min,"a2"=a2,"a3"=a3,"a4" =a4))
}
*Reference [#a63b2258]
**書籍 [#h8a36313]
-[[The R Tips―データ解析環境Rの基本技・グラフィックス活用集:http://www.amazon.co.jp/gp/product/486167039X/ref=pd_bxgy_img_b/249-0823452-2558734?ie=UTF8]]
**リンク [#f4df0207]
-[[Econometrics in R:http://cran.r-project.org/doc/contrib/Farnsworth-EconometricsInR.pdf]]
-[[CRAN Task View: Computational Econometrics:http://cran.md.tsukuba.ac.jp/src/contrib/Views/Econometrics.html]]
-[[パッケージ一覧:http://cran.md.tsukuba.ac.jp/src/contrib/PACKAGES.html]]