2015LETシンポジウム 増加語数の時系列推移情報をもちいた時系列モデリング
- 2. 概要概要
• WMX Corpus Projectで蓄積されたデー
タの⼀部をもちいて,増加語数の時系列タの⼀部をもちいて,増加語数の時系列
推移傾向に対する時系列データ分析の⽅
法を紹介
推移傾向に対する時系列データ分析の⽅
法を紹介
- 5. ポアソン分布へのあてはめポアソン分布へのあてはめ
• 推定された⺟数(λ)
– 離散確率の分布
Λが高ければ高いほどよい
というわけではなく,発達
– 離散確率の分布
• 当てはまり(カイ二乗値)
というわけではなく,発達
に対して非線形の関係をも
つ可能性が指摘されている
(草薙ほか, 2014; 川口ほか, 2014)• 当てはまり(カイ二乗値) (草薙ほか, 2014; 川口ほか, 2014)
150200
これまでのさまざまな研究
(e.g., 草薙ほか, 2012; 川口ほか, 2014;
50100150
Words
(e.g., 草薙ほか, 2012; 川口ほか, 2014;
石井ほか, 2014)では理論的予測
に反して実測値が適切に
フィットしない場合がある
050
フィットしない場合がある
ことがわかってきている
0 10 20 30 40 50 60
Time
- 10. 成分の分解成分の分解
• トレンド + 周期性成
200
• トレンド + 周期性成
分 + 誤差
50100150
data
分 + 誤差
– ほかにも⾃⼰回帰モデ
ル,状態空間モデルな
0
0.00.5
seasonal
ル,状態空間モデルな
どより高度な時系列
データ分析が可能
-1.5-0.5
seasonal
200
データ分析が可能
50100150200
trend
050
24
remainder
ただし実測値のライティングプロセスが
-4-20
remainder
ただし実測値のライティングプロセスが
明確な周期性をもつことは稀であると予
測される
2 4 6 8 10 12
time