Weitere ähnliche Inhalte Ähnlich wie 211101_LiBRA_AI (20) Mehr von Masanori Saito (20) Kürzlich hochgeladen (12) 211101_LiBRA_AI11. 人工知能の分類 まとめ
人工知能/AI と 汎用型人工知能/AGI 弱いAI と 強いAI
人間同様の意識や知性を持つかどうか
人間同様に広範な課題を処理できるか
特定の課題にのみ対応
するのではなく、人間
と同じようにさまざま
な課題を処理可能なAI。
人間は、想定外の出来
事が起きた場合でも、
これまでの経験に基づ
いて総合的に判断し、
問題を解決できる。こ
のように、人間のよう
な問題処理能力を持つ。
限定された領域の課題
に特化して自動的に学
習、処理するAI。
例えば、画像認識や音
声認識、自然言語処理
などの技術を持つAI。
既に実用の段階にあり、
ビジネスで広く活用さ
れている。
人間のような意識を備
え、全認知能力を必要
とする作業も可能なAI。
人間と意識や知性のメ
カニズムを解明し、同
じことを人工的に実現
しようという考え方。
人間の知性の一部分の
みを代替し、特定の知
的処理タスクだけを実
行するAI。
人間が実際に行ってい
る処理をまねするので
はなく、結果として、
「人間がやっているよ
うな」知的処理の成果
が得られれば良いとい
う考え方。
人工知能/AI 弱いAI
汎用型人工知能/AGI 強いAI
18. 「人工知能」と言われるものの4つのレベル
18
単純制御:指示されたことをそまま行う
予め定められたルールに従い制御する(人工知能搭載○○)。
気温が上がるとスイッチを切るエアコン
洗濯物の重さで洗濯時間を自動的に変更する洗濯機
ひげの伸び具合で剃り方を変える電気シェーバーなど
ルールベース:指示されたことを自ら考えて実行する
外の世界を観測することによって振る舞いを変える。
振る舞いの種類・パターンを増やすため、予め多数のルールを用意しておく。
「駒がこの場所にあるときは、こう動かすのがいい」といった予め決められたルールに従って、
これからの打ち手を探索して打つことができる囲碁や将棋のシステム
与えられた知識ベースに従って、検査の結果から診断内容や処方する薬を決めて出力する医療診断システム
機械学習:着眼点は人間が教え、対応パターンを自動的に学習する
人間があらかじめルールを細かく決めて組み込んでおかなくても、
大量のデータから対応パターンを自ら見つけ出す。
ただし学習のための着眼点(特徴量)は人間が設計。
「駒がこの場所にあるときは、こう動かすのがいい」ということを設定しておかなくても、
対戦を繰り返すことでコンピュータ自身が自分で学習する将棋や囲碁のシステム
診断データや生体データを多数読み込み、ある病気とある病気に相関があるということを自分で学ぶ医療診断システム
深層学習:着眼点を人間が教えずに、対応パターンを自動的に学習する
学習に使う変数(着眼点/特徴量)を自分で学習して見つけ、
対応のパターンを見つけ出す。
一連の症状が患者の血糖異常を表していて、複数の病気の原因になっているようだ、
ということを自分で見つけ出すことができる医療診断システム
状況に応じて、最適な判断をおこなう自動運転の自動車
レ
ベ
ル
1
レ
ベ
ル
2
レ
ベ
ル
3
レ
ベ
ル
4
19. 各時代のAI(人工知能)と呼ばれるもの
ルールとゴールが決められているゲームの中
で、コンピュータがなるべくゴールにたどり
つけるように選択肢を選んでいくもの。
できること:
パズルや迷路を解く
数学の定理を証明する
チェスを指す など
トイプロブレムから脱却し、現実の問題を解
くために専門家(エキスパート)の知識をコ
ンピュータに移植することで現実の複雑な問
題を解かせようとするもの。
できること:
患者の症状から病名を特定する
起こっている現象から、機械の故障を診断する
患者の症状から、細菌感染の診断をする
人間がルールを与えるのではなく、データを
分析することで、そこに含まれるパターンを
見つけ出し、機械にルールを獲得させるもの。
できること:
画像を認識して分類する
自然な表現の文章に翻訳する
CTやレントゲン写真から癌の病巣を発見する
推論と探索
ルールベースと
エキスパートシステム
ディープ・ラーニング
を含む統計的機械学習
第一次AIブーム
第二次AIブーム
第三次AIブーム
1960年代
1980年代
2010年代
帰納法:事実や事例(データ)から導き出される傾向から結論を導く方法
演繹法:人間の経験や観察による一般的かつ普遍的な事実から結論を導く方法
ルールとゴールが厳密に決まっ
ていることが前提。ルールが記
述しきれず、ルールやゴールが
曖昧である現実世界では役にた
たない(トイプロブレム/おも
ちゃの問題)。
ルールとして教え込まなければ
ならないし、互いに矛盾する
ルールも出てくると処理できな
い。また、教えていない例外的
な事例が出てくると対処できな
い。
画像処理、音声認識、証券取引
といった用途ごとに特化した技
術が現状。人間の知能のように
汎用的で、意識や心も宿すよう
な技術ではない。
20. AIにできること
識別 ゾウ or カバ? 予測 晴れ or 雨? 対話 〜 ですね?
画像、音声、匂いな
どの知覚、言語の種
類や使われ方など貸
せ、部類する
需要、気候、株価な
どの変化から、将来
の変化を予測する
テキストや音声で使わ
れる用語や文脈から、
適切な言葉の組合せを
返し、対話する
音声認識
顔認証
自動運転
創薬支援
天気予報 画像診断 人材採用
故障予測
機械翻訳 競技アドバイス
惑星探査 ヒビ割れ点検
製品品質検査
人工知能/AIアプリケーション
気候変動予測 接客応対 ヘルプデスク ID認証 投資アドバイス
資源発見 事務処理支援
自律性/Autonomy 適応性/Adaptivity
人間による介在なく作業を実行する 繰り返しによりパフォーマンスを改善する
人工知能/AI
23. 統計と機械学習の違い
統計
Statics
機械学習
Machine Learning
記述統計
Descriptive Statistics
推測統計
Inferential Statistics
得られたデータの特徴や傾
向をわかりやすく表現する
一部のデータからそのデー
タを含む全体の特徴を推測
する
収集したデータの統計量
(平均や分散など)を計算
してデータの示す傾向や性
質を知る
採取したデータ(標本やサ
ンプルとも呼ぶ)から母集
団(全体のこと)の性質を
推測
人間が、データから規則・ルール・傾向を発見し、説明
することを支援する
予測
Prediction
分類・識別・判断
Classification/Identification/Decision
学習されたモデルから
将来を予測する
学習されたモデルから
分類・識別・判断を行う
学習のためのデータを計算
することで、予測のための
モデル(推論モデル)を生
成する
学習のためのデータを計算
することで、分類・識別・
判断のためのモデル(推論
モデル)を生成する
機械(ソフトウェア)が、データから規則・ルー
ル・傾向を発見し、予測と分類・識別・判断を自動化する
24. 「人工知能」と言われるものの4つのレベル
24
単純制御:指示されたことをそまま行う
予め定められたルールに従い制御する(人工知能搭載○○)。
気温が上がるとスイッチを切るエアコン
洗濯物の重さで洗濯時間を自動的に変更する洗濯機
ひげの伸び具合で剃り方を変える電気シェーバーなど
ルールベース:指示されたことを自ら考えて実行する
外の世界を観測することによって振る舞いを変える。
振る舞いの種類・パターンを増やすため、予め多数のルールを用意しておく。
「駒がこの場所にあるときは、こう動かすのがいい」といった予め決められたルールに従って、
これからの打ち手を探索して打つことができる囲碁や将棋のシステム
与えられた知識ベースに従って、検査の結果から診断内容や処方する薬を決めて出力する医療診断システム
機械学習:着眼点は人間が教え、対応パターンを自動的に学習する
人間があらかじめルールを細かく決めて組み込んでおかなくても、
大量のデータから対応パターンを自ら見つけ出す。
ただし学習のための着眼点(特徴量)は人間が設計。
「駒がこの場所にあるときは、こう動かすのがいい」ということを設定しておかなくても、
対戦を繰り返すことでコンピュータ自身が自分で学習する将棋や囲碁のシステム
診断データや生体データを多数読み込み、ある病気とある病気に相関があるということを自分で学ぶ医療診断システム
深層学習:着眼点を人間が教えずに、対応パターンを自動的に学習する
学習に使う変数(着眼点/特徴量)を自分で学習して見つけ、
対応のパターンを見つけ出す。
一連の症状が患者の血糖異常を表していて、複数の病気の原因になっているようだ、
ということを自分で見つけ出すことができる医療診断システム
状況に応じて、最適な判断をおこなう自動運転の自動車
レ
ベ
ル
1
レ
ベ
ル
2
レ
ベ
ル
3
レ
ベ
ル
4
25. 各時代のAI(人工知能)と呼ばれるもの
ルールとゴールが決められているゲームの中
で、コンピュータがなるべくゴールにたどり
つけるように選択肢を選んでいくもの。
できること:
パズルや迷路を解く
数学の定理を証明する
チェスを指す など
トイプロブレムから脱却し、現実の問題を解
くために専門家(エキスパート)の知識をコ
ンピュータに移植することで現実の複雑な問
題を解かせようとするもの。
できること:
患者の症状から病名を特定する
起こっている現象から、機械の故障を診断する
患者の症状から、細菌感染の診断をする
人間がルールを与えるのではなく、データを
分析することで、そこに含まれるパターンを
見つけ出し、機械にルールを獲得させるもの。
できること:
画像を認識して分類する
自然な表現の文章に翻訳する
CTやレントゲン写真から癌の病巣を発見する
推論と探索
ルールベースと
エキスパートシステム
ディープ・ラーニング
を含む統計的機械学習
第一次AIブーム
第二次AIブーム
第三次AIブーム
1960年代
1980年代
2010年代
帰納法:事実や事例(データ)から導き出される傾向から結論を導く方法
演繹法:人間の経験や観察による一般的かつ普遍的な事実から結論を導く方法
ルールとゴールが厳密に決まっ
ていることが前提。ルールが記
述しきれず、ルールやゴールが
曖昧である現実世界では役にた
たない(トイプロブレム/おも
ちゃの問題)。
ルールとして教え込まなければ
ならないし、互いに矛盾する
ルールも出てくると処理できな
い。また、教えていない例外的
な事例が出てくると対処できな
い。
画像処理、音声認識、証券取引
といった用途ごとに特化した技
術が現状。人間の知能のように
汎用的で、意識や心も宿すよう
な技術ではない。
32. 自動化ツール
Google Cloud AutoML
Microsoft Azure ML
AWS SageMaker など
AIと人間の役割分担
データを準備
意志決定
学習方式の選択
パラメーターの調整
推論
問いを生みだす
解決したいこと・知りたいことを決める
膨大なデータの中から、人間
の経験に基づく先入観なしに
規則、相関、区分を見つける
新たな問いを生みだす
判断・制御
モデル
57. Amazonの戦略と日本の現状
57
家電製品 オンライン通販 オンライン・サービス
メーカー 小売店 物流事業者
商品個別の情報を識別し、詳細な商品管理を実現
詳細なマーケティング分析
販促・宣伝
仕入れの最適化
商品開発
棚卸し作業の効率化
配送の追跡
レジ人員の削減
購入時の作業時間が圧倒的に短縮される利便性
家庭サービスのOS
IDによる一元化
コンビニ電子タグ
1000億枚宣言
経済産業省+コンビニ5社*
2025年までに全商品にRFID
(ICタグ)を付け、カゴに入
れた商品を一括で集計できる
セルフレジを実現。
*セブンイレブン、ファミマ、ローソン、ミニストップ、ニューデイズ(今後、増やしたい意向)
家庭サービスの全領域を
amazon IDで紐付けることで、
個人の生活全判に関わる行動
データを手に入れ、様々なビ
ジネス分野での「絶対的仲介
者」としての地位を得ようと
している。
小売店舗のOS
画像認識やディープラーニン
グ、センサー技術などを駆使
して実現(RFIDは使用せず)
音声というハードルの低いUIによる手軽さと操作の利便性
75. 機械学習の仕組み/学習が不十分な状態
四角い 丸い 尖ってる 光沢
40% 60% 40% 60%
リンゴである確率
(40%+60%+40%+60%)/4
50%
四角い 丸い 尖ってる 光沢
40% 50% 50% 60%
イチゴである確率
(40%+50%+50%+60%)/4
50%
リンゴ or イチゴ?
<特徴量>
76. 機械学習の仕組み/学習が十分な状態
四角い 丸い 尖ってる 光沢
10% 90% 20% 80%
リンゴである確率
(90%+80%)/4
85%
四角い 丸い 尖ってる 光沢
10% 70% 90% 30%
イチゴである確率
(70%+90%)/2
80%
リンゴ or イチゴ?
リンゴ イチゴ
<特徴量>
77. ルールベースと機械学習
77
答えを出すための
ルール(知識)を
人間が記述がして登録
If 〜 then 〜 else
推論
機械学習
Machine Learning
ビッグデータ
(学習データ)
インターネット
IoT
HPC (high-performance computing)
GPU、AI専用LSI、量子コンピュータなどを利用
INPUT
レントゲン写真
遺伝子データ
電子メール
外国語音声
・・・
OUTPUT
癌病巣の発見
病気の診断
犯罪の証拠を発見
翻訳
・・・
ルールベース
機械学習
84. 一般的機械学習とディープラーニングとの違い
84
耳 27%
目 48%
口 12%
特徴量
「特徴量」とは、猫と犬を識別・分類するために着目すべき特徴
正しく認識 82%
誤った認識 18%
認識結果
耳 27%
目 48%
口 12%
特徴量
学習
ディープラーニング
学習
推論
ディープラーニング
推論
正しく認識 82%
誤った認識 18%
認識結果
人間が認識結果が
最適になる組合せを
見つける
機械が認識結果が
最適になる組合せを
見つける
学習データ
教師付きデータ 学習データの一部
評価データ
86. ルールベースと機械学習
86
Sheep Dog
を見分ける仕様
やルール
= if XX
Then XXX
else XXX
Mop
を見分ける仕様
やルール
= if XX
Then XXX
else XXX
Sheep Dog
を見分ける仕様
やルール
0101011101010
1110101001011
1110010101010
Mop
を見分ける仕様
やルール
0111100101010
1101010001010
1110100100101
人間が記述 データから生成
88. 大きさ
直径
重さ
中空かどうか
底のあるなし
・・・
・・・
・・・
〇〇cm以上〜〇〇cm未満
〇〇cm以上〜〇〇cm未満
〇〇g 以上〜〇〇g 未満
中空である
底がある
・・・
・・・
・・・
人間が
観察と経験で
決める
機械が
データ解析して
決める
機械が
データ解析して
決める
機械が
データ解析して
決める
機械学習
統計確率的
アプローチ
機械学習
ディープラーニング
(深層学習)
統計確率的機械学習とディープラーニングの違い
特徴量
「コップであること」を決定
するための着眼点
最適値
「コップであること」を
決定するのに最適な値
推論モデルの生成
コップを識別するために最適な
特徴量の値とその組合せパターン(=推論モデル)を決定する
推論モデル保存
特徴抽出 推論モデル適用 推論結果
未知の
データ
推論
学習
学習
データ
93. 学習と推論の役割分担
93
学習
推論
学習
推論
大規模な計算能力
専用プロセッサー
長時間演算
比較的小規模な計算能力
専用プロセッサー・省電力
短時間演算
学習モデル 学習モデル
学習
推論
学習モデル
学習モデル
クラウドでモデルを作り、
そのモデルをエッジのデバ
イスに送りリアルタイムの
現場のデータから予測や判
定を行う。
リアルタイム性が重要な処
理は、できるだけ現場に近
い場所で処理できたほうが
有利。また、機器の個体差
にも対処できる。
クラウドで完結するサービ
スに適用。
学習
推論
推論モデル(予測や分類などの
ルール)を大量のデータから作る
推論モデルを使って現場データ
から予測や分類、判断/判定を行う
AISing,HACURUS,
SOINN など
ARAYA,LEAPMIND,
IDENなど
ABEJA,Microsoft,Google,
Facebook,Amazon,
Preferred Networkなど
NVIDIA,Intelなど
102. Googleが発表した自然言語処理モデル BERT
102
トロフィーが スーツケースに収まらない。なぜなら、それは 大きすぎるから だ。
トロフィーが スーツケースに収まらない。なぜなら、それは 小さすぎるから だ。
BERT:“Bidirectional Encoder Representations from Transformers”自然言語処理技術
(NLP: Natural Language Processing)人間が使う言語をコンピュータに理解させるための技術の一種
例えば、感情分析タスクであれば、与えられた文から感情を読み取って「肯定的」か「否定的」かのどちらで
あるかを判別。これを活かして、アルゴリズムが複数の映画レビューを参照し、その映画の平均的な評価を分
析するというタスクを高精度で実行
また、「文脈の理解」や「暗黙の了解」など、より深いレベルでの言語理解に役立つとコンタクトセンターで
活用されるなど。
103. 人工知能と機械学習の関係
103
人工知能 Artificial Intelligence/AI
機械学習 Machine Learning
ニューラル・ネットワーク
Neural Network
深層学習
Deep Learning
人間の”知能”を機械で
人工的に再現したもの
データからグループ分
けのためのルール(モ
デル)を作る仕組み
脳の仕組みを参考に作
られた機械学習の手法
従来よりも精度の高いモ
デルを作ることができる
ニューラル・ネットワー
クの手法
遺伝アルゴリズム、エキスパートシステム、音声認識、画像認識、感性処理、機械学習、
ゲーム、自然言語処理、情報検索、推論、探索知識表現、データマイニング、ニューラル
ネット、ヒューマンインターフェース、プランニング、マルチエージェント、ロボット
データ
プログラム
モデル
コンピューター科学 Computer Science
107. 第3次AIブームの背景とこれから
107
1960 1970 1980 1990 2000 2010 2020 2030
第1次AIブーム
推論・探査など
ゲームや迷路などに
用途は限られ実用性は
無かった
第2次AIブーム
ルールベースなど
エキスバーとシステムと
して実用化されたが汎用
性が無かった
第3次AIブーム
機械学習(統計確率論や深層学習など)
汎用性、実用性が高まり、様々な分野の適用
が期待されている
大型コンピューター
メインフレーム
パーソナル・コンピューター
スマート
フォン
IoT
ビッグデータ時代の到来
ARPAnet 米国・インターネット
商用利用開始
日本・インターネット
商用利用開始(IIJ)
World Wide Web
が開発され公開
画像が扱えるWWWブラウザー
Mozaicが開発され公開
Windows95発売
IEが付属し、ブラウザーでの
インターネット利用者が拡大
ISLVRCにて
ディープラーニング圧勝
1969 1990 1993
1995
2012
Googleによる
猫認識
2011
Jeopardyにて
IBM Watson勝利
電脳将棋
竜王戦 開始
1997
チェス・チャンピオンに勝利
IBM Deep Blue
2007
iPhone
発売
1981
IBM PC 5150
発売
汎用人工知能
Artificial General Intelligence
登場の可能性
ムーアの法則/コンピュータ性能の加速度的向上
1965〜
ムーアの法則の限界/新たな選択肢の登場
GPGPU、ニューロモーフィング・チップ
量子コンピュータ等
IBM S/360
メインフレーム
1964
ニューラル
ネットワーク
考案
Intel 404
マイクロプロセッサ
1971
データ流通量
1957
1956
ダートマス
会議
1982
第5世代
コンピュータ
プロジェクト
108. 人
工
知
能
の
冬
人
工
知
能
の
冬
1950 1960 1970 1980 1990 2000 2010
1958年 パーセプトロン
脳の神経活動を数式モデル化しコンピューターに処
理させる初歩的なニューラル・ネットワーク
1960年代 記号処理方式
記号処理のためのルールや数式をプログラム化し思
考や推論など人間が行う情報処理を行わせる
1980年代
専門家の知識やノウハウをルール化し、
コンピューターに処理を行わせる
ルールベース
アプローチ 2000年代
膨大なデータをベイズ理論に基づく統計的手法
で計算し自らルール生成し情報処理する
2006年 脳科学的アプローチ
脳科学の研究成果を取り入れより忠実に脳の神
経活動を再現
人工知能研究の歴史
インターネット登場
ハードウェア性能向上
ビッグデータ・IoT
PC登場
メインフレーム登場
知
的
活
動
を
再
現
脳
の
活
動
を
再
現
統計・確率論的
アプローチ
112. 人間の知性の発達と人工知能研究の発展
112
if (条件) then (処理1) else (処理2)
論理的思考
感覚的思考
心身的反応
心による身体の制御
や身体の変化による
心の変化
パターンの認識や識
別、規則性やルール
の発見
感覚として得られた
ことについての論理
的な解釈
観察から意識
意欲から行動
特徴の抽出
概念の獲得
感覚についての
論理的理由付け
ルールベース
機械学習
???
人
工
知
能
研
究
の
発
展
人
間
の
知
性
の
発
達
120. K-meansクラスタリング
階層的クラスタリング
Apriori
One-class SVM など
データを探索してその内部に何らかの構
造を見つけ出すこと。
例えば、よく似た属性値(の組み合わ
せ)を持つ顧客のセグメントを特定すれ
ば、マーケティング・キャンペーンでそ
のセグメントに特化した活動を展開でき
る。また、顧客セグメントを区別する主
要な属性値(の組み合わせ)を明らかに
することもできる。
過去のデータから将来起こりそうな事象
を予測すること。
例えば、クレジットカード取引に不正の
疑いがあるケースや、保険金請求を行い
そうな保険契約者を特定することが可能
です。
教師あり学習と教師なし学習
教
師
な
し
学
習
教
師
あ
り
学
習
線型モデル
ロジスティック回帰
判別分析
k近傍法
決定木
サポートベクターマシン(SVM)
ニューラルネットワーク
ナイーブヘイズ
ランダムフォレスト など
適 用 アルゴリズム
121. 敵対的生成ネットワーク GANs: Generative Adversarial Networks
121
生成者
Generator
識別者
Discriminator
画像
画像
元データ
レプリカ
元データの特徴から
できるだけ本物に近い
レプリカを生成する
元データの特徴から
元データと同じかどう
かを識別しようとする
「生成者」はレプリカをできるだけ元データに近づけようとし、「識別者」は確実に見分けられるように互いに競い合う。
「識別者」の能力が次第に上がり元データとレプリカをうまく見分けられるようになり、「生成者」は更に本物に近いレプ
リカを造れるようになる。
これを繰り返してゆくことで、「生成者」は元データと区別が付かないレプリカを造れるようになる。
認識や識別などの受動的機能
深層学習(ディープラーニング)
生成や復元などの能動的機能
敵対的生成ネットワーク(GANs)
122. 深層強化学習 deep reinforcement learning
122
勝
勝
負
プラス評価
マイナス評価
プラス評価
ゲームを繰り返し、結果の勝(プラス評価)/負(マイナス評価)
から、結果に至るプロセスひとつひとつを評価し、勝(プラス評
価)になる一番効果的/効率的なプロセスの組合せを見つけてゆく
強化学習 reinforcement learning
ブロック崩しなどのゲーム 囲 碁
ゲームに勝つために有効な特徴(量)を画像から直
接見つけ出すために深層学習(deep learning)のア
ルゴリズムであるCNN(convolutional neural
network)を使用する。
複雑なゲームでも人間が何を基準に勝ち負けを評価
するかを教えなくても、自分で勝ちパターンを見つ
け出す。
対戦ゲームの場合は、機械の中でお互いに対戦させ
て、学習の回数を増やし、勝ちターンを見つけ出し
て行く。
深層強化学習 deep reinforcement learning
Deep Mind社のDQN(Deep Q-Learning)など
囲碁の世界チャンピオンに勝ったAlphaGo/Alpha Go Zeroが有名
137. 機械学習とデータサイエンス
137
データ
アナログな現実世界の「ものごと」や「できごと」
学習
推論
識別
予測 判断
ゾウ or カバ? 正常 or 異常?
晴れ or 雨?
音声認識
顔認証
自動運転
創薬支援
天気予報 画像診断 人材採用
故障予測
機械翻訳 競技アドバイス
惑星探査 ヒビ割れ点検
製品品質検査
アプリケーション
機械翻訳 商品提案
モデルと
プロセスの設計
要件と課題
の設定
仮説の設定
学習
モデル
データ
の探査
データ
の収集
IoT、モバイル、Webなど
特徴が共通するグループに
分けるための基準/ルール
(学習モデル)を作る
学習モデルを使って
特徴が共通するグループに
分類する
機械学習
デジタル化された学習データ
データ・サイエンス
多くの学問領域にわたる科学的手法やシステ
ムなどを使い、様々なデータから知見や洞察
を引き出そうとする研究分野
何を知りたいか?
どのように知るかを
まずは明確にする
138. アナリティクスとビジネス・インテリジェンス
138
DWH
Data Warehouse
業務システム IoT/センサー
Big Data
ソーシャル
Webサイト
業務システム
Big Data
ソーシャル
Webサイト
業務システム
データに基づく
社内業務に関連した
意志決定の支援
意志決定方法の改善と
リアルタイム化
価値の高い製品やサービス
の提供
説明的アナリティクス
リポーティング、OLAP分析、データマイニング
予測的アナリティクス
予測モデルとプランニング
指示的アナリティクス
大規模テストと最適化
DWH DWH
RDB+列指向DB NoSQL+Hadoop 人工知能
アナリティクス1.0 アナリティクス2.0 アナリティクス3.0
BI(Business Intelligence)
Harvard Business Review 2014.5月号「アナリティクス3.0」を参考に独自作成
139. ビジネス・インテリジェンスの適用とツール
139
ソーシャル・メディア
Webサイト 業務システム IoT/センサー
非構造化データ
ビックデータ
経営戦略や経営計画の立案
事業部門への指示と実行
月次などで行う経営会議での
モニタリングと問題点の分析
の指示
問題点の分析と問題点を修正
するための意思決定と指示
全社の戦略に沿った部門別
の計画立案
部門での業務実行
日々のモニタリング
問題点の分析と上位部門へ
の報告や修正
レポーティング OLAP分析 データマイニング プランニング
問題の兆候を発見する 問題の要因を検証する 対処のヒントを得る 計画の根拠を得る
集計、推移、比較、内訳、順
位、関係、シグナル表示
多次元データベース、スライ
シング、ドリルダウン&ドリ
ルアップ、ドリルスルー
クロス分析、相関分析、回帰
分析
モデリング、シミュレーショ
ン
Webリポート(リポートを
Webページなどで多数のユー
ザーに公開)
ダッシュボード(複数のリ
ポートを単一の画面で表示)
大量の分析元データの処理
最新の分析元データの共有
大量の分析元データの処理
より高度なマイニングアルゴ
リズムの利用
多くの部署から収集された計
画データの統合
DWH
構造化データ
経営層の目的 現場部門の目的
BA:Business Analytics
BI:Business Intelligence
BI
Business Intelligence
アナリティクス
Analysis
141. ETL (Extract, Transformation and Load)
SFA
POS
ERP
製造管理システム
販売管理システム
会計システム
CRM
SCM
DWH
Load
Transformation
DBのレプリケーションが主目的
リアルタイム性はあまり考えられていない
EAIやESBを使えばリアルタイムのデータ連係も可能
ただし、他システムへの負荷を考える必要有り
Extract
不要なデータの削除 分析では不要なデータや異常なデータについて削除する。
値の変換 Null値の変換や、データ型の変換(日付→文字列など)を行なう。
クレンジング システム間でコードの意味が違う場合にそれを統一するなど、データの意味をそろ
える。また、データ内に不整合があった場合にそれをエラーとしたり、一定のロジックで変換したりする。
統合・集計 複数のシステムから抽出した別のデータを1つのデータとして統合する。また、たとえ
ば業務システムでは日単位のデータを月単位に集計するなどの集計処理を行なう。
142. データウェアハウス DWH Data Warehouse
項目別
統合化
非更新
時系列
基幹システムとデータウェアハウス(DWH)の違い
基幹システムは「機能別」に設計されており、データには「目的」がある。DWHで
は、これを項目(サブジェクト)毎に再構成する
様々なシステムからのデータを一つに統合するために、データフォーマットの変換や
抽象化などを行う
データの修正があった場合でも、古いデータを削除したり、上書きしたりせずに、追
記し、履歴を完全に残す
データを上書きせずに追記していくことによって、過去のある時点でのデータを参照
できるようにする
データウェアハウスの要件
基幹システム データウェアハウス
トランザクションを高速処理することが目的
頻繁に更新、長期保存は前提にせず
リレーショナル・データベースが一般的
高速な検索や集計処理することが目的
追加のみ、更新は行われない
列指向型データベースが広く利用