SlideShare ist ein Scribd-Unternehmen logo
1 von 57
ベイジアンネットと確率的潜在クラス分析
による行動履歴データからの計算モデル構築


        本村 陽一
 (独)産業技術総合研究所
  サービス工学研究センター 副研究センター長
  (デジタルヒューマン工学研究センター兼務)
 統計数理研究所客員教授
 東京工業大学知能システム科学専攻 連携准教授
背景:「モノ」から「コトへ」
 車               vs    家族で
       のドライブ
クリスマスプレゼント vs    クリスマスパ
        ーティ
携帯電話     vs           楽しい会
          話
似合う洋服       vs        良い第一
         印象
映画DVD     vs            感動
モノづくりからコトづくりの時代へ

• 状況依存性のある人々の行動や経験価値

• 一人十色とも呼ばれる複雑化した消費者の異質性

• 変動する外的環境のもとでの不確実性の予測と制
  御



などへの対応が時代的にも重要となっている
                       3
コト(サービス)の特性
無形性:手に取ったり、見たりできない
消滅性:保存しておくことができない
同時性:提供と消費が同時
異質性:価値は均一ではなく、標準化できな
 い

 こうした特質から、物理・機械・情報工学
的な扱いだけではなく人、人々、状況、環境
(場)とその関係性まで含めたモデル化が必要
人が入る系(システム)の研究

  制御対象としてのシステムの中に人を含める。
  →全体システムの中では人はもっとも不確実



   狭義のシステム
             ヒューマンモデル



• 全体システムの中に人のモデル(ヒューマンモデ
  ル)を入れて最適な動作を設計する→「コト」の
  工学研究
サービスの科学・工学(モノからコト
             へ)
  The unified service theory
  The unified service theory
  (Sampson 2006)
  Service can be characterized by Users’ feedback

                サービス現場
                   利用者            Inputs
                   提供者
            実社会    経営者
                   Production
  Suppliers                                         users
        日常生活        process
              inputs                  outputs




        How can we realize input from users ?
サービス工学:サービス(価値共創)システム
   (サービス場面の人々の活動を対象としたシステム)

 「モノの伝達」から「コトの伝達」へのパラダイムシフト

                      顧客接点
    提供者(企業)          Point of Service    受容者(顧客)


 製品設計                                         製品利用
                                            サービス利用
サービス設計
        バックヤード   フロントヤード       購買行動       日常生活
                                        価値・評価・ライフスタイ

        サービス現場(顧客接点)での相互作用(ダイナミクス)
        を観測・予測・制御するために大規模データを活用する

大規模データを通じた人々の活動:社会のシステムダイナミクス(オートポイ
エーシス)
共創的コトづくりのために:
サービスシステムダイナミクスの計算モデル化
 サービスデザイン
                           生活者の計算モデル化
        最適化                    と
                             情報サービス
                     シミュレーション
           To be
支援技術                          大規模・大量
                                のデータ
                               POSデータ
                              アンケートなど
                   As is      からのモデル化
        サービス現場
                                  サービス活動中に
  実社会
           利用者
                           人間行動   取得できるよう実
                           観測技術   験計画されたデー
           提供者                       タ
 日常生活
           経営者

                     データ収集
大規模データ活用技術

    • ID付POSデータなど大量データが蓄積
    • 数千人規模のアンケートも容易に実施可能

    • ただし、データ分析、データマイニングだけでは
      、結果の活用が限定的(従来通りの施策の実施の
      ため)飛躍的生産性向上に結び付きにくい。
    • そこで、大規模データを計算モデル化し、その結
      果をITで活用できるようにする。

    • 「顧客の見える化」「生活者起点」を促進するた
      めに
Center for Service Research, AIST
生活中の履歴データなどの大規模
  データから再利用可能な計算モデル
          へ
従来の統計(母集団依存性大)

    各事例の保存と検索(データベース)
    単独の頻度、集計、統計
    複数の変数の間の関係(相関、独立性)
    ある変数を説明するルール、予測モデル
    変数群の依存関係の条件付確率(確率的知識)
    因果的構造のネットワーク(計算モデル)
 有用な知識(再利用性大)
集めたデータの説明から、そのデータ以外にも成り立つ知識、
 すなわち過去の経験から、『次』に活かせる知識へ!!
構造を表す計算モデル:ベイジアン
      ネット
和文書籍
ベイジアンネットワーク技術:東京電機大学出版局(本村・岩崎)
ベイジアンネットワーク概説:培風館(繁桝・植野・本村)

   条件付確率:   P(目的変数| 説明変数)
    条件付確率 P(X3|X1,X2)




     X1          X3              X5


                        条件付確率 P(X4|X2)
     X2          X4              X2 0   1
                            X4
                             0     0.8 0.4
                             1     0.2 0.6
ベイジアンネットの学習(モデル
        構築)
 確率変数の選択    情報量の高い、重要な変数の抽出

 グラフ構造の学習   情報量基準による(局所)モデル選択

 条件付確率(パラメータ)の
  学習
 離散確率変数: CPT (cond prob table)    連続変数:パラメトリックモデル
 事例の頻度から確率化                       のパラメータ学習 or 離散化
    P                            P
          B
                                       B
                        A
                                           A
   {P1 (a1|b1), P2 (a2|b2), …}
ベイジアンネットの学習(グラフ構造の探索)

    X        Y     ?      OR         X            Y     ?

Y                Ex.
                                 Y                Ex.
        n1       3
                                         P1       0.3
        n2       4
        n3                               P2       0.4
                  :                      P3
        n4                                         :
                 クロス集計表                  P4
        n5                                        条件付確率表
        n6       度数|Y, X| = n            P5
             X              xy           P6       P(Y|X) = p xy
                                              X
X,Yに関するクロス集計表                     ベイジアンネットの条件付確率表
カイ二乗検定により変数間の                    条件付依存性を情報量基準(AIC, MDL)
独立・従属性を判定                        により判定しモデルを選択(ベイズ比検定

この検定を一つの子ノード毎に、複数の親ノードに対して繰り返し行う。
確率推論(belief propagation)
                                                  Observation e+

                                         X1 P(X1|e+)
                                                         CPT:P(X2|X1)
                                                           X1 0 1
                                                          X2
 もっとも単純な場合(基本系)                                            0 0.8 0.4
  Belief(X2)                                  P(X2|X1)     1 0.2 0.6
= P(X2|e+, e-)
=P(X2|X1) P(X1|e+) ・ P(X2|X3) P(X3|e-)   X2

                              P(X2|X3)

                               P(X3|e-) X3


                                                Observation e-
Belief propagationアルゴリズム
Pr( X        x)              ( x) ( x).                                        U1          ……     Ui
  ( x)            u
                      P( X | U u )                    UiX
                                                            (Ui),
                                                                             UX (u )
                                               Ui                                                 Xからの出力

                                                                                                           (u )
  ( x)                 YjX ( x ),
                                                                                                      XU

             Yj                                                             Xへの入力
                                                                                     (x)   X    (x)
                                                                                                  Xへの入力
  XYj
      ( x)            ( x)               YkX ( x ),
                             k j                                             XY   (x )
                                                                                                  YX   (x)
                                                                            Xからの出力
  XUi (u )                 ( x)          P( x | U )           UkX (u k ).
                  x                k i                k i
                                                                               Y1          ……     Yj
ベイジアンネットの
            ベイズ的世界観
•   ドメインを全て確率変数として表現
•   ドメインの状態は各確率変数の同時分布
•   観測可能、決定的な場合を包含
•   末端の変数は事前確率分布を仮定

• 目的:知りたい対象の変数の事後確率分布を計
  算
• この時、主要な依存関係のみをグラフとして表
  し、モデル化することで記述量、計算量を劇的
  に削減。

    P(X1,X2,…,Xn) = P(X1|X2)P(X2|…)P(Xn)
ベイジアンネットワーク構築・推論ソフト BayoNet
     (1998:IBIS、AI学会などにて発表)
 (2003~:商用ソフトとして販売, COMDEX出展)
(2005~ 本格的実用化によりソリューションビジネスも提供)
ベイジアンネット技術とその深化
• 大規模実データの中から、
  ・非線形・交互作用を含むゆるやかな因果的連鎖構
  造を自動的に抽出し、
  ・計算機上のモデルとして作成し、
  ・推論やシミュレーション、制御などに活用できる

• 表形式の離散変数(SQL-DB)だけでなく、
  ・ センサ、画像、テキスト、電子カルテ、ID-POSデ
  ータなど、日常で集積されつつある大規模データを
  適用可能にする技術研究
  BN + テキストマイニング/ 潜在クラス分析 / 特徴抽
  出
                            18
事象指向計算モデル化技術

サービス工学における最適設計ループの実現のため
の
• 大規模データ(ID-POS, アンケート, 操作履歴, テキス
   ト)
• カテゴリセット抽出(PLSA, クラスタリング, 質的
   調査)
• 構造・関係モデル構築(BN, 情報量基準)                 Trident/
                                        POSEIDON
                  APOSTOOL/BayoNet
  ID-POS                           主
• Man-Machine Lifelong Learning(IT+コミュニティの学
                                時
 アンケー
                                     客
  ト
   習)
  Log
                          場     動
 テキス
  ト                                    IT+コミュニティ
          顧客セグメント・潜在クラス
                      5W1Hを反映した       → ダイナミクス
  etc
          機能・情緒ベネフィット 構造的計算モデル        (サービスシステム
初期課題(企業ニーズ)の例:
   顧客のモデル化、顧客理解
 (消費者行動選択とプロセスモデル)
                     デジタル
店頭での会員勧誘 メルマガクーポン              接客支援ツール
                     サイネージ
  興味ドライバー   来店ドライバー 入店ドライバー    購買ドライバー

            実物を見たい   実物を見たい    実感(似合う、機能)
  商品情報      買い物の日    フィッティング   揃える(色・デザイン)
  ノベルティ     イベント     素材感       安心(保有・確保)
  話題        同行者として   時間がある     接客に惹かれて
  季節感       なんとなく    ディスプレイに     :
    :         :      惹かれて
                       :
                                      購買
                              入店・閲覧
会員入会      メルマガ受信   来店
                         リピート

             ロイヤリティ向上
大規模ID-POSデータの活用事例
 – データの件数約数十億トランザクション

          データイメージ


                  **
           ・・ ・

 ID-POS:「誰が」「商品」を「どの店舗で」「いつ
 買ったか」

• 付加的なデータも加え、因果的な構造としてモデ
  ル化することで、「どういう理由で」購買したか
  を推定し、
  「もしもこうしたら、どうなる」というシミュレ
  ーションにも活用できる計算モデルを構築する
潜在クラス分析(pLSI)による顧客ー商品の同時分類
 ID-POSデータに基づく購買履歴から顧客と商品群を自動で同時に分類
 ・2008年9月から2009年9月までの12カ月分のID-POSデータ
 ・アンケート対象者3981人と購買回数上位1000商品に関して同時分類
 ・確率的潜在意味解析法(PLSI法)の適用により自動的に分類

         属カ       計算結果                                  属カ       計算結果
         すテ
         るゴ
                                  カテゴリ数は情報量規準によ   商品1
                                                        すテ
                                                        るゴ
         確リ
         率に
              カ   カ   カ
                          ・   カ         り               確リ
                                                        率に
                                                             カ   カ   カ   ・   カ
              テ   テ   テ       テ                              テ   テ   テ       テ
   顧客1        ゴ   ゴ   ゴ   ・   ゴ   20カテゴリと自動的に決定              ゴ   ゴ   ゴ   ・   ゴ
              リ   リ   リ       リ                              リ   リ   リ       リ
              1   2   3   ・   3                              1   2   3
                                                                         ・   3
         属カ
         すテ
                              2     カテゴリ1               属カ
                                                        すテ
                                                                             2
         るゴ                                       商品2   るゴ
         確リ                                             確リ
              カ   カ   カ       カ                              カ   カ   カ   ・   カ
   顧客2   率に
              テ   テ   テ
                          ・   テ
                                                        率に
                                                             テ   テ   テ       テ
                          ・                                              ・
                                     ・
                                     ・
              ゴ
              リ
                  ゴ
                  リ
                      ゴ
                      リ
                              ゴ
                              リ      ・                       ゴ
                                                             リ
                                                                 ゴ
                                                                 リ
                                                                     ゴ
                                                                     リ   ・
                                                                             ゴ
                                                                             リ
              1   2   3
                          ・   3                              1   2   3       3
         属カ                   2                         属カ                   2
         すテ                                             すテ
         るゴ                                       商品3   るゴ

   顧客3
         確リ
         率に   カ
              テ
                  カ
                  テ
                      カ
                      テ   ・
                              カ
                              テ
                                    カテゴリ2               確リ
                                                        率に
                                                             カ
                                                             テ
                                                                 カ
                                                                 テ
                                                                     カ
                                                                     テ   ・
                                                                             カ
                                                                             テ
                                                             ゴ   ゴ   ゴ       ゴ
              ゴ
              リ
              1
                  ゴ
                  リ
                  2
                      ゴ
                      リ
                      3
                          ・
                          ・
                              ゴ
                              リ
                              3
                                      0                      リ
                                                             1
                                                                 リ
                                                                 2
                                                                     リ
                                                                     3
                                                                         ・
                                                                         ・
                                                                             リ
                                                                             3
         属カ                                             属カ                   2
         すテ                   2                         すテ
         るゴ                                       商品4   るゴ

   顧客4
         確リ
         率に
              カ   カ   カ       カ     顧客と商品を              確リ
                                                        率に
                                                             カ   カ   カ   ・   カ
              テ   テ   テ   ・   テ                              テ   テ   テ       テ
                                                  ・
                                                  ・
                                                  ・
              ゴ   ゴ   ゴ
                          ・   ゴ    各カテゴリへ分類                  ゴ   ゴ   ゴ   ・   ゴ
 ・
 ・
 ・




              リ   リ   リ       リ                              リ   リ   リ   ・   リ
              1   2   3   ・   3                              1   2   3       3
                              2                                              2
推定結果:顧客がある意味カテゴリに属する                推定結果:商品がある意味カテゴリに属する確
         確率     推定されたカテゴリ所属確率が最大となったカテゴリへ     率
                            分類
大規模ID-POS(ジャーナルデータ)と
      アンケート(マスタデータ)の統合(計算モデル化)
 顧客パーソナリティ因子と商品群の関係をPOSデータからベイジアンネット
 化
  (青い線:各ライフスタイルカテゴリーに対して全商品カテゴリーで得点が高い3商品カテ
  ゴリー)                                  既存の
       ライフスタイルカテゴ      新しい商品カテゴリー
  (赤い線:各商品カテゴリー内で1番得点が高いライフスタイルカテゴリー)  商品分類
アンケー
           リー           (ID-POSから抽出)
 ト項目 (アンケートから抽出)       果物自炊的     健康飲料的
                                            野菜
デモグ
                      お手軽夕食的     菓子のお伴的
 ラ      こだわり消費派
日常行
                                            肉・
動・生                   酒飲み健康的     お手軽栄養的
活時間                                         魚・
        家庭生活充実派
                                             卵
                       パン食的      肉不使用自炊的
健康意                                          冷
 識      アクティブ派                   しっかり野菜     凍・
                      野菜自炊的
                                    的       レト
食に対                                         ルト
する意                    おやつ的      和風朝食的
        節約消費派                               総菜
 識
                      洋風朝食的      おかずもう一品的
                                            飲料
消費傾                                         水・
 向      堅実生活派
                                            酒類
                      牛乳・清涼飲料的   見切り品的
パーソ
 ナリ     パパっと消費派       しっかり自炊
                                  日用品的      日用
                        的
 ティ                                         雑貨
                        PB的       肉自炊的
利用者の心理特性(アンケート結果)をモデル化したベイジアンネットの例
         各商品カテゴリを購入している利用者の解釈 (アンケート回答との関係性

Class06 おやつ的




Class07 洋風朝食的
コトの理解(5W1H)
• Who: どんな顧客が
• What: 何を
• Why: なぜ
購入しているか、
についての理解ができる。
(さらにWhen, Where, Howも追加する)

さらに、その顧客がどの位来店するかがわ
かれば、店舗でのアクションが最適化でき          25
利用者の購買行動を表すベイジアンネットモデル
対象ジャーナルデータを用いて、カテゴリ分類、ID-POS解析、
アンケートデータ解析の結果を統合した、ベイジアンネットワークモデルを構
築した。




     ジャーナルデータについてのベイジアンネットワーク
(データ数420万件、計算時間約48時間、Greedy サーチ、構造探索スコア:
                  AIC )
ベイジアンネットを用いたシミュレーション
作成したモデルを用いて状況依存性についての確率推論を行った。

P(回答”家庭生活充実してない”| お手軽夕食商品, 夕方に購入)        →   高
い確率    0.3
                    家庭生活充実していない   それ以外
      0.25


       0.2


      0.15


       0.1


      0.05


        0
      夕方        0    0      1       1
      夏         0    1      0       1


             お手軽夕食的クラスタ商品
来店行動予測モデル→ 需要予測への応用

 非対称な分散の構造をモデル化したベイジアンネットによる予測結果の
  補正
 ・ベースモデルの予測残差に対しベイジアンネットモデル(BNモデ
  ル)を作成
 ・予測外れが大きい変数に対して、予測結果を補正
       外れの大きい値に対して  事後確率の期待値を
                   ベイジアンネット構築            予測結果に加算

 下ブレ外れの            上ブレ外れの
  大きい範囲             大きい範囲                     ①上ブレ、下ブレ、両者
(-2σ, -1σ以下)       (1σ, 2σ以上)                 の内
                                              使用する補正の有無を判
  30




                                              定
                                                    ↓
  20




                                              ②各日の説明変数をBN
  10




                                              へ
                                                    ↓
  0




       -200    0    200   400                 ③大きな予測外れが起こ
         外れの値                                 る
       残差のヒストグラム                  外れ方の構造      事後確率を推論
                                (ベイジアンネットモデ         ↓
非対称分散構造モデルによる需要予測補正効果

 条件付層別差分モデル(ベイジアンネット)による予測結果の補正
 ・補正が必要なブレの大きい日についてのみ、限定的に補正する
 ・下ブレ、上ブレの判定→ 符号関数ξ(x)をBNでモデル化したものを用いる

  上ブレ残差                  下ブレ残差
             σup           σlow
  10 20 30




                                        y - z = diff (x) @ å        x (x)ks P(x (x)ks | x)
                                                              k=1,2
  0




              -200   0   200      400


  符号関数ξ(x)は上ブレ(y-z>σ)の時+1, 下ブレ(y-z<σ)の時-1それ以外では0

                   “セグメント毎予測+BN残差モデル補正”による予測結果の改
                   ①前年同月同曜日 ②線形予測
                                       善率
                                  ③セグメント毎 ④線形+BN補正 ⑤セ+BN補正 ①からの改善                 ②からの改善

平均予測再現率               92.7%       96.2%      96.4%    96.4%       96.4%    -        -
残差合計                 -2835人       -762人     -516人     -555人      -141人    2694人     621人
絶対残差合計                3285人       1599人     1542人     1549人      1501人    1784人      98人
人間の認知評価構造・
                                       生活行動モデル


                                        楽しい
日常の                       時間・空間的に展開し
                               統計的学習
大量データ      認識モデル            動きが
                            ~だから       好き・嫌い
 センサ統合
                            場所が
               PLSI                    怖い・危険
 データー統合    SQL DB, etc…     ~だから


  アンケート                     状況が
 ・インタビュー                    ~だから       笑い・怒り
           生成モデル

                                       欲しい・
                                       買いたい
サービス適用                      モノが
           Web, 携帯電話        ~だから
            SNS, etc…
                                       快適・安心
                            確率分布を出力
 実サービス
                              再利用可能な計算モデル
ベイジアンネットによる顧客モデル化技術

  デジタルサイネージへの応用シナリオ
     デジタルサイネージ

          店舗内キオスク端末、
ライフスタイル
  提案      携帯、インターネット

  生活コミュニケーション促進                  大規模
                       ID-POSデータ
                                 データベース
      (生活満足度向上)           と連携
嗜好性予測
                             顧客セグメント推定・
                             認知・興味喚起を行う
                                コンテンツ選択
                   カテゴリマイニング技術




  ベイジアンネット技術            顧客理解・サービス品質の評価
リコメンデーションへの応用
・協調フィルタリング(CF)
(ex. アマゾン、アスクル):P(X) ∝∑類似度(u) 購入経
 験(u,X)     購買履歴
    類似度
  ユーザ
          他の    コンテンツ      u
         ユーザu     x




・アスペクトモデル:P(X)= ∑P(X|H)P(H|U)
   関心 内容アスペクト   コンテンツ       H
 ユーザ      H       x




構造を持つ確率モデル=

ユーザが対象が興味深いと評価する確率を推定して、
その確率の高いコンテンツ(X)を推奨。
ユーザ適応型カーナビ(レストラン推薦)
(本村・岩崎「ベイジアンネットワーク技術」東京電機大出版
             局)
例:カーナビでのレストラン選択のモデル
(デンソーITLとの共同研究、iPhoneアプリ化)
                                            年齢層


   自動車                              運転歴
   ユーザ層         可処分
                  所得    食事の好み                        ユーザー属性
                        (休日夜)




           主客層           メイン                        レストラン属性
                        ディッシュ
   平均                                       レストラン
                  高級感
   予算                            フランチャイズ   カテゴリ




        状況                急ぐ                時間        状況
        気温
• 映画推薦サービスにより集積する大規模データをマーケティングに
  活用
  (KDDI研究所、松竹との共同研究)
 観測・モデル化(状況を入力)
                    auOneラボのサービス
 手段→映画館     状況
 誰と→恋人と
 気分→感動したい
                              状況 誰と    TPOに応じた
                     「恋人と、             コンテンツ
                      映画館で、 どんな気分      推薦エンジン
                     感動したい」            (嗜好性モデル)
                                        感じ方
                                              評価
                              プロフィール               推薦
                                       感動した   結果
                               年齢 性別
                                       癒された   好む
                                              確率
        デートにぴったりの
        映画でうれしい★              コンテンツ情報
                     「30代、男
                     性、
                     ストーリー重   製作国ジャンル
                     視」

個人プロファイル(年齢、性別等)
 過去の履歴情報(視聴、購買等)
                                        数万コンテンツ
  数千人アンケート、過去の視聴履歴                      (パートナー企業提供)
                    映画DB
  など大規模データ収集・嗜好性モデル構築
利用しながらモデル更新(連続・動的最適化)
                                                        水平展開

 他のサービスにも利用できる再利用可能な計算モデル(知的基盤)
事例2:センサハウス内のライフログ
   からの掃除行動のモデル化
• 掃除行動実験
   ・5人の被験者対象
   ・ほぼ同じ状態の部屋を自由に掃除してもらう
     →5人の行動の違いを見る
• 掃除中、思ったこと感じたことを発言してもらう
     →5人の発言の違いを見る




      やるぞ!   A   やだなぁ   B
Who, Why, How, (Where, When)の理解




行動計測結果とプロトコル分析による欲求構造と
個人属性との間の関係を計算論的にモデル化できた
コト:研究対象は生活現場にある
                  初期の課題解決をしながら
                  社会実装と研究開発を同時に推進




            結果として死の谷とダーウィン
            の海を先に渡ってしまう


   研究開発(基礎から応用ま       社会実装
   で)                        サービス
                             社会受容
                             法・制度
                              認証
                             合わせて
                             同時に検討
生活現場での課題解決アプローチ
• 現場情報を包括的にデータとして収集
• この時、データを入力すると何かが得られる、実
  用的なサービスとして設計することが重要
• 行動変容を促す生活現場での「アクションリサーチ」の
  実践
• 現場に介入し、問題解決をはかる仕組み作りを目指す。

• 「現場に入る」ために:初期の解決すべき課題
• 「現場でループをまわす」ために:持続的な観測を可能
  に
• 「現場でループが回り続ける」ために:解決課題の継続
  的探索                      40
現場参加型サービス工学
      (On-site research)
• 目的:現場で起きている良いインタラクションを
  促進

• 効果:現場の「知」を見える化し再利用、増幅す
  る

• 成果:現場発の工夫を即、システムへ反映できる
  仕組

• 顧客接点のインタラクション支援端末(POSEIDON)
• 顧客接点データ活用ツールキット(APOSTOOL)
POSEIDON・APOSTOOL: サービスの支援技術
 小柴, 竹中, 本村:ステイクホルダー分析と実データに基づく経営者支援システムの開発
 人工知能学会社会とAI研究会, 2012年3月 研究奨励賞受賞




                                   「9.こだわりの逸品」画面
                                   へ




                    店舗スタッフごと
                        の
                      お薦め料理


「 10.食事中、食事後アンケー   「7.スタッフのいちおし」   「8.銀座四丁目のおすすめ」
ト」画面へ              画面へ             画面へ
開発した技術パッケージ
技術:
  ID有/無データからの顧客・商品分類技術:PLSIを用いた潜在クラス分析,
  需要予測コーザルDB,サービス接点でのインタラクション支援技術,など
 飲食系のITコンサル企業で活用中                      ITベンダ経由で小売企業にて活用中

      APOSTOOL                POSEIDON
      (サービス分析機能)              (サービス接点インタラクション支援)
            顧客分類
            需要予測
              ・・・




         天候収集・記録              バックヤード          店頭
         データ整形・集計                                      ユーザ
                                                    (顧客・店長等)
        APOSTOOL Web-API


      Trident              DB,Webサーバ,
      (データ収集配信基盤)          WiFiルータ,CMS,etc.



組み合わせ自由な機能(API)を使って、ユーザ(店長・マネージャ)のニーズに
もとづいて,機能・UI設計,需要予測システムの構築などを実施、提供(共同研究)
POSEIDONによる
   従来のアンケートの問題解決
• 事実と行動に基づくウソのない回答
  →現場に没入、リアルタイム収集
• 母集団と標本集団の一致
• 知覚時と回答時の状況(フレーム)の一致
• サービスを一体化し、操作履歴として自然にデ
  ータ収集 → 回答率の向上
• 集計速度向上と集計結果をリアルタイム活用
• 従業員やマネージャーが現場で使うメリットも
サービス現場における共創的
 コミュニティ参加型アプローチ

• 外食サービスの例:支援対象のステイク
  ホルダーを対象にニーズや課題を調査
 – 全店長へのアンケート調査
 – 複数店長へのインタビュー
 – 全エリアマネージャへのインタビュー
ユーザの具体的要求の抽出(KJ法
         )           発注を自動化・支援
                       してほしい                 予測してほしい
                                                                  シフト組を自動化・支援
                                                                                     店長・調理長側に強い要望

                                                                     してほしい
                                                                                    正しいシフト組をしたい
                      (金額/量について)
     最低・最高ラインが                            予測される売上を知りたい
                     どれだけ発注すべきか知
        知りたい
                          りたい
                                                                                  年に数度の特殊イベントに
                                                                シフト組の正否を評価したい      どのような対応をしたか
                          どの商品がいつ・どのくらい                                            あとから振り返りたい
                                            予測される客数を知りたい
                            出そうか知りたい
             食材のロスを知りたい

                                                                                        申し送り・振り返りが
                                                                   シフト組の正解を知りたい        簡単にできるようにしたい
                     品切れ(チャンスロス)
      廃棄ロスを知りたい
                        を知りたい
                                           予約管理を効率化したい
                                                                            店がうまく回った日と,
                                                                                                クレームと,
                                                                             そうでなかった日の
                                     席のみの予約客が       予約客・一般客は                                 店の状態の関係を知りたい
                                                                              差分を知りたい
                                   何を注文するか知りたい     それぞれ別に管理したい
        売れ筋・死に筋商品を
           知りたい
                                                                                  店の状態を知りたい
                                   昼・夜は別に管理したい     フロア別に管理したい


最適なメニュー配置を        商品に対する満足度を                                        客単価の分布を知りたい
   知りたい            満足度を知りたい               売上や客数の傾向を見たい
                                                                                             接客スタッフの忙しさを
                                                                                                知りたい
                                                            良いスタッフとそれ以外の
立ち位置(特徴)を知りたい                                                  違いを知りたい
                                                                                各調理ポジション毎の
                                           現状を知りたい
                                                                                 忙しさを知りたい
                     評価の高い店の特徴を
                        知りたい
                                       自店の客層と,                                                     要求
                                                                        評価の高い店の施策を
                                     他店との相違と知りたい
                                                                           知りたい
      複数の店,地域の傾向を                                                                                代表的要求
       簡単に比較したい
                                            店の雰囲気に対する満足度を   接客に対する満足度を                           筆者らの理解
                                               満足度を知りたい      満足度を知りたい
AM側に強い要望
小売サービスにおけるデータ活用支援技術
                                  顧            従業員報告(従業員アンケート・店舗レポート
 基本DB関                            客            等)
連                                           顧客行動(閲覧履歴・アンケート
            商品情報データ               接         等)
            店舗情報データ               点
                       商品    店舗                        POSEIDON
                                             レコメンド・
                      データ   データ   支          アンケート結
                                  援          果


                                                    POSインタラクション
 実店舗
 データ                                                                メルマガクーポ
                                                              ECサイト ン
 POSデータ
 CRMデータ           時間-空間-意味
                   ラベル化

                マージ済みデー               APOSTOOL
                タ                                    店舗フィード
                加工済みデータ               (分析サー          バック
                                                       売上関連分析結果
ECサイト           時空間意味DB                 バー)            店舗比較情報
 データ                                                   顧客動向・売れ筋 等
                              オフィスフィード
EC系データ                        バック                                   業務日誌・ブロ
                                   各種分析結果                APOSTOOL
   売上デー                                                             グ
タ
                                   レベル別閲覧
   会員デー           自動レポート閲
タ                 覧                  経営層向け
   配送デー                               マネージャ向
タ                                        け
                              手動レポート   一般社員向け
楽天データ
Amazonデータ

                                        生産管理        従業員支援
                        最適化             在庫管理
                                                 経営者支援
ビッグデータ活用のまとめ
• サービス工学の一つのアプローチ:
  「サービス現場で生成される大規模データ活用
  」と「現場での情報収集と提示」

• 「利用者セグメント」と「状況」により場合分
  けされた層別の分析
  → 生活者行動分析の高精度化

• コト=5W1Hを含めた複雑なダイナミクスの理解
  へ
• 包括的データに基づく全体システムのモデリン
業務支援ツールへの拡張(医薬看護介護も含む
                 )

                                                              業務プロセスの可視化
                                                 60.0                             100%
                                                 50.0                              90%     73.1%    55.2%
   看護実施(2011/5/23)                               40.0                              80%




                                            分)
                                                 30.0                              70%




                                           (
作業名:




                                                                             %)
                                                 20.0
       介助                                        10.0
                                                                                   60%




                                                                          比率(
                                                                                   50%                      非
                                                  0.0
                                                                                   40%                      直




                                                            片付け
                                                            声掛け
                                                                                                    44.8%




                                                        その他の処置
                                                           ル測定

                                                          記録作成



                                                          更衣介助
                                                          備品確認
                                                             連絡

                                                             移動




                                                             消毒
 開始時刻        終了時刻                                                                  30%

                       新人・メンバー                                                     20%     26.9%




                                                         準備・
                                                        バイタ
                                                                                   10%
                                                                                    0%
対象利用者                             行動時点記録                                                 プロセス変更前    変更後



 基本情報                                              作業内容の可視化           直接関与/
電子カルテ呼び出し機能:                                              品質          非直接関与時間の可視化
                                                          誘導          6
                                                          6
ナースステーション アラート情報                                          5           5
                                                          4           4
                                                          3
                                                          2
業務日誌入力機能                                   移乗介助           1     声掛け
                                                                      3
                                                                      2
                                                                      1
                                                                                   速さ          強さ     丁寧さ
                                                         排泄介助
        入力画面                                                                      スキルの可視化
                      記録ツール        リーダー                 作業の評価
                     (iPhoneなど)

「サービス現場」における人の活動(ソーシャルダイナミクス)を支援する情報技術
                                      分析ツールキッ                     制御モジュー
  顧客接点支援端末           時空間データベース
                                         ト                           ル

をパッケージ化、提供予定 (佐賀大学, 長崎大学病院、小児歯科学会他)
タブレット端末による看護業務見える
          化
• 7’ Androidタブレット+看護支援アプリ.
• バーコードスキャナー+WiFiアクセスポイント

による操作履歴をデータベース化して、業務分析




 Android tablet   Micro-server   Bar-code scanner
コミュニティ参加型サービス工学
(ホールシステムズアプローチの援用)
少子高齢化時代:コンパクトシティのための
       新規サービス創成基盤の確立へ
                                    利
   新規サービスの成長が困                      用    成長性・生産性が低
                                    頻
   難                                度    い                   高級デパー
              地域の                   低                          ト
              専門店
                                          地域の
                                                         高級店
                                           名店
                    救急病院
                                         かかりつけ
                                高付加価値化                  全国的名医
              地域の                          医
             小規模店
                                                 多
                     髙     大規                    店
 ロイヤリティ低・日用                                            ロイヤリティ高・日用性
                     頻     模化     総合病院           舗
     性大                                                     低
                     度                           化
 (顧客流動性が高い)          化                           ・      (顧客流動性低)
                                  ショッピ    多様化
                                  ングモー           イ
                                    ル            ベ   ニーズの多様化、多
サービスは同質・                                         ン   店舗化、分散化への
         チェーンスト                                  ト
地域性が大・     ア                    パーソナライズ          出   対応が必要!
需要予測が重要!                                         店 ハイサービスか
                                                     つ、
                    健康サービ           利
                                                  ワンストップサー
     地域密着型
      スーパー
                      ス
                                    用                ビス
                                         訪問医療介護     共有サービス
                                    頻               ステーション     屋台・配食
                                    度
    METI委託事業(2008〜2011)             高            新たなサービス創成基盤
    (既存サービス用の支援技術基盤)
(2) 実証拠点整備
      気仙沼五右衛門が原仮設住宅
                        「技術支援トレーラ」1台の運用・管理は産総研にて
                         実施。
                        全トレーラの設置に関する規制や国、関係組織との調
                         整は、「産総研 スマートライフ コンソーシアム」
                         が担当。

                                仮設住宅エリア
浄化槽コンテナ
  ※帝人


          技術支援トレーラ

                     多目的支援トレー
                        ラ
                     (仮設診療所等)

                                物販・支援トレー
                                   ラ
 「物販・支援トレーラ」については、コン
  ソーシアムが市に無償貸与契約を結び
 市より公募をかけ、物販支援の運用業者を募
  る。
トレーラーハウスの運用
    • トレーラーハウス3棟を設置
     – 1: 物販、カフェスペース
     – 2: 多目的室
     – 3: 研究者居住・ワークスペース
地域内サービス行動観測・分析技術
                    どこで、どんな時、ど
         現場を支援する        んな
         アプリやサービス   ニーズが生まれている
         設計に活用      かを動的に分析・モデ
                        ル化

                       カード認証機

ありがとうカード                         サーバー

仮設住民カー
ド
としてデザイ
(裏面にバーコード)
ン




                                  55
「被災後の子どもの心の支援に関する研究
          」
   イベントを通じた支援情報サービスと分析




子ども
イベントなど
での相談会



         気仙沼仮設商店街
         南町Cadocco 12/8,23   56
今後の展開:「社会・コミュニティ参加型工
                   学」
 大規模データからの計算モデル構築と活用技
• “Data to Action” 術
  具体的行動につながる『計算モデルの活用』のために
• サービス現場の『インタラクション』を通じたデータ収集
• 実社会の中のダイナミクスとして持続させる仕組み化
• コトのモデル化→共創的課題解決、社会参加を促す仕組み
  へ
       モデル化(計算モデル       シミュレーション
           化)

   モデル化
               大規模データ            適用
(カテゴリ・コンテク                  (サービス・システム再
    スト         の活用技術
                                設計)
 ・ダイナミクス)


                現場観測
             (生活現場への埋込)              57

Weitere ähnliche Inhalte

Ähnlich wie Ym20121122

第8回関西CV・PRML勉強会(Meanshift)
第8回関西CV・PRML勉強会(Meanshift)第8回関西CV・PRML勉強会(Meanshift)
第8回関西CV・PRML勉強会(Meanshift)Yutaka Yamada
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)Kota Matsui
 
第1回R勉強会@東京
第1回R勉強会@東京第1回R勉強会@東京
第1回R勉強会@東京Yohei Sato
 
プログラミング模擬授業20180724
プログラミング模擬授業20180724プログラミング模擬授業20180724
プログラミング模擬授業20180724義広 河野
 
パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰sleipnir002
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知Chika Inoshita
 
オープンなデータベースを利用した行動計画提案に関する研究
オープンなデータベースを利用した行動計画提案に関する研究オープンなデータベースを利用した行動計画提案に関する研究
オープンなデータベースを利用した行動計画提案に関する研究Fumihiro Kato
 
機械学習と深層学習の数理
機械学習と深層学習の数理機械学習と深層学習の数理
機械学習と深層学習の数理Ryo Nakamura
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習Seiichi Uchida
 
テーブル・テキスト・画像の反実仮想説明
テーブル・テキスト・画像の反実仮想説明テーブル・テキスト・画像の反実仮想説明
テーブル・テキスト・画像の反実仮想説明tmtm otm
 
【SSII2015】人を観る技術の先端的研究
【SSII2015】人を観る技術の先端的研究【SSII2015】人を観る技術の先端的研究
【SSII2015】人を観る技術の先端的研究Hirokatsu Kataoka
 
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術Yoshihiro Mizoguchi
 
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Yuya Unno
 
データ同化でパラメータ同定.PPTX
データ同化でパラメータ同定.PPTXデータ同化でパラメータ同定.PPTX
データ同化でパラメータ同定.PPTXTatsuyaKatayama
 

Ähnlich wie Ym20121122 (20)

bigdata2012ml okanohara
bigdata2012ml okanoharabigdata2012ml okanohara
bigdata2012ml okanohara
 
第8回関西CV・PRML勉強会(Meanshift)
第8回関西CV・PRML勉強会(Meanshift)第8回関西CV・PRML勉強会(Meanshift)
第8回関西CV・PRML勉強会(Meanshift)
 
Deep learning入門
Deep learning入門Deep learning入門
Deep learning入門
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
 
第1回R勉強会@東京
第1回R勉強会@東京第1回R勉強会@東京
第1回R勉強会@東京
 
ma99992006id365
ma99992006id365ma99992006id365
ma99992006id365
 
プログラミング模擬授業20180724
プログラミング模擬授業20180724プログラミング模擬授業20180724
プログラミング模擬授業20180724
 
パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰
 
第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知第8章 ガウス過程回帰による異常検知
第8章 ガウス過程回帰による異常検知
 
オープンなデータベースを利用した行動計画提案に関する研究
オープンなデータベースを利用した行動計画提案に関する研究オープンなデータベースを利用した行動計画提案に関する研究
オープンなデータベースを利用した行動計画提案に関する研究
 
機械学習と深層学習の数理
機械学習と深層学習の数理機械学習と深層学習の数理
機械学習と深層学習の数理
 
機械学習とこれを支える並列計算 : 並列計算の現状と産業応用について
機械学習とこれを支える並列計算 : 並列計算の現状と産業応用について機械学習とこれを支える並列計算 : 並列計算の現状と産業応用について
機械学習とこれを支える並列計算 : 並列計算の現状と産業応用について
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習
 
テーブル・テキスト・画像の反実仮想説明
テーブル・テキスト・画像の反実仮想説明テーブル・テキスト・画像の反実仮想説明
テーブル・テキスト・画像の反実仮想説明
 
【SSII2015】人を観る技術の先端的研究
【SSII2015】人を観る技術の先端的研究【SSII2015】人を観る技術の先端的研究
【SSII2015】人を観る技術の先端的研究
 
15min nov25
15min nov2515min nov25
15min nov25
 
17th cvsaisentan takmin
17th cvsaisentan takmin17th cvsaisentan takmin
17th cvsaisentan takmin
 
行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術行列計算を利用したデータ解析技術
行列計算を利用したデータ解析技術
 
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
 
データ同化でパラメータ同定.PPTX
データ同化でパラメータ同定.PPTXデータ同化でパラメータ同定.PPTX
データ同化でパラメータ同定.PPTX
 

Ym20121122

  • 1. ベイジアンネットと確率的潜在クラス分析 による行動履歴データからの計算モデル構築 本村 陽一 (独)産業技術総合研究所 サービス工学研究センター 副研究センター長 (デジタルヒューマン工学研究センター兼務) 統計数理研究所客員教授 東京工業大学知能システム科学専攻 連携准教授
  • 2. 背景:「モノ」から「コトへ」 車 vs 家族で のドライブ クリスマスプレゼント vs クリスマスパ ーティ 携帯電話 vs 楽しい会 話 似合う洋服 vs 良い第一 印象 映画DVD vs 感動
  • 3. モノづくりからコトづくりの時代へ • 状況依存性のある人々の行動や経験価値 • 一人十色とも呼ばれる複雑化した消費者の異質性 • 変動する外的環境のもとでの不確実性の予測と制 御 などへの対応が時代的にも重要となっている 3
  • 5. 人が入る系(システム)の研究 制御対象としてのシステムの中に人を含める。 →全体システムの中では人はもっとも不確実 狭義のシステム ヒューマンモデル • 全体システムの中に人のモデル(ヒューマンモデ ル)を入れて最適な動作を設計する→「コト」の 工学研究
  • 6. サービスの科学・工学(モノからコト へ) The unified service theory The unified service theory (Sampson 2006) Service can be characterized by Users’ feedback サービス現場 利用者 Inputs 提供者 実社会 経営者 Production Suppliers users 日常生活 process inputs outputs How can we realize input from users ?
  • 7. サービス工学:サービス(価値共創)システム (サービス場面の人々の活動を対象としたシステム) 「モノの伝達」から「コトの伝達」へのパラダイムシフト 顧客接点 提供者(企業) Point of Service 受容者(顧客) 製品設計 製品利用 サービス利用 サービス設計 バックヤード フロントヤード 購買行動 日常生活 価値・評価・ライフスタイ サービス現場(顧客接点)での相互作用(ダイナミクス) を観測・予測・制御するために大規模データを活用する 大規模データを通じた人々の活動:社会のシステムダイナミクス(オートポイ エーシス)
  • 8. 共創的コトづくりのために: サービスシステムダイナミクスの計算モデル化 サービスデザイン 生活者の計算モデル化 最適化 と 情報サービス シミュレーション To be 支援技術 大規模・大量 のデータ POSデータ アンケートなど As is からのモデル化 サービス現場 サービス活動中に 実社会 利用者 人間行動 取得できるよう実 観測技術 験計画されたデー 提供者 タ 日常生活 経営者 データ収集
  • 9. 大規模データ活用技術 • ID付POSデータなど大量データが蓄積 • 数千人規模のアンケートも容易に実施可能 • ただし、データ分析、データマイニングだけでは 、結果の活用が限定的(従来通りの施策の実施の ため)飛躍的生産性向上に結び付きにくい。 • そこで、大規模データを計算モデル化し、その結 果をITで活用できるようにする。 • 「顧客の見える化」「生活者起点」を促進するた めに Center for Service Research, AIST
  • 10. 生活中の履歴データなどの大規模 データから再利用可能な計算モデル へ 従来の統計(母集団依存性大)  各事例の保存と検索(データベース)  単独の頻度、集計、統計  複数の変数の間の関係(相関、独立性)  ある変数を説明するルール、予測モデル  変数群の依存関係の条件付確率(確率的知識)  因果的構造のネットワーク(計算モデル) 有用な知識(再利用性大) 集めたデータの説明から、そのデータ以外にも成り立つ知識、 すなわち過去の経験から、『次』に活かせる知識へ!!
  • 11. 構造を表す計算モデル:ベイジアン ネット 和文書籍 ベイジアンネットワーク技術:東京電機大学出版局(本村・岩崎) ベイジアンネットワーク概説:培風館(繁桝・植野・本村) 条件付確率: P(目的変数| 説明変数) 条件付確率 P(X3|X1,X2) X1 X3 X5 条件付確率 P(X4|X2) X2 X4 X2 0 1 X4 0 0.8 0.4 1 0.2 0.6
  • 12. ベイジアンネットの学習(モデル 構築) 確率変数の選択 情報量の高い、重要な変数の抽出 グラフ構造の学習 情報量基準による(局所)モデル選択 条件付確率(パラメータ)の 学習 離散確率変数: CPT (cond prob table) 連続変数:パラメトリックモデル 事例の頻度から確率化 のパラメータ学習 or 離散化 P P B B A A {P1 (a1|b1), P2 (a2|b2), …}
  • 13. ベイジアンネットの学習(グラフ構造の探索) X Y ? OR X Y ? Y Ex. Y Ex. n1 3 P1 0.3 n2 4 n3 P2 0.4 : P3 n4 : クロス集計表 P4 n5 条件付確率表 n6 度数|Y, X| = n P5 X xy P6 P(Y|X) = p xy X X,Yに関するクロス集計表 ベイジアンネットの条件付確率表 カイ二乗検定により変数間の 条件付依存性を情報量基準(AIC, MDL) 独立・従属性を判定 により判定しモデルを選択(ベイズ比検定 この検定を一つの子ノード毎に、複数の親ノードに対して繰り返し行う。
  • 14. 確率推論(belief propagation) Observation e+ X1 P(X1|e+) CPT:P(X2|X1) X1 0 1 X2 もっとも単純な場合(基本系) 0 0.8 0.4 Belief(X2) P(X2|X1) 1 0.2 0.6 = P(X2|e+, e-) =P(X2|X1) P(X1|e+) ・ P(X2|X3) P(X3|e-) X2 P(X2|X3) P(X3|e-) X3 Observation e-
  • 15. Belief propagationアルゴリズム Pr( X x) ( x) ( x). U1 …… Ui ( x) u P( X | U u ) UiX (Ui), UX (u ) Ui Xからの出力 (u ) ( x) YjX ( x ), XU Yj Xへの入力 (x) X (x) Xへの入力 XYj ( x) ( x) YkX ( x ), k j XY (x ) YX (x) Xからの出力 XUi (u ) ( x) P( x | U ) UkX (u k ). x k i k i Y1 …… Yj
  • 16. ベイジアンネットの ベイズ的世界観 • ドメインを全て確率変数として表現 • ドメインの状態は各確率変数の同時分布 • 観測可能、決定的な場合を包含 • 末端の変数は事前確率分布を仮定 • 目的:知りたい対象の変数の事後確率分布を計 算 • この時、主要な依存関係のみをグラフとして表 し、モデル化することで記述量、計算量を劇的 に削減。 P(X1,X2,…,Xn) = P(X1|X2)P(X2|…)P(Xn)
  • 17. ベイジアンネットワーク構築・推論ソフト BayoNet (1998:IBIS、AI学会などにて発表) (2003~:商用ソフトとして販売, COMDEX出展) (2005~ 本格的実用化によりソリューションビジネスも提供)
  • 18. ベイジアンネット技術とその深化 • 大規模実データの中から、 ・非線形・交互作用を含むゆるやかな因果的連鎖構 造を自動的に抽出し、 ・計算機上のモデルとして作成し、 ・推論やシミュレーション、制御などに活用できる • 表形式の離散変数(SQL-DB)だけでなく、 ・ センサ、画像、テキスト、電子カルテ、ID-POSデ ータなど、日常で集積されつつある大規模データを 適用可能にする技術研究 BN + テキストマイニング/ 潜在クラス分析 / 特徴抽 出 18
  • 19. 事象指向計算モデル化技術 サービス工学における最適設計ループの実現のため の • 大規模データ(ID-POS, アンケート, 操作履歴, テキス ト) • カテゴリセット抽出(PLSA, クラスタリング, 質的 調査) • 構造・関係モデル構築(BN, 情報量基準) Trident/ POSEIDON APOSTOOL/BayoNet ID-POS 主 • Man-Machine Lifelong Learning(IT+コミュニティの学 時 アンケー 客 ト 習) Log 場 動 テキス ト IT+コミュニティ 顧客セグメント・潜在クラス 5W1Hを反映した → ダイナミクス etc 機能・情緒ベネフィット 構造的計算モデル (サービスシステム
  • 20. 初期課題(企業ニーズ)の例: 顧客のモデル化、顧客理解 (消費者行動選択とプロセスモデル) デジタル 店頭での会員勧誘 メルマガクーポン 接客支援ツール サイネージ 興味ドライバー 来店ドライバー 入店ドライバー 購買ドライバー 実物を見たい 実物を見たい 実感(似合う、機能) 商品情報 買い物の日 フィッティング 揃える(色・デザイン) ノベルティ イベント 素材感 安心(保有・確保) 話題 同行者として 時間がある 接客に惹かれて 季節感 なんとなく ディスプレイに : : : 惹かれて : 購買 入店・閲覧 会員入会 メルマガ受信 来店 リピート ロイヤリティ向上
  • 21. 大規模ID-POSデータの活用事例 – データの件数約数十億トランザクション データイメージ ** ・・ ・ ID-POS:「誰が」「商品」を「どの店舗で」「いつ 買ったか」 • 付加的なデータも加え、因果的な構造としてモデ ル化することで、「どういう理由で」購買したか を推定し、 「もしもこうしたら、どうなる」というシミュレ ーションにも活用できる計算モデルを構築する
  • 22. 潜在クラス分析(pLSI)による顧客ー商品の同時分類 ID-POSデータに基づく購買履歴から顧客と商品群を自動で同時に分類 ・2008年9月から2009年9月までの12カ月分のID-POSデータ ・アンケート対象者3981人と購買回数上位1000商品に関して同時分類 ・確率的潜在意味解析法(PLSI法)の適用により自動的に分類 属カ 計算結果 属カ 計算結果 すテ るゴ カテゴリ数は情報量規準によ 商品1 すテ るゴ 確リ 率に カ カ カ ・ カ り 確リ 率に カ カ カ ・ カ テ テ テ テ テ テ テ テ 顧客1 ゴ ゴ ゴ ・ ゴ 20カテゴリと自動的に決定 ゴ ゴ ゴ ・ ゴ リ リ リ リ リ リ リ リ 1 2 3 ・ 3 1 2 3 ・ 3 属カ すテ 2 カテゴリ1 属カ すテ 2 るゴ 商品2 るゴ 確リ 確リ カ カ カ カ カ カ カ ・ カ 顧客2 率に テ テ テ ・ テ 率に テ テ テ テ ・ ・ ・ ・ ゴ リ ゴ リ ゴ リ ゴ リ ・ ゴ リ ゴ リ ゴ リ ・ ゴ リ 1 2 3 ・ 3 1 2 3 3 属カ 2 属カ 2 すテ すテ るゴ 商品3 るゴ 顧客3 確リ 率に カ テ カ テ カ テ ・ カ テ カテゴリ2 確リ 率に カ テ カ テ カ テ ・ カ テ ゴ ゴ ゴ ゴ ゴ リ 1 ゴ リ 2 ゴ リ 3 ・ ・ ゴ リ 3 0 リ 1 リ 2 リ 3 ・ ・ リ 3 属カ 属カ 2 すテ 2 すテ るゴ 商品4 るゴ 顧客4 確リ 率に カ カ カ カ 顧客と商品を 確リ 率に カ カ カ ・ カ テ テ テ ・ テ テ テ テ テ ・ ・ ・ ゴ ゴ ゴ ・ ゴ 各カテゴリへ分類 ゴ ゴ ゴ ・ ゴ ・ ・ ・ リ リ リ リ リ リ リ ・ リ 1 2 3 ・ 3 1 2 3 3 2 2 推定結果:顧客がある意味カテゴリに属する 推定結果:商品がある意味カテゴリに属する確 確率 推定されたカテゴリ所属確率が最大となったカテゴリへ 率 分類
  • 23. 大規模ID-POS(ジャーナルデータ)と アンケート(マスタデータ)の統合(計算モデル化) 顧客パーソナリティ因子と商品群の関係をPOSデータからベイジアンネット 化 (青い線:各ライフスタイルカテゴリーに対して全商品カテゴリーで得点が高い3商品カテ ゴリー) 既存の ライフスタイルカテゴ 新しい商品カテゴリー (赤い線:各商品カテゴリー内で1番得点が高いライフスタイルカテゴリー) 商品分類 アンケー リー (ID-POSから抽出) ト項目 (アンケートから抽出) 果物自炊的 健康飲料的 野菜 デモグ お手軽夕食的 菓子のお伴的 ラ こだわり消費派 日常行 肉・ 動・生 酒飲み健康的 お手軽栄養的 活時間 魚・ 家庭生活充実派 卵 パン食的 肉不使用自炊的 健康意 冷 識 アクティブ派 しっかり野菜 凍・ 野菜自炊的 的 レト 食に対 ルト する意 おやつ的 和風朝食的 節約消費派 総菜 識 洋風朝食的 おかずもう一品的 飲料 消費傾 水・ 向 堅実生活派 酒類 牛乳・清涼飲料的 見切り品的 パーソ ナリ パパっと消費派 しっかり自炊 日用品的 日用 的 ティ 雑貨 PB的 肉自炊的
  • 24. 利用者の心理特性(アンケート結果)をモデル化したベイジアンネットの例 各商品カテゴリを購入している利用者の解釈 (アンケート回答との関係性 Class06 おやつ的 Class07 洋風朝食的
  • 25. コトの理解(5W1H) • Who: どんな顧客が • What: 何を • Why: なぜ 購入しているか、 についての理解ができる。 (さらにWhen, Where, Howも追加する) さらに、その顧客がどの位来店するかがわ かれば、店舗でのアクションが最適化でき 25
  • 26. 利用者の購買行動を表すベイジアンネットモデル 対象ジャーナルデータを用いて、カテゴリ分類、ID-POS解析、 アンケートデータ解析の結果を統合した、ベイジアンネットワークモデルを構 築した。 ジャーナルデータについてのベイジアンネットワーク (データ数420万件、計算時間約48時間、Greedy サーチ、構造探索スコア: AIC )
  • 28. 来店行動予測モデル→ 需要予測への応用 非対称な分散の構造をモデル化したベイジアンネットによる予測結果の 補正 ・ベースモデルの予測残差に対しベイジアンネットモデル(BNモデ ル)を作成 ・予測外れが大きい変数に対して、予測結果を補正 外れの大きい値に対して 事後確率の期待値を ベイジアンネット構築 予測結果に加算 下ブレ外れの 上ブレ外れの 大きい範囲 大きい範囲 ①上ブレ、下ブレ、両者 (-2σ, -1σ以下) (1σ, 2σ以上) の内 使用する補正の有無を判 30 定 ↓ 20 ②各日の説明変数をBN 10 へ ↓ 0 -200 0 200 400 ③大きな予測外れが起こ 外れの値 る 残差のヒストグラム 外れ方の構造 事後確率を推論 (ベイジアンネットモデ ↓
  • 29.
  • 30. 非対称分散構造モデルによる需要予測補正効果 条件付層別差分モデル(ベイジアンネット)による予測結果の補正 ・補正が必要なブレの大きい日についてのみ、限定的に補正する ・下ブレ、上ブレの判定→ 符号関数ξ(x)をBNでモデル化したものを用いる 上ブレ残差 下ブレ残差 σup σlow 10 20 30 y - z = diff (x) @ å x (x)ks P(x (x)ks | x) k=1,2 0 -200 0 200 400 符号関数ξ(x)は上ブレ(y-z>σ)の時+1, 下ブレ(y-z<σ)の時-1それ以外では0 “セグメント毎予測+BN残差モデル補正”による予測結果の改 ①前年同月同曜日 ②線形予測 善率 ③セグメント毎 ④線形+BN補正 ⑤セ+BN補正 ①からの改善 ②からの改善 平均予測再現率 92.7% 96.2% 96.4% 96.4% 96.4% - - 残差合計 -2835人 -762人 -516人 -555人 -141人 2694人 621人 絶対残差合計 3285人 1599人 1542人 1549人 1501人 1784人 98人
  • 31. 人間の認知評価構造・ 生活行動モデル 楽しい 日常の 時間・空間的に展開し 統計的学習 大量データ 認識モデル 動きが ~だから 好き・嫌い センサ統合 場所が PLSI 怖い・危険 データー統合 SQL DB, etc… ~だから アンケート 状況が ・インタビュー ~だから 笑い・怒り 生成モデル 欲しい・ 買いたい サービス適用 モノが Web, 携帯電話 ~だから SNS, etc… 快適・安心 確率分布を出力 実サービス 再利用可能な計算モデル
  • 32. ベイジアンネットによる顧客モデル化技術 デジタルサイネージへの応用シナリオ デジタルサイネージ 店舗内キオスク端末、 ライフスタイル 提案 携帯、インターネット 生活コミュニケーション促進 大規模 ID-POSデータ データベース (生活満足度向上) と連携 嗜好性予測 顧客セグメント推定・ 認知・興味喚起を行う コンテンツ選択 カテゴリマイニング技術 ベイジアンネット技術 顧客理解・サービス品質の評価
  • 33. リコメンデーションへの応用 ・協調フィルタリング(CF) (ex. アマゾン、アスクル):P(X) ∝∑類似度(u) 購入経 験(u,X) 購買履歴 類似度 ユーザ 他の コンテンツ u ユーザu x ・アスペクトモデル:P(X)= ∑P(X|H)P(H|U) 関心 内容アスペクト コンテンツ H ユーザ H x 構造を持つ確率モデル= ユーザが対象が興味深いと評価する確率を推定して、 その確率の高いコンテンツ(X)を推奨。
  • 35. 例:カーナビでのレストラン選択のモデル (デンソーITLとの共同研究、iPhoneアプリ化) 年齢層 自動車 運転歴 ユーザ層 可処分 所得 食事の好み ユーザー属性 (休日夜) 主客層 メイン レストラン属性 ディッシュ 平均 レストラン 高級感 予算 フランチャイズ カテゴリ 状況 急ぐ 時間 状況 気温
  • 36. • 映画推薦サービスにより集積する大規模データをマーケティングに 活用 (KDDI研究所、松竹との共同研究) 観測・モデル化(状況を入力) auOneラボのサービス 手段→映画館 状況 誰と→恋人と 気分→感動したい 状況 誰と TPOに応じた 「恋人と、 コンテンツ 映画館で、 どんな気分 推薦エンジン 感動したい」 (嗜好性モデル) 感じ方 評価 プロフィール 推薦 感動した 結果 年齢 性別 癒された 好む 確率 デートにぴったりの 映画でうれしい★ コンテンツ情報 「30代、男 性、 ストーリー重 製作国ジャンル 視」 個人プロファイル(年齢、性別等) 過去の履歴情報(視聴、購買等) 数万コンテンツ 数千人アンケート、過去の視聴履歴 (パートナー企業提供) 映画DB など大規模データ収集・嗜好性モデル構築 利用しながらモデル更新(連続・動的最適化) 水平展開 他のサービスにも利用できる再利用可能な計算モデル(知的基盤)
  • 37. 事例2:センサハウス内のライフログ からの掃除行動のモデル化 • 掃除行動実験 ・5人の被験者対象 ・ほぼ同じ状態の部屋を自由に掃除してもらう →5人の行動の違いを見る • 掃除中、思ったこと感じたことを発言してもらう →5人の発言の違いを見る やるぞ! A やだなぁ B
  • 38. Who, Why, How, (Where, When)の理解 行動計測結果とプロトコル分析による欲求構造と 個人属性との間の関係を計算論的にモデル化できた
  • 39. コト:研究対象は生活現場にある 初期の課題解決をしながら 社会実装と研究開発を同時に推進 結果として死の谷とダーウィン の海を先に渡ってしまう 研究開発(基礎から応用ま 社会実装 で) サービス 社会受容 法・制度 認証 合わせて 同時に検討
  • 40. 生活現場での課題解決アプローチ • 現場情報を包括的にデータとして収集 • この時、データを入力すると何かが得られる、実 用的なサービスとして設計することが重要 • 行動変容を促す生活現場での「アクションリサーチ」の 実践 • 現場に介入し、問題解決をはかる仕組み作りを目指す。 • 「現場に入る」ために:初期の解決すべき課題 • 「現場でループをまわす」ために:持続的な観測を可能 に • 「現場でループが回り続ける」ために:解決課題の継続 的探索 40
  • 41. 現場参加型サービス工学 (On-site research) • 目的:現場で起きている良いインタラクションを 促進 • 効果:現場の「知」を見える化し再利用、増幅す る • 成果:現場発の工夫を即、システムへ反映できる 仕組 • 顧客接点のインタラクション支援端末(POSEIDON) • 顧客接点データ活用ツールキット(APOSTOOL)
  • 42. POSEIDON・APOSTOOL: サービスの支援技術 小柴, 竹中, 本村:ステイクホルダー分析と実データに基づく経営者支援システムの開発 人工知能学会社会とAI研究会, 2012年3月 研究奨励賞受賞 「9.こだわりの逸品」画面 へ 店舗スタッフごと の お薦め料理 「 10.食事中、食事後アンケー 「7.スタッフのいちおし」 「8.銀座四丁目のおすすめ」 ト」画面へ 画面へ 画面へ
  • 43. 開発した技術パッケージ 技術: ID有/無データからの顧客・商品分類技術:PLSIを用いた潜在クラス分析, 需要予測コーザルDB,サービス接点でのインタラクション支援技術,など 飲食系のITコンサル企業で活用中 ITベンダ経由で小売企業にて活用中 APOSTOOL POSEIDON (サービス分析機能) (サービス接点インタラクション支援) 顧客分類 需要予測 ・・・ 天候収集・記録 バックヤード 店頭 データ整形・集計 ユーザ (顧客・店長等) APOSTOOL Web-API Trident DB,Webサーバ, (データ収集配信基盤) WiFiルータ,CMS,etc. 組み合わせ自由な機能(API)を使って、ユーザ(店長・マネージャ)のニーズに もとづいて,機能・UI設計,需要予測システムの構築などを実施、提供(共同研究)
  • 44. POSEIDONによる 従来のアンケートの問題解決 • 事実と行動に基づくウソのない回答 →現場に没入、リアルタイム収集 • 母集団と標本集団の一致 • 知覚時と回答時の状況(フレーム)の一致 • サービスを一体化し、操作履歴として自然にデ ータ収集 → 回答率の向上 • 集計速度向上と集計結果をリアルタイム活用 • 従業員やマネージャーが現場で使うメリットも
  • 45. サービス現場における共創的 コミュニティ参加型アプローチ • 外食サービスの例:支援対象のステイク ホルダーを対象にニーズや課題を調査 – 全店長へのアンケート調査 – 複数店長へのインタビュー – 全エリアマネージャへのインタビュー
  • 46. ユーザの具体的要求の抽出(KJ法 ) 発注を自動化・支援 してほしい 予測してほしい シフト組を自動化・支援 店長・調理長側に強い要望 してほしい 正しいシフト組をしたい (金額/量について) 最低・最高ラインが 予測される売上を知りたい どれだけ発注すべきか知 知りたい りたい 年に数度の特殊イベントに シフト組の正否を評価したい どのような対応をしたか どの商品がいつ・どのくらい あとから振り返りたい 予測される客数を知りたい 出そうか知りたい 食材のロスを知りたい 申し送り・振り返りが シフト組の正解を知りたい 簡単にできるようにしたい 品切れ(チャンスロス) 廃棄ロスを知りたい を知りたい 予約管理を効率化したい 店がうまく回った日と, クレームと, そうでなかった日の 席のみの予約客が 予約客・一般客は 店の状態の関係を知りたい 差分を知りたい 何を注文するか知りたい それぞれ別に管理したい 売れ筋・死に筋商品を 知りたい 店の状態を知りたい 昼・夜は別に管理したい フロア別に管理したい 最適なメニュー配置を 商品に対する満足度を 客単価の分布を知りたい 知りたい 満足度を知りたい 売上や客数の傾向を見たい 接客スタッフの忙しさを 知りたい 良いスタッフとそれ以外の 立ち位置(特徴)を知りたい 違いを知りたい 各調理ポジション毎の 現状を知りたい 忙しさを知りたい 評価の高い店の特徴を 知りたい 自店の客層と, 要求 評価の高い店の施策を 他店との相違と知りたい 知りたい 複数の店,地域の傾向を 代表的要求 簡単に比較したい 店の雰囲気に対する満足度を 接客に対する満足度を 筆者らの理解 満足度を知りたい 満足度を知りたい AM側に強い要望
  • 47. 小売サービスにおけるデータ活用支援技術 顧 従業員報告(従業員アンケート・店舗レポート 基本DB関 客 等) 連 顧客行動(閲覧履歴・アンケート 商品情報データ 接 等) 店舗情報データ 点 商品 店舗 POSEIDON レコメンド・ データ データ 支 アンケート結 援 果 POSインタラクション 実店舗 データ メルマガクーポ ECサイト ン POSデータ CRMデータ 時間-空間-意味 ラベル化 マージ済みデー APOSTOOL タ 店舗フィード 加工済みデータ (分析サー バック 売上関連分析結果 ECサイト 時空間意味DB バー) 店舗比較情報 データ 顧客動向・売れ筋 等 オフィスフィード EC系データ バック 業務日誌・ブロ 各種分析結果 APOSTOOL 売上デー グ タ レベル別閲覧 会員デー 自動レポート閲 タ 覧 経営層向け 配送デー マネージャ向 タ け 手動レポート 一般社員向け 楽天データ Amazonデータ 生産管理 従業員支援 最適化 在庫管理 経営者支援
  • 48. ビッグデータ活用のまとめ • サービス工学の一つのアプローチ: 「サービス現場で生成される大規模データ活用 」と「現場での情報収集と提示」 • 「利用者セグメント」と「状況」により場合分 けされた層別の分析 → 生活者行動分析の高精度化 • コト=5W1Hを含めた複雑なダイナミクスの理解 へ • 包括的データに基づく全体システムのモデリン
  • 49. 業務支援ツールへの拡張(医薬看護介護も含む ) 業務プロセスの可視化 60.0 100% 50.0 90% 73.1% 55.2% 看護実施(2011/5/23) 40.0 80% 分) 30.0 70% ( 作業名: %) 20.0 介助 10.0 60% 比率( 50% 非 0.0 40% 直 片付け 声掛け 44.8% その他の処置 ル測定 記録作成 更衣介助 備品確認 連絡 移動 消毒 開始時刻 終了時刻 30% 新人・メンバー 20% 26.9% 準備・ バイタ 10% 0% 対象利用者 行動時点記録 プロセス変更前 変更後 基本情報 作業内容の可視化 直接関与/ 電子カルテ呼び出し機能: 品質 非直接関与時間の可視化 誘導 6 6 ナースステーション アラート情報 5 5 4 4 3 2 業務日誌入力機能 移乗介助 1 声掛け 3 2 1 速さ 強さ 丁寧さ 排泄介助 入力画面 スキルの可視化 記録ツール リーダー 作業の評価 (iPhoneなど) 「サービス現場」における人の活動(ソーシャルダイナミクス)を支援する情報技術 分析ツールキッ 制御モジュー 顧客接点支援端末 時空間データベース ト ル をパッケージ化、提供予定 (佐賀大学, 長崎大学病院、小児歯科学会他)
  • 50. タブレット端末による看護業務見える 化 • 7’ Androidタブレット+看護支援アプリ. • バーコードスキャナー+WiFiアクセスポイント による操作履歴をデータベース化して、業務分析 Android tablet Micro-server Bar-code scanner
  • 52. 少子高齢化時代:コンパクトシティのための 新規サービス創成基盤の確立へ 利 新規サービスの成長が困 用 成長性・生産性が低 頻 難 度 い 高級デパー 地域の 低 ト 専門店 地域の 高級店 名店 救急病院 かかりつけ 高付加価値化 全国的名医 地域の 医 小規模店 多 髙 大規 店 ロイヤリティ低・日用 ロイヤリティ高・日用性 頻 模化 総合病院 舗 性大 低 度 化 (顧客流動性が高い) 化 ・ (顧客流動性低) ショッピ 多様化 ングモー イ ル ベ ニーズの多様化、多 サービスは同質・ ン 店舗化、分散化への チェーンスト ト 地域性が大・ ア パーソナライズ 出 対応が必要! 需要予測が重要! 店 ハイサービスか つ、 健康サービ 利 ワンストップサー 地域密着型 スーパー ス 用 ビス 訪問医療介護 共有サービス 頻 ステーション 屋台・配食 度 METI委託事業(2008〜2011) 高 新たなサービス創成基盤 (既存サービス用の支援技術基盤)
  • 53. (2) 実証拠点整備 気仙沼五右衛門が原仮設住宅  「技術支援トレーラ」1台の運用・管理は産総研にて 実施。  全トレーラの設置に関する規制や国、関係組織との調 整は、「産総研 スマートライフ コンソーシアム」 が担当。 仮設住宅エリア 浄化槽コンテナ ※帝人 技術支援トレーラ 多目的支援トレー ラ (仮設診療所等) 物販・支援トレー ラ  「物販・支援トレーラ」については、コン ソーシアムが市に無償貸与契約を結び  市より公募をかけ、物販支援の運用業者を募 る。
  • 54. トレーラーハウスの運用 • トレーラーハウス3棟を設置 – 1: 物販、カフェスペース – 2: 多目的室 – 3: 研究者居住・ワークスペース
  • 55. 地域内サービス行動観測・分析技術 どこで、どんな時、ど 現場を支援する んな アプリやサービス ニーズが生まれている 設計に活用 かを動的に分析・モデ ル化 カード認証機 ありがとうカード サーバー 仮設住民カー ド としてデザイ (裏面にバーコード) ン 55
  • 56. 「被災後の子どもの心の支援に関する研究 」 イベントを通じた支援情報サービスと分析 子ども イベントなど での相談会 気仙沼仮設商店街 南町Cadocco 12/8,23 56
  • 57. 今後の展開:「社会・コミュニティ参加型工 学」 大規模データからの計算モデル構築と活用技 • “Data to Action” 術 具体的行動につながる『計算モデルの活用』のために • サービス現場の『インタラクション』を通じたデータ収集 • 実社会の中のダイナミクスとして持続させる仕組み化 • コトのモデル化→共創的課題解決、社会参加を促す仕組み へ モデル化(計算モデル シミュレーション 化) モデル化 大規模データ 適用 (カテゴリ・コンテク (サービス・システム再 スト の活用技術 設計) ・ダイナミクス) 現場観測 (生活現場への埋込) 57