Diese Präsentation wurde erfolgreich gemeldet.
Die SlideShare-Präsentation wird heruntergeladen. ×

企業におけるデータ分析プロジェクトと求められるスキル

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Wird geladen in …3
×

Hier ansehen

1 von 23 Anzeige

企業におけるデータ分析プロジェクトと求められるスキル

Herunterladen, um offline zu lesen

2019/11/16に開催された、成城大学データサイエンス教育研究センターシンポジウム (https://www.seijo.ac.jp/events/jtmo42000000rm1j.html)の発表資料です。
企業におけるデータ分析プロジェクトの進み方や、その中で求められるスキル、大学で学ぶと良い内容などについてまとめています。

2019/11/16に開催された、成城大学データサイエンス教育研究センターシンポジウム (https://www.seijo.ac.jp/events/jtmo42000000rm1j.html)の発表資料です。
企業におけるデータ分析プロジェクトの進み方や、その中で求められるスキル、大学で学ぶと良い内容などについてまとめています。

Anzeige
Anzeige

Weitere Verwandte Inhalte

Diashows für Sie (20)

Ähnlich wie 企業におけるデータ分析プロジェクトと求められるスキル (20)

Anzeige

Weitere von Rakuten Group, Inc. (20)

Aktuellste (20)

Anzeige

企業におけるデータ分析プロジェクトと求められるスキル

  1. 1. 成城大学データサイエンス教育研究センター シンポジウム 「人文・社会科学系大学におけるデータサイエンス教育」 企業におけるデータ分析プロジェクトと求められるスキル Nov 16, 2019 Wataru Miura Data Science & AI Dept. Rakuten, Inc.
  2. 2. 2 自己紹介 【氏名】三浦 航 【略歴】 • 2014/03: 東京工業大学大学院総合理工学研究科知能システム科学専攻 • 日本企業100万社の取引ネットワークの解析 • 2014/04 ~ 2018/06: 株式会社ブレインパッド • データ分析を用いた各種受託分析プロジェクトの推進 • 2018/07 ~ 現在: 楽天株式会社 • データ分析を用いた楽天における各種サービスの改善 今日まで一貫して、データサイエンティストとして分析によるビジネス課題の解決に取り組んできた。 本日お話しすること 1. 企業においてデータ分析プロジェクトがどのように進行するのか 2. どのようなスキルがデータ分析プロジェクトで必要とされるのか 3. 企業でデータサイエンスに携わるには大学で何を身につけるべきか
  3. 3. 3 データ分析プロジェクトの進み方
  4. 4. 4 意思決定のためのデータ分析 “例えば、すごく心配性の人に「明日雨降りそうって聞いたけど降水確 率って何%?」と聞かれるとします。「90%と10%だったらどう変わる の?」と聞き返したら、「どっちみち傘を持って行きます」みたいな。 これですと結局、意思決定は変わらないので、分析する必要はないです よね。実は、こういうことって結構あるんですよ。 ですので、分析の依頼があった時にも場合によっては「分析の結果がA だった場合とBだった場合で、意思決定は変わりそうですか?」というこ とは聞きますね。 それで「うーん」みたいな感じだと、その分析はさほど必要ではないと いうことになります。” Ref. 「大げさな分析資料はいらない。メルカリの「意思決定」を支えるデータアナリストの役割」 (https://seleck.cc/1201 , 2019/11/12時点, 太字は発表者)
  5. 5. 5 データ分析の目的はビジネスの課題解決 なので、決してデータ分析自体が目的※ではない。 個人的には、分析結果を上手く活用できた経験はそれほど多くないと感じる。 失敗と感じる一例 • 機器故障の要因分析をしていたが、実運用に向けて故障する機器の予測を求められる • PoC (概念実証)時と運用時の使用データが異なる • 異常検知プロジェクトで、疑似異常データを検出するロジックを構築したが、実際の異常を検知できない • モデルの精度がどれだけ高くても、ビジネスで価値を生み出せない ビジネスの課題解決のためには、どう解くか (分析手法)よりも何を解くのかが重要。 ※最新のAIで何ができるか知りたい!などの技術調査は別。 ビジネスの業務プロセスを理解し、解くべき問題を正しく設定する
  6. 6. 6 分析テーマをどう設定するか 分析テーマをどう設定するかに関しては、業務プロセスを理解した上でユースケース・想定アクションなども 事前に考慮しなければならない。 コールセンターにおけるトランスコスモスの分析事例 【目的】”3カ月後に辞めてしまうであろう、オペレーターを予測” 【分析後】”3カ月後に辞める人を予測できたところで、現場で何をするのか” • 辞める人を引き留める? • 高確率で辞めてしまうなら、前もって別の人を採用する? • 離職の原因が勤怠悪化なら、勤怠悪化の予測モデルを作る?  “退職率の予測値が高い50人以上のオペレーターに対して、毎月スーパーバイザーが面談し、退職の意向有 無を確認しながら、退職理由につながる要因が発生していないかをケアする予防施策” Ref. 「コールセンターの退職予備軍をAIで予測し、半年で離職者を半分にできた理由」 (https://www.itmedia.co.jp/enterprise/articles/1809/05/news001.html, 2019/11/12時点) 目的の見直し
  7. 7. 7 正しく問題設定をするということ 分析の目的によって問題設定は異なり、取りうる分析アプローチも異なる。 天候を分析する場合の例 【目的】天候データから3時間後に傘が必要かどうかを予測したい 天候と傘の必要有無の関係性を示す過去データが (おそらく)存在しないので、問題設定を少し変化させる必要がある。 当然実際の案件はこれほどシンプルではなく、分析力の前に問題設定力が求められる。 • 数学では定理を証明する人が重要なだけではなく、定理を予想する人も同様に重要 • Kaggleの隆盛により問題を解く部分ばかりが注目されているが、そもそも正しい問題設定に落とし込むまでが大変 問題設定 分析アプローチ例 天気が何になるかを予測 他クラス分類 雨が一定以上降るかどうかを予測 二値分類 降水量を予測 回帰 降水量が何mm以上であれば傘をさす、 などの前提の下で二値分類を選択
  8. 8. 8 開発プロジェクトは成功までに 回失敗する、でも決して折れてはならない 分析プロジェクトはPoCで終わってしまうことが多く、昨年頃から失敗に対する知見・共有が増えてきた。 AIプロジェクトを阻む壁 ”3ない問題” (by トランスコスモス) 1. データがない失敗: 分析の目的に合ったデータの重要性に気付き、必要なデータを用意するところからやり直す 2. 分析力がない失敗: 報告してすごい!とはなるものの分析後のアクションに繋がらず、やりたいテーマに取り組み直す 3. 開発力がない失敗: 開発したツールがAI化が最優先になっているため、UIや操作性、業務ルールとの整合性など運用面で 課題が発生 "AIが普及しないのは『データサイエンティストが不足しているから』といわれていますが、それ以前に、「AIに対する理解 や当事者意識がない」という企業が意外と多い" ディープラーニング/機械学習のビジネスフレームワーク「5D」 (by LeapMind) 1. Define: どのようなビジネス効果があるのか、課題の選定 2. Data: データの質と量が揃っているか 3. Develop: 最適なモデルを開発できるか 4. Deploy: 実用環境で実行できるか 5. Drive: システム全体で運用に乗るか • Ref. 「AI開発プロジェクトは成功までに3回失敗する、でも決して折れてはならない」 (https://www.itmedia.co.jp/enterprise/articles/1809/03/news010.html, 2019/11/12時点) 「ディープラーニング/機械学習のビジネスフレームワーク「5D」 (https://leapmind.io/blog/2018/09/10/deeplearning5d/, 2019/11/11時点)
  9. 9. 9 分析プロジェクトにおける の例 自社サービスをデータ分析で改善する上では、分析における問いを立てるために、以下の観点での理解が 不可欠と考えている。 分析プロジェクトを計画する人にとっては、分析面以外にも把握しなければならないことが多々存在する。 3C 今までの経緯 今後のニーズ Customer  事業の業務プロセス、重視するKPI  既存プロダクトのカバー領域・機能  事業ユニット、プロダクトマネージャー からのリクエスト Competitor  他社におけるプロダクト・サービス、PoC などの事例  事業ドメインにおけるデータ分析・研究 のトレンド Company  部署における過去のPoC、プロジェクト  各事業・サービスで取得可能なデータ  会社、部署の方針  貢献可能なROI
  10. 10. 10 データ分析プロジェクトの進み方 大別して、プロジェクトにはMLシステム構築がゴール、意思決定・施策実施がゴールの場合の2通りが存在。 上記以外のパターンも無論存在するが、いずれにせよデータ分析をしているのはプロジェクトのごく一部。 分析面以外でもつまずくポイントは多数存在し、プロジェクトにはデータサイエンティスト以外の人材も必要。 構想 PoC (概念実証)  ヒアリング  スコープ・要件定義  技術検証  ユースケース/ROI検討  プロジェクト計画策定  データ収集/設計  モデル作成/評価  レポーティング  ロジック改善 開発 運用  プロトタイプ開発  システム設計  実装  機能追加  運用・保守  精度モニタリング 機械学習システム構築がゴール 施策実施  マーケ施策実施  KPIモニタリング  自動化 意思決定・施策実施がゴール ↑ データ分析のメイン
  11. 11. 11 機械学習システム構築におけるエンジニアリング 機械学習システムは技術的負債になることが多く、2014年頃からアンチパターンについて議論されてきた。 その文脈においても、機械学習システム内でアルゴリズム関連のコード部分は少ないことが指摘されている。 Ref. D. Sculley et al., “Hidden Technical Debt in Machine Learning Systems”, NIPS 2015.
  12. 12. 12 分析プロジェクトで必要とされるスキル
  13. 13. 13 データサイエンティストに対する需要は高い Glassdoor社による求人の格付け (給料の中央値、求人数、満足度)によると、米国では2016年から4年連続でデータ サイエンティストがトップ。  分析ツールの民主化やAIの認知拡大により、分析をする人は増えてきたという印象  今だに人気がある一方で、個人的には分析だけする人が増え、やりにくくなってきていると感じる • Ref. “Best Jobs in America | Glassdoor” (https://www.glassdoor.com/List/Best-Jobs-in-America-LST_KQ0,20.htm, 2019/11/12時点) Best Jobs in America for 2019
  14. 14. 14 データサイエンティストに求められるスキル ビジネス、サイエンス、エンジニアリングのスキルが必要とされるが、多くの人はデータサイエンティストと 聞いてサイエンス的な部分 (分析できる)を想像しがち。だが各スキルを組織的にカバーする必要がある。 Ref. データサイエンティスト協会プレスリリース (2014.12.10) (http://www.datascientist.or.jp/files/news/2014-12-10.pdf) 多くの人がイメージする データサイエンティスト 求められるスキルセット 各フェーズで必要なスキルセット
  15. 15. 15 組織でスキルを分担してカバーする データサイエンティストしかいない組織は、FWだけでサッカーをして負けるのと同じ。 分析プロジェクトを成功させるためには、各ポジションがバランス良く必要となる。 AS ISの状態でありがちなこと • FW (サイエンス): 「シュートを打たせろ」「パスをくれ」など注文が多く、個人技など勝利に直結しないプレーも多い ある程度実績を積むとフリーで移籍する • MF (エンジニアリング): FWのコードを引き受けて苦労する人、カバーするエリアがフルスタックで広くなりがち • DF (ビジネス): 話題になりにくい上に、チームによっては必要性も認識されにくい 人がいないとFWでスキルのある人がやることになり、FWにも多少は守備をしてほしいと思っている AS IS TO BE
  16. 16. 16 分析プロジェクトに必要なポジション 企業でデータ分析を行うことは、レストランで料理を提供することに似ている。 それほど各ポジションの境界が明確ではなく、特にオーダーを取る部分は曖昧になりがち。 ※ Ref. 「データ分析を始める時に必要なのはデータサイエンティストのような専門家ではなく『アナリティクスディレクター』である」 (https://analytics-and-intelligence.net/archives/3578, 2019/11/12時点) レストランに おける役割 ポジション プロジェクトに おける役割 オーダーを取る • データサイエンスコンサルタント • アナリティクスディレクター※ • データサイエンティスト, etc. • 分析プロジェクトのPM • 相手の要求を理解した上で、分析方針をデザイン しプロジェクト計画を策定 料理を作る データサイエンティスト • 統計・機械学習などを用いて分析を実施 前処理した食材を料理人 に提供する データエンジニア • データの理解 • データパイプラインの構築 • データマート作成などデータ環境の整備 調理器具を料理人に提供 する 機械学習エンジニア • 分析基盤・環境の構築 • 分析ツール・ライブラリの整備 料理をレシピとして、 いつでも提供可能にする 機械学習エンジニア • 機械学習システムの構築
  17. 17. 17 におけるポジションの一例 DeNAでは分析プロジェクトで必要なポジションが細かく定義されている。 Ref. 「運用中のゲームにAIを導入するには〜プロジェクト推進・ユースケース・運用〜 [DeNA TechCon 2019]」 (https://www.slideshare.net/dena_tech/ai-dena-techcon-2019)
  18. 18. 18 大学で学ぶべきデータサイエンスのスキル
  19. 19. 19 データサイエンス分野におけるスキル領域 各企業で求められるスキルが異なることもあり、2017年に発表されたデータサイエンティスト協会のスキル チェックリストは、2015年の422項目から457項目に増加し、データサイエンス分野においても多岐にわたる。 Ref. 「データサイエンティスト協会スキル委員会4thシンポジウム講演資料」 (https://www.slideshare.net/DataScientist_JP/4th-81178634)
  20. 20. 20 大学で何を身につければ良いのか 結局のところビジネスでデータサイエンスに関わる上では、スキルの本質的な部分は大学での研究・ゼミに共通する部分が 多いと感じている。またデータサイエンティストに必要なスキルは多様で、全てを大学で身につけるのは不可能に近い。 まずは研究・ゼミに取り組み、数学的素養なども含めた基礎体力を養うのが良いと考えている。 共通するスキルの一例  コミュニケーション 【ビジネス】分析について詳しくないクライアントのリクエストを聞く、分かりやすく説明する力が必要 【研究ゼミ】他分野の人の発表を聞く、非専門家に分かりやすく説明する  ドメインに対する理解 【ビジネス】適切な分析をするために、ドメイン知識・事例を理解する 【研究ゼミ】研究分野を把握するために、論文をサーベイする  解くべき問いの設定 【ビジネス】ビジネスの課題を解決するために、想定アクションを考慮し問題設定 【研究ゼミ】分野の背景を把握した上で、新規性・重要性を考慮し研究テーマを選択
  21. 21. 21 大学で何を身につければ良いのか ガートナー社は2018年に、シチズンデータサイエンティスト (AutoMLなど分析ツールを用いて高度な分析を活 用する、主要な職務はデータサイエンスではない人々) と呼ばれる、データサイエンティストを補完する存在 が今後増加すると予想。 分析ツールが今後アルゴリズム選択も行うとしても、1. データサイエンスで何ができる/できないか、2. 分析プロセスを把握 するために、自分が設定したテーマで分析サイクルを一度回しておけると良い。 Ref. “Citizen Data Scientists and Why They Matter” (https://blogs.gartner.com/carlie-idoine/2018/05/13/citizen-data-scientists-and-why-they-matter/, 2019/11/12時点) “Machine Learning Algorithm Cheat Sheet for Azure Machine Learning designer” (https://docs.microsoft.com/en-us/azure/machine-learning/algorithm-cheat-sheet, 2019/11/12時点) ※Microsoftサイトより一部抜粋
  22. 22. 22 まとめ • 企業におけるデータ分析プロジェクトでは、正しい問題設定も含め、実際の分析以外の比重が大きい • データ分析プロジェクトで求められるスキルはデータサイエンスだけではなく、組織・プロジェクト内で バランス良く補完し合う必要がある • 大学では研究・ゼミにきちんと取り組み、かつ一度は分析サイクルを回せると良い

×