SlideShare ist ein Scribd-Unternehmen logo
1 von 37
Downloaden Sie, um offline zu lesen
データサイエンティストの
つくり⽅方
PFIセミナー 2012/09/13
株式会社Preferred Infrastructure
リサーチャー&Jubatusチームリーダー
⽐比⼾戸  将平
⾃自⼰己紹介
l  ⽐比⼾戸将平(HIDO Shohei)
l  TwitterID: @sla
l  専⾨門:データマイニング、機械学習
l  経歴:
l  2006: 京都⼤大学⼤大学院情報学研究科修⼠士卒
l  ⽊木構造データマイニング
l  2006-2012: IBM東京基礎研究所データ解析グループ
l  機械学習(特に異異常検知)のアルゴリズム研究開発
l  お客様案件でデータ解析プロジェクトに従事
l  2012-: 株式会社プリファードインフラストラクチャー
l  ⼤大規模オンライン分散機械学習基盤Jubatusチームリーダー
2
「データサイエンティスト」って、なに?
l  2010年年まではほとんど⽬目にしなかった単語
l  2011年年から急激に増加
l  さらに2012年年は現時点で去年年の倍のヒット数
3
0
500
1000
1500
2000
2500
3000
3500
データサイエンティストの検索索ヒット数(Google)
最近増えているデータサイエンティスト情報
(特に海外から)
4
http://www.computerworld.jp/topics/1468/204704/
http://www.computerworld.jp/topics/1468/204705/
http://www.computerworld.jp/contents/204769
⼀一⽅方、データサイエンティストに対する懐疑的な声
5
データサイエンティストのイメージ
6
デ
ー
タ
サ
イ
エ
ン
テ
ィ
ス
ト
的
に
この発表の⽬目的
l  データサイエンティストの真実
l  この単語にまつわる誤解や過度度の期待を解く
l  データサイエンティストの仕事
l  そういう役割の⼈人が今後増えるという⾒見見通しを明らかにする
l  データサイエンティストのつくり⽅方
l  どうやったらいいデータサイエンティストになれるのか
7
データサイエンティストの真実
9
Data science ≒ Applied statistics
Data scientist ≒ Applied statistician
海外での定義
応⽤用 統計
応⽤用 統計家
Data science: 英語Wikipediaにおける定義
l  Data science: 複合領領域
l  データ⼯工学、科学的思考、数学、
統計学、先端コンピューティング、
可視化技術、ハッカー精神、
特定ドメインでの経験
l  Data scientist: practitioner
l  Data scienceの実務家
l  複雑なデータの問題を解決する⼈人
l  通常は上記のうち2-3の専⾨門家
l  残りのうち2-3に熟練している
l  ⼀一⼈人では全領領域でエキスパートにはなれない
l  Data scienceはチームで補い合って実践すべき
10
http://en.wikibooks.org/wiki/Data_Science:_An_Introduction/
,"
20%
,"
20%
,"15%
,"5%
,"
25%
,"15%
Data scienceの起源:
統計学の範囲を広げるための新カリキュラムとして
l  William S. Cleveland, “Data Science: An Action Plan for Expanding
the Technical Areas of the Field of Statistics”, 2001.
l  重視すべきこと
l  (統計の)アルゴリズム研究だけに没頭しない
l  実問題に当たって実データに触れる
l  発達した計算機のデータ処理理能⼒力力をフル活⽤用する
11
http://cm.bell-labs.com/cm/ms/departments/sia/doc/datascience.pdf
Data scientist: math and statistics
l  “For Today’s Graduate, Just One Word: Statistics”, NYT, 2009
l  GoogleのHal Varian「次の10年年で最もセクシーな職業は統計」
l  データ活⽤用「能⼒力力」がいろんなビジネスでボトルネックに
l  新世代の統計家が豊富なコンピュータ処理理能⼒力力と⾼高度度なモデリング
⼿手法を使ってそれらを解決しようとしている
l  例例:Web, Netfilx Challenge, IBMのBAOサービス
l  “What is data science?”, O’Reilly, 2010
l  Data products and Data-driven apps
l  CDDBが最も初期のData product
l  その後はGoogle周辺を中⼼心に爆発的に増加
l  「データサイエンティストに向いてるのは
コンピュータサイエンスでなく物理理の⼈人」
12http://radar.oreilly.com/2010/06/what-is-data-science.html
http://www.nytimes.com/2009/08/06/technology/06stats.html
“The ability to take data — to be able to understand it,
to process it, to extract value from it, to visualize it, to
communicate it — that’s going to be a hugely
important skill in the next decades.”
— Hal Varian, Google
13
Data scientist: for “data jiujitsu”
データサイエンス ≒ Data science
国内での定義
データサイエンティスト ≒ Data scientist
or Rによるデータ分析
or ビッグデータ分析者
データサイエンス: ⽇日本語Wikipediaに項⽬目なし
l  柴⽥田⾥里里程教授(慶応⼤大学数理理科学科)
l  データサイエンス=統計+データベース+データマイニング
l  「本来データの科学であった統計学も確率率率論論を基礎とする近代統計
学に⾐衣替えするにつれ、形式的な論論理理を展開するための道具となっ
てしまった」
l  「いま再び、データサイエンスの枠組みでその輝きを取り戻しつつ
あります。」
l  「いまではデータの構造や作⽤用、その成分や性質を研究する「デー
タサイエンス」も⽴立立派な科学の⼀一分野です。」
l  関連書籍:共⽴立立出版「データサイエンス」シリーズ
15
http://www.st.keio.ac.jp/learning/0611.html
データサイエンスがRと結びつきやすい理理由
l  ⾦金金明哲教授(同志社⼤大学⽂文化情報学部)
l    財団法⼈人統計情報研究開発センター  ⽉月刊専⾨門誌  ESTRELA連載
「フリーソフトによるデータ解析・マイニング」
2003年年8⽉月号から2009年年7⽉月号まで系72回
l  関連書籍:共⽴立立出版「Rによるデータサイエンス」
l  関連書籍:森北北出版「Rで学ぶデータサイエンス  データ解析の基礎
から最新⼿手法まで」全20巻中13巻刊⾏行行
16
データサイエンティスト=ビッグデータ分析者?
l  海外:本来Data scientistとBig dataは別系統から⽣生まれた概念念
l  Big data→データが⼤大量量かつ⾼高速に⽣生まれる現場から
l  Wikipediaには”Data science”に関する記述は無い
l  Data scientist→センサと計算機の発展がキー、サイズは副次的
l  ここ数年年でBig dataと結び付けられたとある
l  Data scienceの困難さが際⽴立立つのがBig data環境だからだろう
l  国内:ビッグデータ流流⾏行行直後にデータサイエンティストの輸⼊入
l  最初からデータサイエンティストはビッグデータと不不可分
l  バズワード化したビッグデータに対する違和感や批判の眼差しが
データサイエンティストにもそのまま注がれている
17
http://www.computerworld.jp/topics/617/201766/
(理理想的な)データサイエンティストの真の姿
データサイエンティストの仕事
データサイエンティストのお仕事
1.  業務でデータを使って改善できそうなところを探す
2.  改善のための仮説を⽴立立てて提案を作る
3.  社内で調整してプロジェクト化する
4.  データを収集する・データを受け取る
5.  データをクリーニングする
6.  データを可視化する
7.  データを集計する
8.  データマイニングや機械学習を⽤用いる
9.  結果を元に再調整や再実験を繰り返す
10.  結果を可視化してレポートにまとめる
11.  レポートを関係者と共有する
12.  結果を元に有効と思われるビジネスアクションを取る
13.  ビジネアクションの効果を測定して検証する
14.  (可能であればこれらをPDCAサイクルのように回す)
データサイエンティスト
うおおおおおお
ここがツライよデータサイエンティスト(1)
プロジェクトが開始できない
いくら儲かるかわからないと
投資もデータも出せないよ。
で、データ分析すると
どれくらい売上アップするの?
データサイエンティスト マネージャー
それは実データで
やってみないと…
ここがツライよデータサイエンティスト(2)
データ⼊入⼿手の壁が超えられない
…そこをなんとか…
機密情報だからなー
個⼈人情報保護もあるし。
そんなデータないよ。
え?新しく取れ?
(⾯面倒だな…)
データサイエンティスト
マネージャー
現場社員
ここがツライよデータサイエンティスト(3)
データが汚い
すいませんデータが変です
分析できたろ?
そんなはずないけどな
…あーなるほど…
まぁなんとかしてよ
データサイエンティスト
マネージャー
現場社員
いえ、あの、まだです
ここがツライよデータサイエンティスト(4)
データ分析の利利害調整ができてない
お⼿手数おかけしますが
データ準備お願いします
早くやれって!
(査定UP〜~♪)
え、忙しいし無理理だよ
(俺にメリット無いし)
データサイエンティスト
マネージャー
現場社員
なんか難しいみたいですが…
ここがツライよデータサイエンティスト(5)
必殺技が効かない
いろいろ調整しましたが
どうやらそのようで…
何これ?フリーのツールで
やったときより悪いじゃん!?
データサイエンティスト
マネージャー
つまり無駄ってこと?
ここがツライよデータサイエンティスト(6)
必殺技が使えない
いや、たぶんLIBSVM
使ったほうが精度度が…
じゃあWekaの決定⽊木で
いろいろ試してやってみてよ
データサイエンティスト
マネージャー
SVMは何で良良くなったか
わからないじゃん!
働くデータサイエンティスト:
Twitterプロフィールから
l  海外
l  Data Scientist @ Twitter x 3
l  Principal Data Scientist @LinkedIn
l  Data Scientist @Cloudera, creator of Crunch
l  Data scientist, blogger, and R evangelist at Revolution Analytics
l  国内
l  DeNA
l  J!NS
l  Albert
l  ( チーフデータマエショリスト @ Treasure Data )
⽇日本で最もデータサイエンティストが
活躍している企業はソーシャルゲーム企業(1)
l  “2100万⼈人会員「モバゲー」はデータマイニングの宝の⼭山”
l  Hadoop、Mahout、R⾔言語などを駆使してユーザー分析
l  データサイエンティストとして外部で活躍する社員
http://rikunabi-next.yahoo.co.jp/tech/docs/ct_s03600.jsp?p=001829
⽇日本で最もデータサイエンティストが
活躍している企業はソーシャルゲーム企業(2)
l  “「個⼈人のセンスよりも数千万⼈人のデータの⽅方を信じる」、
これがGREEの作り⽅方” (CEDEC 2011)
l  少⼈人数チームでPDCAを徹底的に回すデータ駆動ゲーム開発
l  GREE Analyticsというデータマイニングツール
http://gigazine.net/news/20110914_gree_howto_cedec2011/
将来的に:Chief Analytics Officerと
アナリティクス部⾨門の出現
設計
営業
品質管理理
保守作業
業務改⾰革
経営
研究開発
財務
製造
IT
CAO
アナリティクス部⾨門
l  全社横断的なデータ活⽤用に権限と責任を持つCAO
l  その実⾏行行部隊としてのアナリティクス部⾨門(IT部⾨門とは別)
理理想的なデータサイエンティスト集団:
⼤大阪ガス(株)情報通信部情報ソリューションチーム
l  ミッション
l  関連会社含む全組織・全業務・全サービスにおいてデータ分析の
活⽤用機会を探って価値ある分析結果を提供する
l  独⽴立立採算制、構成員10名
http://ci.nii.ac.jp/naid/110008722771
データサイエンティストのつくり⽅方
(理理想的な)データサイエンティストの真の姿
無理理!
データサイエンティスト
データサイエンティストのつくり⽅方(1):
タイプ別に弱点を補う
数学,
20%
統計,
20%
機械学
習やマ
イニン
グ, 15%
Rなどツー
ル, 5%
実データ
処理理,
25%
ビジネス
連携,
15%
理理論論
20%
モデリン
グ⼿手法
20%
計算⼿手法
15%ツール評
価
5%
実データ
処理理
25%
教育⽅方法
15%
タイプ別
l  コンサル型
l  ビジネスコンサルタント
l  BI型
l  KPI設計やダッシュボード
l  研究者型
l  機械学習やマイニングの
修⼠士号や博⼠士号
l  新世代型
l  RやHadoopなどOSSに精通
l  ドメイン型
l  ⾃自企業のデータ分析など
l  必要に応じて万遍ないスキル
0
1
2
3
4
5
統計・機械学
習・マイニング
R/Matlab/
Weka
Hadoop/
NoSQL
DWH/BI/可視
化
コンサル
ドメイン知識識
コンサル型
BI型
研究者型
新世代型
ドメイン型
データサイエンティストのつくり⽅方(2):多様な
スキルを持つデータサイエンティスト集団を作る
0
1
2
3
4
5
統計・機械学
習・マイニング
R/Matlab/
Weka
Hadoop/
NoSQL
DWH/BI/可視
化
コンサル
ドメイン知識識 コンサル型
BI型
研究者型
新世代型
ドメイン型
l  そもそも全部を満たす個⼈人を作ることは不不可能
l  グループとして全部のスキルが揃うように⼈人を集めてくる
まとめ
l  データサイエンティストの真実
l  統計ベースのデータ分析者として正しい⼈人たち
l  データサイエンティストの仕事
l  データが競争優位性の源泉になるという流流れは変わらない
l  データサイエンティストのつくり⽅方
l  タイプに応じて弱点を補う、あるいはグループで補完する
明⽇日から君も
データサイエンティストだ!!
データサイエンティスト

Weitere ähnliche Inhalte

Was ist angesagt?

機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)Satoshi Hara
 
レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方Shun Nukui
 
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用Hiroyuki Masuda
 
PlaySQLAlchemy: SQLAlchemy入門
PlaySQLAlchemy: SQLAlchemy入門PlaySQLAlchemy: SQLAlchemy入門
PlaySQLAlchemy: SQLAlchemy入門泰 増田
 
Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Fumihiko Takahashi
 
How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?Kazuyuki Miyazawa
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...NTT DATA Technology & Innovation
 
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイDeep Learning JP
 
さらば!データサイエンティスト
さらば!データサイエンティストさらば!データサイエンティスト
さらば!データサイエンティストShohei Hido
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピTakahiro Kubo
 
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門KnowledgeGraph
 
第8回Language and Robotics研究会20221010_AkiraTaniguchi
第8回Language and Robotics研究会20221010_AkiraTaniguchi第8回Language and Robotics研究会20221010_AkiraTaniguchi
第8回Language and Robotics研究会20221010_AkiraTaniguchiAkira Taniguchi
 
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...Deep Learning JP
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic DatasetsDeep Learning JP
 
時系列問題に対するCNNの有用性検証
時系列問題に対するCNNの有用性検証時系列問題に対するCNNの有用性検証
時系列問題に対するCNNの有用性検証Masaharu Kinoshita
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用Yoshitaka Ushiku
 

Was ist angesagt? (20)

機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)機械学習モデルの判断根拠の説明(Ver.2)
機械学習モデルの判断根拠の説明(Ver.2)
 
レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方レコメンドエンジン作成コンテストの勝ち方
レコメンドエンジン作成コンテストの勝ち方
 
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
 
PlaySQLAlchemy: SQLAlchemy入門
PlaySQLAlchemy: SQLAlchemy入門PlaySQLAlchemy: SQLAlchemy入門
PlaySQLAlchemy: SQLAlchemy入門
 
Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究
 
How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?How Much Position Information Do Convolutional Neural Networks Encode?
How Much Position Information Do Convolutional Neural Networks Encode?
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
 
BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装
 
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
 
さらば!データサイエンティスト
さらば!データサイエンティストさらば!データサイエンティスト
さらば!データサイエンティスト
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
 
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-02] Federated Learningの基礎と応用
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門
 
第8回Language and Robotics研究会20221010_AkiraTaniguchi
第8回Language and Robotics研究会20221010_AkiraTaniguchi第8回Language and Robotics研究会20221010_AkiraTaniguchi
第8回Language and Robotics研究会20221010_AkiraTaniguchi
 
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
 
時系列問題に対するCNNの有用性検証
時系列問題に対するCNNの有用性検証時系列問題に対するCNNの有用性検証
時系列問題に対するCNNの有用性検証
 
MLOpsはバズワード
MLOpsはバズワードMLOpsはバズワード
MLOpsはバズワード
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用
 

Ähnlich wie データサイエンティストのつくり方

(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方Shohei Hido
 
今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しましたShohei Hido
 
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキルRakuten Group, Inc.
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Shohei Hido
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)Yuya Unno
 
ソーシャルビッグデータ・オープンデータによる社会構造変化の発見
ソーシャルビッグデータ・オープンデータによる社会構造変化の発見ソーシャルビッグデータ・オープンデータによる社会構造変化の発見
ソーシャルビッグデータ・オープンデータによる社会構造変化の発見Masanori Takano
 
データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)Takashi J OZAKI
 
人を動かすデータビジュアライゼーション - データビジュアライゼーションを学問にするには?
人を動かすデータビジュアライゼーション - データビジュアライゼーションを学問にするには?人を動かすデータビジュアライゼーション - データビジュアライゼーションを学問にするには?
人を動かすデータビジュアライゼーション - データビジュアライゼーションを学問にするには?E2D3.org
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Preferred Networks
 
横幹連合サービス科学
横幹連合サービス科学横幹連合サービス科学
横幹連合サービス科学Yuriko Sawatani
 
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性BrainPad Inc.
 
最先端学術情報基盤(Csi)委託事業報告交流会パネル
最先端学術情報基盤(Csi)委託事業報告交流会パネル最先端学術情報基盤(Csi)委託事業報告交流会パネル
最先端学術情報基盤(Csi)委託事業報告交流会パネルNational Institute of Informatics (NII)
 
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方Recruit Lifestyle Co., Ltd.
 
LT データ可視化とd3.js js_cafe_20130908_otanet
LT データ可視化とd3.js js_cafe_20130908_otanetLT データ可視化とd3.js js_cafe_20130908_otanet
LT データ可視化とd3.js js_cafe_20130908_otanet博三 太田
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理Preferred Networks
 
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーションいじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーションcyberagent
 
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形Hiroko Onari
 
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤Shohei Hido
 

Ähnlich wie データサイエンティストのつくり方 (20)

(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方(道具としての)データサイエンティストのつかい方
(道具としての)データサイエンティストのつかい方
 
mlabforum2012_okanohara
mlabforum2012_okanoharamlabforum2012_okanohara
mlabforum2012_okanohara
 
今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました今年のKDDベストペーパーを実装・公開しました
今年のKDDベストペーパーを実装・公開しました
 
企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル企業におけるデータ分析プロジェクトと求められるスキル
企業におけるデータ分析プロジェクトと求められるスキル
 
Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門Jubatus Casual Talks #2 異常検知入門
Jubatus Casual Talks #2 異常検知入門
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
 
ソーシャルビッグデータ・オープンデータによる社会構造変化の発見
ソーシャルビッグデータ・オープンデータによる社会構造変化の発見ソーシャルビッグデータ・オープンデータによる社会構造変化の発見
ソーシャルビッグデータ・オープンデータによる社会構造変化の発見
 
データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)
 
人を動かすデータビジュアライゼーション - データビジュアライゼーションを学問にするには?
人を動かすデータビジュアライゼーション - データビジュアライゼーションを学問にするには?人を動かすデータビジュアライゼーション - データビジュアライゼーションを学問にするには?
人を動かすデータビジュアライゼーション - データビジュアライゼーションを学問にするには?
 
tut_pfi_2012
tut_pfi_2012tut_pfi_2012
tut_pfi_2012
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
 
横幹連合サービス科学
横幹連合サービス科学横幹連合サービス科学
横幹連合サービス科学
 
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
 
最先端学術情報基盤(Csi)委託事業報告交流会パネル
最先端学術情報基盤(Csi)委託事業報告交流会パネル最先端学術情報基盤(Csi)委託事業報告交流会パネル
最先端学術情報基盤(Csi)委託事業報告交流会パネル
 
リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方リクルートライフスタイル流!分析基盤との賢い付き合い方
リクルートライフスタイル流!分析基盤との賢い付き合い方
 
LT データ可視化とd3.js js_cafe_20130908_otanet
LT データ可視化とd3.js js_cafe_20130908_otanetLT データ可視化とd3.js js_cafe_20130908_otanet
LT データ可視化とd3.js js_cafe_20130908_otanet
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
 
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーションいじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
いじめられた子供を支援する 仮想世界ピグパーティの コミュニケーション
 
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
Thank you communication network in organization 感謝ネットワークからみる組織のコミュニケーションの形
 
Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤Jubatusが目指すインテリジェンス基盤
Jubatusが目指すインテリジェンス基盤
 

Mehr von Shohei Hido

CuPy: A NumPy-compatible Library for GPU
CuPy: A NumPy-compatible Library for GPUCuPy: A NumPy-compatible Library for GPU
CuPy: A NumPy-compatible Library for GPUShohei Hido
 
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門Shohei Hido
 
ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術Shohei Hido
 
機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA
機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA
機械学習モデルフォーマットの話:さようならPMML、こんにちはPFAShohei Hido
 
Software for Edge Heavy Computing @ INTEROP 2016 Tokyo
Software for Edge Heavy Computing @ INTEROP 2016 TokyoSoftware for Edge Heavy Computing @ INTEROP 2016 Tokyo
Software for Edge Heavy Computing @ INTEROP 2016 TokyoShohei Hido
 
Chainer GTC 2016
Chainer GTC 2016Chainer GTC 2016
Chainer GTC 2016Shohei Hido
 
How AI revolutionizes robotics and automotive industries
How AI revolutionizes robotics and automotive industriesHow AI revolutionizes robotics and automotive industries
How AI revolutionizes robotics and automotive industriesShohei Hido
 
NIPS2015概要資料
NIPS2015概要資料NIPS2015概要資料
NIPS2015概要資料Shohei Hido
 
プロダクトマネージャのお仕事
プロダクトマネージャのお仕事プロダクトマネージャのお仕事
プロダクトマネージャのお仕事Shohei Hido
 
あなたの業務に機械学習を活用する5つのポイント
あなたの業務に機械学習を活用する5つのポイントあなたの業務に機械学習を活用する5つのポイント
あなたの業務に機械学習を活用する5つのポイントShohei Hido
 
PFIセミナー "「失敗の本質」を読む"発表資料
PFIセミナー "「失敗の本質」を読む"発表資料PFIセミナー "「失敗の本質」を読む"発表資料
PFIセミナー "「失敗の本質」を読む"発表資料Shohei Hido
 
NIPS2013読み会: More Effective Distributed ML via a Stale Synchronous Parallel P...
NIPS2013読み会: More Effective Distributed ML via a Stale Synchronous Parallel P...NIPS2013読み会: More Effective Distributed ML via a Stale Synchronous Parallel P...
NIPS2013読み会: More Effective Distributed ML via a Stale Synchronous Parallel P...Shohei Hido
 
機械学習CROSS 後半資料
機械学習CROSS 後半資料機械学習CROSS 後半資料
機械学習CROSS 後半資料Shohei Hido
 
機械学習CROSS 前半資料
機械学習CROSS 前半資料機械学習CROSS 前半資料
機械学習CROSS 前半資料Shohei Hido
 
ICML2013読み会 開会宣言
ICML2013読み会 開会宣言ICML2013読み会 開会宣言
ICML2013読み会 開会宣言Shohei Hido
 
ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?Shohei Hido
 
FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」Shohei Hido
 
Travis E. Oliphant, "NumPy and SciPy: History and Ideas for the Future"
Travis E. Oliphant, "NumPy and SciPy: History and Ideas for the Future"Travis E. Oliphant, "NumPy and SciPy: History and Ideas for the Future"
Travis E. Oliphant, "NumPy and SciPy: History and Ideas for the Future"Shohei Hido
 
111015 tokyo scipy2_ディスカッション
111015 tokyo scipy2_ディスカッション111015 tokyo scipy2_ディスカッション
111015 tokyo scipy2_ディスカッションShohei Hido
 

Mehr von Shohei Hido (20)

CuPy: A NumPy-compatible Library for GPU
CuPy: A NumPy-compatible Library for GPUCuPy: A NumPy-compatible Library for GPU
CuPy: A NumPy-compatible Library for GPU
 
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
 
NIPS2017概要
NIPS2017概要NIPS2017概要
NIPS2017概要
 
ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術
 
機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA
機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA
機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA
 
Software for Edge Heavy Computing @ INTEROP 2016 Tokyo
Software for Edge Heavy Computing @ INTEROP 2016 TokyoSoftware for Edge Heavy Computing @ INTEROP 2016 Tokyo
Software for Edge Heavy Computing @ INTEROP 2016 Tokyo
 
Chainer GTC 2016
Chainer GTC 2016Chainer GTC 2016
Chainer GTC 2016
 
How AI revolutionizes robotics and automotive industries
How AI revolutionizes robotics and automotive industriesHow AI revolutionizes robotics and automotive industries
How AI revolutionizes robotics and automotive industries
 
NIPS2015概要資料
NIPS2015概要資料NIPS2015概要資料
NIPS2015概要資料
 
プロダクトマネージャのお仕事
プロダクトマネージャのお仕事プロダクトマネージャのお仕事
プロダクトマネージャのお仕事
 
あなたの業務に機械学習を活用する5つのポイント
あなたの業務に機械学習を活用する5つのポイントあなたの業務に機械学習を活用する5つのポイント
あなたの業務に機械学習を活用する5つのポイント
 
PFIセミナー "「失敗の本質」を読む"発表資料
PFIセミナー "「失敗の本質」を読む"発表資料PFIセミナー "「失敗の本質」を読む"発表資料
PFIセミナー "「失敗の本質」を読む"発表資料
 
NIPS2013読み会: More Effective Distributed ML via a Stale Synchronous Parallel P...
NIPS2013読み会: More Effective Distributed ML via a Stale Synchronous Parallel P...NIPS2013読み会: More Effective Distributed ML via a Stale Synchronous Parallel P...
NIPS2013読み会: More Effective Distributed ML via a Stale Synchronous Parallel P...
 
機械学習CROSS 後半資料
機械学習CROSS 後半資料機械学習CROSS 後半資料
機械学習CROSS 後半資料
 
機械学習CROSS 前半資料
機械学習CROSS 前半資料機械学習CROSS 前半資料
機械学習CROSS 前半資料
 
ICML2013読み会 開会宣言
ICML2013読み会 開会宣言ICML2013読み会 開会宣言
ICML2013読み会 開会宣言
 
ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?ビッグデータはどこまで効率化できるか?
ビッグデータはどこまで効率化できるか?
 
FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」
 
Travis E. Oliphant, "NumPy and SciPy: History and Ideas for the Future"
Travis E. Oliphant, "NumPy and SciPy: History and Ideas for the Future"Travis E. Oliphant, "NumPy and SciPy: History and Ideas for the Future"
Travis E. Oliphant, "NumPy and SciPy: History and Ideas for the Future"
 
111015 tokyo scipy2_ディスカッション
111015 tokyo scipy2_ディスカッション111015 tokyo scipy2_ディスカッション
111015 tokyo scipy2_ディスカッション
 

Kürzlich hochgeladen

UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdffurutsuka
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 

Kürzlich hochgeladen (9)

UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdf
 
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 

データサイエンティストのつくり方