SlideShare ist ein Scribd-Unternehmen logo
1 von 34
Downloaden Sie, um offline zu lesen
流行りの分散表現を用いた文書分類について
2018/10/19
Netadashi Meetup #7 in みなとみらい
Mr_Sakaue(SKUE)
1
● 阪上晃幸(@Mr_Sakaue)
● データアナリスト@渋谷のベンチャー企業
● 経歴
2012/2:インターン@渋谷のベンチャー企業
2012/3:一橋大学大学院経済学研究科 修士課程修了
2012/4〜:渋谷のベンチャー企業入社
● 趣味
料理、ブログ記事の作成
『かものはしの分析ブログ』で検索!
自己紹介
2
● 対象リスナー
・今あるデータを活用したい方々(エンジニア /データサイエンティスト)
● 話したいこと
・近年流行っている分散表現を用いた分析事例の紹介
● 話さないこと
・自社での活用事例
・最先端技術などの紹介
・細かい技術の詳細(参考文献あり。または懇親会や質問などで)
話したいこと/話さないこと
3
公開するのでメモは
不要
● 1章:分散表現入門
● 2章:分散表現の活用事例、学習済みの分散表現の紹介
● 3章:実践例
4
● 1章:分散表現入門
● 2章:分散表現の活用事例、学習済みの分散表現の紹介
● 3章:実践例
5
● one-hot表現
one-hot(ワン・ホット)は1つだけ1をとり、他は0であるような数列のこと。
単語をそのようなものにしたものをone-hot表現と呼んでいる。
分散表現入門
ある世界に存在する単語
イクラ
ウニ
マグロ
鯖
鮭
鮭 イクラ マグロ ウニ 鯖
0 1 0 0 0
イクラのone-hot表現
鯖のone-hot表現
鮭 イクラ マグロ ウニ 鯖
0 0 0 0 1
6
● one-hot表現
文をone-hot表現で扱えばBag-of-words表現になる。文書分類の特徴量としても使われ
る。
分散表現入門
ある世界に存在する 3つの文書
あのイクラの味が忘れられない
マグロよりはウニが食べたい
鮭の缶詰ばかり食べる
イクラ マグロ ウニ 缶詰 鮭 味
文書1 1 0 0 0 0 1
文書2 0 1 1 0 0 0
文書3 0 0 0 1 1 0
7
● one-hot表現
未知語を扱うことができなかったり次元数が膨大となるという欠点がある。
分散表現入門
ある世界に存在する 3つの文書
あのイクラや牡蠣や…(30万語)の
味が忘れられない
マグロよりはウニが食べたい
鮭の缶詰ばかり食べる
イクラ マグロ … 牡蠣 鮭 味
文書1 1 0 … 1 0 1
文書2 0 1 … 0 0 0
文書3 0 0 … 0 1 0
3行30万列の行列
8
● 分散表現とは
単語を高次元の実数ベクトルで表現する技術。一つの単語を10~1000次元ほどのベクト
ルで表現する。大量のテキストをもとに、主にニューラルネットワークを用いて計算され
る。(Wikipediaの全データなど)
自然言語処理における特徴量としても用いられている。
分散表現入門
ウナギ 0.01 0.03 0.01 … 0.04 0.03
アナゴ 0.02 0.05 0.01 … 0.05 0.01
タコ 0.01 0.01 0.12 … 0.01 0.09
10~1000次元
9
● Word2Vec(ワードトゥーベック)
2013年に当時GoogleにいたMikolovらによって考案された、単語の分散表現を得るた
めのアルゴリズム。
ある単語の単語ベクトルを入力として、前後の単語の単語ベクトルを予測することを目的
としている。(うまく予測できるように最適化をしている。)
単語ベクトルが類似している単語は同じコンテキストでの出現率が高くなるように計算さ
れる。
分散表現入門
10
● Word2Vec…3次元に圧縮するケース
分散表現入門
俺 の イタリアン 行っ た
1 0 0 0 0
「俺」のone-hot表現 「イタリアン」のone-hot表現
俺 の イタリアン 行っ た
0 0 1 0 0
0.1 0.9 0.1 0.01 0.01
俺 の イタリアン 行っ た
0.01 0.5 0.02 0.001 0.002
ハズレ アタリ ハズレ ハズレ ハズレ
中間層
入力層
出力層
確率
ラベル
周辺の単語、
「俺」
「イタリアン」
から
「の」を当てにいくタスク。 確率(0~1)にするための関数を適用
ここで得られる重みづけが分
散表現になる
11
● Word2Vec
先ほどの図のように入力層、中間層、出力層からなる、2層のニューラルネットワークを
元に計算され、各単語が3次元のベクトルで表現されるようになる。
分散表現入門
俺 0.1 0.2 0.1
の 0.2 0.2 0.1
イタリアン 0.3 0.1 0.2
行っ 0.5 0.8 0.3
た 0.01 0.3 0.9
※ここでの値は適当に入れている
12
● Word2Vec
もとめた分散表現自体を足し算や引き算することもできる。
非常に有名なものとして「”queen” - “woman” + “man” = “king”」があり、意味の四則演
算のようなものが実現できているものもある。
私が過去に試したものとしては、
「”ディズニーランド” - ”夢” = ”舞浜” / ”ベイシティバス”」
などがある。(※Wikipediaコーパスデータを用いた)
分散表現入門
13
● Word2Vec
コンテクストの似た単語を分散表現の類似度から求めることができる。
分散表現入門
14
↑Wikipediaのクラシック楽曲情報 3000件から推定 ↑某グルメ系口コミサイトの蒙古タンメン中本の口コミ情報 4000
件から推定
● fastText(ファストテキスト)
2016年にFacebookにいたMikolovらによって考案されたアルゴリズム。
単語ではなく、n-gramを用いているので、未知の単語に強いとされている。
単語の「表記」が類似した単語は同様の意味をもつというモデルとなっている。
分散表現入門
3-gramでの「お疲れ様です」
・お疲
・お疲れ
・疲れ様
・様です
・です
15
● 分散表現の用途
・単語の分散表現をニューラルネットワークやSVMや
 一般的な機械学習の特徴量として扱う。
 →単語や文書を固定長のベクトルに変換できると適応領域が増える。
・単語のクラスタリングに使う(コンテクストの近い単語をまとめる)
分散表現入門
16
● 1章:分散表現入門
● 2章:分散表現の活用事例、学習済みの分散表現の紹介
● 3章:実践例
17
● 活用事例1
・リクルートテクノロジーズ
 ・ユーザーのアクションログデータを入力して、分散表現を手に入れ、
  その分散表現を元に計算したアイテム間の類似度などを計算し、
  アイテムをレコメンドするというシステムで適用している。
 ・ユーザーの行動ログの分散表現から、その分散表現を足し合わせる
  ことでユーザーの志向性を捉えるために使っている。
分散表現の活用事例
18
● 活用事例2
・サイバーエージェント
 ・検索連動型広告のテキストを自動生成をする際に、Word2Vecを用いて
  類義語による単語の入替をする研究を発表している。
分散表現の活用事例
赤枠がGoogle広告の検索連動型広告。
表現次第でクリック率が違ってくるが、文言を考える
のは骨が折れる作業。
19
● 活用事例3(公式なプレスは出ていない)
・メルカリ/Gunosy
 ・2017年のテキストアナリティクスシンポジウムでの講演内容のもの。
  ・メルカリ
   ・通報商品の分類自動化などのために様々なテキスト情報をもとに
    分散表現を得て予測できるようにしている。
  ・Gunosy
   ・ニュース記事の CTR予測などで分散表現を使ったモデルが
    一番性能が出ているという発言があった。
  →Word2Vecなどでもとめた分散表現が二値分類の際の特徴量として使われるケースが出てきた。
分散表現の活用事例
20
● 自然言語の資源問題
先ほどあげたようなデータ規模が膨大な企業の場合は分散表現を得るための学習を十
分にできるが、そうでない企業はなかなか取り組むことができない。
学習済みの分散表現の紹介
21
● ファインチューニング
Wikipediaやニュース記事のテキストなどの一般的なテキストデータをもとに、学習した
ネットワークのパラメータなどを、特定の目的(何かの分類とか)のためのデータで再度
学習させ、特定の目的における精度を高めること。
言語資源の乏しい企業はファインチューニング頑張るマンになれば幸せになれる?
学習済みの分散表現の紹介
22
● 学習済み分散表現
・各研究機関や企業などが公開している学習済みの分散表現。
 ・大規模な言語資源でWord2Vecを計算しようとすると何日も要するので、
  提供してくださる機関には感謝しかない。
 ・だいたいGensimで読み込める。
  ・KeyedVectors形式…再学習ができない
  ・full model形式…再学習ができる
学習済みの分散表現の紹介
23
● 学習済み分散表現
・白ヤギコーポレーションのモデル:full model形式(Gensim)
 →Wikipedia日本語版をコーパス
・東北大学 乾・岡崎研究室のモデル:KeyedVectors形式(Gensim)
 →Wikipedia日本語版をコーパス(エンティティーなどの分散表現も推定している)
・Facebookの学習済みFastTextモデル:KeyedVectors形式(Gensim)
 →Wikipediaなどをコーパス
・NWJC から取得した単語の分散表現データ (nwjc2vec):KeyedVectors形式(Gensim)
 →国語研日本語ウェブコーパス
・NNLM embedding trained on Google News:TensorFlow
 →Googleニュースをコーパス
公開されているものはfull model形式のものが少ない。
学習済みの分散表現の紹介
24
● 1章:分散表現入門
● 2章:分散表現の活用事例、学習済みの分散表現の紹介
● 3章:実践例
25
● やりたいこと
不動産物件の設備情報のテキストから、
その物件がデザイナーズマンションかどうか当てたい。
実践例
26
● データ
・某不動産物件情報サイトをWebスクレイピング
 ・渋谷区のデザイナーズマンションに関する物件の設備情報のテキスト
 ・渋谷区の普通のマンションに関する物件の設備情報のテキスト
 →合わせて1800件程度
実践例
27
実践例
28
テキストの一例
バス トイレ 別 バルコニー エアコン フローリ
ング 浴室 乾燥機 オートロック 室内 洗濯
置 システムキッチン エレベーター 宅配ボッ
クス 入居 可 最上階 バイク 置場 CS BS
テキストの文字数ヒストグラム
● 手法など
・Scikit-learnのExtremely Randomized Treesを用いる
・特徴量は以下の3つ
 ・設備情報に含まれる単語ごとの分散表現を足し合わせたもの
 ・設備情報に含まれる単語ごとの分散表現の平均値をとったもの
 ・設備情報に含まれる単語ごとの分散表現をTF-IDFで重み付けしたもの
・評価指標はAUC(うまく分類できているかの指標で0.5~1の間の値)
・5分割クロスバリデーションの平均スコアを比較する
実践例
29
● 以下の分散表現でデザイナーズマンション分類器の学習を行う。
・1800件のテキストで分散表現を学習したもの
・各種、学習済み分散表現をそのまま使ったもの
・再学習可能なものに関しては1800件のテキストで再学習したもの
実践例
30
実践例
31
実践例
物件情報 白ヤギ 東北大学 FastText 梵天
分散表現(平均) 0.789 0.820 0.890 0.936 0.920
分散表現(合計) 0.783 0.821 0.865 0.897 0.875
分散表現(TF-IDF) 0.779 0.829 0.903 0.945 0.926
5分割クロスバリデーションの AUCの平均値
※「物件情報」は物件情報のテキストだけで学習したもの
※※「白ヤギ」は物件情報で再学習したもの
※※※それ以外は学習済み分散表現をそのまま使っています。
● 結果
1800件程度のテキストで作成した分散表現よりも、大規模な言語資源で学習された学
習済み分散表現の方が、任意の物件がデザイナーズマンションかどうかを当てるタスク
において性能が高いことがわかった。
タスクによっては学習済み分散表現を使うことで、うまくこなせるのかもしれない。
別件で、蒙古タンメン中本の口コミ評価点数を予測しようとして、全く精度が出なかったこ
ともあるので、タスクによりけりな印象がある。
実践例
32
● 分散表現の基礎をお話した。
● 企業での分散表現のビジネスにおける実活用例を紹介した。
● 学習済み分散表現を用いた分類問題の実践例を紹介した。
まとめ
33
● 堅山 耀太郎(2017)「Word Embeddingモデル再訪」
● 斎藤 康毅(2018)『ゼロから作るDeep Learning ❷――自然言語処理編』
● 新納 浩幸(2017)『Chainer v2による実践深層学習』
● @Hironsan(2017)「なぜ自然言語処理にとって単語の分散表現は重要なのか?」
● リクルートテクノロジーズ(2015)「リクルート式 自然言語処理技術の適応事例紹介」
● 馬場 et al.(2015)「検索連動型広告におけるテキスト自動生成とその評価指標の検討」
● ナード戦隊データマン(2018)「Word Embeddingだけで文書分類する」
● Gensim「Why use KeyedVectors instead of a full model?」
参考文献
34

Weitere ähnliche Inhalte

Was ist angesagt?

12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf幸太朗 岩澤
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類Shintaro Fukushima
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Yamato OKAMOTO
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度Seiichi Uchida
 
統計的係り受け解析入門
統計的係り受け解析入門統計的係り受け解析入門
統計的係り受け解析入門Yuya Unno
 
5分で分かる自己組織化マップ
5分で分かる自己組織化マップ5分で分かる自己組織化マップ
5分で分かる自己組織化マップDaisuke Takai
 
最適化超入門
最適化超入門最適化超入門
最適化超入門Takami Sato
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門KnowledgeGraph
 
If文から機械学習への道
If文から機械学習への道If文から機械学習への道
If文から機械学習への道nishio
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised LearningまとめDeep Learning JP
 
Word2vecの理論背景
Word2vecの理論背景Word2vecの理論背景
Word2vecの理論背景Masato Nakai
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3までYahoo!デベロッパーネットワーク
 
推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれからcyberagent
 

Was ist angesagt? (20)

12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf12. Diffusion Model の数学的基礎.pdf
12. Diffusion Model の数学的基礎.pdf
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)Skip Connection まとめ(Neural Network)
Skip Connection まとめ(Neural Network)
 
ゼロから始める転移学習
ゼロから始める転移学習ゼロから始める転移学習
ゼロから始める転移学習
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
 
統計的係り受け解析入門
統計的係り受け解析入門統計的係り受け解析入門
統計的係り受け解析入門
 
正準相関分析
正準相関分析正準相関分析
正準相関分析
 
研究効率化Tips Ver.2
研究効率化Tips Ver.2研究効率化Tips Ver.2
研究効率化Tips Ver.2
 
5分で分かる自己組織化マップ
5分で分かる自己組織化マップ5分で分かる自己組織化マップ
5分で分かる自己組織化マップ
 
最適化超入門
最適化超入門最適化超入門
最適化超入門
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門
 
If文から機械学習への道
If文から機械学習への道If文から機械学習への道
If文から機械学習への道
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM) 一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
 
Word2vecの理論背景
Word2vecの理論背景Word2vecの理論背景
Word2vecの理論背景
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
 
推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから推薦アルゴリズムの今までとこれから
推薦アルゴリズムの今までとこれから
 
数式からみるWord2Vec
数式からみるWord2Vec数式からみるWord2Vec
数式からみるWord2Vec
 
Semantic segmentation
Semantic segmentationSemantic segmentation
Semantic segmentation
 
機械学習と主成分分析
機械学習と主成分分析機械学習と主成分分析
機械学習と主成分分析
 

Ähnlich wie 流行りの分散表現を用いた文書分類について Netadashi Meetup 7

深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについてMasahiro Suzuki
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)Masahiro Suzuki
 
潜在ディリクレ配分法
潜在ディリクレ配分法潜在ディリクレ配分法
潜在ディリクレ配分法y-uti
 
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]takashi ono
 
Interop2017
Interop2017Interop2017
Interop2017tak9029
 
【ビジプラ】pptとプレゼン
【ビジプラ】pptとプレゼン【ビジプラ】pptとプレゼン
【ビジプラ】pptとプレゼンMasayuki Shindo
 
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃんYasushi Hara
 
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」Takashi Uemura
 
エンジニアのキャリアを考える
エンジニアのキャリアを考えるエンジニアのキャリアを考える
エンジニアのキャリアを考えるMKT International Inc.
 
座談会資料 事前配布 20170225
座談会資料 事前配布 20170225座談会資料 事前配布 20170225
座談会資料 事前配布 20170225知礼 八子
 
Monadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
Monadic Programmingのススメ - Functional Reactive ProgrammingへのアプローチMonadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
Monadic Programmingのススメ - Functional Reactive ProgrammingへのアプローチTomoharu ASAMI
 
Claudia Enqueteの作り方教えます
Claudia Enqueteの作り方教えますClaudia Enqueteの作り方教えます
Claudia Enqueteの作り方教えますAkira Hatsune
 
Engineers can change the world ~ "世界" で活躍するエンジニアになるために
Engineers can change the world ~ "世界" で活躍するエンジニアになるためにEngineers can change the world ~ "世界" で活躍するエンジニアになるために
Engineers can change the world ~ "世界" で活躍するエンジニアになるためにAkira Inoue
 
明日から使えるビジネス文章の書き方
明日から使えるビジネス文章の書き方明日から使えるビジネス文章の書き方
明日から使えるビジネス文章の書き方Jo Hattori
 
DevLove2012「勝手にワークシフト」(宣伝用)
DevLove2012「勝手にワークシフト」(宣伝用)DevLove2012「勝手にワークシフト」(宣伝用)
DevLove2012「勝手にワークシフト」(宣伝用)masashi takehara
 
今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010Hiroshi Tokumaru
 
セレンディピティと機械学習
セレンディピティと機械学習セレンディピティと機械学習
セレンディピティと機械学習Kei Tateno
 
非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長Keiko Inagaki
 

Ähnlich wie 流行りの分散表現を用いた文書分類について Netadashi Meetup 7 (20)

深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
潜在ディリクレ配分法
潜在ディリクレ配分法潜在ディリクレ配分法
潜在ディリクレ配分法
 
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
 
Interop2017
Interop2017Interop2017
Interop2017
 
NLP2017 NMT Tutorial
NLP2017 NMT TutorialNLP2017 NMT Tutorial
NLP2017 NMT Tutorial
 
【ビジプラ】pptとプレゼン
【ビジプラ】pptとプレゼン【ビジプラ】pptとプレゼン
【ビジプラ】pptとプレゼン
 
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
 
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
 
エンジニアのキャリアを考える
エンジニアのキャリアを考えるエンジニアのキャリアを考える
エンジニアのキャリアを考える
 
座談会資料 事前配布 20170225
座談会資料 事前配布 20170225座談会資料 事前配布 20170225
座談会資料 事前配布 20170225
 
Monadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
Monadic Programmingのススメ - Functional Reactive ProgrammingへのアプローチMonadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
Monadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
 
Claudia Enqueteの作り方教えます
Claudia Enqueteの作り方教えますClaudia Enqueteの作り方教えます
Claudia Enqueteの作り方教えます
 
Engineers can change the world ~ "世界" で活躍するエンジニアになるために
Engineers can change the world ~ "世界" で活躍するエンジニアになるためにEngineers can change the world ~ "世界" で活躍するエンジニアになるために
Engineers can change the world ~ "世界" で活躍するエンジニアになるために
 
明日から使えるビジネス文章の書き方
明日から使えるビジネス文章の書き方明日から使えるビジネス文章の書き方
明日から使えるビジネス文章の書き方
 
DevLove2012「勝手にワークシフト」(宣伝用)
DevLove2012「勝手にワークシフト」(宣伝用)DevLove2012「勝手にワークシフト」(宣伝用)
DevLove2012「勝手にワークシフト」(宣伝用)
 
今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010
 
DL-D_ver1.pdf
DL-D_ver1.pdfDL-D_ver1.pdf
DL-D_ver1.pdf
 
セレンディピティと機械学習
セレンディピティと機械学習セレンディピティと機械学習
セレンディピティと機械学習
 
非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長
 

Mehr von Teruyuki Sakaue

実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022Teruyuki Sakaue
 
警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!Teruyuki Sakaue
 
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組みTeruyuki Sakaue
 
[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習Teruyuki Sakaue
 
[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9Teruyuki Sakaue
 
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについてデータ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについてTeruyuki Sakaue
 
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみるTeruyuki Sakaue
 
[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3Teruyuki Sakaue
 
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理Teruyuki Sakaue
 
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2Teruyuki Sakaue
 
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16Teruyuki Sakaue
 
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選Teruyuki Sakaue
 
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1Teruyuki Sakaue
 
Marketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノックMarketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノックTeruyuki Sakaue
 
機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測Teruyuki Sakaue
 

Mehr von Teruyuki Sakaue (15)

実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022
 
警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!
 
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
 
[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習
 
[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9
 
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについてデータ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
 
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
 
[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3
 
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
 
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
 
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
 
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
 
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
 
Marketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノックMarketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノック
 
機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測
 

Kürzlich hochgeladen

2024 01 Virtual_Counselor
2024 01 Virtual_Counselor 2024 01 Virtual_Counselor
2024 01 Virtual_Counselor arts yokohama
 
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdfTaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdfMatsushita Laboratory
 
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見Shumpei Kishi
 
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦Sadao Tokuyama
 
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~arts yokohama
 
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法ssuser370dd7
 
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-LoopへTetsuya Nihonmatsu
 
20240326_IoTLT_vol109_kitazaki_v1___.pdf
20240326_IoTLT_vol109_kitazaki_v1___.pdf20240326_IoTLT_vol109_kitazaki_v1___.pdf
20240326_IoTLT_vol109_kitazaki_v1___.pdfAyachika Kitazaki
 
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)ssuser539845
 

Kürzlich hochgeladen (12)

2024 01 Virtual_Counselor
2024 01 Virtual_Counselor 2024 01 Virtual_Counselor
2024 01 Virtual_Counselor
 
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdfTaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
 
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
 
What is the world where you can make your own semiconductors?
What is the world where you can make your own semiconductors?What is the world where you can make your own semiconductors?
What is the world where you can make your own semiconductors?
 
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
 
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
 
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
 
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
 
20240326_IoTLT_vol109_kitazaki_v1___.pdf
20240326_IoTLT_vol109_kitazaki_v1___.pdf20240326_IoTLT_vol109_kitazaki_v1___.pdf
20240326_IoTLT_vol109_kitazaki_v1___.pdf
 
2024 04 minnanoito
2024 04 minnanoito2024 04 minnanoito
2024 04 minnanoito
 
2024 03 CTEA
2024 03 CTEA2024 03 CTEA
2024 03 CTEA
 
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
 

流行りの分散表現を用いた文書分類について Netadashi Meetup 7