SlideShare ist ein Scribd-Unternehmen logo
1 von 12
長岡技術科学大学 自然言語処理研究室
修士1年 西山 浩気
 機械学習の役割
◦ 例: メールスパムフィルタを作成したい
◦ 従来
 過去に送信されたスパムメールから「ルール」を獲得
 人手でスパムと判断できそうな単語等をフィルタリング
◦ 機械学習
 過去のデータから自動的にスパムと判断する「知識」を獲得
 過去のデータに基づいてフィルタリング
2単純パーセプトロンと学習アルゴリズム
 機械学習の利点
◦ 自動的にルールを学習できる
 人間では扱えないような大量,複雑なデータか
ら予測・分類できる
 応用例
◦ Siriなどの文字/音声認識
◦ Web検索エンジン
3単純パーセプトロンと学習アルゴリズム
 良い学習をするために必要なこと
1. 問題に合ったアルゴリズムの選定
2. 高品質な過去データ
3. 性能の評価
4単純パーセプトロンと学習アルゴリズム
 これから学ぶこと
1. 問題に合ったアルゴリズムの選定
 分類アルゴリズムの種類・利点
2. 高品質な過去データ
 過去データ(学習データ)を高品質にするための処理
3. 性能の評価
 評価の指標とモデルのチューニング
◦ 本スライドではこれらの概要を説明、次回以降で詳しく説明する
5単純パーセプトロンと学習アルゴリズム
1. 3種類の機械学習
1.1 教師あり学習
1.2 教師なし学習
1.3 強化学習
2. 分類の種類
2.1 二値・多クラス分類
2.2 回帰分析
3. 前処理
4. モデルの評価
5. まとめ
単純パーセプトロンと学習アルゴリズム 6
 機械学習には3つの学習方法がある
1. 教師あり学習
 「正解」から学習
 例: スパムメールのフィルタリング
2. 教師無し学習(今回は割愛)
 正解の示されていないデータから学習
 例: マーケティングプログラム(主に分類問題)
3. 強化学習(今回は割愛)
 「選択した行動」と「結果」から学習
 例: チェスエンジン, AlphaGo
7単純パーセプトロンと学習アルゴリズム
 分類問題(classification)
◦ 過去のデータから未知のデータに対してクラスラベルを
予測
 二値分類 (例: 受信メールがスパムか否か)
 多クラス分類 (例: 手書き文字が0~9の何れか)
 回帰分析(regression analysis)
◦ クラスではなく, 連続値を予測
 例: 広告宣伝費と来場者数
次回以降では分類問題を解くアルゴリズムについて学ぶ
8単純パーセプトロンと学習アルゴリズム
 生データ(例:過去のスパムを含むメール) が機械学習に適した
形で提供されることはめったにない!
 機械学習に適した 前処理(preprocessing) が必要
◦ 例: 花の写真から種類を分類
 花の色や高さ、長さなどの特徴の尺度を合わせる
 花の種類を “-1, 0, 1” などの数値に変換する.
9単純パーセプトロンと学習アルゴリズム
 次回以降で説明する分類アルゴリズムには特性がある
◦ 最も性能の良い学習をするためには、複数種類のアルゴリズム
を比較する必要がある
 比較するためには「指標」が必要
◦ 正解率, F値 等…
◦ 学習の 汎化性能(generalization performance)
 未知のデータに対応できる能力
 ハイパーパラメータを調整
◦ 評価の結果を踏まえて学習し直すことで性能向上を図る
10単純パーセプトロンと学習アルゴリズム
 教師あり学習は2種類
◦ 分類問題 : 既知のクラスに分類
 例: スパムメールか否か, 花の種類
◦ 回帰分析 : 連続値を予測
 例 : 広告宣伝費と来場者数
 より高い精度で予測するためには
◦ 前処理
◦ 評価・ハイパーパラメータ調整
次回から 分類問題を解くためのアルゴリズムについて学ぶ
11単純パーセプトロンと学習アルゴリズム
 Python機械学習プログラミング, Seastian
Raschka, インプレス
12単純パーセプトロンと学習アルゴリズム

Weitere ähnliche Inhalte

Mehr von 浩気 西山

Using continuous lexical embeddings to improve symbolicprosody prediction in ...
Using continuous lexical embeddings to improve symbolicprosody prediction in ...Using continuous lexical embeddings to improve symbolicprosody prediction in ...
Using continuous lexical embeddings to improve symbolicprosody prediction in ...浩気 西山
 
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...浩気 西山
 
Character word lstm language models
Character word lstm language modelsCharacter word lstm language models
Character word lstm language models浩気 西山
 
Nlp2018 参加報告
Nlp2018 参加報告Nlp2018 参加報告
Nlp2018 参加報告浩気 西山
 
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...浩気 西山
 
Evaluating non expert_annotations_for_natural_language_tasks
Evaluating non expert_annotations_for_natural_language_tasksEvaluating non expert_annotations_for_natural_language_tasks
Evaluating non expert_annotations_for_natural_language_tasks浩気 西山
 
Semi supervised sequence tagging with bidirectional language models
Semi supervised sequence tagging with bidirectional language modelsSemi supervised sequence tagging with bidirectional language models
Semi supervised sequence tagging with bidirectional language models浩気 西山
 
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths
Classifying Temporal Relations by Bidirectional LSTM over Dependency PathsClassifying Temporal Relations by Bidirectional LSTM over Dependency Paths
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths浩気 西山
 
Neural Network Language Model For Chinese Pinyin Input Method Engine
Neural Network Language Model For Chinese Pinyin Input Method EngineNeural Network Language Model For Chinese Pinyin Input Method Engine
Neural Network Language Model For Chinese Pinyin Input Method Engine浩気 西山
 
Are emojis predictable
Are emojis predictableAre emojis predictable
Are emojis predictable浩気 西山
 
Semantic analysis and helpfulness prediction of text for online product reviews
Semantic analysis and helpfulness prediction of text  for online product reviewsSemantic analysis and helpfulness prediction of text  for online product reviews
Semantic analysis and helpfulness prediction of text for online product reviews浩気 西山
 
Effective search space reduction for spell correction using character neural ...
Effective search space reduction for spell correction using character neural ...Effective search space reduction for spell correction using character neural ...
Effective search space reduction for spell correction using character neural ...浩気 西山
 
1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム浩気 西山
 

Mehr von 浩気 西山 (13)

Using continuous lexical embeddings to improve symbolicprosody prediction in ...
Using continuous lexical embeddings to improve symbolicprosody prediction in ...Using continuous lexical embeddings to improve symbolicprosody prediction in ...
Using continuous lexical embeddings to improve symbolicprosody prediction in ...
 
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...
Character-based Joint Segmentation and POS Tagging for Chinese using Bidirec...
 
Character word lstm language models
Character word lstm language modelsCharacter word lstm language models
Character word lstm language models
 
Nlp2018 参加報告
Nlp2018 参加報告Nlp2018 参加報告
Nlp2018 参加報告
 
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...
Character aware-neural-networks-for-arabic-named-entity-recognition-for-socia...
 
Evaluating non expert_annotations_for_natural_language_tasks
Evaluating non expert_annotations_for_natural_language_tasksEvaluating non expert_annotations_for_natural_language_tasks
Evaluating non expert_annotations_for_natural_language_tasks
 
Semi supervised sequence tagging with bidirectional language models
Semi supervised sequence tagging with bidirectional language modelsSemi supervised sequence tagging with bidirectional language models
Semi supervised sequence tagging with bidirectional language models
 
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths
Classifying Temporal Relations by Bidirectional LSTM over Dependency PathsClassifying Temporal Relations by Bidirectional LSTM over Dependency Paths
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths
 
Neural Network Language Model For Chinese Pinyin Input Method Engine
Neural Network Language Model For Chinese Pinyin Input Method EngineNeural Network Language Model For Chinese Pinyin Input Method Engine
Neural Network Language Model For Chinese Pinyin Input Method Engine
 
Are emojis predictable
Are emojis predictableAre emojis predictable
Are emojis predictable
 
Semantic analysis and helpfulness prediction of text for online product reviews
Semantic analysis and helpfulness prediction of text  for online product reviewsSemantic analysis and helpfulness prediction of text  for online product reviews
Semantic analysis and helpfulness prediction of text for online product reviews
 
Effective search space reduction for spell correction using character neural ...
Effective search space reduction for spell correction using character neural ...Effective search space reduction for spell correction using character neural ...
Effective search space reduction for spell correction using character neural ...
 
1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム1.単純パーセプトロンと学習アルゴリズム
1.単純パーセプトロンと学習アルゴリズム
 

1.単純パーセプトロンと学習アルゴリズム