SlideShare a Scribd company logo
1 of 19
LearningPhraseRepresentations
usingRNNEncoder-Decoder
forStatisticalMachineTranslation
(2014) K.Cho et al.
발표: 곽근봉
이논문을선택한이유
기계번역을위한자연어표현학습
Abstract
RNN Encoder-Decoder
RNN을 활용하여 문장 구절을 학습시킴 (다양한 길이에 적용 가능)
Encoder-Decoder라는 새로운 구조를 제안
새로운 Hidden Unit을 제안
Statistical Machine Translation의 성능을 개선
제안하는 RNN모델로 기존의 SMT의 성능을 개선시킴
SMT이외의 가능성도 보여줌
학습된 Vector가 의미와 문법을 포착한다
© NBT All Rights Reserved.
기계 번역(Machine Translation)
Rule-based MT
Dictionary, 문법 기반의 번역 (Parser, Analyzer, Generator, Transfer Lexicon)
Statistical MT
이미 번역된 문서들을 바탕으로한 통계 기반의 번역
Hybrid MT
Rule-based와 Statistical을 함께 사용
Neural MT
Deep Learning을 활용한 번역
https://en.wikipedia.org/wiki/Machine_translation
Statistical Machine Translation
https://en.wikipedia.org/wiki/Statistical_machine_translation
f가 주어졌을 때 e가 나올 확
률
e가 주어졌을 때 f가 나올 확률
과
e가 나올 확률의 곱과 비례한다
가장 높은 확률이 나오는 표현들을 골라서 최종 번역 를 찾는다
RNNEncoder-Decoder구조소개
HiddenUnit소개
Update Gate
Reset Gate
RNNEncoder
RNNDecoder
RNNEncoder-Decoder학습
SMT에적용
활용
성능
BLEU (bilingual evaluation understudy)
기계 번역의 품질을 측정하는데 사용하는 지표. 실제 사람이 한 번
역과 기계 번역의 유사성을 계산하는 방식으로 구함. 간단하고 쉽게
구할 수 있다는 장점이 있음.
Holger Schwenk et al. Continuous Space Language Models for Statistical Machine Translation, 2006
SMT에적용
왜 성능이 잘 나올까
• CSLM의 contribution과 많이 겹치지 않음
• 통계적으로 도출된 Score가 아님
• 출현 빈도가 많지 않은 표현들에 대해서 보완이 가능함
• RNN Encoder-Decoder가 짧은 표현을 선호함
• 일반적으로 BLEU 값은 짧은 표현에서 높게 나옴
이외의 활용 방안
• SMT를 완전히 대체
• 범용적인 Phrase Representation
• 의미와 문법 모두를 담아냄
© NBT All Rights Reserved.
결론
• SMT의 성능을 높일 수 있었다
• 기존 번역 시스템에 쉽게 적용 가능하다
• 완전히 SMT를 대체할 가능성을 보았다
• 범용 Phrase Representation으로 활용가능하다
질문 및 논의
감사합니다
kkb2849@gmail.com
https://github.com/kkb2849

More Related Content

What's hot

Introduction to Deep Learning, Keras, and TensorFlow
Introduction to Deep Learning, Keras, and TensorFlowIntroduction to Deep Learning, Keras, and TensorFlow
Introduction to Deep Learning, Keras, and TensorFlow
Sri Ambati
 

What's hot (20)

PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
 
Topology Managerについて / Kubernetes Meetup Tokyo 50
Topology Managerについて / Kubernetes Meetup Tokyo 50Topology Managerについて / Kubernetes Meetup Tokyo 50
Topology Managerについて / Kubernetes Meetup Tokyo 50
 
分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~分散学習のあれこれ~データパラレルからモデルパラレルまで~
分散学習のあれこれ~データパラレルからモデルパラレルまで~
 
Introduction to Deep Learning, Keras, and TensorFlow
Introduction to Deep Learning, Keras, and TensorFlowIntroduction to Deep Learning, Keras, and TensorFlow
Introduction to Deep Learning, Keras, and TensorFlow
 
20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術
 
Ml system in_python
Ml system in_pythonMl system in_python
Ml system in_python
 
Solr から使う OpenNLP の日本語固有表現抽出
Solr から使う OpenNLP の日本語固有表現抽出Solr から使う OpenNLP の日本語固有表現抽出
Solr から使う OpenNLP の日本語固有表現抽出
 
画像生成AI stable diffusionの紹介
画像生成AI stable diffusionの紹介画像生成AI stable diffusionの紹介
画像生成AI stable diffusionの紹介
 
Edge Computing と k8s でなんか話すよ
Edge Computing と k8s でなんか話すよEdge Computing と k8s でなんか話すよ
Edge Computing と k8s でなんか話すよ
 
Basics of Deep learning
Basics of Deep learningBasics of Deep learning
Basics of Deep learning
 
Testing machine learning development
Testing machine learning developmentTesting machine learning development
Testing machine learning development
 
WebRTC入門 ~沖縄編~
WebRTC入門 ~沖縄編~WebRTC入門 ~沖縄編~
WebRTC入門 ~沖縄編~
 
AutoTVM紹介
AutoTVM紹介AutoTVM紹介
AutoTVM紹介
 
gRPC入門
gRPC入門gRPC入門
gRPC入門
 
PyTorch Python Tutorial | Deep Learning Using PyTorch | Image Classifier Usin...
PyTorch Python Tutorial | Deep Learning Using PyTorch | Image Classifier Usin...PyTorch Python Tutorial | Deep Learning Using PyTorch | Image Classifier Usin...
PyTorch Python Tutorial | Deep Learning Using PyTorch | Image Classifier Usin...
 
GPU と PYTHON と、それから最近の NVIDIA
GPU と PYTHON と、それから最近の NVIDIAGPU と PYTHON と、それから最近の NVIDIA
GPU と PYTHON と、それから最近の NVIDIA
 
Introduction to deep learning
Introduction to deep learningIntroduction to deep learning
Introduction to deep learning
 
ビジネス向けIBネットワークを考える ~HPCクラスタでの経験を踏まえて~
ビジネス向けIBネットワークを考える ~HPCクラスタでの経験を踏まえて~ビジネス向けIBネットワークを考える ~HPCクラスタでの経験を踏まえて~
ビジネス向けIBネットワークを考える ~HPCクラスタでの経験を踏まえて~
 
DeBERTA : Decoding-Enhanced BERT with Disentangled Attention
DeBERTA : Decoding-Enhanced BERT with Disentangled AttentionDeBERTA : Decoding-Enhanced BERT with Disentangled Attention
DeBERTA : Decoding-Enhanced BERT with Disentangled Attention
 
LLM+LangChainで特許調査・分析に取り組んでみた
LLM+LangChainで特許調査・分析に取り組んでみたLLM+LangChainで特許調査・分析に取り組んでみた
LLM+LangChainで特許調査・分析に取り組んでみた
 

Similar to 딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for statistical machine translation

Similar to 딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for statistical machine translation (20)

Mt
MtMt
Mt
 
문자 단위의 Neural Machine Translation
문자 단위의 Neural Machine Translation문자 단위의 Neural Machine Translation
문자 단위의 Neural Machine Translation
 
Neural Machine Translation 기반의 영어-일본어 자동번역
Neural Machine Translation 기반의 영어-일본어 자동번역Neural Machine Translation 기반의 영어-일본어 자동번역
Neural Machine Translation 기반의 영어-일본어 자동번역
 
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석
i-VOC (Voice of the Customer Big Data Analytics Solution) 고객의소리 분석
 
Sequence to Sequence Learning with Neural Networks
Sequence to Sequence Learning with Neural NetworksSequence to Sequence Learning with Neural Networks
Sequence to Sequence Learning with Neural Networks
 
에센스(Essence) 기반 sw 방법론 제정 도구와 essencia 오픈소스 프로젝트
에센스(Essence) 기반 sw 방법론 제정 도구와 essencia 오픈소스 프로젝트에센스(Essence) 기반 sw 방법론 제정 도구와 essencia 오픈소스 프로젝트
에센스(Essence) 기반 sw 방법론 제정 도구와 essencia 오픈소스 프로젝트
 
2017 tensor flow dev summit
2017 tensor flow dev summit2017 tensor flow dev summit
2017 tensor flow dev summit
 
파이썬을 활용한 자연어 분석
파이썬을 활용한 자연어 분석파이썬을 활용한 자연어 분석
파이썬을 활용한 자연어 분석
 
GNMT로 알아보는 신경망 기반 기계번역
GNMT로 알아보는 신경망 기반 기계번역GNMT로 알아보는 신경망 기반 기계번역
GNMT로 알아보는 신경망 기반 기계번역
 
딥러닝 자연어처리 - RNN에서 BERT까지
딥러닝 자연어처리 - RNN에서 BERT까지딥러닝 자연어처리 - RNN에서 BERT까지
딥러닝 자연어처리 - RNN에서 BERT까지
 
NLU Tech Talk with KorBERT
NLU Tech Talk with KorBERTNLU Tech Talk with KorBERT
NLU Tech Talk with KorBERT
 
순환신경망(Recurrent neural networks) 개요
순환신경망(Recurrent neural networks) 개요순환신경망(Recurrent neural networks) 개요
순환신경망(Recurrent neural networks) 개요
 
[224] backend 개발자의 neural machine translation 개발기 김상경
[224] backend 개발자의 neural machine translation 개발기 김상경[224] backend 개발자의 neural machine translation 개발기 김상경
[224] backend 개발자의 neural machine translation 개발기 김상경
 
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용
Python과 Tensorflow를 활용한  AI Chatbot 개발 및 실무 적용Python과 Tensorflow를 활용한  AI Chatbot 개발 및 실무 적용
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용
 
200819 NAVER TECH CONCERT 04_NDK로 안드로이드에 C++ 끼얹기
200819 NAVER TECH CONCERT 04_NDK로 안드로이드에 C++ 끼얹기200819 NAVER TECH CONCERT 04_NDK로 안드로이드에 C++ 끼얹기
200819 NAVER TECH CONCERT 04_NDK로 안드로이드에 C++ 끼얹기
 
마인즈랩소개자료 20150616
마인즈랩소개자료 20150616마인즈랩소개자료 20150616
마인즈랩소개자료 20150616
 
마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030
 
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
 
Toolkits for robust speech processing
Toolkits for robust speech processingToolkits for robust speech processing
Toolkits for robust speech processing
 
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
 

More from keunbong kwak

More from keunbong kwak (13)

그로스해킹 기초
그로스해킹 기초그로스해킹 기초
그로스해킹 기초
 
NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료
 
PR-099: MRNet-Product2Vec
PR-099: MRNet-Product2VecPR-099: MRNet-Product2Vec
PR-099: MRNet-Product2Vec
 
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
PR12 논문 리뷰 Distributed Representations of Sentences and DocumentsPR12 논문 리뷰 Distributed Representations of Sentences and Documents
PR12 논문 리뷰 Distributed Representations of Sentences and Documents
 
Wide&Deep Learning for Recommender Systems
Wide&Deep Learning for Recommender SystemsWide&Deep Learning for Recommender Systems
Wide&Deep Learning for Recommender Systems
 
논문리뷰: Deep Neural Networks for YouTube Recommendations
논문리뷰: Deep Neural Networks for YouTube Recommendations논문리뷰: Deep Neural Networks for YouTube Recommendations
논문리뷰: Deep Neural Networks for YouTube Recommendations
 
Ad Tech 개요
Ad Tech 개요Ad Tech 개요
Ad Tech 개요
 
Ask me anything: Dynamic memory networks for natural language processing
Ask me anything: Dynamic memory networks for natural language processingAsk me anything: Dynamic memory networks for natural language processing
Ask me anything: Dynamic memory networks for natural language processing
 
GloVe:Global vectors for word representation
GloVe:Global vectors for word representationGloVe:Global vectors for word representation
GloVe:Global vectors for word representation
 
에디터스랩 발표
에디터스랩 발표에디터스랩 발표
에디터스랩 발표
 
Convolutional neural networks for sentence classification
Convolutional neural networks for sentence classificationConvolutional neural networks for sentence classification
Convolutional neural networks for sentence classification
 
NBT 유클라우드 사례 발표
NBT 유클라우드 사례 발표NBT 유클라우드 사례 발표
NBT 유클라우드 사례 발표
 
Window manager활용하기 곽근봉
Window manager활용하기 곽근봉Window manager활용하기 곽근봉
Window manager활용하기 곽근봉
 

딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for statistical machine translation

Editor's Notes

  1. Reset Gate는 이전의 hidden state를 버릴지 말지를 결정함 Update Gate는 새로운 hidden state를 반영할지 말지를 결정함. 이렇게 나눠놓음으로 인해서 다른 time scale에 대해서 capture가 가능함. 짧은 표현은 r로, 긴 표현은 z로 배울 수 있다.