SlideShare ist ein Scribd-Unternehmen logo
1 von 7
Création de modèle de langue fr
On a utilisé les corpus suivant :

EuroParl_fr: 2 M phrases

MultiUN_fr : 9,9 M phrases

News_fr: 90 k phrases

Opensub_fr : 4,3M phrases

Trames_fr : 20k phrases

Wit3_fr : 87 k phrases
Total : 16,5 MTotal : 16,5 M
Chaîne de création LM
Création de modèle de traduction
On a utilisé les corpus suivant :

News_ar/fr: 90 k phrases

Opensub_ar/fr : 4,3M phrases

Trames_ar/fr : 20k phrases

Wit3_ar/fr : 87 k phrases
Total : 4,5 MTotal : 4,5 M
Chaîne de création TM 1
Chaîne de création TM 2
Évaluation
CorpusCorpus Score nouvelScore nouvel
systèmesystème
Score ancienScore ancien
systèmesystème
C2C2 Dev 19,39 19,7
Test 17,67 18,7
C3C3 Dev 13,73 15,7
Test 10,94 13,43
C4C4 Dev 14,37 14,94
Test 13,14 16,10
Création de modèle de traduction
V2
On a utilisé les corpus suivant :

News_ar/fr: 90 k phrases

Opensub_ar/fr : 4,3M phrases

Trames_ar/fr : 20k phrases

Wit3_ar/fr : 87 k phrases

MultiUn_ar/fr : 9,9M phrases
Total : 14,4 MTotal : 14,4 M

Weitere ähnliche Inhalte

Andere mochten auch

Techniques d’imagerie dans l’exploration des pathologies art
Techniques d’imagerie dans l’exploration des pathologies artTechniques d’imagerie dans l’exploration des pathologies art
Techniques d’imagerie dans l’exploration des pathologies artimma-dr
 
Neuerungen KEV, Erwartungen Gleichzeitigkeit, Netzbelastung
Neuerungen KEV, Erwartungen Gleichzeitigkeit, NetzbelastungNeuerungen KEV, Erwartungen Gleichzeitigkeit, Netzbelastung
Neuerungen KEV, Erwartungen Gleichzeitigkeit, NetzbelastungVorname Nachname
 
Aide rectification discontinue
Aide rectification discontinueAide rectification discontinue
Aide rectification discontinueNicolas JOUVE
 
RVC 2012: Réinitialiser le programme
RVC 2012: Réinitialiser le programmeRVC 2012: Réinitialiser le programme
RVC 2012: Réinitialiser le programmeDestination Canada
 
China 19 04 08
China 19 04 08China 19 04 08
China 19 04 08FLIEEP
 
L'Observatoire politique Mai 2016 / ELABE pour Les Echos et Radio Classique
L'Observatoire politique Mai 2016 / ELABE pour Les Echos et Radio ClassiqueL'Observatoire politique Mai 2016 / ELABE pour Les Echos et Radio Classique
L'Observatoire politique Mai 2016 / ELABE pour Les Echos et Radio Classiquecontact Elabe
 
Corporate Update - August 2016
Corporate Update - August 2016Corporate Update - August 2016
Corporate Update - August 2016Agnico Eagle Mines
 
Zoom sur les principales marketplaces en Chine
Zoom sur les principales marketplaces en ChineZoom sur les principales marketplaces en Chine
Zoom sur les principales marketplaces en ChineFrenchWeb.fr
 
EU-Datenschutzgrund-Verordnung-Smart-Metering-2014-Energiewirtschaft-nuances
EU-Datenschutzgrund-Verordnung-Smart-Metering-2014-Energiewirtschaft-nuancesEU-Datenschutzgrund-Verordnung-Smart-Metering-2014-Energiewirtschaft-nuances
EU-Datenschutzgrund-Verordnung-Smart-Metering-2014-Energiewirtschaft-nuancesnuances
 
Estudio de Inversión en Publicidad Digital (total 2013)
Estudio de Inversión en Publicidad Digital (total 2013)Estudio de Inversión en Publicidad Digital (total 2013)
Estudio de Inversión en Publicidad Digital (total 2013)IAB Spain
 
Empuje Hidrostático Sobre Superficies Curvas
Empuje Hidrostático Sobre Superficies CurvasEmpuje Hidrostático Sobre Superficies Curvas
Empuje Hidrostático Sobre Superficies CurvasLayda Orozco
 
Winthrop Elementary School Report
Winthrop Elementary School ReportWinthrop Elementary School Report
Winthrop Elementary School ReportBill Butler
 

Andere mochten auch (14)

Techniques d’imagerie dans l’exploration des pathologies art
Techniques d’imagerie dans l’exploration des pathologies artTechniques d’imagerie dans l’exploration des pathologies art
Techniques d’imagerie dans l’exploration des pathologies art
 
Neuerungen KEV, Erwartungen Gleichzeitigkeit, Netzbelastung
Neuerungen KEV, Erwartungen Gleichzeitigkeit, NetzbelastungNeuerungen KEV, Erwartungen Gleichzeitigkeit, Netzbelastung
Neuerungen KEV, Erwartungen Gleichzeitigkeit, Netzbelastung
 
Aide rectification discontinue
Aide rectification discontinueAide rectification discontinue
Aide rectification discontinue
 
RVC 2012: Réinitialiser le programme
RVC 2012: Réinitialiser le programmeRVC 2012: Réinitialiser le programme
RVC 2012: Réinitialiser le programme
 
China 19 04 08
China 19 04 08China 19 04 08
China 19 04 08
 
L'Observatoire politique Mai 2016 / ELABE pour Les Echos et Radio Classique
L'Observatoire politique Mai 2016 / ELABE pour Les Echos et Radio ClassiqueL'Observatoire politique Mai 2016 / ELABE pour Les Echos et Radio Classique
L'Observatoire politique Mai 2016 / ELABE pour Les Echos et Radio Classique
 
Corporate Update - August 2016
Corporate Update - August 2016Corporate Update - August 2016
Corporate Update - August 2016
 
Zoom sur les principales marketplaces en Chine
Zoom sur les principales marketplaces en ChineZoom sur les principales marketplaces en Chine
Zoom sur les principales marketplaces en Chine
 
8 elevador
8  elevador8  elevador
8 elevador
 
EU-Datenschutzgrund-Verordnung-Smart-Metering-2014-Energiewirtschaft-nuances
EU-Datenschutzgrund-Verordnung-Smart-Metering-2014-Energiewirtschaft-nuancesEU-Datenschutzgrund-Verordnung-Smart-Metering-2014-Energiewirtschaft-nuances
EU-Datenschutzgrund-Verordnung-Smart-Metering-2014-Energiewirtschaft-nuances
 
Estudio de Inversión en Publicidad Digital (total 2013)
Estudio de Inversión en Publicidad Digital (total 2013)Estudio de Inversión en Publicidad Digital (total 2013)
Estudio de Inversión en Publicidad Digital (total 2013)
 
L'Algérie depuis 1954 (1)
L'Algérie depuis 1954 (1)L'Algérie depuis 1954 (1)
L'Algérie depuis 1954 (1)
 
Empuje Hidrostático Sobre Superficies Curvas
Empuje Hidrostático Sobre Superficies CurvasEmpuje Hidrostático Sobre Superficies Curvas
Empuje Hidrostático Sobre Superficies Curvas
 
Winthrop Elementary School Report
Winthrop Elementary School ReportWinthrop Elementary School Report
Winthrop Elementary School Report
 

Ähnlich wie Traduction

Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?pprem
 
C# et .NET : Enigmes et puzzles
C# et .NET : Enigmes  et puzzlesC# et .NET : Enigmes  et puzzles
C# et .NET : Enigmes et puzzlesMicrosoft
 
20100608 01 - Points de fonctions (Renault)
20100608 01 - Points de fonctions (Renault)20100608 01 - Points de fonctions (Renault)
20100608 01 - Points de fonctions (Renault)LeClubQualiteLogicielle
 
Formation Extreme Programming, Tests unitaires, travail collaboratif
Formation Extreme Programming, Tests unitaires, travail collaboratifFormation Extreme Programming, Tests unitaires, travail collaboratif
Formation Extreme Programming, Tests unitaires, travail collaboratifkemenaran
 
Développement informatique : Gestion de projet, versioning, debugging, testin...
Développement informatique : Gestion de projet, versioning, debugging, testin...Développement informatique : Gestion de projet, versioning, debugging, testin...
Développement informatique : Gestion de projet, versioning, debugging, testin...ECAM Brussels Engineering School
 
Les nouveautés de TYPO3 4.2
Les nouveautés de TYPO3 4.2Les nouveautés de TYPO3 4.2
Les nouveautés de TYPO3 4.2Yannick Pavard
 

Ähnlich wie Traduction (7)

Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?Quoi de neuf dans la version 11 Alexandria ?
Quoi de neuf dans la version 11 Alexandria ?
 
C# et .NET : Enigmes et puzzles
C# et .NET : Enigmes  et puzzlesC# et .NET : Enigmes  et puzzles
C# et .NET : Enigmes et puzzles
 
20100608 01 - Points de fonctions (Renault)
20100608 01 - Points de fonctions (Renault)20100608 01 - Points de fonctions (Renault)
20100608 01 - Points de fonctions (Renault)
 
Formation Extreme Programming, Tests unitaires, travail collaboratif
Formation Extreme Programming, Tests unitaires, travail collaboratifFormation Extreme Programming, Tests unitaires, travail collaboratif
Formation Extreme Programming, Tests unitaires, travail collaboratif
 
Développement informatique : Gestion de projet, versioning, debugging, testin...
Développement informatique : Gestion de projet, versioning, debugging, testin...Développement informatique : Gestion de projet, versioning, debugging, testin...
Développement informatique : Gestion de projet, versioning, debugging, testin...
 
Les nouveautés de TYPO3 4.2
Les nouveautés de TYPO3 4.2Les nouveautés de TYPO3 4.2
Les nouveautés de TYPO3 4.2
 
Go
GoGo
Go
 

Kürzlich hochgeladen

Webinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsWebinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsTechnologia Formation
 
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024frizzole
 
Quitter la nuit. pptx
Quitter          la        nuit.    pptxQuitter          la        nuit.    pptx
Quitter la nuit. pptxTxaruka
 
Un petit coin etwinning- Au fil des cultures urbaines
Un petit coin  etwinning- Au fil des cultures urbainesUn petit coin  etwinning- Au fil des cultures urbaines
Un petit coin etwinning- Au fil des cultures urbainesSocratis Vasiopoulos
 
PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdfPowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdfDafWafia
 
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Pedago Lu
 
rapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdfrapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdfOssamaLachheb
 
Nathanaëlle Herbelin.pptx Peintre française
Nathanaëlle Herbelin.pptx Peintre françaiseNathanaëlle Herbelin.pptx Peintre française
Nathanaëlle Herbelin.pptx Peintre françaiseTxaruka
 
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLS
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLSCours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLS
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLSdocteurgyneco1
 
Quitter la nuit. pptx
Quitter        la             nuit.   pptxQuitter        la             nuit.   pptx
Quitter la nuit. pptxTxaruka
 
Bonnes pratiques biomédicales en établissement de soins : Guide
Bonnes pratiques biomédicales en établissement de soins  : GuideBonnes pratiques biomédicales en établissement de soins  : Guide
Bonnes pratiques biomédicales en établissement de soins : Guidebemorad
 
Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"ArchivesdeLyon
 

Kürzlich hochgeladen (12)

Webinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsWebinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctions
 
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
 
Quitter la nuit. pptx
Quitter          la        nuit.    pptxQuitter          la        nuit.    pptx
Quitter la nuit. pptx
 
Un petit coin etwinning- Au fil des cultures urbaines
Un petit coin  etwinning- Au fil des cultures urbainesUn petit coin  etwinning- Au fil des cultures urbaines
Un petit coin etwinning- Au fil des cultures urbaines
 
PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdfPowerPoint-de-Soutenance-de-TFE-infirmier.pdf
PowerPoint-de-Soutenance-de-TFE-infirmier.pdf
 
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
 
rapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdfrapport de stage gros oeuvre_compressed.pdf
rapport de stage gros oeuvre_compressed.pdf
 
Nathanaëlle Herbelin.pptx Peintre française
Nathanaëlle Herbelin.pptx Peintre françaiseNathanaëlle Herbelin.pptx Peintre française
Nathanaëlle Herbelin.pptx Peintre française
 
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLS
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLSCours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLS
Cours-Sur-l'-IP-Multiprotocol-Label-SwitchingMPLS
 
Quitter la nuit. pptx
Quitter        la             nuit.   pptxQuitter        la             nuit.   pptx
Quitter la nuit. pptx
 
Bonnes pratiques biomédicales en établissement de soins : Guide
Bonnes pratiques biomédicales en établissement de soins  : GuideBonnes pratiques biomédicales en établissement de soins  : Guide
Bonnes pratiques biomédicales en établissement de soins : Guide
 
Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"Les débuts de la collection "Le livre de poche"
Les débuts de la collection "Le livre de poche"
 

Traduction

  • 1. Création de modèle de langue fr On a utilisé les corpus suivant :  EuroParl_fr: 2 M phrases  MultiUN_fr : 9,9 M phrases  News_fr: 90 k phrases  Opensub_fr : 4,3M phrases  Trames_fr : 20k phrases  Wit3_fr : 87 k phrases Total : 16,5 MTotal : 16,5 M
  • 3. Création de modèle de traduction On a utilisé les corpus suivant :  News_ar/fr: 90 k phrases  Opensub_ar/fr : 4,3M phrases  Trames_ar/fr : 20k phrases  Wit3_ar/fr : 87 k phrases Total : 4,5 MTotal : 4,5 M
  • 6. Évaluation CorpusCorpus Score nouvelScore nouvel systèmesystème Score ancienScore ancien systèmesystème C2C2 Dev 19,39 19,7 Test 17,67 18,7 C3C3 Dev 13,73 15,7 Test 10,94 13,43 C4C4 Dev 14,37 14,94 Test 13,14 16,10
  • 7. Création de modèle de traduction V2 On a utilisé les corpus suivant :  News_ar/fr: 90 k phrases  Opensub_ar/fr : 4,3M phrases  Trames_ar/fr : 20k phrases  Wit3_ar/fr : 87 k phrases  MultiUn_ar/fr : 9,9M phrases Total : 14,4 MTotal : 14,4 M