This is course program for the following course slides:
http://www.slideshare.net/dmitrykan/introduction-to-machine-translation-2911038
and
http://www.slideshare.net/dmitrykan/introduction-to-machine-translation-1
Это программа курса по машинному переводу, прочитанная первый раз магистрам фак-та ПМ-ПУ СПбГУ в 2009 году. Слайды курса:
http://www.slideshare.net/dmitrykan/introduction-to-machine-translation-2911038
http://www.slideshare.net/dmitrykan/introduction-to-machine-translation-1
1. Программа курса Машинный перевод (МП)
1. Введение. Мотивация существования МП
2. Краткая история МП. Основные этапы. Доклад ALPAC
3. Прямой и косвенный МП. Примеры построенных систем МП (СМП)
4. Современные СМП в индустрии
5. Существующие пакеты для обработки языка и построения СМП
6. Два фундаментальных подхода к МП: статистический и традиционный
(лингвистические правила)
7. Методы МП
8. Прямая СМП. Её характеристики
9. Метод трансфер. Типы трансфера. Характеристики метода
10. Понятие интерлингвы. Характеристики метода МП, основанного на
интерлингве. Сравнение с трасфером
11. Компоненты статистического подхода к МП
12. Системы МП, основанные на примерах
13. Теория статистических СМП. Фундаментальное уравнение (теорема
Байеса). Понятие статистической языковой модели. Модель перевода.
Вычисление языковой модели
14. Модель перевода в статистической СМП
15. Задача выравнивания слов
16. Характеристики статистических СМП
17. Существующие компоненты статистических СМП
18. Оценка качества СМП. Оценка человеком. Автоматические методы оценки,
их важность в целом
19. Метрика BLEU
20. Метрика METEOR
21. Метрика NIST
22. Round-trip
23. Гибридные СМП
24. Задача переупорядочивания слов в предложении. Классические и
статистические подходы
25. Компьютерная семантика русского языка и предпоссылки для построения
СМП на её основе
26. Прагматика. Анализ контекста
27. Детали программных пакетов для машинного перевода: GIZA++, SRILM,
Moses
28. Реализация алгоритма переупорядочивания по статье [7]
Семинар (или темы на реферат):
1. Математика статистического машинного перевода (по статье [1])
2. Иерархическая модель для статистического МП (статья [2])
3. Статистический МП, основанный на фразах (статья [3])
4. СМП, основанные на правилах (статьи [4,5])
5. Гибридные СМП, основанные на примерах ([6])
2. 6. Метрика BLEU в деталях (по статье [8])
7. Робастные крупномасштабные СМП, основанные на примерах (по статье
[9])
3. Литература
[1] Brown P., Della Petra S., Della Petra V., Mercer R.: The Mathematics of
Statistical Machine Translation: Parameter Estimation, 1993
[2] Chiang D.: A Hierarchical Phrase-Based Model for Statistical Machine
Translation, 2005
[3] Koehn P., Och F., Marcu D.: Statistical Phrase-Based Machine Translation, 2003
[4] Kaplan R., Netter K., Wedekind J., Zaenen A.: Translation By Structural
Correspondences, 1989
[5] Landsbergen J.: The Rosetta Project, 1989
[6] Groves D., Way A.: Hybrid Example-Based SMT: the Best of Both Worlds?
(здесь, как принятно в западной литературе, SMT означает Статистический
Машинный Перевод)
[7] Athanaselis T., Bakamidis S., Dologou I.: Words Reordering based on Statistical
Language Model, 2006
[8] Papineni K., Roukos S., Ward T., Zhu W.-J.: BLEU: a Method for Automatic
Evaluation of Machine Translation, 2002
[9] Gough N., Way A.: Robust Large-Scale EBMT with Marker-Based Segmentation,
2004