SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Постредактирование МП
(PEMT):
практические вопросы для
переводчиков и редакторов
Светлана Светова,
“Плюс Перевод”, Санкт-Петербург
План презентации
• PEMT: цифры, факты, комментарии
• Некоторые практические аспекты PEMT
• Взаимодействие с заказчиком
 Тип МП: важно ли знать тип МП и разбираться в МП
 МП хорошего качества: хорошо ли для переводчика
 Настройка и улучшение МП заказчика: должен ли
переводчик в этом участвовать
 PEMT для понимания vs. Полное PEMT
• PEMT как новый вид деятельности
 Обратная связь от переводчиков, страхи и ожидания
 Удобство работы пост-редактора
 Профиль пост-редактора
 Инструкции по PEMT
 Рекомендации по PEMT
The “term used for the correction of
machine translation output by human
linguists/editors” (Veale and Way 1997)
“checking, proof-reading and revising
translations carried out by any kind of
translating automaton” (Gouadec 2007)
“In basic terms, the task of the post-editor
is to edit, modify and/or correct pre-
translated text that has been processed
by a machine translation system from a
source language (a) in to target
language(s).“ (Allen 2003)
“Post-editors … are translators from MT language …”
(H.Krings, Repairing Texts: Empirical Investigation on MT PE
Processes, 2001)
“According to Hutchins (1986), the term “post-editor” was
introduced in 1950 by Erwin Reifler who described the task as
follows: “to select the correct translation from the possibilities found
by the computer dictionary and to rearrange the word order to suit
the target language…”
(H.Krings, Repairing Texts: Empirical Investigation on MT PE
Processes, 2001)
4
○ Overall volumes continue to grow but prices are down (avg $0.13/word)
○ The market for translation technology is worth $1,287m
○ PEMT market is slowly growing – currently at about 3% of the LS
market, worth of $1,238m ($841m last year).
○ Two technology trends: Machine translation and cloud-based software
○ Foreign exchange issues affect market sizing.
○ 17.45% of LSPs sell Post Edited MT
– (although the number is probably higher but LSPs do not identify
this as a different service from Translation)
What’s happening to the market?
PEMT, еще цифры
 чтобы стать хорошим пост-редактором, хорошо бы “отпостредактировать”
минимум 100 000 слов
 ожидания по скорости постредактирования: 600 слов в час
 ожидания по приросту производительности: в 2 раза
(5 000-10 000 слов в день)
 3 текста вместо стандартных 2 при PEMT для обработки (исходный + МП +
собственно перевод)
 3-5 лет – максимальный опыт PE у пост-редакторов
 80% переводчиков не имеют опыта PE
 прирост производительности – в среднем 10%, хотя цифры встречаются
любые
 стандартная скидка на PEMT от полной пословной ставки – 30%
 МП = TM fuzzy match 80-90%
 правило “2 секунд” (см. Рекомендации по PEMT)
PEMT: взаимодействие с
заказчиком
Треугольник PEMT: 3 группы задач
Заказчик
Разработчик Переводчик
1. Внедрить МП для сценариев, когда
недостаточно ресурсов для
выполнения перевода по
традиционной схеме/ требуется
увеличить объем перевода в рамках
ограниченного бюджета/когда
требуется увеличить объем перевода
в пределах того же количества
переводческих ресурсов
2. Купить и настроить систему (обратная
связь)
3. Расширить применение (включая
сферы и языки)
4. Обучить МП-специалистов
5. Повысить эффективность процессов
1. Получить больше объемов на
перевод (включая те, которые
не были бы получены без МП)
2. Выработать новые навыки (в
т.ч. переводить больше и
быстрее, не теряя в деньгах)
3. Выработать подход к новым
условиям
1. Получить опыт внедрения
2. Улучшить качество МП на
конкретном опыте
(обратная связь и
настройка)
3. Расширить применение
(включая языковые пары)
4. Расширить клиентскую базу
5. Продать услуги по
настройке и разработке
6. Продать услуги по
обучению
• Машинный перевод на основе правил (RBMT)
– Лингвистические правила
– Словарные базы данных
– > отсутствие правил > качество перевода
• Статистический машинный перевод (SMT)
– Использование вероятностного подхода (на анализе и паттернах)
– Изучение предварительно переведенных данных
– Способность к статистическому обучению
– > ввод данных> качество перевода… способность к обучению
• Гибридные системы машинного перевода (HMT)
– Технологии объединены в новом подходе к машинному переводу — "статистическом
синтаксисе"
– Автоматическое обучение + "грамматика" на основе правил
– Система распознает "грамматику" и способна к автоматическому обучению
Типы МП
Тип МП: важно ли переводчику знать тип МП и разбираться в МП
 тип RMBT традиционно считается более устойчивым с точки зрения терминологии (после настройки), SMT – более
читабельным
 выбор системы МП обычно связан с языковым направлением (в первую очередь)
 таблицы типовых ошибок МП обычно приветствуются переводчиками для получения представления о возможных
проблемах, связанных с выбором системы МП
 уровень настройки системы МП напрямую связан с объемом последующего постредактирования и решения проблем в
его процессе, основанных на понимании поведения системы
Переводчику не повредит знание о возможностях или
пределах настройки МП для получения представления об
объемах постредактирования (в непосредственной связи с
трудозатратами и расчетом стоимости)
МП хорошего качества: хорошо ли для переводчика
 хорошо настроенная система МП – дополнительные расходы на стороне заказчика – дополнительные ожидания по
экономии в процессе перевода и росту производительности
 более низкая ставка для переводчика?
 но и меньшие трудозатраты для переводчика? в идеале – просто проверить и подтвердить?
 угроза полного перехода на МП при переводе данного типа текстов?
 существует также мнение, что просто все удалить и переписать – более легкое для переводчика действие, чем
выискивать ошибки в МП, особенно хорошего качества (которое может быть намного, намного лучше)
Связанная с предыдущей тема: должен ли переводчик участвовать в повышении качества
системы МП и ее настройке
 хорошо настроенная система МП – меньшие трудозатраты для переводчика?
 быстрее перевел – быстрее получил следующий объем?
 не отвлекаешься на повторяющиеся раздражающие ошибки?
(МП повторяет ошибку до тех пор, пока ее не исправишь в системе)
 одновременно развиваешь новый интересный навык?
1) пост-редактирование до финального качества (полноепост-редактирование, full PEMT)
– наиболее часто выполняемый вид работ
– в результате “не должен быть виден МП”, высокие (стандартные) ожидания по качеству
– для текстов широкого применения
2) пост-редактирование для понимания (light PEMT)
– требуется реже (если вообще требуется)
– менее высокие ожидания по качеству
– фокус на смысле
– применяется для текстов, не требующих массового использования
Два основных вида пост-редактирования МП
12
Перед началом работы целесообразно уточнить ожидания заказчика.
PEMT как новый вид
деятельности
Постредактирование в сравнении с
редактированием
14
• Постредактирование МП заменяет традиционный этап перевода
• Весьма отличается от редактирования ручного перевода (другие, “свои” типы
ошибок)
• Приветствуется понимание “поведения” системы
• После постредактирования МП требуется этап стандартного редактирования
Страхи и ожидания
 Новая деятельность, мало информации, у заказчиков высокие ожидания
 Слишком сильное давление на переводчиков, которые должны принимать решения в условиях пониженной
ставки и меньшего времени при высоких ожиданиях
 Отмечается корреляция между отношением переводчика к PEMT (положительное-отрицательное) и
скоростью работы
 Переводчик без опыта постредактирования относится к ошибкам МП так, как будто они сделаны человеком
(эмоции - лишнее время)
 Хороший МП – “все пропало, у переводческой профессии нет будущего”
 Плохой МП – “я сейчас все удалю и гениально перепишу, но при этом получу на 30% меньше”
 Опасения привыкнуть к “стилю МП” и перестать замечать ошибки.
 Переводчики склонны более доверять нечетким совпадениям в ТМ (“сделано человеком”), чем МП-сегментам
 Но некачественный результат МП вызывает меньше раздражения, чем “человеческий” сегмент из ТМ
 При PEMT приходится иметь дело с 3 текстами вместо 2, отсюда рост когнитивной нагрузки
 Пост-редактирование – по-прежнему “непрестижная” деятельность (?), мало креатива
 Переводчики очень устают от постредактирования, гораздо сильнее, чем от перевода (связано и с типом
текстов, подлежащих МП, например, длинные списки наименований продукции …)
Опыт, навык, здравый смысл, расчет и обсуждение условий –
лучшие друзья пост-редактора.
Удобство работы пост-редактора
 Текущий стандарт работы – в CAT, где результат МП = еще одно нечеткое совпадение (fuzzy match)
 Вопрос: должен ли результат МП быть нечетким совпадением или подсказкой?
 Современные требования к разработчикам по части PEMT:
• формирование отчета, фиксирование времени, запись действий…
 Основное известное требование к разработчикам средств PEMT – внедрить кнопку DELETE ALL 
• предварительная оценка качества МП – связанная с объемом постредактирования ставка
• предварительная оценка пригодности текста к МП (MT-friendly content)
• самообучение системы в процессе работы и обновление последующих сегментов
 Обучение
Профиль пост-редактора
 большинство пост-редакторов МП в настоящее время – штатные сотрудники
 пост-редакторами могут становиться только опытные переводчики со склонностью к редактированию,
поскольку неопытные и без склонности легко увлекутся возможной гладкостью МП (хотя встречается и
точка зрения, что начинающих переводчиков легче обучить постредактированию и убедить в его
целесообразности)
 постредактирование МП требует непредвзятого отношения, гибкого подхода - и умения видеть в МП
еще один профессиональный инструмент для повышения собственной эффективности и
конкурентоспособности
 пост-редактору МП явно не повредят:
 отличные языковые навыки
 знание предметной области
 опыт работы с системами CAT и средствами автоматической проверки и интерес к технологиям
 навык редактирования и умение быстро принимать решения
 положительное отношение к МП
 склонность к экспериментированию
 практика, практика, практика (100 тыс. слов )
Инструкции по PEMT
Инструкции по PEMT создаются под требования конкретных заказчиков и конкретных
проектов, а не “вообще”, это связано с ожиданиями по качеству и уровнем
настройки/типом МП (обычно инструкция по PEMT содержит 3 пункта как минимум:
ожидания/требования по качеству, разбор типовых ошибок МП, рекомендации)
Таблицы типовых ошибок МП включаются в инструкции для напоминания о возможных
проблемах (=доп. проверках)
Поскольку МП-ошибки повторяются, PEMT – это не всего лишь “исправить одно слово и
одну запятую”, речь может идти о структурных изменениях на всем пространстве текста
(текстов), о чем инструкции напоминают
При PEMT обычно рекомендуется пренебрегать стилем, а не терминологией или
правильной передачей смысла, большинство инструкций советует “стараться
использовать как можно больше из результата МП”
Пост-редакторы должны следовать и стандартным процедурам (QA и т.д.)
Инструкции по PEMT – традиционная часть
• Результат перевода должен быть корректным и истинным отображением
исходного текста
• Перевод должен соответствовать всем правилам выходного языка
• Обязательным условием является последовательное использование
правильной терминологии
• Необходимо применение соответствующего документу стиля
• Должны использоваться справочные материалы (проектные указания, базы
TM, глоссарии, терминологические базы и т.д.)
• Форматы дат и времени, единиц измерения, числовых выражений, валют и
пр. должны быть адаптированы к правилам выходного языка
• Должно воспроизводиться форматирование исходного документа
• Перевод должен быть читабельным и пригодным для целей его
использования
Дополнительные
или
отсутствующие
слова
Отрицание
Составные
конструкции или
конструкции с
дефисом
Имена
собственные
Вопросительные
предложения
Инструкции по PEMT: примеры дополнительных проверок в случае SMT
20
21
Инструкции по PEMT - рекомендации
Убедитесь, что вся информация
передана корректно
Проверьте все числовые
выражения
Проверьте корректность
терминологии
Вносите необходимые изменения
только в том случае, если значение
передано неправильно или
искажено
Не меняйте структуру текста, если
значение передано верно
Всегда помните, что превалируют
конкретные требования заказчика
Для максимального удовольствия от
эксплуатации данной палатки следуйте,
пожалуйста, нашим рекомендациям.
Постановка палатки
Выберите максимально ровную
поверхность. Очистите её от острых камней
и веток.
Правила противопожарной безопасности.
• не держите плитки, горелки и лампы
близко к материалу палатки
• следуйте противопожарной инструкции
пришитой внутри палатки
• держите выход свободным от вещей
Пример, просто пример
Типовые рекомендации пост-редактору
Минимум усилий для максимума
результата (как можно меньше коррекции)
И как можно меньше времени
Вносить изменения только тогда, когда это
совершенно необходимо
Ничего не добавлять по сравнению с
исходником
Ничего не удалять по сравнению с
исходником
И вот еще рекомендации…
24
Пытайтесь
использовать результат
МП по максимуму
Не стоит стараться
“гениально переписать” все
заново – равно как и
оставить все как есть
Всегда перечитывайте
результат перевода после
постредактирования
Находите те фрагменты в
результате МП,
использование которых
может значительно ускорить
работу
Правило “2 секунд”
Раз
• Прочитать
исходный текст,
затем МП
• Определить
пригодные для
использования
фрагменты
Два
• Откорректиро
вать МП
• Стараться не
пытаться все
переписать
или оставить
как есть
• Фокус – на
корректности
Три
• Провести
дополнительные
проверки
• Исправить
опечатки
• Проверить
терминологию
Этапы постредактирования
25
Обучение по PEMT: что предлагается в
настоящее время
 SDL PEMT Certification (бесплатно для
пользователей SDL Trados Studio)
 TAUS Post-Editing Course с различными
языковыми модулями
Рис. 3 Спасибо за внимание!
svetlana.svetova@plustranslation.ru

Weitere ähnliche Inhalte

Ähnlich wie PEMT: практические вопросы для переводчиков и редакторов

Основы текстовой оптимизации
Основы текстовой оптимизацииОсновы текстовой оптимизации
Основы текстовой оптимизации
Rush Agency
 
Средства автоматизированного перевода
Средства автоматизированного переводаСредства автоматизированного перевода
Средства автоматизированного перевода
comfortgalaxy
 
Controlled technical russian
Controlled technical russianControlled technical russian
Controlled technical russian
Goudron1979
 
Тимофей Перевезенцев. Кухня современных python шаблонизаторов
Тимофей Перевезенцев. Кухня современных python шаблонизаторовТимофей Перевезенцев. Кухня современных python шаблонизаторов
Тимофей Перевезенцев. Кухня современных python шаблонизаторов
otkds
 

Ähnlich wie PEMT: практические вопросы для переводчиков и редакторов (20)

Software craftsmanship meetup #4
Software craftsmanship meetup #4Software craftsmanship meetup #4
Software craftsmanship meetup #4
 
Основы текстовой оптимизации
Основы текстовой оптимизацииОсновы текстовой оптимизации
Основы текстовой оптимизации
 
Средства автоматизированного перевода
Средства автоматизированного переводаСредства автоматизированного перевода
Средства автоматизированного перевода
 
Cредства автоматизированного перевода
Cредства автоматизированного переводаCредства автоматизированного перевода
Cредства автоматизированного перевода
 
TextPlan.ru
TextPlan.ruTextPlan.ru
TextPlan.ru
 
Планируй и зарабатывай: управление проектами в бюро переводов (короткая версия)
Планируй и зарабатывай: управление проектами в бюро переводов (короткая версия)Планируй и зарабатывай: управление проектами в бюро переводов (короткая версия)
Планируй и зарабатывай: управление проектами в бюро переводов (короткая версия)
 
Решения Lement Pro - Партнёрское обучение
Решения Lement Pro - Партнёрское обучениеРешения Lement Pro - Партнёрское обучение
Решения Lement Pro - Партнёрское обучение
 
Controlled technical russian
Controlled technical russianControlled technical russian
Controlled technical russian
 
08 машинный перевод
08 машинный перевод08 машинный перевод
08 машинный перевод
 
Operating through the “eyes” of development: Efficient communications
Operating through the “eyes” of development: Efficient communicationsOperating through the “eyes” of development: Efficient communications
Operating through the “eyes” of development: Efficient communications
 
Авиком
АвикомАвиком
Авиком
 
Метрики автоматизированного тестирования на пальцах
Метрики автоматизированного тестирования на пальцахМетрики автоматизированного тестирования на пальцах
Метрики автоматизированного тестирования на пальцах
 
Варианты использования (use cases) для быстрой оценки проектов
Варианты использования (use cases) для быстрой оценки проектовВарианты использования (use cases) для быстрой оценки проектов
Варианты использования (use cases) для быстрой оценки проектов
 
Kpi управление в типографии
Kpi управление в типографииKpi управление в типографии
Kpi управление в типографии
 
Stolyarov
StolyarovStolyarov
Stolyarov
 
TFR 2017 smartCAT Егор Секиров — Интеграция технологии в бизнес
 TFR 2017 smartCAT Егор Секиров — Интеграция технологии в бизнес TFR 2017 smartCAT Егор Секиров — Интеграция технологии в бизнес
TFR 2017 smartCAT Егор Секиров — Интеграция технологии в бизнес
 
Тимофей Перевезенцев. Кухня современных python шаблонизаторов
Тимофей Перевезенцев. Кухня современных python шаблонизаторовТимофей Перевезенцев. Кухня современных python шаблонизаторов
Тимофей Перевезенцев. Кухня современных python шаблонизаторов
 
How to assess the company's readiness to intelligent automation of office pro...
How to assess the company's readiness to intelligent automation of office pro...How to assess the company's readiness to intelligent automation of office pro...
How to assess the company's readiness to intelligent automation of office pro...
 
Что DevOps должен знать про статический анализ кода?
Что DevOps должен знать про статический анализ кода?Что DevOps должен знать про статический анализ кода?
Что DevOps должен знать про статический анализ кода?
 
Презентация RPA
Презентация RPAПрезентация RPA
Презентация RPA
 

Mehr von Tetyana Struk TrainStation

Шлях до мети: шість кроків і один стрибок із зони комфорту
Шлях до мети: шість кроків і один стрибок із зони комфортуШлях до мети: шість кроків і один стрибок із зони комфорту
Шлях до мети: шість кроків і один стрибок із зони комфорту
Tetyana Struk TrainStation
 
Вебинар "Стратегическое планирование для компаний и фрилансеров"
Вебинар "Стратегическое планирование для компаний и фрилансеров"Вебинар "Стратегическое планирование для компаний и фрилансеров"
Вебинар "Стратегическое планирование для компаний и фрилансеров"
Tetyana Struk TrainStation
 

Mehr von Tetyana Struk TrainStation (17)

Проектный подход: объективная реальность бизнеса в вузовской аудитории
Проектный подход: объективная реальность бизнеса в вузовской аудитории Проектный подход: объективная реальность бизнеса в вузовской аудитории
Проектный подход: объективная реальность бизнеса в вузовской аудитории
 
Шлях до мети: шість кроків і один стрибок із зони комфорту
Шлях до мети: шість кроків і один стрибок із зони комфортуШлях до мети: шість кроків і один стрибок із зони комфорту
Шлях до мети: шість кроків і один стрибок із зони комфорту
 
Анонс кейс-турнира по проектному управлению среди студентов переводческих фак...
Анонс кейс-турнира по проектному управлению среди студентов переводческих фак...Анонс кейс-турнира по проектному управлению среди студентов переводческих фак...
Анонс кейс-турнира по проектному управлению среди студентов переводческих фак...
 
Проектно-лексикографическая работа при обучении теории перевода в магистратуре
Проектно-лексикографическая работа при обучении теории перевода в магистратуреПроектно-лексикографическая работа при обучении теории перевода в магистратуре
Проектно-лексикографическая работа при обучении теории перевода в магистратуре
 
«С места в карьер»: как помочь выпускникам выйти на переводческий рынок. Опыт...
«С места в карьер»: как помочь выпускникам выйти на переводческий рынок. Опыт...«С места в карьер»: как помочь выпускникам выйти на переводческий рынок. Опыт...
«С места в карьер»: как помочь выпускникам выйти на переводческий рынок. Опыт...
 
А не замахнуться ли нам на...
А не замахнуться ли нам на...А не замахнуться ли нам на...
А не замахнуться ли нам на...
 
Сказки, которыми мы живем. Вебинар Ульяны Рудик
Сказки, которыми мы живем. Вебинар Ульяны Рудик Сказки, которыми мы живем. Вебинар Ульяны Рудик
Сказки, которыми мы живем. Вебинар Ульяны Рудик
 
Обеспечение качества перевода. Сергей Лещинский
Обеспечение качества перевода. Сергей Лещинский Обеспечение качества перевода. Сергей Лещинский
Обеспечение качества перевода. Сергей Лещинский
 
Vox Translatorum: результати опитування перекладачів щодо їх роботи з термінами
Vox Translatorum: результати опитування перекладачів щодо їх роботи з термінамиVox Translatorum: результати опитування перекладачів щодо їх роботи з термінами
Vox Translatorum: результати опитування перекладачів щодо їх роботи з термінами
 
Cтратегия синхронного перевода C.Cаржевского
Cтратегия синхронного перевода C.CаржевскогоCтратегия синхронного перевода C.Cаржевского
Cтратегия синхронного перевода C.Cаржевского
 
Практическое руководство для переводчиков от бюро переводов «Трактат»
Практическое руководство для переводчиков от бюро переводов «Трактат»Практическое руководство для переводчиков от бюро переводов «Трактат»
Практическое руководство для переводчиков от бюро переводов «Трактат»
 
Устный переводчик в кабине, в команде и в жизни. П.Палажченко
Устный переводчик в кабине, в команде и в жизни. П.ПалажченкоУстный переводчик в кабине, в команде и в жизни. П.Палажченко
Устный переводчик в кабине, в команде и в жизни. П.Палажченко
 
VoxTran: третий мастер-класс Александра Поддубного «SWEATware» из серии «HARD...
VoxTran: третий мастер-класс Александра Поддубного «SWEATware» из серии «HARD...VoxTran: третий мастер-класс Александра Поддубного «SWEATware» из серии «HARD...
VoxTran: третий мастер-класс Александра Поддубного «SWEATware» из серии «HARD...
 
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...
 
VoxTran: вебинар с Александром Поддубным "Фрилансерами не рождаются"
VoxTran: вебинар с Александром Поддубным "Фрилансерами не рождаются"VoxTran: вебинар с Александром Поддубным "Фрилансерами не рождаются"
VoxTran: вебинар с Александром Поддубным "Фрилансерами не рождаются"
 
Вебинар "Стратегическое планирование для компаний и фрилансеров"
Вебинар "Стратегическое планирование для компаний и фрилансеров"Вебинар "Стратегическое планирование для компаний и фрилансеров"
Вебинар "Стратегическое планирование для компаний и фрилансеров"
 
Академическая программа SDL Trados
Академическая программа SDL TradosАкадемическая программа SDL Trados
Академическая программа SDL Trados
 

PEMT: практические вопросы для переводчиков и редакторов

  • 1. Постредактирование МП (PEMT): практические вопросы для переводчиков и редакторов Светлана Светова, “Плюс Перевод”, Санкт-Петербург
  • 2. План презентации • PEMT: цифры, факты, комментарии • Некоторые практические аспекты PEMT • Взаимодействие с заказчиком  Тип МП: важно ли знать тип МП и разбираться в МП  МП хорошего качества: хорошо ли для переводчика  Настройка и улучшение МП заказчика: должен ли переводчик в этом участвовать  PEMT для понимания vs. Полное PEMT • PEMT как новый вид деятельности  Обратная связь от переводчиков, страхи и ожидания  Удобство работы пост-редактора  Профиль пост-редактора  Инструкции по PEMT  Рекомендации по PEMT
  • 3. The “term used for the correction of machine translation output by human linguists/editors” (Veale and Way 1997) “checking, proof-reading and revising translations carried out by any kind of translating automaton” (Gouadec 2007) “In basic terms, the task of the post-editor is to edit, modify and/or correct pre- translated text that has been processed by a machine translation system from a source language (a) in to target language(s).“ (Allen 2003) “Post-editors … are translators from MT language …” (H.Krings, Repairing Texts: Empirical Investigation on MT PE Processes, 2001) “According to Hutchins (1986), the term “post-editor” was introduced in 1950 by Erwin Reifler who described the task as follows: “to select the correct translation from the possibilities found by the computer dictionary and to rearrange the word order to suit the target language…” (H.Krings, Repairing Texts: Empirical Investigation on MT PE Processes, 2001)
  • 4. 4 ○ Overall volumes continue to grow but prices are down (avg $0.13/word) ○ The market for translation technology is worth $1,287m ○ PEMT market is slowly growing – currently at about 3% of the LS market, worth of $1,238m ($841m last year). ○ Two technology trends: Machine translation and cloud-based software ○ Foreign exchange issues affect market sizing. ○ 17.45% of LSPs sell Post Edited MT – (although the number is probably higher but LSPs do not identify this as a different service from Translation) What’s happening to the market?
  • 5. PEMT, еще цифры  чтобы стать хорошим пост-редактором, хорошо бы “отпостредактировать” минимум 100 000 слов  ожидания по скорости постредактирования: 600 слов в час  ожидания по приросту производительности: в 2 раза (5 000-10 000 слов в день)  3 текста вместо стандартных 2 при PEMT для обработки (исходный + МП + собственно перевод)  3-5 лет – максимальный опыт PE у пост-редакторов  80% переводчиков не имеют опыта PE  прирост производительности – в среднем 10%, хотя цифры встречаются любые  стандартная скидка на PEMT от полной пословной ставки – 30%  МП = TM fuzzy match 80-90%  правило “2 секунд” (см. Рекомендации по PEMT)
  • 7. Треугольник PEMT: 3 группы задач Заказчик Разработчик Переводчик 1. Внедрить МП для сценариев, когда недостаточно ресурсов для выполнения перевода по традиционной схеме/ требуется увеличить объем перевода в рамках ограниченного бюджета/когда требуется увеличить объем перевода в пределах того же количества переводческих ресурсов 2. Купить и настроить систему (обратная связь) 3. Расширить применение (включая сферы и языки) 4. Обучить МП-специалистов 5. Повысить эффективность процессов 1. Получить больше объемов на перевод (включая те, которые не были бы получены без МП) 2. Выработать новые навыки (в т.ч. переводить больше и быстрее, не теряя в деньгах) 3. Выработать подход к новым условиям 1. Получить опыт внедрения 2. Улучшить качество МП на конкретном опыте (обратная связь и настройка) 3. Расширить применение (включая языковые пары) 4. Расширить клиентскую базу 5. Продать услуги по настройке и разработке 6. Продать услуги по обучению
  • 8. • Машинный перевод на основе правил (RBMT) – Лингвистические правила – Словарные базы данных – > отсутствие правил > качество перевода • Статистический машинный перевод (SMT) – Использование вероятностного подхода (на анализе и паттернах) – Изучение предварительно переведенных данных – Способность к статистическому обучению – > ввод данных> качество перевода… способность к обучению • Гибридные системы машинного перевода (HMT) – Технологии объединены в новом подходе к машинному переводу — "статистическом синтаксисе" – Автоматическое обучение + "грамматика" на основе правил – Система распознает "грамматику" и способна к автоматическому обучению Типы МП
  • 9. Тип МП: важно ли переводчику знать тип МП и разбираться в МП  тип RMBT традиционно считается более устойчивым с точки зрения терминологии (после настройки), SMT – более читабельным  выбор системы МП обычно связан с языковым направлением (в первую очередь)  таблицы типовых ошибок МП обычно приветствуются переводчиками для получения представления о возможных проблемах, связанных с выбором системы МП  уровень настройки системы МП напрямую связан с объемом последующего постредактирования и решения проблем в его процессе, основанных на понимании поведения системы Переводчику не повредит знание о возможностях или пределах настройки МП для получения представления об объемах постредактирования (в непосредственной связи с трудозатратами и расчетом стоимости)
  • 10. МП хорошего качества: хорошо ли для переводчика  хорошо настроенная система МП – дополнительные расходы на стороне заказчика – дополнительные ожидания по экономии в процессе перевода и росту производительности  более низкая ставка для переводчика?  но и меньшие трудозатраты для переводчика? в идеале – просто проверить и подтвердить?  угроза полного перехода на МП при переводе данного типа текстов?  существует также мнение, что просто все удалить и переписать – более легкое для переводчика действие, чем выискивать ошибки в МП, особенно хорошего качества (которое может быть намного, намного лучше)
  • 11. Связанная с предыдущей тема: должен ли переводчик участвовать в повышении качества системы МП и ее настройке  хорошо настроенная система МП – меньшие трудозатраты для переводчика?  быстрее перевел – быстрее получил следующий объем?  не отвлекаешься на повторяющиеся раздражающие ошибки? (МП повторяет ошибку до тех пор, пока ее не исправишь в системе)  одновременно развиваешь новый интересный навык?
  • 12. 1) пост-редактирование до финального качества (полноепост-редактирование, full PEMT) – наиболее часто выполняемый вид работ – в результате “не должен быть виден МП”, высокие (стандартные) ожидания по качеству – для текстов широкого применения 2) пост-редактирование для понимания (light PEMT) – требуется реже (если вообще требуется) – менее высокие ожидания по качеству – фокус на смысле – применяется для текстов, не требующих массового использования Два основных вида пост-редактирования МП 12 Перед началом работы целесообразно уточнить ожидания заказчика.
  • 13. PEMT как новый вид деятельности
  • 14. Постредактирование в сравнении с редактированием 14 • Постредактирование МП заменяет традиционный этап перевода • Весьма отличается от редактирования ручного перевода (другие, “свои” типы ошибок) • Приветствуется понимание “поведения” системы • После постредактирования МП требуется этап стандартного редактирования
  • 15. Страхи и ожидания  Новая деятельность, мало информации, у заказчиков высокие ожидания  Слишком сильное давление на переводчиков, которые должны принимать решения в условиях пониженной ставки и меньшего времени при высоких ожиданиях  Отмечается корреляция между отношением переводчика к PEMT (положительное-отрицательное) и скоростью работы  Переводчик без опыта постредактирования относится к ошибкам МП так, как будто они сделаны человеком (эмоции - лишнее время)  Хороший МП – “все пропало, у переводческой профессии нет будущего”  Плохой МП – “я сейчас все удалю и гениально перепишу, но при этом получу на 30% меньше”  Опасения привыкнуть к “стилю МП” и перестать замечать ошибки.  Переводчики склонны более доверять нечетким совпадениям в ТМ (“сделано человеком”), чем МП-сегментам  Но некачественный результат МП вызывает меньше раздражения, чем “человеческий” сегмент из ТМ  При PEMT приходится иметь дело с 3 текстами вместо 2, отсюда рост когнитивной нагрузки  Пост-редактирование – по-прежнему “непрестижная” деятельность (?), мало креатива  Переводчики очень устают от постредактирования, гораздо сильнее, чем от перевода (связано и с типом текстов, подлежащих МП, например, длинные списки наименований продукции …) Опыт, навык, здравый смысл, расчет и обсуждение условий – лучшие друзья пост-редактора.
  • 16. Удобство работы пост-редактора  Текущий стандарт работы – в CAT, где результат МП = еще одно нечеткое совпадение (fuzzy match)  Вопрос: должен ли результат МП быть нечетким совпадением или подсказкой?  Современные требования к разработчикам по части PEMT: • формирование отчета, фиксирование времени, запись действий…  Основное известное требование к разработчикам средств PEMT – внедрить кнопку DELETE ALL  • предварительная оценка качества МП – связанная с объемом постредактирования ставка • предварительная оценка пригодности текста к МП (MT-friendly content) • самообучение системы в процессе работы и обновление последующих сегментов  Обучение
  • 17. Профиль пост-редактора  большинство пост-редакторов МП в настоящее время – штатные сотрудники  пост-редакторами могут становиться только опытные переводчики со склонностью к редактированию, поскольку неопытные и без склонности легко увлекутся возможной гладкостью МП (хотя встречается и точка зрения, что начинающих переводчиков легче обучить постредактированию и убедить в его целесообразности)  постредактирование МП требует непредвзятого отношения, гибкого подхода - и умения видеть в МП еще один профессиональный инструмент для повышения собственной эффективности и конкурентоспособности  пост-редактору МП явно не повредят:  отличные языковые навыки  знание предметной области  опыт работы с системами CAT и средствами автоматической проверки и интерес к технологиям  навык редактирования и умение быстро принимать решения  положительное отношение к МП  склонность к экспериментированию  практика, практика, практика (100 тыс. слов )
  • 18. Инструкции по PEMT Инструкции по PEMT создаются под требования конкретных заказчиков и конкретных проектов, а не “вообще”, это связано с ожиданиями по качеству и уровнем настройки/типом МП (обычно инструкция по PEMT содержит 3 пункта как минимум: ожидания/требования по качеству, разбор типовых ошибок МП, рекомендации) Таблицы типовых ошибок МП включаются в инструкции для напоминания о возможных проблемах (=доп. проверках) Поскольку МП-ошибки повторяются, PEMT – это не всего лишь “исправить одно слово и одну запятую”, речь может идти о структурных изменениях на всем пространстве текста (текстов), о чем инструкции напоминают При PEMT обычно рекомендуется пренебрегать стилем, а не терминологией или правильной передачей смысла, большинство инструкций советует “стараться использовать как можно больше из результата МП” Пост-редакторы должны следовать и стандартным процедурам (QA и т.д.)
  • 19. Инструкции по PEMT – традиционная часть • Результат перевода должен быть корректным и истинным отображением исходного текста • Перевод должен соответствовать всем правилам выходного языка • Обязательным условием является последовательное использование правильной терминологии • Необходимо применение соответствующего документу стиля • Должны использоваться справочные материалы (проектные указания, базы TM, глоссарии, терминологические базы и т.д.) • Форматы дат и времени, единиц измерения, числовых выражений, валют и пр. должны быть адаптированы к правилам выходного языка • Должно воспроизводиться форматирование исходного документа • Перевод должен быть читабельным и пригодным для целей его использования
  • 21. 21 Инструкции по PEMT - рекомендации Убедитесь, что вся информация передана корректно Проверьте все числовые выражения Проверьте корректность терминологии Вносите необходимые изменения только в том случае, если значение передано неправильно или искажено Не меняйте структуру текста, если значение передано верно Всегда помните, что превалируют конкретные требования заказчика
  • 22. Для максимального удовольствия от эксплуатации данной палатки следуйте, пожалуйста, нашим рекомендациям. Постановка палатки Выберите максимально ровную поверхность. Очистите её от острых камней и веток. Правила противопожарной безопасности. • не держите плитки, горелки и лампы близко к материалу палатки • следуйте противопожарной инструкции пришитой внутри палатки • держите выход свободным от вещей Пример, просто пример
  • 23. Типовые рекомендации пост-редактору Минимум усилий для максимума результата (как можно меньше коррекции) И как можно меньше времени Вносить изменения только тогда, когда это совершенно необходимо Ничего не добавлять по сравнению с исходником Ничего не удалять по сравнению с исходником
  • 24. И вот еще рекомендации… 24 Пытайтесь использовать результат МП по максимуму Не стоит стараться “гениально переписать” все заново – равно как и оставить все как есть Всегда перечитывайте результат перевода после постредактирования Находите те фрагменты в результате МП, использование которых может значительно ускорить работу Правило “2 секунд”
  • 25. Раз • Прочитать исходный текст, затем МП • Определить пригодные для использования фрагменты Два • Откорректиро вать МП • Стараться не пытаться все переписать или оставить как есть • Фокус – на корректности Три • Провести дополнительные проверки • Исправить опечатки • Проверить терминологию Этапы постредактирования 25
  • 26. Обучение по PEMT: что предлагается в настоящее время  SDL PEMT Certification (бесплатно для пользователей SDL Trados Studio)  TAUS Post-Editing Course с различными языковыми модулями
  • 27. Рис. 3 Спасибо за внимание! svetlana.svetova@plustranslation.ru

Hinweis der Redaktion

  1. Average price per word in 2012 was $0.13 Pressure remains on translation and translators who are looking at ways to become more productive. Emphasize PEMT Trend ( in our own SDL research Machine Translation & releated services are seen as the major disrupter over next 2 years CLOUD BASED- SUBSCRIPTION : We talk about this from SDL Perspective later ( GS Cloud & Language Cloud)