5. Прежние переводы хранятся в бумажном виде При большом объеме хранимых документов поиск конкретной фразы практически неосуществим
6. Наглядный пример В данном фрагменте Руководства пользователя количество повторов уже переведенного составляет 57%.
7.
8. Структура системы Память переводов Терминологическая база Проект Лет 10 назад компания IBM разработала «Систему памяти переводов» - Translation memory system
9. Структура системы Новое название - Computer-assisted translation tool (CAT tool) – Автоматизированная система перевода Память переводов Терминологическая база Лексикон Проект
12. Сегментация Исходный текст CONFIDENTIALITY AGREEMENT August ,2004 [address] Re: Confidentiality Agreement Ladies and Gentlemen: You have requested Confidential Information from Company1 Corporation ("Company1") concerning Company1 that is either confidential, proprietary, or publicly unavailable in connection with your consideration of a possible business combination ("Transaction") between you and Company1 involving TLLC. As a condition, and in consideration, of furnishing to you "Confidential Information" (as defined below), Andrew requires that you treat the Confidential Information so furnished confidentially as set forth in this letter agreement (the "Confidentiality Agreement"). 1. Confidential Information As used in this Confidentiality Agreement, the term "Confidential Information" means all information concerning Company1 and its subsidiaries or affiliates that is furnished or made available to you by Company1 or any agent or representative of Company1 or that is obtained or derived by you from any of the foregoing persons as part of your consideration of the Transaction,
13. Сегментация Текст, разбитый на сегменты Сегмент - абзац, предложение и т.п. Сегмент оригинала
17. Наиболее популярные системы По данным опроса, проведенного Imperial College London в августе 2006 года среди 900 переводчиков из 54 стран, наибольшей популярностью пользуются системы Trados , D é j à Vu X и Wordfast с разными приоритетами среди разных групп переводчиков Количество пользователей различно в разных подгруппах (внештатные переводчики, бюро переводов и т.п.). Deja Vu используется равномерно во всех группах.
18. Количество пользователей, использующих различные системы как основные (в %)
19. Оценка четырех систем по функциональным и нефункциональным критериям 3,4 3,9 4,0 3,3 Средний рейтинг 2,6 3,7 3,7 2,5 Поддержка пользователей 3,1 4,6 4,3 2,9 Соотношение "цена-качество" 3,4 4,1 4,0 3,3 Простота обучения 3,5 4,2 4,2 3,5 Удобство использования 3,4 3,8 4,1 3,3 Надежность 3,7 3,9 4,1 3,7 Быстродействие 3,8 3,4 3,8 3,3 Правильность нахождения совпадений 3,3 3,4 3,8 3,3 Нахождение совпадений 3,6 3,9 4,1 3,5 Функциональные возможности SDL Trados 2006 Wordfast D é j à Vu Trados Рейтинг систем по следующим критериям
20.
21. Источники Приведенные результаты взяты из документа: http :// www 3. imperial . ac . uk / portal / pls / portallive / docs /1/7307707. PDF Некоторые более ранние сведения приведены в документах: http :// www . accurapid . com / journal /03 TM 2. htm http :// www . accurapid . com / journal /03 TM 1. htm http :// www . atril . com / docs / Benis - ITI - DVX . pdf http :// www . techwr - l . com / techwhirl / magazine / technical / translationmemory . html Попытка собрать сведения о сравнительной эффективности популярных систем была сделана на форуме http://www.trworkshop.net/forum/viewtopic.php?t=6254 Плюсы и минусы систем неоднократно обсуждались на форумах http://trworkshop.net/forum/viewforum.php?f=16 http :// www . libra - k . ru / forum / viewforum . php ? f =18& sid =346091 f 51 e 807035 cfb 94 de 841 eaa 0 b 3 http :// tech . groups . yahoo . com / group / dejavu - L http://www.lisa.org
22. ПОЧЕМУ Déjà Vu X? Новое направление в технологии перевода
23. Все системы умеют находить в памяти переводов предложения, сходные с переведенными Запустите Déjà Vu X и откройте нужную память переводов ( Translation memory ). Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков). Выберите в меню Database команду Find Duplicate Sentences . Пометьте поле Find sets of duplicate source sentences. Пометьте поле Find sets of duplicate source sentences with identical translations. Пометьте поле Delete redundant sentences in each set of duplicates. Укажите нужные языки. Пометьте в разделе Miscellaneous : Удаление ненужных переводов одного и того же оригинала. Запустите Déjà Vu X и откройте нужную память переводов ( Translation memory ). Выберите в меню Database команду Find Duplicate Sentences . Пометьте поле Find sets of duplicate source sentences with different translations. Укажите нужные языки. Пометьте в разделе Miscellaneous : Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк. Выберите в меню View команду Toggle Sorting , чтобы упорядочить память переводов по алфавиту.
24. Запустите Déjà Vu X и откройте нужную память переводов ( Translation memory ). Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков). Выберите в меню Database команду Find Duplicate Sentences . Пометьте поле Find sets of duplicate source sentences. Пометьте поле Find sets of duplicate source sentences with identical translations. Пометьте поле Delete redundant sentences in each set of duplicates. Укажите нужные языки. Пометьте в разделе Miscellaneous : Удаление ненужных переводов одного и того же оригинала. Запустите Déjà Vu X и откройте нужную память переводов ( Translation memory ). Выберите в меню Database команду Find Duplicate Sentences . Пометьте поле Find sets of duplicate source sentences with different translations. Укажите нужные языки . Пометьте в разделе Miscellaneous : Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк. Выберите в меню View команду Toggle Sorting , чтобы упорядочить память переводов по алфавиту. Déjà Vu X , кроме того, автоматически подставляет фрагменты предложений из памяти переводов
25. Запустите Déjà Vu X и откройте нужную память переводов ( Translation memory ). Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры , чтобы удалить дублирующие записи ( проверьте правильность указания языков). Выберите в меню Database команду Find Duplicate Sentences . Пометьте поле Find sets of duplicate source sentences. Пометьте поле Find sets of duplicate source sentences with identical translations. Пометьте поле Delete redundant sentences in each set of duplicates. Укажите нужные языки . Пометьте в разделе Miscellaneous : Удаление ненужных переводов одного и того же оригинала . Запустите Déjà Vu X и откройте нужную память переводов ( Translation memory) . Выберите в меню Database команду Find Duplicate Sentences . Пометьте поле Find sets of duplicate source sentences with different translations. Укажите нужные языки . Пометьте в разделе Miscellaneous : Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк. Выберите в меню View команду Toggle Sorting , чтобы упорядочить память переводов по алфавиту. Déjà Vu X автоматически подставляет слова и из терминологической базы
26. Запустите Déjà Vu X и откройте нужную память переводов ( Translation memory ). Выберите в меню Database команду Find Duplicate Sentences . Укажите нужные языки . Пометьте в разделе Miscellaneous : Количество символов текста – 1052 Обычная система найдет 190 символов повторяющихся предложений - 18%: Обнаруживается больше повторов
27. Запустите откройте память переводов Выберите в меню команду задайте параметры , удалить записи проверьте Выберите в меню Database команду Find Duplicate Sentences . Пометьте поле Пометьте поле Find sets of duplicate source sentences Пометьте поле . Укажите языки . Пометьте разделе Удаление переводов оригинала . Запустите Déjà Vu X и откройте нужную память переводов ( Translation memory) . Выберите в меню Database команду Find Duplicate Sentences . Пометьте поле Find sets of duplicate source sentences Укажите нужные языки . Пометьте в разделе Miscellaneous : просмотра переводов выберите Déjà Vu X дополнительно найдет 424 символа повторяющихся фрагментов – 40%, итого - 58% . Не считая английских слов и чисел, которые подставляются в перевод автоматически ( View , Toggle Sorting и т.п., здесь не учтены) . 58% против 18%! C помощью функции "мозаичного перевода " ( AutoAssemble ) перевод автоматически собирается из фрагментов сегментов, найденных в памяти переводов, и терминов из терминологической базы. Обнаруживается больше повторов
29. Эффективность Статистика для одного из больших документов Точное совпадение с предложениями в памяти переводов 33,1% Неточное совпадение с предложениями в памяти 4,2% Сборка из фрагментов предложений в памяти и терминов 0,3% Копирование перевода аналогичных предложений далее по тексту 37,3% Перевод вручную 25,2% ------------------------- ----------------------------------------------------------------------- --- Примечание: Высокая степень совпадений объясняется тем, что в памяти переводов уже содержался предварительный перевод трех разделов данного документа. Полученная выгода очевидна
30. Analyze : Анализ наличия и степени повторений для другого реального проекта – оценка трудоемкости будущей работы Дубликатов – 17% Сходных элементов - 25% (сходство более 20%), - 16% (сходство до 20%) Точных совпадений – 21% Всего Несходных элементов – 23%
31. Почему Déjà Vu X Пример еще одного проекта 44% текста подставлено автоматически (память составлена по одному файлу)
32. Статистика для последнего проекта Экономические выгоды для бюро переводов в месяц легко подсчитываются
33. Эффективность Средний процент повторений в документах, обнаруживаемый системой – 20-30% . В месяце – 22 рабочих дня по 8 часов = 176 часов Норма переводчика: 1 страница в час 20% от 176 = 35 часов = 35 страниц = 4 рабочих дня ! В больших пакетах документов для некоторых документов процент повторений достигал 100% . Умножим на зарплату в час!
35. Основные этапы Создание и настройка проекта Импорт файлов Автоматический поиск в памяти переводов с использованием нечеткой логики и автоматическая сборка Ручной перевод Экспорт Переводчик создает и настраивает проект Переводчик импортирует документы DVX находит сходные предложения или строит часть перевода автоматически Переводчик переводит остальное DVX экспортирует документы Предварительная обработка документов проекта Переводчик приводит документы к виду, облегчающему перевод и предотвращающему возникновение проблем Редактирование и форматирование переводов Переводчик редактирует и форматирует экспортированные переведенные документы
36.
37.
38.
39.
40.
41.
42. Выборочный импорт части файла ( Excel ) Для текста, который не нужно переводить, задайте красный цвет шрифта, а при импорте укажите в параметрах фильтра "Ignore Red Text" . Если сделать копию столбца оригинала и задать для исходного столбца красный цвет шрифта, то первый столбец не будет импортирован и останется неизменным, а второй - будет импортирован и переведен, в результате чего получится таблица с колонками оригинала и перевода.
43.
44.
45.
46. Глобальный предварительный перевод ( Pretr anslation ) DVX просматривает памяти переводов и терминологические базы, чтобы автоматически вставить точный или сходный перевод
47. Автоматический поиск переводов сходных предложений ( Auto S earch ) Сходные сегменты Отличие оригинала от найденного сегмента Отличие найденного сегмента от оригинала При единственном выборе перевод подставляется в поле перевода автоматически
48.
49. Нечеткий поиск при предварительном переводе и ручном переводе При ручном переводе автоматический поиск с использованием нечеткой логики обнаруживает большее количество сходных сегментов
50. Автоматическая сборка ( AutoAssemble ) Автоматическая сборка перевода из фрагментов предложений в памяти переводов и элементов терминологической базы, если не найден перевод всего предложения , – уникальная функция, которая имеется только в Déjà Vu X Наличие нескольких вариантов перевода указывается цветом. Просмотр – нажатием правой кнопки мыши. Перевод подставляется в поле перевода автоматически
51. Ручной поиск в файлах памяти переводов ( Scan ) Сходные сегменты Искомое слово или словосочетание Найденный оригинал Найденный перевод
52.
53.
54.
55. Временный экспорт в MS Word для анализа и редактирования его средствами с возвратом в Déjà Vu X
56. Экспорт примечаний Примечания, введенные при работе в D é j à Vu X (как указано выше), будут видны и в экспортированном файле:
64. Сегментированный текст оригинала Редактируемые ячейки Фрагменты, найденные в памяти переводов и терминологической базе Предложения, найденные в памяти переводов Список импорти-рованных файлов Рабочее пространство
65. Выборочный вывод сегментов на экран Мощная система фильтрации сегментов по более чем десяти параметрам, включая заданные пользователем на основе SQL
77. Варианты систем DVX DVX Workgroup DVX Professional DVX Standard Standard – Автономная программа для внештатных переводчиков, может создавать проекты, не имеет некоторых развитых и автоматизированных возможностей . Professional – Классическая версия, предназначена для внештатных переводчиков и имеет все возможности. Workgroup – Все функции Professional плюс мощные возможности для управления работой переводчиков и организации групповой работы .
82. Ресурсы в сети Интернет для Déjà Vu X, основные форумы , где можно получить информацию и помощь 5. Автоматизированный перевод . Из открытой для дополнения энциклопедии Wikipedia – http://en.wikipedia.org/wiki/Computer-assisted_translation#Computer-assisted translation 6. Greek Translation Vortal -- http://www.translatum.gr/dics/translation-memory.htm 7 . Форум Lingvoda http://www.lingvoda.ru/forum/actualtopics.aspx?bid=9 8 . English Spanish Translator Org: Translation Forum – Translators Forums – CAT Tools - http://www.english-spanish-translator.org/cat-tools/