В данной статье собраны программы (программы translation memory, электронные словари, программы для распознавания текста, программы для подсчета статистики, программы для локализации приложений, программы для перевода сайтов, другие программы для переводчиков), в том числе – бесплатные, которые позволяют переводить больше текстов за меньшее время. Так же даны краткие описания этих программ с ссылками на первоисточники для скачивания и установки. Надеемся, что Вы найдете здесь что-то полезное для себя.

ПРОГРАММЫ TRANSLATION MEMORY

Translation memory (переводческая память, накопители переводов) – программы, позволяющие «не переводить одно и то же два раза». Это базы данных, которые содержат ранее переведенные единицы текста. Если в новом тексте обнаруживается единица, которая уже есть в базе, система автоматически добавляет ее в перевод. Такие программы значительно экономят время переводчика, особенно если он работает с однотипными текстами.

Trados . На момент написания статьи – одна из самых популярных программ Translation memory. Позволяет работать с документами MS Word, презентациями PowerPoint, HTML-документами и файлами других форматов. В Trados есть модуль для ведения глоссариев. Сайт: http://www.translationzone.com/trados.html

Déjà Vu . Также один из лидеров по популярности. Позволяет работать с документами практически всех популярных форматов. Есть отдельные версии программы для переводчиков-фрилансеров и для бюро переводов. Сайт: http://www.atril.com/

OmegaT . Поддерживает большое количество популярных форматов, но документы в MS Word, Excel, PowerPoint требуется конвертировать в другие форматы. Приятная особенность: программа бесплатная. Сайт: http://www.omegat.org/

MetaTexis . Позволяет работать с документами основных популярных форматов. Предлагается два варианта программы – модуль для MS Word и серверная программа. Сайт: http://www.metatexis.com/

MemoQ . Функционал схож с Традосом и Déjà Vu, стоимость программы (на момент написания статьи) ниже, чем у более популярных систем. Сайт: http://kilgray.com/

Star Transit . Предназначена для перевода и локализации. На данный момент совместима только с ОС Windows. Сайт: http://www.star-group.net/DEU/group-transit-nxt/transit.html

WordFisher . Бесплатная система Translation Memory, созданная и поддерживаемая профессиональным переводчиком. Сайт: http://www.wordfisher.com/

Across . Предлагается 4 различных версии программы, отличающихся по объему функционала. Сайт: http://www.across.net/us/translation-memory.aspx

Catnip . Бесплатная программа, «наследница» программы MT2007. Сайт: http://mt2007-cat.ru/catnip/

ЭЛЕКТРОННЫЕ СЛОВАРИ

Здесь мы представили только электронные словари для автономной работы (без доступа в интернет). Онлайн-словарей значительно больше, им будет посвящена отдельная статья. Хотя интернет проник в самые удаленные уголки планеты, полезно иметь хотя бы 1 словарь для работы в автономном режиме. Мы рассмотрели словари для профессионального использования, разговорники и словари для изучающих язык сюда не вошли.

ABBYY Lingvo . На данный момент позволяет переводить с 15 языков. Есть несколько версий программы с разным объемом словарей. Существует версия для мобильных устройств. Платная версия словаря устанавливается на компьютер и может работать без подключения к интернету, бесплатная доступна только онлайн. Программа совместима с Windows, Symbian, Mac OS X, iOS, Android. Сайт: http://www.lingvo.ru/

Мультитран . Не все знают, что существует офлайновая версия этого популярного словаря. Может устанавливаться на компьютеры (стационарные и карманные), смартфоны. Работает с Windows, Symbian и Android, а также Linux (через браузер). На данный момент позволяет переводить с / на 13 языков. Сайт: http://www.multitran.ru/c/m.exe

Promt . У данной программы есть версии для профессионального использования. Плюс Промта в том, что он позволяет работать совместно с Trados. Сайт: http://www.promt.ru/

Slovoed . Может переводить c/на 14 языков. Устанавливается на стационарные компьютеры и ноутбуки, мобильные устройства и ридеры Amazon Kindle. Работает с операционными системами iOS, Android, Windows, Symbian, BlackBerry, bada, Tizen. У словаря несколько версий, в том числе – узкоспециализированные тематические словари. Сайт: http://www.slovoed.ru/

ПРОГРАММЫ ДЛЯ РАСПОЗНАВАНИЯ ТЕКСТА

ABBYY FineReader . Распознает текст на фотографиях, сканах, PDF-документах. Последняя (на момент написания статьи) версия распознает текст на 190 языках, а для 48 из них делает проверку орфографии. Сохранить полученный текст можно практически во всех популярных форматах (Word, Excel, PowerPoint, PDF, html и др.) Сайт: http://www.abbyy.ru/finereader/

CuneiForm (OpenOCR). Программа была создана как коммерческий продукт, однако на данный момент распространяется свободно. Совместима с операционными системами Linux, Mac OS X , Windows. Сайт: http://openocr.org/

ПРОГРАММЫ ДЛЯ ПОДСЧЕТА СТАТИСТИКИ

Translator’s Abacus бесплатная программа для подсчета количества слов в документах различного типа. Сайт: http://www.globalrendering.com/

AnyCount – платная программа, обладающая большим числом настроек. Например, можно посчитать кол-во знаков с пробелами или без пробелов, кол-во слов, строк, страниц, или задать единицу подсчета самостоятельно. Сайт: http://www.anycount.com/

FineCount – программа доступна в двух версиях, платной и бесплатной, которые различаются объемом функций. Сайт: http://www.tilti.com/

ПРОГРАММЫ ДЛЯ ЛОКАЛИЗАЦИИ ПРИЛОЖЕНИЙ

ПРОГРАММЫ ДЛЯ ПЕРЕВОДА САЙТОВ

ДРУГИЕ ПРОГРАММЫ ДЛЯ ПЕРЕВОДЧИКОВ

ApSIC Comparator – программа для сравнения файлов (исходный текст VS текст с изменениями, внесенными переводчиком). Сайт.

ТМ – это база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ. А в результате нет необходимости дважды переводить одно и то же предложение.

С другой стороны, при работе с крупными проектами переводчик сталкивается с проблемой согласованного применения терминологического глоссария в ходе длительного проекта или быстрого повторного использования ранее переведенного текста. По своей природе подобные рутинные задачи сравнительно легко (в отличие от машинного перевода) формализуются и программируются.

Каждая запись базы данных ТМ представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому. Несмотря на то что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, computer-aided/assisted translation), их не следует путать с программами машинного перевода (machine translation) – память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.

Как правило, запись памяти перевода состоит из двух сегментов: на исходном (source) и конечном (target) языках. Если идентичный (или похожий) сегмент на исходном языке встречается в тексте, сегмент на конечном языке будет найден в памяти перевода и предложен переводчику в качестве основы для нового перевода. Автоматически найденный текст может быть задействован как есть, отредактирован или полностью отвергнут. Большинство программ используют алгоритм нечеткого соответствия (fuzzy matching), существенно улучшающий их функциональные возможности, поскольку в этом случае можно находить предложения, лишь отдаленно напоминающие искомые фразы, но, тем не менее, пригодные для последующего редактирования.

Преимущества от использования такого программного обеспечения поначалу могут быть неочевидны – однако по мере наполнения базы данных результаты автоматической подстановки основ для перевода будут становиться все более точными и регулярными.

Архитектура автоматизированной системы и ее функциональные возможности могут различаться. Средства поиска могут работать как с целыми сегментами, так и с отдельными словами или фразами, позволяя переводчику выполнять терминологический поиск. В систему также включают отдельную программу для работы с глоссарием, содержащим утвержденные для применения в проекте термины. Некоторые системы работают с программами машинного перевода. Основной рабочий интерфейс либо встраивается непосредственно в имеющийся текстовый процессор, такой как Word, либо представляет собой отдельный редактор. В состав системы обязательно включают фильтры для импорта-экспорта файлов различных форматов. Кроме того, многие системы, если не все, имеют средство для добавления в память перевода сегментов из, как правило, имеющихся у переводчика старых переведенных файлов.

То, что применимо к понятию «обучение языку», применимо и к «Translation Memories».

«Пустая» система запоминает термины и предложения.

Строится «память переводов» – Translation Memory (TM).

TM становится «языковой памятью» по продукту или по деятельности компании в целом.

Системы ТМ: SDLX, TRADOS, Deja Vu, Star Transit, Trans Suite 2000, WordFast, WordFisher, ACROSS.

КОМБИНИРОВАННЫЕ СИСТЕМЫ

Технологии МП и ТМ друг друга дополняют, но никак не дублируют. Система МП готова к использованию сразу после установки (хотя это не исключает того, что в процессе работы пользователю захочется что-то изменить в словаре, алгоритмах перевода и т.п.). Систему ТМ необходимо специально настраивать на перевод текстов в какой-то конкретной области, и чем больше эти тексты друг на друга похожи (например, такая система используется для перевода стандартных договоров), тем меньше времени требуется для настройки.

В связи с этим совершенно логично появление гибридов – example-based machine translation – программ, объединяющих системы машинного перевода и ТМ (например, компания «ПРОМТ» создала интегрированную технологию PROMT Term и PROMT For TRADOS, которая объединяет систему TM TRADOS и систему машинного перевода – PROMT XT Professional). PROMT For TRADOS (P4T) предназначена для интеграции системы машинного перевода PROMT и системы ТM TRADOS:

Перевод в системе TRADOS;

Перевод в системе PROMT не найденных в ТМ сегментов;

Вставка переведенных PROMT сегментов в TM.

Схема автоматизированной цепочки перевода на основе интегрированной технологии PROMT-TRADOS

Применение интегрированной технологии делает процесс перевода больших массивов документации управляемым и повышает его экономическую эффективность.

Пример реализации проектов с применением интегрированной технологии PROMT-TRADOS.

Предположим, необходимо осуществить перевод инструкции к мини-АТС.

1. На первом этапе применяется программа PROMT TerM. Документы анализируются, и выявляется основная терминология, которая заносится в словари системы машинного перевода PROMT.

2. Выполняется машинный перевод (МП) с подключенным словарем, продолжается терминологическая работа по коррекции словаря.

3. Результаты МП корректируются и заносятся в ТМ переводимого документа.

4. Таким образом пользователь получает:

Терминологический словарь;

Переведенный документ;

Соответствующую переведенному документу TM, которая может быть использована в дальнейшей работе с документами подобного рода.

Системы автоматического проектирования

САПР - программное обеспечение, предназначенное для создания чертежей, конструкторской и технологической документации, а также 3D-моделей. В данный список включены наиболее распространённые CAx-программы (CAD, CAM, CAE).

Системы памяти переводов (Translation Memory): концепция и реализации 1. Идеология ТМ-инструментариев 2. Общий принцип ТМ 3. Состав системы ТМ 4. Функции ТМ 5. Обзор основных программ класса Translation Memory: ТРАДОС 3. 0 Deja. Vu SDLX 3. 0 Transit и Term. Star Word. Fisher 4 IBM Translation. Manager 2. 0 6. Преимущества и недостатки ТМ ТМ

Идеология ТМ-инструментариев Макото Нагао, Япония, университет г. Киото. В 1982 г. предложил новую концепцию машинного перевода, которая была основана на утверждении, что тексты должны переводиться по аналогии с текстами, ранее переведенными вручную. М. Нагао назвал свой подход к техническому переводу с английского на русский язык „Example based translation“ (перевод, основанный на примерах). Идея М. Нагао была использована некоторыми Makoto Nagao

Что такое Translation Memory? Translation Memory (ТM) - база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то этот сегмент отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ.

Идеология ТМ-инструментов ТМ-инструменты предназначены для сохранения пар предложений в переводческой базе данных. Каждая такая пара состоит из предложения из оригинала и его технического перевода на другом языке. Возможно размещение фрагментов текста и других форматов превышающих длину предложения или являющихся лишь его частью. Но в автоматическом режиме сохраняются именно предложения, поэтому довольно часто такие программы называют «память предложений» (от англ. Sentence Memory).

Принцип действия ТМ-инструментов ТМ-программы интегрируются с такими офисными программами, как, например, Word. Некоторые средства текста. из них имеют собственные редактирования технического Их интерфейсы мало отличаются от привычных для современного переводчика интерфейсов текстовых редакторов.

Память переводов и вспомогательные программы для перевода Классы: MT (Machine Translation) – автоматический или машинный перевод; программы CAT (Computer-assisted/aided translation) автоматизируют и облегчают труд переводчика в различных его аспектах, реализуют концепцию памяти переводов (translation memory), такие, как Trados, Omega. T, Deja. Vu, Word. Fast и т. п.

Принцип работы современных CAT-программ Программа делит исходный текст на сегменты (как правило, это предложения или части предложений), и переводчик вписывает перевод каждого сегмента прямо под исходным текстом или если текст представлен в виде таблицы - справа от него. Перевод сегмента сохраняется вместе с исходным текстом. Записываются также имя переводчика и дата перевода (что важно для командной работы). К сегменту можно вернуться в любой момент, чтобы проверить или изменить перевод. Программа помещает сегмент в память переводов, так что если он снова встретится в исходном тексте, его перевод подставится из ТМ автоматически. Кроме того, CATпрограмма имеет функцию поиска нечетких соответствий: она обнаруживает сегменты, только частично схожие с уже переведенным (например, совпадающие на 75 %), и дает «подсказки» по их переводу.

Cистема автоматизированного перевода Trados (Традос) Trados - система автоматизированного перевода, разработанная немецкой компанией Trados Gmb. H в 1992 году. Один из мировых лидеров в классе систем Translation Memory (TM, накопитель переводов). Система Trados включает несколько модулей, предназначенных для перевода текстов различного формата: документов Microsoft Word, презентаций Power. Point, текстов в формате HTML и других метаданных, документов Frame. Maker, Inter. Leaf и др. , а также для ведения терминологических баз данных (модуль Multi. Term).

Принцип работы системы Trados Концепция Translation Memory предполагает выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов, и за счет этого сокращение объема работы переводчика. Это выявление получило название выравнивания или сопоставления (alignment). Фрагменты, оставшиеся непереведёнными после выравнивания (сопоставления), передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT). Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает на однотипных текстах, где повторяемость словосочетаний достаточно высока.

Основные модули системы Trados * Trados Workbench - основной модуль для перевода документов, интегрируется в оболочку Microsoft Word; * Tag. Editor - модуль для перевода документов в формате HTML, XML и т. п. ; * Win. Align - модуль для создания памяти переводов на основе ранее переведённых двуязычных текстов; * S-Tagger - модуль для перевода документов в формате Frame. Maker и Inter. Leaf; * T-Window - модуль для перевода документов в формате Power. Point; * Multi. Term - модуль для ведения глоссариев; * Extra. Term

Что общего у программ Translation Memory - Сведение – Alignment Обслуживание – Maintenance Терминологический словарь – Terminology Program Текстовый редактор – Document Editor Конкорданс (Связка словоупотребле-ния с контекстом) – Concordance

Преимущества и недостатки программ класса Translation Memory Преимущества - Сокращение времени и объема работы переводчика - Улучшение последовательности перевода, особенно при работе нескольких переводчиков над одним проектом. - Увеличение прибыли за счет увеличения продуктивности труда - Повышение качества услуг за счет увеличения точности перевода терминов, особенно в специализированных текстах. Недостатки - Может делать перевод более „сухим“, утрачивается сама суть текста - Часто отсутствует связь предлагаемого программой предложения/текста с соседними предложениями и с текстом в целом - Оригинал должен быть в электронном виде - Одна ошибка распространяется на весь проект - Необходимо обучение самой программе, а при смене работы возможно, и не один раз (если работодатели работают с разными программами ТМ) - Подходит не ко всем видам текстов - Высокая стоимость

Литература: 1. 2. 3. 4. Грабовский В. Н. : Технология Translation Memory. „Мосты“ 2/2004 Кутузов, А. Б. : Компьютерные технологии в формировании профессиональной компетенции переводчика // Языки профессиональной коммуникации: сборник статей Третьей международной научной конференции, т. 2. – Челябинск, 2007 г. URL: http: //tc. utmn. ru/files/kutuzov_it. pdf Шахова Н. Г. : Поезд снова уходит. Домашний компьютер № 5 1. 05. 2000 Силонов А. : Программы, помогающие переводчику. Компьютерная неделя № 16 (238) Москва 16 -22. 05. 2000

Программы машинного перевода — это программы, которые специально разрабатываются для облегчения процесса перевода с помощью компьютера (букв. computer assisted translation ), как AutoCAD для инженеров или ArchiCAD для архитекторов. Такое программное обеспечение специально разработано, чтобы создавать, хранить, читать и записывать информацию в виде файлов под названием «память перевода» (букв. translation memories), при этом программа создает строку с языковой парой, автоматически находя для отдельного слова или словосочетания его соответствие на другом языке. Программа создает файл с названием, например, RU_EN или RU_IT и т.п., в котором слово или словосочетание на одном языке соответствует своему значению на другом языке.

Что такое «память перевода» и как она работает.

Память перевода (translation memory, TM) — это объемный файл с техническими терминами, сокращениями, устоявшимися выражениями.

Если вам предстоит перевести, например, сокращение «CCCP » с русского на английский с помощью программы машинного перевода (CAT), программа сразу предложит вам вариант перевода: Soviet Union.

На первый взгляд, все просто, но не все так просто, как кажется. Если мы переводим документ, не имеющий отношения к истории, тогда данная аббревиатура может означать нечто совершенно другое: c arbonyl c yanide m-c hlorophenyl h ydrazone , токсичный ионофор, разобщитель дыхательной цепи. Или, например, это может означать «c ombined c ommunity c odec p ack «, программный пакет Microsoft Windows для воспроизведения мультимедийных файлов.

Вот почему компания «Экспримере» не использует в работе программы автоматического перевода. Мы пользуемся исключительно терминологическими базами данных для технических переводов.

В.Н. Грабовский; Журнал практикующего переводчика "МОСТЫ" 2/2004

Статья рассказывает о новом инструменте переводчика – технологии Translation Memory (TM), благодаря которой осуществляется механизация переводческой деятельности.

Нейронные сети в работе переводчика

Теории машинного перевода, разрабатывавшиеся в вялотекущем режиме с незапамятных времен, с 1970-х годов получили серьезный импульс. Это было связано с существенными достижениями в области моделирования интеллектуальной деятельности. Помимо чисто научного интереса, это объяснялось возрастающей ролью межъязыковых коммуникаций в современном мире.

Кроме электронных словарей и словарей-разговорников, к середине 1990-х годов довольно большое распространение получили "электронные переводчики" (их стали называть технологией MT ). В принципе, "электронные переводчики" - это программы, которые могли обработать целый текст. Правда, на выходе получалось не совсем то, что надо, а если откровенно, то совсем не то. Для того, чтобы результат работы технологии MT стал действительно связным текстом, человеку приходилось немало поработать над ним.

Понятие “машинный перевод” стало общеизвестным. Довольно большое распространение у нас получили отечественные программы Stylus (сейчас она называется Promt и Сократ ). Впрочем, интерес к таких программам после периода первоначального любопытства постепенно снижался, и сейчас он невелик, даже несмотря на то, что их в значительной степени доработали. В настоящее время их используют в основном для знакомства с содержанием иноязычных сайтов в Интернете, а также для чтения и написания электронных писем на иностранном языке.

По большому счету, работа переводчика за столетия принципиально не изменилась. Да, появились компьютеры, этакие быстродействующие и удобные пишущие машинки. Да, появились "электронные переводчики". Однако при всем том, что технологии MT совершенствовались, они так и не стали инструментом, имеющим широкую сферу применения и позволяющим по-настоящему экономить время и силы.

Что такое технология Translation Memory

Новым инструментом переводчика стала технология Translation_Memory (TM). На Западе технология TM и созданный на ее базе инструментарий переводчика - Translation Memory Tools (TMT) - хорошо известны и широко применяются. Особенностью такой технологии является механизация переводческой деятельности, а не ее автоматизация в том виде, каком ее видели создатели технологии MT. Причем это более скромное, на первый взгляд, решение принесло практической пользы неизмеримо больше, чем глобальный замысел "электронных переводчиков".

Отличие от электронных словарей и других инструментов переводчика заключается в том, что типичная программа класса ТМ основана на нейронных сетях, которые способны в определенной степени моделировать работу человеческого мозга при обработке данных. Эти сети способны обучаться и анализировать сложные наборы данных, которые сложно обрабатывать с помощью линейных алгоритмов.

В этих программах используются размытый алгоритм, позволяющий отыскивать слова не только в их словарных формах, но и в других формах, например, в другом падеже. Кроме того, они могут находить словосочетания в другом порядке слов. Самоорганизующаяся искусственная нейронная сеть способна находить закономерности и определять взаимосвязи между ними. Программа сравнивает тот фрагмент, над которым вы сейчас работаете, с содержимым базы данных, и предоставляет эту информацию на дисплей. Она может установить, что данный фрагмент похож на аналогичный фрагмент, имеющийся в памяти системы, например, на 99%, на 74%, или даже на 20%.

Каждому переводчику знакомо ощущение, что фраза, над которой он сейчас бьется, уже где-то, когда-то встречалась, хотя бы в приблизительном виде. Причем попадалась либо в этом же материале, либо в каком-то другом, переводимом ранее. Прямо дежавю какое-то… Посмотреть бы ее, эту фразу, хотя бы для справки, чтобы толково сформулировать ту, над которой работаешь сейчас…

Начинаешь листать оригинал обратно, рыться на книжной полке. И часто бывало так, что искомая фраза действительно обнаруживалась. Чаще всего, когда уже поздно, уже после того, как работа над переводом закончена. Думается, в такую минуту все бы отдал за средство, которое помогло бы найти необходимый текст. Даже сейчас, когда печатаешь текст перевода с помощью компьютера, а не на пишущей машинке, всегда жаль переделывать то, что сочинялось с таким трудом. Давняя мечта переводчика - придумать какое-либо средство, которое бы освобождало от необходимости переводить одну и ту же фразу несколько раз.

Подобного рода идея лежит в основе создания технологии Translation Memory, или просто ТМ, на основе которой с конца 80-х - начала 90-х годов начали появляться более или менее работоспособные программы. По сути дела, такая программа представляет собой управляющую оболочку, которая работает с той или иной подключаемой базой данных (ТМ) и которую я бы назвал копилкой переводов. ТМ - это компьютеризированная версия большого картотечного шкафа, в котором хранится каждая фраза, которую вы когда-либо переводили, причем в паре - как на языке оригинала, так и перевода. Каждая такая пара называется билингва. Программа мгновенно напомнит вам, как эту фразу переводили в прошлый раз. Доступ к информации легкий и быстрый.

Обзор основных программ класса Translation Memory

В настоящее время на мировом рынке представлено несколько программных продуктов, использующих технологию ТМ. Они отличаются друг от друга, и порой существенно. Вместе с тем им всем присущи некоторые общие функциональные возможности.

Например, у них, как правило, предусмотрен текстовый редактор, имеющий два параллельных окна. Одно окно предназначено для текста оригинала, второе - для перевода. Когда в окно оригинала выводится исходный фрагмент текста (это может быть предложение, абзац, отдельное слово), начинается поиск аналогичного фрагмента в базе данных. Если в памяти оказался точно такой же фрагмент, он выводится в окно перевода автоматически. Если в точности такого же фрагмент не нашлось, но обнаружился какой-то похожий, то в окно программы выводится найденный фрагмент с указанием процента совпадения.

Переводчик редактирует предложенный программой текст перевода, приводя его в соответствие с оригиналом, посылает его в память базы данных и приступает к следующему. Если ничего не нашлось вообще, то переводчик переводит его с нуля, впечатывая текст в окошко перевода. Закончив работу над этим фрагментом, переводчик посылает его в память базы данных и приступает к следующему. Таким образом, пополнение ТМ происходит автоматически, по мере работы. Сразу после того, как билингва попала в ТМ, она становится доступной пользователю. Если ТМ-программа расположена на сетевом диске и с ней работают другие пользователи, то новая билингва сразу же становится доступной и для остальных переводчиков. После того, как фрагмент оригинала и фрагмент перевода отправлены в базу данных, в окно оригинала выводится следующий фрагмент.

Первую программу такого типа, получившую название Translation Manager, разработала фирма IBM. Вначале IBM использовала Translation Manager для собственных потребностей - для локализации (адаптации на иностранные языки) собственного программного обеспечения. Затем Translation Manager был предложен рынку в качестве коммерческого продукта, и некоторое время он был монополистом в этой области. Эта программа довольно проста в использовании, отличается быстродействием и обеспечивает хорошие возможности для индивидуальных настроек пользователя. Для каждой из трех основных функций предусмотрены отдельные окна - Translation, Translation Memory и Dictionary. В окне Translation Memory отображаются найденные в памяти соответствия, если они там есть, а в окно Dictionary выводится терминология из словарей, разработанных IBM. Есть в этой программе и некоторые неудобства, например, усложненная процедура поиска в копилке памяти (Translation Memory) отдельных слов.

Еще одна программа - SDLX - разработана для своих собственных потребностей английской компанией SDL , занимающейся локализацией программного обеспечения. Каждая программа, входящая в комплект, устанавливается отдельно. SDL Edit - это, собственно, сама программа, с помощью которой осуществляется перевод. В ней есть три окна, показывающие исходный текст, перевод и Translation Memory. Следует отметить, что документ для перевода нельзя импортировать непосредственно в SDL Edit. Сначала его необходимо преобразовывать при помощи SDL Convert, что является определенным неудобством.

Программа Déjà Vu пользуется у переводчиков в Европе популярностью благодаря своей гибкости и адаптивности. Помимо удобства, Déjà Vu отличается от других продуктов самым высоким соотношением цена/качество. По сравнению с двумя предыдущими программами рассматриваемый продукт имеет ряд удобных возможностей. Специалисты отмечают, что с самого начала эта программа разрабатывалась в контакте с ее будущими пользователями. Известно, что последняя версия Déjà Vu тестировалась, в частности, российскими переводчиками. Один из них, Андрей Герасимов, написал положительную рецензию на эту программу в журнале MultiLingual Computing & Technology

Известна в нашей стране и популярная в Европе программа STAR Transit . По своей идеологии она совершенно не похожа на другие продукты рассматриваемого класса. Вы уже получили определенное представление о них, и знаете, что все они имеют центральную базу данных большой емкости, копилку переводов, в которой нужные данные обнаруживаются мгновенно (если они там есть, конечно). Как сказал бы Билл Гейтс: "Information at your fingertips". Так вот, все программы Translation Memory имеют электронный каталожный шкаф, а Transit - не имеет. У него все по-другому. Исходные данные и перевод сохраняются в текстовом формате в виде файлов, которые переводчик размещает в директориях по своему усмотрению. Затем переводчик может просто указать программе, какие директории и даже какие файлы ему необходимы. Затем Transit формирует ассоциативную сеть ссылок, с которой и ведется работа. Несмотря на отдельные плюсы, в России Transit не получил широкого распространения. В конечном счете Promt, официальный дистрибьютор Transit, переключился на дистрибуцию Translator’s Workbench фирмы Trados.

А вот Translator’s Workbench, или просто Традос, быстро получил широкое распространение в России, сначала среди переводческих фирм, а затем и среди индивидуальных переводчиков. Наверное, это можно объяснить тем, что он дает возможность работать, не выходя из Word’a, что психологически комфортней. Кому приятно смотреть на текст, испещренный всевозможными кодами в квадратных скобках? Translator’s Workbench (Традос) по сравнению с другими программами более удобен для обычного переводчика, который не является специалистом по программированию, он более понятен по сравнению с остальными программами подобного типа. В частности, кнопки управления снабжены всплывающими подсказками. Находясь в знакомом и понятном Word’е, можно использовать все его инструменты (например, автотексты).

Данный продукт обладает полным набором полезных инструментов, которые в остальных программах присутствуют лишь в той или иной степени. Одним из таких инструментов является Analise, позволяющий заранее проанализировать текст оригинала и выяснить, есть ли там (и в каком количестве) полные и неполные совпадения. Стоит упомянуть и такую удобный инструмент, как Placeables, позволяющую, например, автоматически менять цифры в тексте, если все остальное в переводимом фрагменте совпадает с обнаруженным в копилке переводов (ТМ). Очень удобна автоматическая функция замены в цифрах десятичных точек и/или запятых, формата времени, аббревиатур и т.д. на соответствующие параметры, задаваемые переводчиком.

Подавляющее большинство российских переводчиков, использующих технологию TM, предпочитают Translator’s Workbench (Традос).

Что общего у программ Translation Memory

Резюмируя описание основных программных продуктов класса Translation Memory, следует отметить наличие у них, как правило, ряда общих функциональных возможностей.

Сведение - Alignment

Эта функция позволяет создавать копилки переводов (ТМ) из существующих файлов. Из двух файлов - один с текстом оригинала, а другой с текстом перевода - создается набор билингв. Напротив предложения исходного текста выстраивается его перевод. И так по всем файлам, которые переводчик свел в единую копилку. Степень удобства функции совмещения у разных программ различная.

Обслуживание – Maintenance

По мере накопления в базе данных билингв их количество может увеличиться настолько, что содержимое базы может выйти за все пределы. Могут обнаружиться какие-то неточности и даже ошибки, особенно если программа используется в сети многими пользователями. Возникнет необходимость что-то отредактировать или уточнить, а то и просто удалить. Справедливости ради надо сказать, что упомянутое средство обслуживания программ до конца эту проблему не решает - бороться на практике с засорением копилок переводов все равно затруднительно.

Терминологический словарь - Terminology Program

Все рассматриваемые программы имеют свои терминологические словари, являющиеся по сути известными всем электронными словарями. Терминологические словари могут импортировать файлы в формате словарей или глоссариев, их можно пополнять и вручную.

Текстовый редактор - Document Editor

Здесь, собственно, и осуществляется процесс перевода. Для этого у всех программ предусмотрены упоминавшиеся выше два окна - для исходного текста и для его перевода. У всех текстовых редакторов есть возможность устанавливать в процентах степень сходства между переводимым в данный момент исходным текстом и текстом в копилке переводов. Чем выше вы установите процент сходства, например, 90% или 95%, тем меньше вероятность обнаружения там подходящего текста. Однако можно установит процент поменьше, тогда может набраться немало материала, который был бы полезен хотя бы для справки.

Конкорданс (Связка словоупотребления с контекстом) - Concordance

Это очень полезная функция всех рассматриваемых программ. Нередко бывает, что какой-то термин (или сочетание терминов) может иметь несколько значений или оттенков значений. Выделив термин, можно просмотреть в окне все билингвы, имеющиеся в копилке, причем в самых разных контекстах. Это всегда облегчает выбор наиболее точного варианта перевода данного термина или сочетания.

Наталья Шахова, директор агентства EnRus, считает что большинство TM-продуктов избавляют пользователя от необходимости знакомиться с различными текстовыми процессорами. Достаточно изучить особенности текстового редактора самого продукта, и вам станет подвластно все разнообразие текстов, будь они представлены в QuarkXPress, FrameMaker или Adobe Illustrator. Здесь есть, конечно, некоторый подвох: для того чтобы освоить очередной текстовый процессор или издательскую систему, вам понадобится соответствующая программа-фильтр, которая - что? Правильно - продается за отдельные деньги! Вообще денежный вопрос самый серьезный, когда речь идет о TMT. Стоят они недешево (как правило, несколько сотен долларов), совместимости, понятное дело, нет. Поэтому если вы приобрели (и освоили!) какой-либо продукт для одного проекта, то для следующего может потребоваться приобрести другой продукт и снова тратить время на его изучение.

Далее Наталья Шахова отмечает, что на Западе уже вовсю обсуждают последствия повсеместного распространения таких программ. Одно из них заключается в том, что переводчик-новичок теряет возможность выйти на рынок. Точно так же, как в России уже очень трудно получить заказ переводчику, если у него нет компьютера и принтера, так и за границей возникают проблемы трудоустройства у переводчиков, не имеющих TM-программы. У этого явления есть и положительная сторона - нанимая на работу владельца TM-программы, заказчик получает некоторую гарантию его профессионализма. Но ведь и новички должны иметь возможность стартовать!

Отношение к технологии Translation Memory в нашей стране разное.

Когда в 1999 году бюро переводов "Фонетикс" начало работать с Trados Translator’s Workbench, то естественно, в ходе контактов с заказчиками мы рассказывали о переходе на новую технологию. Вопреки ожиданиям, реакция была настороженной, а порой и просто отрицательной. Оказалось, что идея машинного перевода была уже скомпрометирована бездумным применением в 90-х годах программ типа Stylus и Socrat. Причем их нередко использовали переводчики, скажем, не очень высокой квалификации, которые не утруждали себя редактированием того, что выдавали "электронные переводчики". Впрочем, пользователей этих программ тоже можно понять - редактирование этих текстов требовало много времени и сил.

Даже сейчас порой можно встретить со стороны заказчиков из числа российских организаций настороженное отношение к любым новациям в сфере программного обеспечения для переводов. Вместе с тем иностранные фирмы, наоборот, требуют применения программ класса Translation Memory. Зачастую у них есть сложившиеся предпочтения, в основном это Trados Translator’s Workbench, а также Star Transit. У них нередко имеются готовые ТМ (копилки переводов), которые они предлагают использовать.

Что касается переводчиков, то они испытывают к технологии Translation Memory вполне понятный интерес. Еще более понятный интерес испытывают к ним бюро переводов. Они имеют дело не столько с художественной литературой, публицистикой, поэзией и т.д., сколько с инструкциями по эксплуатации, руководствами по поиску и устранению неисправностей, а также с локализацией программного обеспечения, т.е. с теми материалами, где имеются повторяющиеся или схожие фрагменты текста.

В своем нынешнем виде программы Translation Memory, по-видимому, достигли потолка. Дальнейшая работа по их доработке идет по пути совершенствования их существующих функциональных возможностей. Это ведет к тому, что программы становятся все более громоздкими и сложными, и это при том, что каких-то принципиально новых идей там нет. Тот же Translator’s Workbench (Традос) в своей последней версии оброс таким набором инструментов, что простому пользователю разобраться в них очень сложно.

Эксплуатация этой программы предполагает наличие в штате бюро переводов отдельного сотрудника. Помимо руководства пользователя, в документации предусмотрено руководство для выделенного специалиста (TRADOS Specialist Guide). Кроме этого в пакет документации входит Project Management Guide, MultiTerm User Guide и WinAlign User Guide. Даже у подготовленного переводчика на ознакомление с сотнями страниц этих документов потребуется много сил и времени.

Поиском новых решений занимается группа исследователей в университете Мэрилэнд, округ Балтимор (США), под руководством профессора С.Ниренбурга, известного специалиста в области искусственного интеллекта и машинного перевода. Пока разработки находятся на стадии теоретических исследований, и скорее всего, доведение этих исследований до стадии коммерческого продукта потребует значительного времени.

Обращает на себя внимание то обстоятельство, что на рынке инструментов переводчика работают в основном зарубежные фирмы. Хотелось бы надеяться, что это не будет продолжаться вечно. Потенциал теоретических разработок российских специалистов в области семантического анализа очень большой. Наши исследования в этой области достигли весьма высокого уровня. Есть все основания рассчитывать, что эти разработки будут материализованы в виде принципиально новых лингвистических технологий, которые позволят в полной мере раскрыть творческий потенциал переводчика.

Журнал практикующего переводчика «Мосты», одно из немногих профессиональных периодических изданий для переводчиков. В журнале публикуются статьи переводчиков различных специальностей, как устных, так и письменных. На страницах журнала переводчики, специализирующиеся в различных областях знаний, имеют возможность обсуждать актуальные проблемы, полемизировать друг с другом, делиться секретами профессионального мастерства.


Close