Обзор основных программ класса Translation Memory. Обзор основных программ класса Translation Memory Переводческая память

В данной статье мы собрали программы, в том числе - бесплатные, которые позволяют переводить больше текстов за меньшее время. Надеемся, что Вы найдете здесь что-то полезное для себя.

Программы Translation memory

Translation memory (переводческая память, накопители переводов) - программы, позволяющие «не переводить одно и то же два раза». Это базы данных, которые содержат ранее переведенные единицы текста. Если в новом тексте обнаруживается единица, которая уже есть в базе, система автоматически добавляет ее в перевод. Такие программы значительно экономят время переводчика, особенно если он работает с однотипными текстами.

Trados . На момент написания статьи - одна из самых популярных программ Translation memory. Позволяет работать с документами MS Word, презентациями PowerPoint, HTML-документами и файлами других форматов. В Trados есть модуль для ведения глоссариев. Сайт: http://www.translationzone.com/trados.html

Déjà Vu . Также один из лидеров по популярности. Позволяет работать с документами практически всех популярных форматов. Есть отдельные версии программы для переводчиков-фрилансеров и для бюро переводов. Сайт: http://www.atril.com/

OmegaT . Поддерживает большое количество популярных форматов, но документы в MS Word, Excel, PowerPoint требуется конвертировать в другие форматы. Приятная особенность: программа бесплатная. Сайт: http://www.omegat.org/

MetaTexis . Позволяет работать с документами основных популярных форматов. Предлагается два варианта программы - модуль для MS Word и серверная программа. Сайт: http://www.metatexis.com/

MemoQ . Функционал схож с Традосом и Déjà Vu, стоимость программы (на момент написания статьи) ниже, чем у более популярных систем. Сайт: http://kilgray.com/

Star Transit . Предназначена для перевода и локализации. На данный момент совместима только с ОС Windows. Сайт: http://www.star-group.net/DEU/group-transit-nxt/transit.html

WordFisher . Бесплатная система Translation Memory, созданная и поддерживаемая профессиональным переводчиком. Сайт: http://www.wordfisher.com/

Across . Предлагается 4 различных версии программы, отличающихся по объему функционала. Сайт: http://www.across.net/us/translation-memory.aspx

Catnip . Бесплатная программа, «наследница» программы MT2007. Сайт: http://mt2007-cat.ru/catnip/

Электронные словари

Здесь мы представили только электронные словари для автономной работы (без доступа в интернет). Онлайн-словарей значительно больше, им будет посвящена отдельная статья. Хотя интернет проник в самые удаленные уголки планеты, полезно иметь хотя бы 1 словарь для работы в автономном режиме. Мы рассмотрели словари для профессионального использования, разговорники и словари для изучающих язык сюда не вошли.

ABBYY Lingvo . На данный момент позволяет переводить с 15 языков. Есть несколько версий программы с разным объемом словарей. Существует версия для мобильных устройств. Платная версия словаря устанавливается на компьютер и может работать без подключения к интернету, бесплатная доступна только онлайн. Программа совместима с Windows, Symbian, Mac OS X, iOS, Android. Сайт: http://www.lingvo.ru/

Мультитран . Не все знают, что существует офлайновая версия этого популярного словаря. Может устанавливаться на компьютеры (стационарные и карманные), смартфоны. Работает с Windows, Symbian и Android, а также Linux (через браузер). На данный момент позволяет переводить с / на 13 языков. Сайт: http://www.multitran.ru/c/m.exe

Promt . У данной программы есть версии для профессионального использования. Плюс Промта в том, что он позволяет работать совместно с Trados. Сайт: http://www.promt.ru/

Slovoed . Может переводить c/на 14 языков. Устанавливается на стационарные компьютеры и ноутбуки, мобильные устройства и ридеры Amazon Kindle. Работает с операционными системами iOS, Android, Windows, Symbian, BlackBerry, bada, Tizen. У словаря несколько версий, в том числе - узкоспециализированные тематические словари. Сайт: http://www.slovoed.ru/

Программы для распознавания текста

ABBYY FineReader . Распознает текст на фотографиях, сканах, PDF-документах. Последняя (на момент написания статьи) версия распознает текст на 190 языках, а для 48 из них делает проверку орфографии. Сохранить полученный текст можно практически во всех популярных форматах (Word, Excel, PowerPoint, PDF, html и др.) Сайт: http://www.abbyy.ru/finereader/

CuneiForm (OpenOCR). Программа была создана как коммерческий продукт, однако на данный момент распространяется свободно. Совместима с операционными системами Linux, Mac OS X , Windows. Сайт: http://openocr.org/

Программы для подсчета статистики

Translator"s Abacus - бесплатная программа для подсчета количества слов в документах различного типа. Сайт: http://www.globalrendering.com/

AnyCount - платная программа, обладающая большим числом настроек. Например, можно посчитать кол-во знаков с пробелами или без пробелов, кол-во слов, строк, страниц, или задать единицу подсчета самостоятельно. Сайт: http://www.anycount.com/

FineCount - программа доступна в двух версиях, платной и бесплатной, которые различаются объемом функций. Сайт: http://www.tilti.com/

Программы для локализации приложений

Программы для перевода сайтов

Другие программы для переводчиков

ApSIC Comparator - программа для сравнения файлов (исходный текст VS текст с изменениями, внесенными переводчиком). Сайт: http://www.apsic.com/en/products_comparator.html

AfterScan - программа для автоматической проверки и коррекции исходного текста. Обнаруживает и исправляет опечатки, ошибки, отсутствующие пробелы, ошибки при распознавании текста. Сайт:

В настоящее время на мировом рынке представлено несколько программных продуктов, использующих технологию ТМ. Они отличаются друг от друга, и порой существенно. Вместе с тем им всем присущи некоторые общие функциональные возможности.

Например, у них, как правило, предусмотрен текстовый редактор, имеющий два параллельных окна. Одно окно предназначено для текста оригинала, второе - для перевода. Когда в окно оригинала выводится исходный фрагмент текста (это может быть предложение, абзац, отдельное слово), начинается поиск аналогичного фрагмента в базе данных. Если в памяти оказался точно такой же фрагмент, он выводится в окно перевода автоматически. Если в точности такого же фрагмент не нашлось, но обнаружился какой-то похожий, то в окно программы выводится найденный фрагмент с указанием процента совпадения.

Переводчик редактирует предложенный программой текст перевода, приводя его в соответствие с оригиналом, посылает его в память базы данных и приступает к следующему. Если ничего не нашлось вообще, то переводчик переводит его с нуля, впечатывая текст в окошко перевода. Закончив работу над этим фрагментом, переводчик посылает его в память базы данных и приступает к следующему. Таким образом, пополнение ТМ происходит автоматически, по мере работы. Сразу после того, как билингва попала в ТМ, она становится доступной пользователю. Если ТМ-программа расположена на сетевом диске и с ней работают другие пользователи, то новая билингва сразу же становится доступной и для остальных переводчиков. После того, как фрагмент оригинала и фрагмент перевода отправлены в базу данных, в окно оригинала выводится следующий фрагмент.

Первую программу такого типа, получившую название Translation Manager, разработала фирма IBM. Вначале IBM использовала Translation Manager для собственных потребностей - для локализации (адаптации на иностранные языки) собственного программного обеспечения. Затем Translation Manager был предложен рынку в качестве коммерческого продукта, и некоторое время он был монополистом в этой области. Эта программа довольно проста в использовании, отличается быстродействием и обеспечивает хорошие возможности для индивидуальных настроек пользователя. Для каждой из трех основных функций предусмотрены отдельные окна - Translation, Translation Memory и Dictionary. В окне Translation Memory отображаются найденные в памяти соответствия, если они там есть, а в окно Dictionary выводится терминология из словарей, разработанных IBM. Есть в этой программе и некоторые неудобства, например, усложненная процедура поиска в копилке памяти (Translation Memory) отдельных слов.

Еще одна программа - SDLX - разработана для своих собственных потребностей английской компанией SDL, занимающейся локализацией программного обеспечения. Каждая программа, входящая в комплект, устанавливается отдельно. SDL Edit - это, собственно, сама программа, с помощью которой осуществляется перевод. В ней есть три окна, показывающие исходный текст, перевод и Translation Memory. Следует отметить, что документ для перевода нельзя импортировать непосредственно в SDL Edit. Сначала его необходимо преобразовывать при помощи SDL Convert, что является определенным неудобством.

Программа Déjà Vu пользуется у переводчиков в Европе популярностью благодаря своей гибкости и адаптивности. Помимо удобства, Déjà Vu отличается от других продуктов самым высоким соотношением цена/качество. По сравнению с двумя предыдущими программами рассматриваемый продукт имеет ряд удобных возможностей. Специалисты отмечают, что с самого начала эта программа разрабатывалась в контакте с ее будущими пользователями. Известно, что последняя версия Déjà Vu тестировалась, в частности, российскими переводчиками. Один из них, Андрей Герасимов, написал положительную рецензию на эту программу в журнале MultiLingual Computing & Technology

Известна в нашей стране и популярная в Европе программа Star Transit. По своей идеологии она совершенно не похожа на другие продукты рассматриваемого класса. Вы уже получили определенное представление о них, и знаете, что все они имеют центральную базу данных большой емкости, копилку переводов, в которой нужные данные обнаруживаются мгновенно (если они там есть, конечно). Как сказал бы Билл Гейтс: "Information at your fingertips". Так вот, все программы Translation Memory имеют электронный каталожный шкаф, а Transit - не имеет. У него все по-другому. Исходные данные и перевод сохраняются в текстовом формате в виде файлов, которые переводчик размещает в директориях по своему усмотрению. Затем переводчик может просто указать программе, какие директории и даже какие файлы ему необходимы. Затем Transit формирует ассоциативную сеть ссылок, с которой и ведется работа. Несмотря на отдельные плюсы, в России Transit не получил широкого распространения. В конечном счете Promt, официальный дистрибьютор Transit, переключился на дистрибуцию Translator’s Workbench фирмы Trados.

А вот Translator’s Workbench, или просто Традос, быстро получил широкое распространение в России, сначала среди переводческих фирм, а затем и среди индивидуальных переводчиков. Наверное, это можно объяснить тем, что он дает возможность работать, не выходя из Word’a, что психологически комфортней. Кому приятно смотреть на текст, испещренный всевозможными кодами в квадратных скобках? Translator’s Workbench (Традос) по сравнению с другими программами более удобен для обычного переводчика, который не является специалистом по программированию, он более понятен по сравнению с остальными программами подобного типа. В частности, кнопки управления снабжены всплывающими подсказками. Находясь в знакомом и понятном Word’е, можно использовать все его инструменты (например, автотексты).

Данный продукт обладает полным набором полезных инструментов, которые в остальных программах присутствуют лишь в той или иной степени. Одним из таких инструментов является Analise, позволяющий заранее проанализировать текст оригинала и выяснить, есть ли там (и в каком количестве) полные и неполные совпадения. Стоит упомянуть и такую удобный инструмент, как Placeables, позволяющую, например, автоматически менять цифры в тексте, если все остальное в переводимом фрагменте совпадает с обнаруженным в копилке переводов (ТМ). Очень удобна автоматическая функция замены в цифрах десятичных точек и/или запятых, формата времени, аббревиатур и т.д. на соответствующие параметры, задаваемые переводчиком.

Подавляющее большинство российских переводчиков, использующих технологию TM, предпочитают Translator’s Workbench (Традос).

Говоря об автоматизированном переводе, обычно подразумевают программы, осуществляющие перевод на основе технологии машинного перевода (Machine Translation). Однако существует и другая технология - Translation Memory, которая хотя и не столь широко известна российским пользователям, но, тем не менее, имеет ряд преимуществ.

Бурное развитие технического прогресса привело к увеличению числа технических устройств, машин и другой сложной техники, без которых жизнь современного человека практически немыслима. Например, объем документации для европейского самолета Airbus исчисляется десятками тысяч страниц. Как показывают данные исследования, проведенного в конце 2004 года ассоциацией LISA (LISA 2004 Translation Memory Survey), 42% опрошенных переводят около 1 млн. слов в год, у 24% компаний - участников опроса ежегодный объем переводов составляет 1-5 млн., 12% переводят от 5 до 10 млн., объем переводов остальных компаний - от 10 до 500 и более миллионов слов в год. В частности, большинство производителей сегодня не ограничиваются своим локальным рынком и активно осваивают региональные рынки. При этом локализация продукции, в том числе перевод описания продукта на местный язык, является одним из обязательных условий для выхода на новый рынок.

В то же время, хотя производители регулярно выпускают новые версии своих продуктов - автомобилей, экскаваторов, компьютеров и мобильных телефонов, программного обеспечения, - далеко не все из них принципиально отличаются от предыдущих моделей. Подчас новая модель телефона представляет собой слегка измененную (или рестайлинговую) предыдущую модель. Новые версии продаются лучше, поэтому производителям приходится регулярно обновлять свои продукты. В результате документация по каждому из таких продуктов зачастую на 70-90% совпадает с той, что была у предыдущей версии.

Два фактора - большой объем требующих перевода документов и их высокая повторяемость - послужили стимулом к созданию технологии Translation Memory (сокращенно именуется TM, общепринятый русский перевод этого термина отсутствует). Суть технологии TM можно образно передать одной фразой: «Не переводить один и тот же текст дважды». Иначе говоря, Translation Memory используется для повторного использования ранее сделанных переводов. Это позволяет серьезно сократить время на подготовку перевода, особенно при работе с текстами, имеющими высокую степень повторяемости.

Технологию Translation Memory часто путают с машинным переводом (Machine Translation), которая, безусловно, тоже полезна и интересна, но ее описание не является целью настоящей статьи. Использование технологии ТМ повышает скорость перевода за счет уменьшения объема механической работы. Однако важно отметить, что TM не выполняет перевод за переводчика, а является мощным инструментом для сокращения затрат при переводе повторяющихся текстов.

Технология ТМ работает по принципу накопления результатов перевода: в процессе перевода в базе ТМ сохраняются исходный текст и его перевод. Для облегчения обработки информации и сравнения различных документов система Translation Memory разбивает весь текст на отдельные кусочки, которые называются сегментами. Такими сегментами чаще всего являются предложения, но могут быть приняты и другие правила сегментации. При загрузке нового текста система TM осуществляет сегментирование и сравнивает сегменты исходного текста с уже имеющимися в подключенной базе переводов. Если системе удается найти полностью или частично совпадающий сегмент, то его перевод отображается с указанием совпадения в процентах. Сегменты, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается только перевести новые сегменты и отредактировать частично совпадающие.

Как правило, задается порог совпадений на уровне не ниже 75%, так как если установить меньший процент совпадений, то увеличатся затраты на редактирование текста. Каждое изменение или новый перевод сохраняются в ТМ, так что нет необходимости переводить одно и то же дважды!

Важно также постоянно пополнять базу Translation Memory, сохраняя в базе (или в базах, если перевод выполняется по различным тематикам) пары сегментов «исходный текст - правильный перевод». Это позволит значительно сократить время, необходимое для перевода сходных текстов. Помимо снижения трудоемкости перевода система TМ позволяет выдержать единство терминологии и стиля во всей документации.

Использование технологии ТМ обеспечивает переводчику следующие преимущества:

  • повышение производительности труда. Подстановка даже на 80% совпадающих сегментов из базы переводов может сократить время работы над переводом на 50-60%. Как показывает практика, гораздо эффективнее править уже готовый перевод, чем переводить заново - «с нуля»;
  • единство терминологии и стиля при наличии базы переводов по тематике переводимого документа. Это особенно важно при переводе узкоспециальной документации;
  • организация работы коллектива переводчиков с гарантированным качеством перевода благодаря доступу к общей базе Translation Memory.

Отдельно отметим, что в западных странах, где технология Translation Memory давно уже стала де-факто обязательным инструментом переводчика, средства, потраченные на создание базы переводов, рассматриваются не как затраты, а, скорее, как инвестиции в стабильную и качественную работу, что увеличивает не только прибыль, но и стоимость самой компании.

Рынок систем Тranslation Мemory

Бесспорным лидером на рынке систем Translation Memory являются программы SDL-TRADOS. Летом 2005 года произошло объединение двух крупнейших разработчиков систем ТМ - компаний SDL и TRADOS (программные продукты под торговой маркой TRADOS хорошо известны многим пользователям), и теперь они выпускают совместный продукт, который является законодателем стандартов в области Translation Memory.

Новая система SDL-TRADOS имеет расширенные (настраиваемые пользователем) функциональные возможности нечеткого соответствия (поиск по совпадениям в базе переводов), а также инструментарий для проверки качества переводимых документов. Программа осуществляет проверку орфографии и защищает содержимое блоков памяти с помощью технологии шифрования.

Система поддерживает такие форматы, как Word DOC и RTF, online help RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML, включая HTML Help, RC (Windows Resource), Bookmaster (DCF) и Troff. Помимо системы SDL-TRADOS, на IT-рынке имеются и другие системы ТМ. Особенно широко представлены французские производители.

Система французской компании Atril (www.atril.com) называется. Ее разработчики сначала организовали собственное бюро перевода технической документации, после чего возникла идея создания специализированного ПО на основе технологии Translation Memory.

Это самостоятельное приложение с систематизированным меню. Система может создавать базы ТМ, а также базы данных терминологии и подключать словари. Процесс перевода осуществляется в специальной оболочке Project, куда при ее создании прикрепляется файл, который необходимо перевести, и подключаются дополнительные настройки: база ТМ, словари и др. Текст переводится в специальной таблице, где напротив каждой графы его оригинала нужно заполнить вариант перевода. К преимуществам также относится дополнительная функция для перевода файлов различных форматов, которая позволяет сохранить исходное форматирование файла.















10 Типичный процесс работы переводчика в действительности Не все так уж просто


Получение заказа: в любом удобном заказчику формате. Подсчет объема работ: часы, слова, символы. Не считать лишнего. Выполнение перевода: не переводить лишнее: то что уже переводили, дубликаты, цифры, даты, списки. Верстка: нужно чтобы перевод выглядел так же как оригинал(xml, html). Редактура: нет ошибок в документе, терминологическое единообразие. Отправка заказчику: сохранение документов, шифрование, обеспечение всех требований закзачика. 11 «Подводные камни»




Зачем нужны САТ системы? Зачем нужны САТ системы? 13 Объективная необходимость – переводить больше и быстрее Современные требования Эффективность и единообразие Совместимость и многоязычность Надежность, безопасность и контроль – важная информация защищена Интерфейс пользователя – легко научиться Процедура работы – удобно использовать Память переводов, терминологическая база, лексикон


14 Объективнаянеобходимость Объективная необходимость Работодатели требуют владения автоматизированными системами перевода Заказчики требуют предоставления перевода в виде базы данных Высокая конкуренция между переводчиками Требования к качеству и срокам


15 Современные требования Необходимость повышения качества переводов: Обеспечение единообразия терминологии Обеспечение единообразного перевода одних и тех же предложений Необходимость повышения эффективности (снижение трудозатрат, сокращение сроков): Автоматизация рутинных операций Исключение полного повторного перевода документации, в которую внесены изменения и дополнения Исключение повторного перевода одних и тех же слов и предложений




17 CONFIDENTIALITY AGREEMENT August,2004 Re: Confidentiality Agreement Ladies and Gentlemen: You have requested Confidential Information from Company1 Corporation ("Company1") concerning Company1 that is either confidential, proprietary, or publicly unavailable in connection with your consideration of a possible business combination ("Transaction") between you and Company1 involving TLLC. As a condition, and in consideration, of furnishing to you "Confidential Information" (as defined below), Andrew requires that you treat the Confidential Information so furnished confidentially as set forth in this letter agreement (the "Confidentiality Agreement"). 1. Confidential Information As used in this Confidentiality Agreement, the term "Confidential Information" means all information concerning Company1 and its subsidiaries or affiliates that is furnished or made available to you by Company1 or any agent or representative of Company1 or that is obtained or derived by you from any of the foregoing persons as part of your consideration of the Transaction. Исходный текст:








21 Основные функции САТ - систем Анализ Предварительный глобальный перевод по ТМ Автоматический поиск переводов сходных предложений Пополнение памяти переводов Сведение – создание TM по готовым переводам Пополнение и ведение терминологической базы данных Текстовый редактор




SDL TRADOS Последняя версия продукта – SDL Trados Studio 2011 (Freelance/Professional/Passolo) Работает с любыми языковыми комбинациями, поддерживаемыми Microsoft Word Системные требования – 2Гб оперативной памяти (для более устойчивой работы), процессор – Pentium IV (минимум) Поддерживает различные форматы файлов (Microsoft Office, Adobe, Java, InDesign)

Память переводов проекта (TM) - это хранилище исходных строк и их переводов на разные языки, которые можно использовать для ускорения перевода одинаковых или похожих строк в вашем проекте или других проектах.

Каждый перевод, сделанный в проекте, автоматически добавляется в память переводов проекта. Владелец или руководители проекта также могут при необходимости загрузить в проект Translation Memory.

Скачивание или загрузка памяти переводов

  1. Перейдите на вкладку TM & MT пункта настройки проекта .
  2. Нажмите кнопку скачать или загрузить .

You can upload and download TM in the following file formats .tmx, .csv, .xlsx.

Если вы загружаете TM в форматах файлов.csv или.xlsx, сопоставьте столбцы с соответствующими языками в диалоге конфигурации.

Привязка ТМ

Чтобы привязать какие-либо конкретные TM для вашего проекта, выполните следующие действия:

  1. Перейдите на вкладку TM & MT пункта настройки проекта .
  2. Нажмите **Привязать TM **.
  3. Выберите необходимые ТМ в открывшемся диалоговом окне.
  4. Кликните по кнопке Сохранить .

Вы можете установить приоритет выбранных ТМ в том же диалоге.

Совместное использование ТМ

Со всеми вашими TM используемыми совместно вы сможете предварительно перевести любой из ваших проектов, используя все общие TM. Кроме того, в редакторе будут показаны предложения по переводу ТМ из всех ТМ, назначенных для проектов, которыми вы владеете.


Применение памяти переводов через предварительный перевод

Предварительный перевод через ТМ позволяет использовать как минимум 100% и совершенные совпадения.