Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация О нас пишут Награды Читальня Конкурсы Опросы
Страницы
Архивы

Что вижу, то и пою

Записки на манжетах сумасшедшего по поводу перевода

Подписаться на RSS  |   На главную

Не прошло и полгода…

Получил на посмотреть в полуфункциональном состоянии первый модуль программы-наследника MT2007.

Проект наследника в большой степени, можно сказать, хулигански-развлекательный (подразнить крупных кошачьих, кодовое имя Catnip).

Одна из дразнилок — встраивание лингвистических алгоритмов для (а) сегментации, (б) создания «терминологических» баз с морфологией, (в) поиска похожего и автоматической сборки возможно правильных переводов.

Еще одна дразнилка — создание «терминов» и правил их подстановки на основе регулярных выражений с упрощенным интерфейсом и набором шаблонов для наиболее вероятных преобразований (типа «поменять местами», «вставить посередине нужное из списка моделей», «согласовать род и падеж» и пр.).

Еще из нового (по сравнению с МТ2007) в наследнике…

1. Поддержка проектов из нескольких файлов (черновик модуля создания проекта я, собственно говоря, и разглядывал). Из интересного, как мне показалось: возможность включать в проект (в дополнение к переводимым файлам, существующим ТМ и пр.) «справочную литературу», т. е. документы, на которые ТМ нет, но в которые заглядывать приходится.

(Кстати, поскольку в том, на что я смотрел, пока сегментация на основе лингвистических данных (WordNet) не встроена, вдруг становится очевидно, насколько при подключении «лингвистики» сегментация лучше.)

2. Модульная архитектура с возможностью встраивания дополнительных правил и процедур обработки для конкретных языков или типов текстов.

Пока выглядит довольно интересно. Бум посмотреть.


20 февраля 2010 Константин Лакшин | 5 комментариев