|
Получил на посмотреть в полуфункциональном состоянии первый модуль программы-наследника MT2007.
Проект наследника в большой степени, можно сказать, хулигански-развлекательный (подразнить крупных кошачьих, кодовое имя Catnip).
Одна из дразнилок — встраивание лингвистических алгоритмов для (а) сегментации, (б) создания «терминологических» баз с морфологией, (в) поиска похожего и автоматической сборки возможно правильных переводов.
Еще одна дразнилка — создание «терминов» и правил их подстановки на основе регулярных выражений с упрощенным интерфейсом и набором шаблонов для наиболее вероятных преобразований (типа «поменять местами», «вставить посередине нужное из списка моделей», «согласовать род и падеж» и пр.).
Еще из нового (по сравнению с МТ2007) в наследнике…
1. Поддержка проектов из нескольких файлов (черновик модуля создания проекта я, собственно говоря, и разглядывал). Из интересного, как мне показалось: возможность включать в проект (в дополнение к переводимым файлам, существующим ТМ и пр.) «справочную литературу», т. е. документы, на которые ТМ нет, но в которые заглядывать приходится.
(Кстати, поскольку в том, на что я смотрел, пока сегментация на основе лингвистических данных (WordNet) не встроена, вдруг становится очевидно, насколько при подключении «лингвистики» сегментация лучше.)
2. Модульная архитектура с возможностью встраивания дополнительных правил и процедур обработки для конкретных языков или типов текстов.
Пока выглядит довольно интересно. Бум посмотреть.
|