Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация О нас пишут Награды Читальня Конкурсы Опросы
Страницы
Рубрики
Архивы
Last referers
Visitors Online

Что вижу, то и пою

Записки на манжетах сумасшедшего по поводу перевода

Подписаться на RSS  |   На главную

Вопрос на засыпку?

Чтобы не сорить в форумах, пишу в блоге. Навеяно, как обычно, переводимым. (Поясню подробнее потом.)

Ниже небольшой список слов (подразумеваются не только сами слова, но и то, к чему они относятся/что к ним относится (вплоть до странных/неявных ассоциаций)).

Вопросы:

1) Что между ними общего?

2) В чем разница?

3) Любые иные соображения?

Собственно список:

конденсатор;

трансформатор;

резистор;

диод;

фотодиод;

фоторезистор;

тиристор;

термистор;

транзистор;

варистор.

 

 

 

 

 


25 Апрель 2016 Константин Лакшин | Комментариев (8)

О чем я хотел рассказать на UTIC 2014

Не знаю, что расслышали побывавшие на моем докладе. На всякий случай повторю еще раз, о чем я хотел рассказать, – в день доклада, а не когда писал заявку.

По пунктам…

  1. Функциональное ядро большинства «лидеров рынка» в том, что касается технологий обработки текстов на естественных языках, застряло на уровне середины девяностых.
  2. Это крайне отрицательно сказывается на производительности нашей работы и возможностях для «выигрыша темпа без потери качества».
  3. Все технологии (я не о машинном переводе), включая необходимые для их реализации наборы данных (например, словари с морфологической и грамматической разметкой), известны, легкодоступны и достаточно широко используются (в т. ч. в открытом ПО и некоммерческих проектах).
  4. Последние семь лет я работаю с малоизвестными, если угодно, экспериментальными инструментами (сначала – МТ 2007, а  теперь – Catnip) и представляю себе положительный эффект от применения таких технологий не понаслышке.

Задумался о том, что надо бы провести семинар  и показать, как оно выглядит на практике.


21 Май 2014 Константин Лакшин | Комментариев (4)

Здравствуйте, я ваша fuzzy

В процессе подготовки доклада прогнал через несколько кошек пять пар предложений (см. ниже).  Получилось, кмк, забавно.  Как именно, расскажу в следующей серии.

Если кому не лень повторить ненаучный эксперимент и поделиться результатами, буду признателен. (Достаточно короткого ответа: пара 1 — совпадение хх%, пара 2 — yy% и т. д.)

———————————

1.

To open Font menu, press Ctrl+1

Press Ctrl+1 to open Font menu

2.

Canceling your check

Cancelling your cheque

3.

Analysing and characterising behaviours

Analyzing and characterizing behaviors

4.

Theatergoers should endeavor to advertize this little-recognized theater

Theatregoers should endeavour to advertise this little-recognised theatre

5.

This subsidized urbanization program antagonizes, polarizes and jeopardizes our colorful neighborhoods

This subsidised urbanisation programme antagonises, polarises and jeopardises our colourful neighbourhoods

 

 


17 Октябрь 2013 Константин Лакшин | Комментариев (8)

Обещанного три года ждут (как бы неофициальный анонс)

Три с лишним года тому назад я написал: «Получил на посмотреть в полуфункциональном состоянии первый модуль программы-наследника MT2007».

С тех пор и до февраля этого года с наследником ничего не происходило. А с мая работаю только в нем.

Более того, уехавший в отпуск разработчик перед отъездом успел склепать временный сайт  и выложить на него последний вариант существующей бета-версии для скачивания.

——————————————————————————-

UPD: Поступила первая жалоба (от Uncle A). Я ответа пока не знаю.

Предварительный ответ дилетанта

Для работы программы Catnip на компьютере должны быть установлены два компонента, которые не обязательно входят в стандартную конфигурацию  Windows, а именно: (а) Microsoft .NET Framework 4 и (б) Microsoft Visual C++ 2010 Redistributable Package.

Установлены ли они на конкретном компьютере, можно узнать, просмотрев список установленных программ в Панели управления (Панель управления > Программы > Программы и компоненты).

1) Если компонент Microsoft .NET Framework 4 не установлен, его можно установить отсюда (установка через Интернет) или отсюда (автономный установщик).

2) Установщики Microsoft Visual C++ 2010 Redistributable Package (vcredist_x64 и (или) vcredist_x86) находятся в папке PreInstall архива Catnip.

Если на компьютере установлена более новая версия Microsoft Visual C++ 2010, при запуске установщика vcredist_x64 или vcredist_x86 появляется сообщение об ошибке.

Это сообщение, скорее всего, можно смело игнорировать, т. е. закрыть установщик и попробовать запустить Catnip.


26 Июнь 2013 Константин Лакшин | Комментариев (4)

Не прошло и полгода…

Получил на посмотреть в полуфункциональном состоянии первый модуль программы-наследника MT2007.

Проект наследника в большой степени, можно сказать, хулигански-развлекательный (подразнить крупных кошачьих, кодовое имя Catnip).

Одна из дразнилок — встраивание лингвистических алгоритмов для (а) сегментации, (б) создания «терминологических» баз с морфологией, (в) поиска похожего и автоматической сборки возможно правильных переводов.

Еще одна дразнилка — создание «терминов» и правил их подстановки на основе регулярных выражений с упрощенным интерфейсом и набором шаблонов для наиболее вероятных преобразований (типа «поменять местами», «вставить посередине нужное из списка моделей», «согласовать род и падеж» и пр.).

Еще из нового (по сравнению с МТ2007) в наследнике…

1. Поддержка проектов из нескольких файлов (черновик модуля создания проекта я, собственно говоря, и разглядывал). Из интересного, как мне показалось: возможность включать в проект (в дополнение к переводимым файлам, существующим ТМ и пр.) «справочную литературу», т. е. документы, на которые ТМ нет, но в которые заглядывать приходится.

(Кстати, поскольку в том, на что я смотрел, пока сегментация на основе лингвистических данных (WordNet) не встроена, вдруг становится очевидно, насколько при подключении «лингвистики» сегментация лучше.)

2. Модульная архитектура с возможностью встраивания дополнительных правил и процедур обработки для конкретных языков или типов текстов.

Пока выглядит довольно интересно. Бум посмотреть.


20 Февраль 2010 Константин Лакшин | Комментариев (5)

Кому он нужен, этот кошко?!

См. содержание первой серии тут.

Все тайное становится явным: на прошлой неделе «смысл пламенного призыва к написанию ТЗ переводчиками» был разъяснен в форуме ГП.

В связи с этим решил поделиться впечатлениями от двухлетнего опыта эксплуатации «индивидуальной модели бюджетной инвалидной коляски» (с) Юрий В.

Катастрофы

За два года работы могу вспомнить две крупные аварии…

Однажды, в первые месяцы работы,  вскоре после того как я успокоился насчет надежности инструмента и перестал создавать резервные копии «ежесекундно», развалилась на мелкие кусочки база данных текущего проекта. Причина установлена не была. Скорее всего — самострел, т. е. бросил ноут в сумку (не выключив) полностью, после чего попал в грозу. В связи с недостатком времени и конструктивных идей пришлось тупо вскрыть остатки нештатным консервным ножом и после выкидывания явного мусора поковыряться в останках преимущественно вручную. Процентов восемьдесят нужного выковырялось.

Вторая авария случилась буквально в ночь перед Рождеством (западным) и хорошо иллюстрирует вполне реальный риск при работе с «написанным на коленке». Поскольку программа была изначально предназначена для использования при переводе с английского на русский, на предмет работы в другом направлении ее, видимо, вообще никто и никогда не тестировал.

А у меня как раз была пара довольно больших документов с русского на английский. Тут-то и оказалось, что встроенный готовым гнушный модуль, отвечающий за индексацию и поиск похожего в подключенных ТМ, просто ничего «не понимает» за пределами Latin-1. Причем этот, мягко говоря, «баг» всплыл только при попытке pre-translate с подглядыванием в ТМ, а внутри документа то ли я его не заметил, то ли все было нормально, т. к. работал другой механизм поиска совпадений. Я тогда выкрутился тупым переводом кириллицы в транслит, а к старому НГ подоспела и обновленная версия на другом гнушном движке (в которой заодно был расширен список «официальных» языков оригинала и перевода).

(Продолжение следует.)


31 Август 2009 Константин Лакшин | Комментариев (5)

Синдром Вордфаста?

В данный момент вижу всякое разное относительно новое из инструментария для переводчика (TEnT, так сказать). Года два на такое не глядел, т. к. нашел нечто меня устраивающее.

Наблюдается, как мне кажется, забавная тенденция. Опиум становится доступнее для народа, но народ не очень-то реагирует на возможность заторчать по-своему. :=)

Вот что имеется в виду…

Лет тридцать тому назад инструментарий для перевода разрабатывали только очень крупные акулы (Сименс, Ай-Би-Эм и т. п.) исходя из собственных интересов (т. е. явно не для переводчика).

Лет десять-пятнадцать тому назад такой инструментарий стали разрабатывать гораздо менее крупные акулы и даже просто всякая мелочь пузатая без мотора (см. ForeignDesk, Rainbow, WordFisher, OmegaT, Wordfast и т. п.), которые стали заводить разговоры насчет учета нужд отдельных производителей переводов.

В последние несколько лет, как кажется, заняться инструментарием может практически кто угодно. Причем практически все выступают под лозунгом «сделано переводчиками для переводчиков»,

Вот тут-то и начинается синдром Вордфаста! (Собственно говоря, все то же самое применимо, как кажется, и к Омеге.) Поначалу все звучит очень заманчиво: обещают делать инструментарий под переводчика. В конечном счете, появляется маленький и более дешевый Традос, т. е. вместо инструмента, подстраиваемого под переводчика, появляется еще один инструмент, под который переводчику предлагается подстроиться.

В чем тут дело? У переводчиков не сложился образ полезного инструментария (машины для производства денег с нулевым налогообложением не рассматриваются)? Писать техническое задание ломает? Предлагаемый инструментарий более чем устраивает? Деньги не пахнут? Или?


20 Июль 2009 Константин Лакшин | Комментариев (51)