Новости Энциклопедия переводчика Блоги Авторский дневник Форум Работа

Декларация О нас пишут Награды Читальня Конкурсы Опросы
Страницы
Архивы

Что вижу, то и пою

Записки на манжетах сумасшедшего по поводу перевода

Подписаться на RSS  |   На главную

Минздрав предупреждает

Среди составителей текстов на этикетках встречаются не только простые разносчики английского, но и граммар-наци.

Первые пишут «30% less calories».

Вторые – «30% fewer calories».


28 августа 2018 Константин Лакшин | 2 комментария


Learners vs. disciples

Открываю новый раздел «ИИ, машинное обучение и прочая чушь». Писать буду по-русски и по-английски, а также не суржике из обоих, короткими перебежками, поскольку времени и молока на большее не хватает.

13 июня 2018 г.

Is machine learning a misnomer?

I think it is. Those honestly looking for learners, not to mention «fast learners», are few and far between. Learners are disruptive, and not really in demand. Disciples is what pretty much everybody is (and has been for quite some time) looking for.

17 июня 2018 г.

Еще по теме (более-менее)…

RBMT, EBMT, SBMT, NMT практически ничем, если не считать «упаковки и маркировки», друг от друга не отличаются.

В варианте RBMT некто с нейронными сетями на белковой основе обработал на каталожных карточках некий корпус, а затем попытался скормить результаты ЭВМ в машиночитаемом виде.

В случае EBMT и SBMT часть обработки (большая/бОльшая?) была переложена на небелковых участников процесса (вот корпус, вот правила обработки — вперед!).

А NMT – просто для ленивых. Вкалывают роботы, а не человек. (с) (Вот корпус, а детали додумайте сами.) Но при этом, похоже, что мало кто задумался о том, где один ленивый человек стоит десяти вкалывающих роботов. И наоборот (приложений для ИИ полно, но ищут их не там).

Заявление полемическое.


13 июня 2018 Константин Лакшин | 3 комментария


Референдум в СМИ: Ж или Х?

Правительство Каталонии по-каталански зовется «женералитат».

По-испански/на языке оккупантов: «хенералидад».

В испанском номинально нет «ж» (диалекты/варианты произношения не обсуждаем).

В итальянском номинально нет «х».

Давеча слушал Euronews по-итальянски.

И они старательно выговаривали «хенералидад», словно назло проголосовавшим за независимость.


5 октября 2017 Константин Лакшин | 13 комментариев


Ленд-лиз и перевод

Возник вдруг вот какой вопрос: а как осуществлялось лингвистическое сопровождение поставок по ленд-лизу?

Ведь поставляли довольно много относительно сложного (военной техники), в т. ч. в разобранном виде. Советские специалисты настолько хорошо знали матчасть и достаточно хорошо английский для того, чтобы обойтись без переводчиков? Был перевод, но нам о нем (в отличие от перевода на Нюрнбергском процессе) забыли рассказать? Или?


25 июня 2017 Константин Лакшин | 9 комментариев


Какой же интересной была жизнь по части коннективити — совсем недавно

В процессе как бы генеральной уборки перебрал и вернул на место несколько коробок технологического наследия. (Я луддит, консерватор, старьевщик и пессимист: а если завтра война, и придется разом перематывать трансформаторы, сооружать источники питания из подручных средств и припаивать их к распотрошенным дивайсам, пусть у меня хоть что-то будет наготове.)

Обнаружил: переходники со старого маковского видео на VGA, универсальные ИП/зарядники с десятком разных штекеров, преобразователи напряжения из всего во все, самые разные кабели/переходники USB, от «оригинальных» до mini-, micro- и фирменных от WD, фильтры для DSL и т. д., и т. п. Самому почти что стыдно.


5 июня 2017 Константин Лакшин | 5 комментариев


Чудеса словообразования

Про существование этого слова я слышал не раз, но живьем впервые столкнулся с ним (в радиопередаче) несколько дней назад: shawoman.


8 мая 2017 Константин Лакшин | 5 комментариев


Еще про языки и Гугл-переводчика

Недавно заполнял анкету, составленную в основном по-английски, но содержавшую несколько вопросов по-испански. Из чисто хулиганских побуждений ответил на них на моем топорном испанском. А потом пришло в голову прогнать написанное через Гугл-переводчика. Результаты, по-моему, довольно забавные (испанский – как бы оригинал; остальное – перевод Гугла).

Veo que es solamente para interpretes españoles. Pero estudiaba ambos idiomas en la Unión Soviética hace tantos años, aunque no puedo decir que los aprendí. Además, producir oraciones completas en español es demasiado para mi después de vivir mas que la mitad de mi vida en los Estados Unidos.

I see that it is only for Spanish interpreters. But I studied both languages in the Soviet Union so many years ago, although I can not say I learned them. In addition, producing complete sentences in Spanish is too much for me after living more than half of my life in the United States.

Je vois qu’il est seulement pour les interprètes espagnols. Mais les deux langues étudiées dans l’Union soviétique il y a plusieurs années, bien que je ne peux pas dire que j’appris. Produisent également des phrases complètes en espagnol est trop pour moi après avoir vécu plus de la moitié de ma vie aux États-Unis.

Vedo che è solo per gli interpreti spagnoli. Ma entrambe le lingue studiate in Unione Sovietica, molti anni fa, anche se non posso dire che ho imparato. Inoltre producono frasi complete in spagnolo è troppo per me dopo aver vissuto più di metà della mia vita negli Stati Uniti.

Я вижу, что это только для испанских переводчиков. Но оба языка учился в Советском Союзе много лет назад, хотя я не могу сказать, что я узнал. Также производит полные предложения на испанском языке слишком много для меня после того, как живет более половины своей жизни в Соединенных Штатах.


8 апреля 2017 Константин Лакшин | 11 комментариев


Пиджинизация, креолизация, Интернет и машинный перевод

Это скорее закладка на будущее, чем полноценный блогпост. (Навеяно первыми двумя комментариями в блоге John Gower’а про (полу)перевод.)

Не первый месяц собираюсь толком задуматься, а потом и высказаться вот на какую тему общего характера…

Изначально пиджинизация и креолизация были привязаны к зонам приграничных контактов, т. е. более-менее по определению их доля в, условно говоря, общем языковом фонде была не слишком велика.

Потом более-менее синхронно на горизонте появились международные организации/корпорации и средства дальней связи (от телеграфа/телефона до эл. почты и далее). Т. е. возникли новые возможности для пиджинизации/креолизации без тупого/физического/приграничного контакта. (Я не видел (но особенно и не искал) ничего конкретного на тему, например, английского ЕС/ООН и пр. как пиджина или креольского, но, кмк, пиджинизация и креолизация там цветут.)

Следующая глава сей повести…

Переносимся в наше время: глобальные торговые площадки, блоги, социальные сети, смс и т. п. + машинный перевод.

Та еще, по-моему, питательная среда для пиджинизации/креолизации. С одной стороны, масса пар-троек-четверок (и далее) из заинтересованных в «купить-продать» лиц, говорящих на разных языках. С другой – МП, который может порождать приемлемый для совершения сделок текст на пиджине. С третьей, общий разброд и шатание по части коммуникационных стандартов и, кмк, довольно заметное влияния девайсов и каналов связи на авторов текста. (Меня, например, некоторое время сильно раздражали сообщения эл. почты без обозначения темы и заглавных букв от людей заведомо куда более грамотных, чем я. А потом дошло, что я от них ожидаю просто [устарелого?] русского, а они пишут на совершенно нормальном русском смс.)


22 марта 2017 Константин Лакшин | 4 комментария


Пара слов про машинный перевод…

Музыкой, т. е. работой, навеяло. В окрестностях НГ я кое-чего успел почитать про «достижения» МП за прошлый год (Adaptive MT, NMT vs. PBMT (и когда они успели еще одно сокращение выдумать?!)) и т. п. С тех пор все собираюсь, да никак не соберусь, что-нибудь [злобное] про состояние MT написать.

А за последнюю примерно неделю была пара заказов, заставивших в очередной раз задуматься.

Первый – примерно 600 слов на как бы примитивнейшую тему ССБТ (система стандартов безопасности труда).

Своими словами содержание мог бы (без особых искажений) пересказать за две минуты.

Угробил практически целый день на чтение стандартов ЕС (на которые ссылались создатели документа), их пересказов по-русски, ГОСТов Р, СТП, СТО и т. п.

Попытался представить себе (и даже проверил), что система МП сотворила бы на моем месте.

Второй – слайды на тему некоторого набора достаточно традиционных (не хайтек) технологий и связанных с ними ТУ, регламентов и пр.

При переводе второго возник ряд вопросов к автору по поводу физической бессмысленности написанного. (Должно же быть ровно наоборот!) После третьего (примерно) прочтения дошло, что автор, может быть, и крив, но я с претензиями — так и вовсе неправ.

Пример моей неправоты (кривой и «условно говоря») – написано автором и прочитано переводчиком: «во избежание таких-то нежелательных последствий необходима максимальная пластичность при таких-то температурах». На самом деле означает (примерно и тоже криво) «во избежание таких-то нежелательных последствий необходимо задать предел пластичности, которая при таких-то температурах не должна превышать…». (Автор всего лишь не очень внятно процитировал давно сидящий у него в печенках стандарт, который он слайдов за десять до того упоминал.)

К чему я все это излагаю?

К тому, что, разработчики МП, похоже, свято веруют в то, что, если найти волшебную палочку (нынешняя, как кажется, нейронные сети; до того были «большие данные», «чистые данные» и пр.), то, произведя некоторые манипуляции такой палочкой, пригодный к употреблению результат можно получить по схеме «набор закорючек > набор закорючек», больше никуда не подглядывая и об устройстве мира за пределами наборов закорючек ничего не зная.

Два упомянутых заказа мне представляются довольно наглядной иллюстрацией связанных с таким подходом проблем.

1. 600 слов про ССБТ
Один «канонический» исходник по версии ЕС – много разных и разнородных изложений [примерно] того же самого по-русски. Как выбрать более-менее уместный вариант?

2. Как ни толкуй набор закорючек сам по себе, получается бессмыслица. Чтобы понять, о чем это было, нужно заглянуть хотя бы в (а) учебник по сопромату и (б) в несколько мест в другом не обозначенном прямо наборе закорючек (стандарте в печенках автора).

И как этим ходам «научить» МП?


26 февраля 2017 Константин Лакшин | 7 комментариев


Язык лишним не бывает

На прошлой неделе переводил на русский с английского нечто, написанное носителями «третьего» языка, которым я худо-бедно владею. Особо не парился. Сейчас перевожу примерно такое же, но «третьим» языком не владею. Довольно мучительно.


23 августа 2016 Константин Лакшин | 59 комментариев



Page 1 of 612345...Last »