• 06 декабря 2024 14:00
  • 139
  • Время прочтения: 1 мин

УдмФИЦ УрО РАН и «Яндекс» объединяют усилия для развития технологий перевода и распознавания удмуртского языка

УдмФИЦ УрО РАН и «Яндекс» объединяют усилия для развития технологий перевода и распознавания удмуртского языка Фото: пресс-служба УдмФИЦ УРО РАН
Удмуртский федеральный исследовательский центр УрО РАН подписал договор о научно-техническом сотрудничестве с компанией «Яндекс». Совместная работа направлена на улучшение качества перевода между русским и удмуртским языками, а также на разработку технологий распознавания и синтеза удмуртской речи. Об этом сообщила пресс-служба УдмФИЦ УРО РАН.

Планируется, что к концу 2024 года «Яндекс Переводчик» будет дополнен не менее чем 100 тысячами выровненных русско-удмуртских предложений. В 2025–2027 годах база данных пополнится еще 300 тысячами параллельных предложений, созданных в рамках гранта Российского научного фонда (РНФ). Дополнительно будет использован монокорпус удмуртского языка, доступный на платформе udmcorpus.udman.ru.

В рамках сотрудничества ученые и разработчики уделят внимание не только текстовому переводу, но и технологиям распознавания и синтеза речи. Для создания синтезатора удмуртской речи будут использованы записи, озвученные ведущей радио «Моя Удмуртия» Светланой Пикулевой. Все разработки внедрят в сервисы и приложения «Яндекса», такие как «Переводчик», «Поиск», «Браузер», и другие.

Фото: пресс-служба УдмФИЦ УРО РАН

«С компанией «Яндекс» у нас налажен хороший диалог, - рассказывает руководитель гранта, старший научный сотрудник Удмуртского института истории, языка и литературы УдмФИЦ УрО РАН Мария Безенова. - С текстами работать умеем, вычиткой занимаются уже опытные люди. К тому же недавно у нас появился молодой программист, подготовил автовыравниватель. Так что даже выравнивать тексты вручную, как изначально планировалось, нам не придется. Поэтому никаких трудностей в реализации проекта на данный момент мы не видим».

Это сотрудничество откроет новые возможности для сохранения и популяризации удмуртского языка, улучшив его доступность в цифровых технологиях.