ApsuaTech

ApsuaTranslator

ApsuaTranslator — это чат-бот для перевода между абхазским и русским языками, разработанный в рамках моего курсового проекта и доступный всем желающим. Данный переводчик предоставляет возможность не только получить перевод, но и оценить уверенность системы в каждом из вариантов.

Использовать

Уникальность

#1

Открытый доступ и интерактивность

Переводчик доступен всем пользователям, а интерфейс включает функцию внесения исправлений: если вы заметили ошибку в переводе, достаточно нажать кнопку «Исправить перевод» и ввести корректный вариант.

#2

Качество перевода

Несмотря на ограниченный объём обучающих данных, переводчик достиг достаточно высокого качества. В большинстве случаев точность перевода превосходит Google Translate, но все же он может допускать ошибки.

Реализация

#1

Технологическая база

В основе работы переводчика лежит нейронная сеть с трансформерной архитектурой. В процессе разработки проводились эксперименты для определения оптимального числа слоев, гиперпараметров и методов аугментации данных.

#2

Источники обучения

Для обучения использовались корпуса, основанные на:
  1. открытом датасете, опубликованном Danial Zakaria на Kaggle.
  2. 3 томах русско-абхазского словаря Джонуа Бориса Георгиевича.
  3. Сопоставленных текстах библейского содержания и иных доступных источниках.
  4. Более 5000 слов и предложений, переведенных самостоятельно, и ручная корректировка нескольких десятков тысяч примеров.
Использовать