GigaChat будет обучен удмуртскому языку
В России 150 национальных языков, некоторые из которых находятся на грани исчезновения. Сохранить их помогут технологии искусственного интеллекта. Нейросетевая модель GigaChat начнёт обучаться удмуртскому языку. Соглашение о сотрудничестве в этой сфере заключили «Сбер» и Министерство национальной политики Удмуртской Республики. Документ был подписан в День удмуртского языка, который отмечается 27 ноября.
Для обучения модели регион предоставит разработчикам тексты на удмуртском языке с переводом на русский. Это будут книги, статьи, научно-образовательные публикации, посты из соцсетей и другие материалы. Чтобы искусственный интеллект «заговорил» на удмуртском, стороны будут работать с носителями языка и дополнят данные актуальной информацией и диалогами. Затем тексты пройдут проверку на ошибки и станут основой для машинного обучения.
Максим Ерёменко, вице-президент, директор Департамента развития искусственного интеллекта и машинного обучения Сбербанка, сказал: «Важно сохранить национальные языки народов России и передать их следующим поколениям. У «Сбера» для этого есть проверенные решения, которыми мы готовы делиться с нашими региональными партнёрами. Примеров, когда AI-технологии помогли воссоздать утраченное и сохранить культурное наследие, много. С помощью искусственного интеллекта мы занимались распознаванием рукописей Петра I и расшифровкой древних египетских манускриптов. Теперь GigaChat займётся изучением разных языков нашей большой страны. Подписанное соглашение с руководством Удмуртской Республики поможет обучить модель удмуртскому. У этого уникального национального языка начинается новый, цифровой этап эволюции».
Дарья Сунцова, постоянный представитель главы Удмуртской Республики при Президенте Российской Федерации – заместитель председателя правительства Удмуртской Республики, сказала: «Сохранение и развитие языков народов Российской Федерации – основной вопрос Стратегии государственной национальной политики нашей страны. В Удмуртской Республике для сохранения национального языка приняты региональные нормативные правовые акты. В том числе Госпрограмма, которая утверждена постановлением Правительства Удмуртской Республики от 20.11.2023 №748. В её рамках оказывается поддержка и развитие национальных СМИ, издаётся художественная, учебная и научная литература на национальном языке. Также ведётся активная работа по оцифровке удмуртского языка. Создание и обработка корпусов текстов, на которых впоследствии можно обучить модели искусственного интеллекта, важный и нужный процесс. Он поможет в дальнейшем не только переводить, но и генерировать тексты на удмуртском языке. Что особенно важно в эпоху цифровизации».