«Выучить новые языки «Переводчику» помогла большая языковая модель Google PaLM 2 - особенно хорошо она справилась с близкими друг к другу языками, например, с «близкими к хинди, такими как авадхи и марвади, а также французскими креольскими языками, такими как сейшельский креольский и маврикийский креольский», - рассказали в компании.
На 13 языках из списка, добавленных в «Переводчик», говорят в России: это аварский, башкирский, бурятский, чеченский, чувашский, осетинский, удмуртский, чукотский, тувинский, якутский, крымско-татарский, коми и луговомарийский языки, пишет 3DNews.ru.
Список новых поддерживаемых языков «Google Переводчика» включает в себя кантонский диалект китайского - он «долгое время был одним из самых востребованных» на платформе. Найти данные для обучения модели было непросто, поскольку он в значительной степени пересекается с мандаринским на письме. Еще около четверти новых языков происходят из Африки. На большинстве из новых языков говорят по меньше мере миллион человек, а в некоторых случаях речь идет о сотнях миллионов.
Цель Google - создать ИИ-модель, которая будет поддерживать 1000 языков. Ознакомиться с полным актуальным списком всех языков, которые поддерживает сервис, можно на сайте Google.