Microsoft проникла в Wikipedia с СПО-переводчиком

Открытое ПО Интернет Софт Веб-сервисы Свободное ПО
мобильная версия
, Текст: Антон Труханов
Исследовательское подразделение компании Microsoft совместно с Wikipedia запустило новый инструмент WikiBhasha. Он предназначен для простого перевода статей в онлайн-энциклопедии с английского на другие языки.

Microsoft Research, исследовательское подразделение компании Microsoft, объявило о запуске нового проекта WikiBhasha совместно с крупнейшей онлайн-энциклопедией Wikipedia.

Инструмент WikiBhasha создан исходя из предположения, что англоязычная версия Wikipedia наиболее полна по сравнению с версиями на других языках. Он позволяет редакторам Wiki находить контент в английской энциклопедии и переводить его на другие языки, после чего либо создавать новые статьи, которых нет в других языковых разделах, либо добавлять полученный текст в уже существующие.

По словам представителей Microsoft Research, новый инструмент будет поддерживать создание нового контента на более чем 30 языках мира. Его название — WikiBhasha — образовано от слова «bhasha», означающего «язык» на хинди и санскрите.

WikiBhasha — проектом с открытым исходным кодом, выпущенным под лицензией Apache License 2.0. Бета-версия WikiBhasha доступна всем желающим на сайте Wikipedia или на ресурсе wikibhasha.org в виде инсталлируемого букмарклета. Само приложение работает на платформе Windows Azure.

Microsoft сообщает, что WikiBhasha можно инсталлировать в браузары Internet Explorer (7.0 и 8.0) в операционных системах Windows XP, Vista и Windows 7, а также в Firefox (3.5 и выше) на Linux Fedora (11 и 12), Windows XP, Vista и Windows 7. Редакции CNews удалось запустить WikiBhasha на Firefox под Linux Ubuntu и Mac OS X.


WikiBasha от Microsoft не брезгует работать под Linux Ubuntu

Wikimedia Foundation и Microsoft Research планируют в будущем тесно сотрудничать с пользовательским сообществом Wikipedia, фокусируясь на создании нового контента для арабского, немецкого, японского, португальского, испанского и хинди разделов энциклопедии.

«Мы всегда рады видеть работу по улучшению сотрудничества между разделами Wikipedia на разных языках. Microsoft Research проделала в рамках WikiBhasha очень хорошую работу. Также мы рады, что компания открыла исходный код этого инструмента», — отметил Дениз Купер (Danese Cooper), технический директор Wikimedia Foundation.

Разработчики WikiBhasha надеются, что данное решение позволит существенно увеличить объемы контента в версиях Wikipedia на разных языках. По их словам, это поможет не только обычным пользователям, но и специалистам, которые работают над улучшением качества машинного перевода.

«Бета-версия WikiBhasha позволяет легко создавать контент на множестве языков, создавая большое количество параллельных данных на разных языках для исследователей, которые занимаются разработками в области машинного перевода. С участием сообществ пользователей Wikipedia, можно существенно увеличить объемы качественного контента на разных языках», — сказал П. Анандан (P. Anandan), управляющий директор Microsoft Research India.

После выхода пресс-релиза Microsoft в ИТ-блогах было высказано предположение, что посредством WikiBhasha корпорация Microsoft будет тестировать свои технологии машинного перевода.