Twitter блокирует пользователей, пишущих кириллицей, как «русских троллей»

Интернет Веб-сервисы Техника
мобильная версия
, Текст: Валерия Шмырова

Алгоритм обнаружения нежелательных публикаций в Twitter массово принимает пользователей, пишущих кириллицей, за «русских троллей». В результате их аккаунты блокируются. Даже когда пользователи доказывают свою невиновность, в силе остается теневая блокировка.


Блокировки в Twitter

Соцсеть Twitter массово блокирует учетные записи и удаляет из бесед сообщения, если их авторы используют кириллицу. За это несет ответственность новый алгоритм Twitter, направленный на пресечение деятельности русскоязычных троллей. Алгоритм принимает невинные сообщения, написанные даже не по-русски, но с использованием кириллицы, за провокационные публикации на политические темы.

Twitter понадобилось два дня, чтобы прокомментировать ситуацию по просьбе издания The Verge. В конечном счете компания сообщила, что знает о проблеме и работает над ее решением, однако по-прежнему намерена принимать меры по защите своих правил и борьбе со спамом и автоматизацией.

Как проводятся блокировки

Первыми на массовые блокировки начали жаловаться пользователи из Болгарии — она является одной из стран, где используется кириллическое письмо. По наблюдениям пользователей, к блокировке учетной записи или удалению сообщения приводит упоминание в кириллической публикации @YouTube или любого другого популярного сервиса. Даже если изначальный твит не удаляется, то комментарии к нему, написанные кириллицей, скрываются из беседы.

Алгоритм никак не фильтрует учетные записи по дате создания — он может заблокировать любой аккаунт, созданный с 2009 г. Многие из забаненных аккаунтов существуют уже несколько лет и имеют тысячи подписчиков.

Как правило, заблокированные таким образом пользователи могут достаточно быстро доказать соцсети свою невиновность и возобновить работу учетной записи. Однако Twitter продолжает скрывать их сообщения из бесед, показывая вместо них надпись «твит недоступен». Кроме того, они не могут рассылать уведомление другим пользователям. Если жертва подобной «теневой блокировки» обращается в службу поддержки, ей отвечают, что все в порядке, ведь аккаунт не заблокирован.

Связи с Россией

Один из пользователей Twitter, журналист Майкл Трейси (Michael Tracey), привел выдержку из правил компании по определению того, что следует считать «аккаунтом, связанным с Россией». Как выяснилось, соцсеть обращает внимание, «был ли аккаунт создан в России, зарегистрировал ли пользователь аккаунт через российского телефонного оператора или на российский e-mail адрес, содержит ли отображаемое имя пользователя кириллические символы, часто ли пользователь размещает твиты на русском языке, и совершал ли пользователь вход в аккаунт с любого российского IP-адреса, даже один раз». Соцсеть считает аккаунт связанным с Россией, если присутствует хотя бы один из указанных маркеров.

twitterblg600.jpg
Twitter наказывает пользователей за использование кириллицы

«Согласно критериям Twitter, пользователь декларируется как «связанный» с российским правительством, если он «часто размещает твиты на русском языке», — делает вывод Трейси.

Новые правила Twitter

Несколько дней назад Twitter сообщил о существенных изменениях в системе оценивания сообщений. Отныне соцсеть будет скрывать из бесед больше комментариев, которые выглядят оскорбительными. Комментарии от пользователей, которые часто подвергаются блокировке, или на которых часто жалуются другие пользователи, будут скрываться по всему сервису.

Соцсеть начнет обращать внимание на большее количество критериев при оценке сообщений. В частности, будет учитываться, сколько учетных записей было создано автором сообщения, его IP-адрес, а также то, заблокировал ли его кто-нибудь после размещения комментария. Подозрительные твиты не будут удаляться, но будут скрываться от глаз и помещаться в секцию «Увидеть больше комментариев». Компания отмечает, что на стадии тестирования новая система помогла уменьшить количество жалоб пользователей на оскорбления в комментариях на 8%.

Достоинствами алгоритма является то, что он не оценивает непосредственно содержание сообщений, то есть не сталкивается с проблемой неверной интерпретации тона или посыла. Кроме того, алгоритм может работать со всеми твитами, независимо от того, на каком языке они написаны. Недостатком системы профильные СМИ считают то, что в случае принятия неверных решений эти решения будут совершенно непонятны пользователям.