Что-то последнее время не дает мне покоя twitter Сервис очень интересный и предоставляет интересные возможности как для общения, так и для рассылки спама. Т. к. я рассылкой спама не занимаюсь, то меня больше интересуют методы борьбы со спамерами в твиттере. В одном из предыдущих постов я уже рассказывал о способе поиска «специалистов по продвижению», но за это время возникло ещё несколько идей, которыми я и хочу поделиться. Идея очень простая – подсчет ответов пользователю. Обратите внимание, не тех ответов, которые пользователь сам написал, а тех, которые написали ему. Давайте порассуждаем. Для администрации узнать количество ответов, которые пришли данному пользователю не сложно. Для этого достаточно посчитать количество сообщений в которых есть @ник_пользователя. Дальше возникает тонкий момент. При каком количестве ответов нужно считать пользователя спамером? И тут опять приходят на помощь "руководства по продвижению в twitter". В них предлагается интенсивно фолловить других пользователей и, чтобы twitter вас не забанил, отвечать на чужие твиты. Т. е. изображать общение. Проблема (спамеров) в том, что написать несколько десятков ОСМЫСЛЕННЫХ сообщений, на которые другой пользователь захочет ответить, очень сложно. А на общие фразы типа "спасибо" и "актуально" обычно никто не отвечает. А дальше все просто. Нужно считать отношение ваших сообщений другим пользователям и сообщений, отправленных вам. Если этот параметр превысит определенное значение – пользователя в бан Администраторы могут взять выборку 100% не спамерских аккаунтов, определить это соотношение для них и использовать его в качестве опорного. Правда этот метод имеет уязвимость. Спамер может зарегистрировать несколько (десятков или сотен) аккаунтов и отвечать с них на свои же твиты. Такой подход значительно усложняет ситуацию, но и тут есть решение. Цель спамера – это не 10-100 фолловеров, а десятки тысяч.
Поэтому если даже спамер отвечает сам себе с сотни аккаунтов, это означает, что с 99% он все равно не получает никаких ответов. Зарегистрировать больше 100 аккаунтов довольно сложно, т. к. для этого нужно: 1) обойти captcha; 2) использовать разные IP (иначе вся эта деятельность будет выглядеть очень подозрительно). В общем, метод имеет недостатки и я не думаю, что администрация твиттера когда-нибудь станет применять его в качестве основного средства поиска спамеров. Но в качестве дополнения к методу, о котором я рассказывал в прошлой статье – вполне возможно. Сложно, конечно, предсказать действия владельцев твиттера. Может, в рассылке спама они видят способ монетизации своего ресурса? И будут продавать специальные спамерские аккаунты? Но в любом случае, возможность найти спамеров у них есть. Делайте выводы Интересно почитать: Может ли страдать тетрадка в клеточку, или моральные проблемы создания искусственного интеллекта