среда, 21 сентября 2011 г.

Обзор конкурса Ботмастера. Часть 6

Продолжение, начало - Часть 1 , Часть 2 , Часть 3 , Часть 4 , Часть 5

11. Автор: Alexei82
Название: Hrefer 3.3 и его скрытые возможности

Описывается способ создания базы для спама путем парсинга проспамленных форумов, на которых топики и профили линкуют между собой. Как и в большинстве случаев, первым шагом является изучение выдачи поисковой машины по какому-нибудь запросу, включающему ключевое слово, часто используемое при спаме. Автор использовал запрос «tramadol forum topic». По такому запросу Гугль выдал множество форумов со спамовыми комментариями. На одном из форумов находим спамовое сообщение, в котором все (или большинство) линки ведут не на интернет-магазин, а на профили (или другие продающие страницы – landing pages) на других форумах. Эти профили или продающие страницы в свою очередь уже имеют у себя ссылку на интернет-магазин, в примере из статьи – на онлайновую аптеку.

Если спарсить все имеющиеся на данном форуме ссылки на спамовые профили или продажные профили, то полученные ссылки можно затем использовать в качестве поисковых запросов для сбора базы конкурента. Но для парсинга отдельного сайта, в данном случае форума, нужно составит специальный шаблон парсинга, так как в стандартный Hrefer 3.3 входят только шаблоны для парсинга поисковых систем. В статье автор описывает как создать шаблон для парсинга конкретного форума ( footballsuperstars.com/forum/ ), а затем порядок парсинга данного форума с использованием созданного шаблона. Также автор описывает настройки фильтра, позволяющие получить из напарсенного списка ссылки только на форумы. Также упоминается о пользе программы rgen.exe, а именно рассылка сообщений в топики, созданные другими пользователями.


12. Автор: Pegas
Название: Xrumer 7.0 + Hrefer 3.3 как источник уникального контента

Принцип поиска контента, описанный автором сводится к составлению списка доменов по определенной тематике, у которых в ближайшие дни истекает срок аренды домена. С этих доменов с помощью программ типа Teleport или Offline Explorer Pro скачивается контент, затем после истечения срока аренды доменов домены из списка проверяются на продленность аренды. Те домены, аренда которых не продлена с большой вероятностью не будут оплачены в течение двух месяцев и будут доступны для перерегистрации. И даже если такие домены будут забраны домен-провайдером, то контент с этих доменов домен-провайдер забрать не сможет и у вас останется уникальный контент в виде готового html-сайта, который можно использовать в различных целях, например под контекстную рекламу или продажу ссылок.

Автор описывает конкретные технические приёмы как собирать базу, как её обработать, как проверить домены на истечение срока аренды и т.п., а также с помощью каких программных средств это сделать. От себя замечу, что такой способ сбора контента трудоемок, поскольку отслеживать домены, которые действительно станут доступными для перерегистрации, придется довольно долго.

Продолжение - Часть 7

Комментариев нет:

Отправить комментарий