четверг, 23 апреля 2009 г.

Как определить блокировку на блогспоте

В статье "Как продлить жизнь сплогу" я уже написал вкратце о разблокировке блогов на блогспоте. Недавно получил отклик. У моего коллеги заблокировали блог на блогспоте. Блог находился на домене 2-го уровня. Контент был копипаст плюс немного уникальных статей. Постинг производился 1-2 раза в неделю руками. Тем не менее, блог был заблокирован. Спамом блог не продвигался. Т. е. блог практически белый. Тем не менее, блог был заблокирован администрацией блогспота. Критерии блокировки не понятны. Разблокирован блог был практически сразу (не позднее чем через час) же после подачи заявки на разблокирование, т. е. после нажатия соответствующей ссылки в админке. Мой коллега оказался наблюдательнее меня и благодаря ему стал известен дополнительный признак блокированности блога на блогспоте.

Сначала напомню первый признак блокированности. В админке аккаунта на блогспоте появляется текст:

"Этот блог заблокирован в связи с возможным нарушением Условий предоставления услуг Blogger. Вы не сможете публиковать новые сообщения, пока блог не будет пересмотрен и разблокирован.

Если вы не запросите пересмотр, блог будет удален в течение 20 дней.

Запросить рассмотрение для разблокирования"

Текст "Запросить рассмотрение для разблокирования" представляет собой ссылку вида http://www.blogger.com/unlock-blog.g?lockedBlogID=6677350657232233180&popup=true при нажатии на которую происходит разблокирование блога.

Второй признак блокированности состоит в том, что у блокированного и неблокированного блога на блогспоте различается текст файла robots.txt, который имеется у каждого блога.

Текст файла robots.txt неблокированного блога выглядит следующим образом:
-------------------------

User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search

Sitemap: http://otissima.blogspot.com/feeds/posts/default?orderby=updated
--------------------------
Текст файла robots.txt заблокированного блога будет выглядеть так:
--------------------------

User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search
Allow: /cse.xml
Disallow: /
------------------------
Каково практическое применение вышеуказанных признаков? Они пригодятся для создания софта для слежения за сеткой своих сплогов на блогспоте. Как видно из первого признака от предупреждения о блокировке до удаления блога проходит 20 дней, поэтому проверка сплогов может производится примерно один раз в 2-3 недели, что не должно вызвать бана IP с которого идет проверка.

Наиболее простой способ - проверка файла robots.txt на наличие определенного текста, например "disallow: /" или "sitemap". Это позволит обойтись без написания кода, ответственного за вход в админку сплога, хотя такой код все равно может понадобиться для модуля нажатия на ссылку разблокировки (текст "Запросить рассмотрение для разблокирования").

3 комментария:

  1. текст полезен,кстати ты зарабатываешь на этом блоге?

    ОтветитьУдалить
  2. На этом не зарабатываю. Этот блог больше для самовыражения.

    ОтветитьУдалить
  3. Меня заблочили, хотя пишу авторские статьи - публикую почти ежедневно, ставлю коды ютьюба, картинки ставлю ссылками в основном (но это же можно!) Прошел час после заявки, но молчание. Неужели придется ждать два дня? А если не разблокируют?

    ОтветитьУдалить