Всех с очередным апом ТИЦ от Яши.
Несмотря на проблемы в WP с & - который я так и не придумал, как написать , чтобы WP - не сделал из него что-то непотребное, и соответственно неработающее. Все-таки, как говорят охота пуще неволи. Решил изобразить на Java Script проверку ТИЦ пока правда усидчивости хватило только на проверку одного сайта, но переделать скрипт для массовой проверки достаточно просто, ввести массив и обработать.
Собственно меня по жизни заботит больше PR и скрипт я собирался писать именно для массовой проверки ПР, но апа от Googla пока нет и проверять собственно нечего, а вот с Тиц несколько иная ситуация, и есть он, да в общем то и без скрипта проверка крайне простая. Но скрипт это основа будущей функциональности - так сказать задел для будущей глобальной программы.
Итак встречаем Java Script для проверки ТИЦ, cсмеяться не надо, через какое то время я его добъю, так что он сможет для большого количества доменов смотреть этот показатель.
А пока дым и смог просто застилают глаза, дышать просто невозможно, свое дело так же делает аномальная жара, в общем как говорят, все тридцать три удовольствия.

Пишем название домена

Жмем Enter

работает не во всех браузерах, пока не смог победить публикатор WP

Смотрим результат:

Яндекс цитирования

Http – Hypertext transfer protocol – протокол уровня приложений, определяющий обмен данными через запрос/ответ. Собственно это мое фривольное определение для данного понятия. Более подробно о http можно узнать на сайте w3.org , где в простой форме, без приукрашиваний, описаны основные стандарты данного протокола, в частности можно почитать увлекательную статью под названием rfc2616 ( Request for Comments ), где описаны основные определения и параметры для http версии 1.1. Поверьте это увлекательное чтение. Есть и другие документы из этой серии ( rfc ) позволяющие пролить свет на нюансы внутреннего устройства сети интернет. Помню при разработке серьезных проектов, я просто зачитывался этими публикациями. Ну да о чем это я собственно, наверно о том, что последнее время одолели разного типа запросы, с использованием данного протокола. Надо сказать, что запрос по http строится до банального просто, достаточно послать текстовое сообщение на определенный адрес в сети, ну и выдержать формат сообщения в соответствии с ранее указанными спецификациями. И что самое интересное, все приложения, работающие по этому протоколу, действуют до банального одинаково: делают запрос в определенном формате, и получают ответ. Так же работают браузеры, которыми мы пользуемся при просмотре интернет страниц. В запрос разные интернет приложения помещают разные параметры, которые довольно подробно описаны в выше приведенной спецификации. Анализируя заголовок запроса можно понять, откуда этот запрос сделан, и что хочет получить система делающая запрос.

Для примера можно сказать, что в запрос помещается адрес страницы с которой произведен переход ( параметр называется “Referrer” ), и описание основных компонент системы с которой запрос был произведен. Наверно вы уже сталкивались с таким понятием как реферер(“Referrer”) при покупке трафика на бирже, да если этот параметр не указан, то скорее всего это или прямой переход с указанием вашего URL в адресной строке, или был выполнен специально написанной программой, в которой горе программист забыл заполнить это поле для большей достоверности в работе бота. User-Agent – показывает тип броузера и компоненты системы с которой был сделан запрос.

Выглядит это приблизительно так: “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)” , если это поле не заполнено, то программиста делающего бот надо просто расстрелять.
Формируется http запрос просто как текст с переводом строк, выглядит это приблизительно так:

initial line, различная для запроса и ответа
Header1: value1
Header2: value2
Header3: value3


GET /pub/WWW/TheProject.html HTTP/1.1
Host: www.w3.org

Или:
GET /path/file.html HTTP/1.0
From: ownru@mail.com
User-Agent: HTTPTool/1.0
[Пустая строка]

Можно наполнить заголовок запроса большим количеством параметров:
GET /dummy.php?name=ownru&p=1000 HTTP/1.1
Host: www.ownru.ru
User-Agent: Mozilla/5.0 (Windows;en-GB; rv:1.8.0.11) Gecko/20070312 Firefox/1.5.0.11
Accept: text/xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: en-gb,en;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Referer: http://www.google.com/search?hl=en&q=seo&aq=f&aqi=g10&aql=&oq=&

И для типа POST:

POST /path/script.cgi HTTP/1.0
From: ownru@mail.com
User-Agent: HTTPTool/1.0
Content-Type: application/x-www-form-urlencoded
Content-Length: 32

home=ownru&address=ownru

POST /dummy.php HTTP/1.1
Host: www.ownru.ru
User-Agent: Mozilla/5.0 (Windows;en-GB; rv:1.8.0.11) Gecko/20070312 Firefox/1.5.0.11
Accept: text/xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: en-gb,en;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive
Referer: http://www.google.com/search?hl=en&q=seo&aq=f&aqi=g10
Content-Type: application/x-www-form-urlencoded
Content-Length: 39

name=ownru&p=1000

Ответ тоже до безобразия примитивный приблизительно так:

HTTP/1.0 200 OK
Date: Fri, 31 Dec 1999 23:59:59 GMT
Content-Type: text/html
Content-Length: 1354

html
body
.
.
/body
/html

Данный запрос просто вызовет указанную страницу на указанном хосте, при этом поле рефферер и поле юсер-агент останутся незаполненными. Да в спецификации можно прочитать о типах запросов, наиболее распространенные это POST и GET, для простоты будем отличать их основываясь на том, что POST – предполагает передачу данных в теле запроса, а GET – передает параметры в адресной строке.

Собственно к чему это я , наверно я все таки не собирался дать полное описание http протокола и всех возможных вариантов его применения? Ах да я о спаме, который нас окружает, так вот, если в поле рефферер – внести полный URL от поискового запроса, например от Yandex, и послать запрос на ваш сайт, то любая система статистики покажет, что пользователь пришел с Yandex по данному запросу, если в данное поле забить адрес вашего сайта, то система статистики покажет, что посетитель перешел с вашей страницы. И это один из видов рекламы в сети, которой многие судя по моим статам пользуются очень активно, рассчитана она конечно в первую очередь на администраторов, но они тоже люди, хотя и со своими особенностями.

Так же легко можно реализовать запрос к блогу на Word Press так называемый TRACKBACK для получения обратной ссылки.
Один из товарищей по сети атакует мой блог такими запросами, но видно квалификации не хватает, и они получаются кривыми, хочу пожелать товарищу тщательно изучить выше указанную спецификацию, создать свой блог , и отладить свое приложение, чтобы все что оно делает не вызывало сомнений в подлинности.
В общем приложите немного фантазии и труда, и удивитесь как разнообразны сферы применения протокола http.

Текст взят из ownru.ru
Долго искал нужную информацию о файле под названием htacess, массу однотипной информации, но общее представление, что это такое и как можно его использовать наиболее эффективно, сложилось только полсе обобщения прочитанного материала.

Самое главное: файл htaccess может быть использован, только если сделаны соответствующие настройки на веб сервере, надо иметь в виду, что многие бесплатные хосты не дают возможность использовать данный файл, для настройки приложения.

Файл htaccess может быть помещен в каждую директорию приложения, и область его действия распространится на эту директорию, перекрывая директивы такого же файла расположенного в директории родителе.

Обработка файла htaccess производится при каждом вызове объекта из директории где он расположен.

Директивы файла обрабатываются последовательно.

Директивы, прописанные в файле учитываются при работе с директорией в которой данный файл конфигурации располагается, и их действие распространяется на все вложенные поддиректории.

Все директивы допустимые в файле htaccess, могут быть сделаны в основном настроечном файле сервера, использование htaccess, позволяет конечным пользователям изменить общие настройки, при этом не имея доступа к основным файлам конфигурации веб сервера.
При использовании htaccess, теряется производительность(зависит еще непосредственно от состава директив), общий файл настройки более предпочтителен, т.к. обрабатывается один раз при старте сервера, а файл htaccess, обрабатывается при каждом обращении к серверу.

Все возможные директивы для файла конфигурации, можно прочитать в описании конкретного сервера, для Apache информацию можно найти на сайте разработчика: httpd.apache.org

Что, нам дает использование данного файла, рассмотрим наиболее часто используемые директивы настройки.

- Прежде всего, это предоставление и блокирование доступа до директории, ну или объектов приложения.
Предположим мы хотим исключить доступ до нашего сайта с определенного IP, или мы
хотим блокировать весе IP в определенном диапазоне:

order deny,allow

deny from 38.117.108.5 – блокируем конкретное IP

deny from 222.251.128.0/17 - блокируем диапазон IP

deny from spamer.com - блокируем определенный домен.

allow from myDoorway.com - разрешаем доступ для домена.

allow from all

Говорим, чтобы файлы .htaccess были доступены со



deny from all

- Переадресация на другую страницу, с возвратом 301 кода:

Redirect 301 /page.htm http://www.mysite.ru/newpage.htm

- Переадресация с обработкой рефера ( referer - поле в http запросе, используемое для внесения информации откуда данный запрос сделан).

RewriteCond %{HTTP_REFERER} HTMLParser/1.6 [OR]

RewriteCond %{HTTP_REFERER} ^http(s)?://(www\.)?spam.com.*$ [NC]

RewriteRule /* http://welcome-spammer.com/ [R,L]

- Все пришедшие с сайта spam.com идут на сайт welcome spamer.

Переадресация на нужную страницу, при возникновении ошибки

ErrorDocument 401 /error401.html

ErrorDocument 403 http://www.partner-site.com

- защита от хотлинков ( картинка лежит на вашем сервере, вызывается на сайте злоумышленника).

RewriteEngine On

RewriteCond %{HTTP_REFERER} !^http://(www\.)?mydomen.com\.com/ [NC]

RewriteCond %{HTTP_REFERER} !^$

RewriteRule \.(jpe?g|gif|bmp|png)$ images/figVam.jpg [L]

Все внешние ссылки на картинки на вашем сайте выдают картинку figVam.jpg

- Делаем красивыми с точки зрения СЕО –URL

#если включен mod_rewrite
RewriteRule ^(.*)$ index.php?q=$1 [L]

Теперь немного поподробнее про выражение: ^(.*)$

Крышка вначале означает начало строки.

Бакс в конце означает конец строки.

Точка в скобочках означает любой символ.

Звездочка после точки означает, что любых символов может быть от нуля до бесконечности.

Скобочки означают группу. Т.к. она первая (и единственная), то эта группа идет под номером 1.

Про: index.php?q=$1
означает, что мы перезаписываем url на index.php?q= и к этому добавляем первую группу $1, т.е. имя запрашиваемого файла.
index.php?q=$1

[L] – последнее преобразование(команда break), флаг используется для того, чтобы не преобразовывать текущий URL другими, следующими за этим, правилами преобразований.

И еще одно важное добавление помогающее в работе:
php_flag display_errors on
включает вывод на экран ошибок приложения.

Рассмотрена только часть возможных директив при использований файла конфигурации htaccess, приведенные в примеры, могут иметь разный синтаксис детали которого можно посмотреть на сайтах разработчика конкретного web сервера.