Обычно серферы гуглят так: заходят на сайт google.com, вбивают в текстовое поле запрос buy viagra и нажимают на кнопку “Search”. После этого Google выдает список ссылок со сниппетами (серп). Как большинство из нас знает, серп сильно зависит от страны IP пользователя, языковых установок и истории поиска. Поэтому для российского IP выдача будет совсем другой, чем для американского IP. Плюс к этому, определяя IP пользователя, Google навязывает нам свои региональные домены типа google.ru, google.com.by и так далее (недавно Google занял и самое короткое название в китайской зоне - g.cn). Региональная выдача ориентируется на конкретную страну - то есть в моем случае Гугл пытается найти белорусскую онлайн-аптеку. В общем региональная выдача не блещет релевантностью.
Сравните: buy viagra, buy viagra, buy viagra, buy viagra. Кстати последний пример был для меня неожиданным…
Чтобы обойти все эти фильтры, можно пойти несколькими путями. Например чтобы посмотреть американскую выдачу не прибегая ни к каким хитростям, можно смотреть выдачу intop20.com (сервис для сеошников) или просто вбить кейвуд в aol.com. Эта м… поисковая система копирует выдачу Google для американского IP и не имеет никаких фильтров. Хороший вариант - юзать прокси с нужным IP.
Короткие слова
Не секрет, что с определением релевантности для коротких запросов типа одного общего слова у поисковиков всегда проблемы. Поэтому для аббревиатур все нормальные поисковики имеют словарь синонимов (пример, еще один, а этот вообще интересный). На блоге GoogleSystem автор рассказывает что можно убрать синонимы вот так: …search?q=+af, но у меня эта фишка не дала ничего (вообще-то гугля считает ‘+’ пробелом).
Дублированный контент и разнообразие сайтов (нулевой фильтр)
При формировании выдачи Google исключает из серпа слишком похожие страницы (одной из них, которая считается оригиналом, везет) и результаты с одного сайта (это хорошо, иначе википедия не оставила бы места другим сайтам в топе). Такое поведение отключается нулевым фильтром:ъ
http://www.google.com/search?q=site:egorych.com&filter=0
Таким запросом видим все проиндексированные страницы - и из основного индекса, и из дополнительного. Благодаря этому фильтру мы можем вычислять количество сапплементала в обход запрета гугли.
Гео таркетинг по вашему желанию
Специально указать на свое желание видеть выдачу для конкретной страны можно добавив в URL параметр &gl=страна, например ищем книги в Канаде, России, UK. Пара региональных ссылок добавляется, но это совсем не то что правильная выдача по стране.
Лучше искать так: books site:it, books site:ru и так далее.
Сайты из Открытого Каталога
http://www.google.com/search?q=books&cat=gwd/top
Проверенные вручную сайты, подойдет для параноиков и искателей хорошего контента.
Как искать потерянные ссылки
Новички на форумах часто просят дать ссылку на чекер PR, бесплатный парсер или официальное описание robots.txt. Особенно интересно, когда пишут “не смог найти переводчик google, дайте ссылку, хочу знать про Суть Форекса — подробнее об основах Форекса хочу читать в специализированных статьях.“
Мне часто приходится искать потерянные посты на каких-нибудь блогах. Перерывать весь архив глупо, поисковой формы иногда вообще нет: по этой причине на kass.ws я как-то долго не мог найти один пост, чтобы поставить на него ссылку :) . В таких случаях помогает только если вы хотя бы приблизительно помните название поста, а еще лучше если знаете URL блога.
В последнем случае искать совсем просто: спам google site:egorych.com.
Обычно первое что приходит в голову - это искать просто введя ключевые слова. Но в этом случае половина выдачи будет состоять из страниц категорий блога, которые обычно имеют больший ПР, чем страницы постов (особенно если на посты вообще нет входящих ссылок). Эти страницы могут быть очень большими и устаревшими - нужный вам пост ушел вниз. Поэтому правильно искать ключевые слова в заголовках страниц: intitle:dmoz site:egorych.com.
На форуме SE первое что слышит новичек в ответ на любой вопрос - юзай поиск по форуму. И новички лезут во встроенный поиск, которые работает из рук вон плохо, и мучаются. Потому что тем поиском найти что-нибудь старше недели вообще нереально. А правильно искать так:
Ап тиц (яндексоидам всегда интересно): ап тиц site:forum.searchengines.ru. Если вы ищете сообщения о последних апах, а не старые/жирные страницы, то пишем в поиск …&as_qdr=m. Об этом параметре я уже писал.
По-моему первое о чем нужно рассказывать новичкам - это site:, intitle: и что в гугле найдется все. А не посылать в поиск генерировать гигабайты трафика :) .
С этим читают так же: