Слово о несовершенстве или ода оптимизатору
Вместо вступления
Наверное, буду не оригинален, но сегодня клиент, женщина, очень далекая от оптимизации, пожаловалась, что не сумела вчера что-то сыскать в Яндексе, а затем зашла в Рамблер и отыскала сразу же то, что искала. Примеров таких можно сыскать сотни и тысячи, и каждый из нас их может привести. Возможно, даже между них попадутся и обратные случаи. А оттого не станем искать крайних, а поговорим о качестве розыска вообще.
Новый русский поисковый язык
На заре развития поисковых систем миссия была одна - найти! Качество розыска определялось, сначала всего, численностью найденных результатов. Неискушенные пользователи просматривали 2, 3, 4 и больше страниц выдачи в попытках сыскать искомое. Сами поисковые требования максимально упрощались. Индикатором этого была средняя протяженность запроса, составлявшая в 1997 году для Яндекса 1,2 слова.
Интернет рос, увеличивалось число документов, совершенствовались поисковые алгоритмы и как последствие - искать стало легче. Люди могли задавать больше точные требования и получать точные ответы. В результате к 2000 году показатель средней длины запроса усилился до 2,5 слов. То есть больше чем в 2 раза за 3 года. За дальнейшие три года данный показатель подрос до 2,8. Да, всего только жалкие +0,3. Может это оптимум и поисковые системы в общем, и Яндекс в частности, добились идеала?
Идеальный и настоящий поиск
На секунду отвлечемся. поймем самого обыкновенного вменяемого человека, не отягощенного знаниями о работе поисковых систем, а оттого далекому от состояния обычного пациента Кащенко. Попросим его сформулировать всякий интересующий его вопрос, при условии, что он хочет получить весьма конкретный удовлетворяющий ответ. Внимание, сколько слов понадобится ему, дабы сформулировать вопрос… одно? Я же заявлял _вменяемого_! Два? Сам такой! Так сколько? отчего-то мне видится (перекрещусь на любой случай), что обычный вопрос содержит 5-6-7 и больше слов. Т.е. в идеале человек обязан искать не «куплю автомобиль», а «куплю бувшую в употреблении BMW 3 серии 2001 года выпуска без пробега по России». И идеальная(!) поисковая система ответит на 2-й вопрос без затруднений.
К сожалению современные поисковые системы безусловно несовершенны. Несовершенны, сначала всего, потому, что в базе их лежит математика и статистика. И за безликими формулами и бездушными цифрами статистики затеривается самый обыкновенный человек, пользователь, который имеет весьма конкретный (а не среднестатистический) запрос и хочет получить на него настолько же конкретный (а не среднестатистически значимый) ответ. Но в реальности человек упирается в препятствие несовершенства поисковых алгоритмов, неспособных сыскать именно то, то надо именно ему, и принужден обходиться среднестатистическим 2,8 слова в запросе, получая среднестиатистически значимую выдачу и осуществляя будущий поиск по старинке, перебирая интернет-сайт за сайтом.
А оттого завершаем лирику и переходим к прозе. Как уже говорилось выше, средний запрос юзера в реальности может быть намного длиннее, чем 2,8. Напомню также, что требования длиной выше 3-х слов являются, как правило, низкочастотными. Т.е. те самые пресловутые «естественно-языковые запросы» в усмиряющем числе - низкочастотники. И тут, чувствуя легкий шок, понимаем, что поисковики слишком плохо ищут по низкочастотным, персональным запросам. И не потому, что нет документов, удовлетворяющих таким запросам, а потому, что в базе поисковиков лежит статистика! А в статистике нет места индивидуальности, нет места личности пользователя, как и нет места личности вебмастера, создающего сайт. В результате рядовой пользователь принужден упрощать личный запрос, сводя его в 1-2-3 словным. Т.е. тем, коие принято именовать высокочастотными. Делать выводы далее или уже всё сами поняли? Ладно, буду писать до конца. произнес «А», надобно говорить «Б».
Оптимизаторы – ассенизаторы выдачи
Итак, существование высокочастотных запросов есть последствие несовершенства поисковых систем. И сами эти требования есть несовершенство. Но природа не терпит несовершенства, а потому, в силу весьма естественных причин, существование высокочастотных запросов (далее ВЧ) запросов привело к появлению оптимизаторов. Да, да, нас с вами, почитаемые коллеги. Мы существуем для того, дабы исправлять недостатки поисковых систем.
Не буду идеализировать, есть в оптимизаторстве и «черные» стороны (кстати, не те о коих вы подумали). Опять же само «оптимизаторство» очень многолико и многогранно. Но возьмем, к примеру, дорвеи (привет дяде Гринвуду) - ключевых врагов поисковых систем. безусловно очевидно, что дорвеи ориентированы, сначала всего, на низкочастотные запросы, то есть, где сами поисковые системы не состоятельны. в случае если создание дорвея не преследует целью ЛОЖЬ посетителя и весьма отвечает его запросу, то он имеет право быть, оттого как релевантен! Пользователю легче перейти излишний раз по ссылке с дорвея, чем не отыскав искомого в «чистой от спама» выдаче, задавать уже больше общий запрос заново и перерывать в розысках нужного некоторое количество страниц. И жестокая правда для поисковиков в том, что дорвеи выполняют свою функцию, сначала всего, потому, что люди находят с их поддержкой то, что сами поисковики между обычных документов сыскать не могут. Опять же повторюсь, это не означает, что все дорвеи «белые и пушистые». Все зависит исключительно от конкретной цели создания. Как говорится, и вилкой можно убить. всякую самую безобидную вещица можно применить не по назначению, в том числе дорвей.
Суровая действительность – торговый поиск
Первый вывод завершили, переходим ко второму. предполагаю еще не утомил?
Итак, на секунду предположим, что поисковики внезапно стали совершенными и на каждый(!) запрос юзера дают безусловно точный ответ. В этой ситуации резко «не у дел» остается «колонка справа» от выдачи, т.к. необходимый результат всякий раз есть «строго по центру». Рекламодатели неудовлетворенны, и поисковая система остается без доходов. В итоге в резкое возражение вступает вопрос качества розыска и доходов некоей группы лиц (читай акционеров поисковой системы). Качественный розыск и существование коммерческих поисковых систем - вещи несовместимые. Логичным следствием этого станет отсутствие принципиальных изменений в алгоритмах поисковых систем и стагнация в качестве поиска. А сейчас скажите, что принципиально нового возникло в поисковых алгоритмах за последние 2-4 года? Ни-че-го. Все перемены последних лет преследуют одну мишень - борьбу с т.н. «поисковым спамом». И ничего кардинально нового не сделано там, где это подлинно необходимо - в области низкочастотных запросов. Наоборот, оттуда деятельно вычищаются дорвеи, коие хоть в некий степени методы дать пользователю то, что он ищет. Как последствие - ухудшение реального(!) качества розыска и вытеснение пользователей в область ВЧ запросов. То есть говоря некоторое количество грубее, аудитория строго сегментируется по области интересов в области ВЧ. И потом изысканное кушанье «статистики» с прекрасными цифрами известности запросов преподносится рекламодателям - платите денежки.