Что должен знать о Яндексе каждый. Часть 2

Стремясь сдерживать лидирующие позиции лучшего поисковика по русскоязычному Интернету, Яндекс непрерывно совершенствует алгоритм расчета релевантности страниц, заимствуя передовые идеи у машин с мировым именем. Последние изменения, внедренные Яндексом, оказались более кардинальными.

На нынешний день стало ясно, что розыск не может быть эффективным и корректным, в случае если он основан лишь на анализе текста документов, т.к. внетекстовые причины могут играть не меньшую роль, чем сам текст. Поисковая машина обязана учитывать состояние страницы на сайте, авторитетность источника, частоту обновления, цитируемость страницы. хитросплетение этих обстоятельств может предоставить более полновесную картину о деятельности ресурса и его восприятии сетевой общественностью, чем анализ лишь текстового содержимого. потому Яндекс помаленьку внедряет в свою практику анализ воздействия подобных обстоятельств на релевантность страницы запросу пользователя.

При анализе текстовых критериев релевантности Яндекс учитывает:

• позицию найденных слов в титульной фразе;

• «вес» слова и его близость к началу документа;

• наличие найденных слов в заголовках и фрагментах выделенного текста;

• компактность цитаты, т.е. учет расположения найденных слов сравнительно друг друга.

Нетекстовые критерии, учитываемые Яндексом, можно условно поделить на 3 вида:

• каталожные;

• ссылочно-расчетные;

• ссылочно-текстовые.

К первому типу критериев относят индекс цитирования (ИЦ) Яндекса,  который определяется как  совокупность всех страниц, ссылающихся на данную (включая и страницы предоставленного сайта). На Яндексе ИЦ исследуемого ресурса можно узнать по адресу http://yandex.Ru/info/cy.Html#cycounter.

Индекс цитирования Яндекс рассчитывает для всех ресурсов, ссылки на коие были отысканы им в русском интернете, при условии, что результирующее смысл тематического ИЦ для них не меньше 10. При учете ИЦ Яндекс вверху результатов розыска по запросу выдает некоторое количество ссылок на сайты, зарегистрированные в своем каталоге.

При подсчете ИЦ не хватаются во интерес ссылки с форумов, электронных досок, конференций. помимо того, Яндекс не учитывает ссылки с сайтов, коие не были ими проиндексированы.

Учет при расчете релевантности ИЦ был слишком популярен в зарубежных поисковых системах приблизительно до 1998 года. впрочем из-за того, что данный показатель просто подвергается накрутке и не учитывает качество самих источников, дополнительно ввели его усовершенствованные версии – тематический и взвешенный индексы цитирования (тИЦ и вИЦ соответственно). Эти 2 показателя по указанной свыше классификации нетекстовых критериев расчета релевантности относят к ссылочно-расчетным.

Для стремительного анализа индекса цитирования можно применить специальный плагин Яндекс.Бар для интернет Explorer 5-6. Модуль, который можно скачать по адресу http://bar.Yandex.Ru/, создает в браузере дополнительную панель инструментов. При данном расширяются возможности розыска и просмотра страниц, а главное, отражается взвешенный индекс цитирования. Индикатор демонстрирует «весомость» и «авторитетность» сайта, просматриваемого в этот момент браузером, разрешает узнать раздел каталога Яндекса, в котором зарегистрирован ресурс, и перечень ссылающихся на него сайтов.

В начале 2000 г. учет поисковыми алгоритмами качества ссылочной политики интернет-сайта был взят за основу при трансформации наиболее известных зарубежных поисковых систем, уточнивших методику ранжирования результатов. Яндекс, следуя общемировой тенденции, еще научился принимать во внимание не лишь количество ссылок, но и их качество. В взаимосвязи с этим им рассчитывается 3 вида индекса цитирования: ИЦ, вИЦ и тИЦ (взвешенный с учетом тематики) .

Т.к. все ссылки на кой-какой ресурс невозможно признать равными, применяется ранжирование их ценности, т.е. определение веса ссылки. Чем популярнее ресурс, тем более вес, а значит, качество ссылки. Т.о. ВИЦ интернет-сайта определяется не численностью ведущих на него ссылок, а суммой их весов.

Тематический индекс цитирования рассчитывается по особому алгоритму, в котором ключевую роль играет близость тематики анализируемого ресурса и ссылающихся на него сайтов. При подсчете применяется количество ссылок  на интернет-сайт и их тематический вес.

При анализе ресурсов на степень сходства тематики изучается их обоюдное положение в каталоге Яндекса. Например, сайты, расположенные в одной рубрике каталога, считаются  близкими по тематике. впрочем только этого фактора мало для того, дабы полноценно рассчитать тИЦ ресурса. дабы решить эту проблему, Яндекс позаимствовал у Гугла уже отработанную «человеческую» технологию применения асессоров – специалистов, выносящих приговор о релевантности страницы.

Некоторые зарубежные поисковики уже давным-давно применяют практику применения человека для оценки релевантности итогов поиска. Приход новой способа работы асессоров на Яндекс обязан был отчасти заменить учет оценки интервала меж кликами одного и такого же юзера на различных позициях в итогах поиска. Анализ кликов сейчас используется Яндексом, но для иных целей, например, для интегральной оценки качества поиска. Непосредственно для опции качества розыска эти данные не годятся, т.к. пользователи совершают выбор только  по цитатам из документов и адресам страниц. Асессоры же работают по больше полноценной методике. впрочем Яндекс не отказался от давнего способа, а элементарно удачно объединил их, получив тем самым синергетический эффект. Благодаря работе асессоров поисковый устройство Яндекса изолирует тематические ссылки, т.е. связывающие сайты одинаковой тематики,  от любых других. Т.о. для оценки качества розыска Яндексом сочетаются как автоматические, так и ручные способы оценки.

Ссылочно-текстовые критерии, учитываемые Яндексом при определении релевантности страницы, основаны на анализе текста ссылок. При этом, в случае если содержимое запроса совпадает с содержимым тега ссылки,  в итогах поиска выдается адрес, указанный в теге. При данном в итогах поиска такая страница выводится Яндексом без титула и сопровождается текстом: «адрес отыскан по ссылке».

Т.о. для высоких позиций в Яндексе оптимизируемый интернет-сайт должен иметь как можно большее численность входящих ссылок, увеличивающих ИЦ, вИЦ и тИЦ, расположенных на ресурсах, близких по тематике исходному.

При ранжировании итогов поиска по запросу юзера Яндекс учитывает не лишь наличие ссылок на эту страницу с иных страниц, но и их текст. потому при верстке html-кода рекомендуется ссылаться на разные страницы интернет-сайта с применением характерных главных слов и словосочетаний. А еще стараться выделять некоторое количество страниц, коие будут приурочены к высококонкурентным темам, и становить на них ссылки как можно чаще.

Однако гонка за высокими показателями ссылочных критериев приводит к определенным трудностям.  Оптимизированная ссылочная конструкция сайта не обязана затруднять совершенную индексацию интернет-сайта поисковой системой. Для этого хорошо бы уменьшать число уровней иерархии, т.е. численность ссылок, которое обязан пройти робот Яндекса, дабы проиндексировать самую глубокую страницу сайта. в случае если же конструкция сайта имеет больше 3-4 уровней хорошо бы вынести более важные внутренние ссылки на отдельную страницу.

Для того, дабы правильно задать тематическую теорию ресурса, содержащего разнородную информацию, нужно при проектировании распределять страницы интернет-сайта по разделам, посвященным отдельным темам, и верно связывать меж собой страницы всякого из разделов. ключевая страница или же карта сайта, в свою очередь, обязаны ссылаться на одну из страниц всякого раздела. Т.о. при оптимизации интернет-сайта под Яндекс нужно особое интерес уделять соблюдению тематической единства ресурса.

Как видно из изложенного свыше материала, Яндекс непрерывно вносит коррективы в методику расчета релевантности страниц. Одними это воспринимается как очередной гранит преткновения для оптимизаторов, другими - как благо. впрочем в целом качество розыска постоянно улучшается, чем довольны все. Сегодня Яндекс заслуживает своеобразного внимания, потому знание его возможностей, а еще методов усовершенствования показателей, коие берутся им при расчете релевантности страниц, нужно для всякого пользователя.