Как оценивается релевантность страниц в Яндекс

6 392

Если по шкале релевантности страница получила положительную оценку (РЕЛ+ или ПОЛЕЗНЫЙ), активизируется дополнительная шкала — оценки, отвечающие на вопрос «Когда этот документ перестанет быть актуальным?». Подробности и примеры — ниже.


Актуальность – один из важных факторов релевантности документа. Если документ содержит устаревшую, неактуальную информацию по запросу, его нельзя считать хорошим ответом и не стоит оценивать положительно.

Конечно, существуют документы, информация в которых не устаревает в принципе. Например, релевантность документа с биографией Пушкина не зависит от того, когда этот документ был опубликован. Но многие документы имеют некоторый «срок жизни», в течение которого информация на них актуальна. Например, новость о том, что Испания стала чемпионом мира по футболу, интересна в течение первых недель после окончания чемпионата, а через месяц уже не будет актуальной.

Наверняка многие из вас сталкивались с муками совести, когда приходилось, следуя инструкции, одиночную новость оценивать как Релевантную-, даже если эта новость была самая что ни на есть свежая и актуальная на момент оценки : ). Это ограничение было связано с тем, что срок жизни асессорских оценок значительно больше времени, в течение которого остаются актуальными и интересными отдельные документы, в т.ч. новости.

Как оцениваются одиночные новости

Чтобы разрешить это противоречие, мы решили регулярно переоценивать устаревающие документы.
Свежую релевантную новость следует оценивать положительно, даже если она одиночная!

Но при этом придется ответить на дополнительный вопрос: «Когда устареет этот документ?», или, другими словами, ставя такую оценку, асессор говорит: «Сейчас это хороший ответ, но через определенный срок его надо перепроверить, так как он может устареть /перестанет быть интересны/актуальным через …».

Как это будет организовано:
1.Асессор оценивает документ по обычной шкале релевантности.
2.Если документ получает положительную оценку (РЕЛ+ или ПОЛЕЗНЫЙ), активизируется дополнительная шкала оценок по актуальности. В ней надо ответить на вопрос «Когда устареет документ?»

  • никогда
  • через месяц
  • через три месяца (квартал)
  • через полгода
  • через год

3. Документ переоценивается через соответствующее время.

Важно понимать, что срок устаревания зависит не от типа страницы, а от содержания и от того, в какой момент вы смотрите на страницу. Например, расписания транспорта изменяются два раза в год (летнее и зимнее), но это не значит, что каждый раз, когда Вы видите перед собой страницу с расписанием, надо ставить ей галочку «устареет через полгода». Срок устаревания этой страницы будет зависеть от того, в какой момент вы на нее смотрите: если летнее расписание сменится на зимнее через месяц, то ее надо будет переоценить через месяц.

Актуальность зависит от запроса

Также стоит помнить, что срок устаревания документа зависит от формулировки запроса. Давайте рассмотрим статью, посвященную итогам последнего Уимблдонского турнира. http://isport.ua/tennis/news/103028.html

Запрос: Уимблдонский турнир
URL: http://isport.ua/tennis/news/103028.html
Оценка сейчас: РЕЛ+
Когда устареет: год
Оценка после: РЕЛ-
Комментарий: Статью можно считать аналитическим материалом о результатах турнира, поэтому сейчас можно РЕЛ- оценить как РЕЛ+ . А когда пройдет следующий Уимблдонский турнир, эта информация уже будет устаревшей и ее надо будет оценивать как РЕЛ-.

Запрос: Уимблдон 2010
URL: http://isport.ua/tennis/news/103028.html
Оценка сейчас: РЕЛ+
Когда устареет: не устареет
Оценка после: РЕЛ+
Комментарий: Так как в запросе явно указано, что интересует РЕЛ+ информация о турнире 2010 года, этот документ не потеряет своей актуальности.

Какие страницы не устаревают?

1) Информация, которая в принципе не устаревает: биографии уже умерших людей, рефераты, сочинения и тп.

2) Страницы с динамическим контентом: как правило, «морды» сайтов обновляются автоматически, и переоценивать их специально нет смысла. Например: по запросу [концерты в петербурге] страница http://www.afisha.ru/spb/concerts/ устаревать не будет, так как в каждый момент времени на ней будут показываться текущие концерты.
Также, раздел http://mobiguru.ru/phones/ в каждый момент времени будет показывать самые новые модели телефонов и устаревать не будет.

3) Считается, что информация на официальных сайтах обновляется своевременно (иначе нам просто не с чем будет сравнивать информацию в других источниках), поэтому по оценке ВИТАЛЬНЫЙ галочки актуальности не выскакивают.

Когда устаревают одиночные новости?

Как правило, чисто новостные сообщения интересны в течение довольно короткого времени. Если в течение первых дней после события пользователю будет интересно почитать новости о нем, то уже через несколько месяцев его скорее будет интересовать более подробная, аналитическая информация. Например, по запросу «Новая Волна» в течение первого месяца после завершения конкурса чисто новостная статья о его итогах будет интересна и релевантна, через некоторое время пользователя по такому запросу будут в большей степени интересовать аналитические материалы, возможность скачать песни с этого конкурса и тп. Поэтому для новостных статей как правило стоит ставить срок устаревания 1 месяц. Не чисто новостные материалы могут иметь более долгий срок устаревания.

Обратите внимание:

Расписания, телепрограммы, прогнозы погоды, афиши с URLами, строго привязанными к дате, стоит сразу оценивать как НЕРЕЛ. Так как они устареют уже на следующий день, и хранить такие оценки смысла не имеет. Например, по запросу [Фильм Призрак] страницу http://afisha.yandex.ru/msk/events/271788/?date=2010-08-07#schedule_table даже 7го августа стоило сразу оценивать как НЕРЕЛ, так как уже на следующий день она перестала быть актуальной.

Уточнения

1) ВНИМАНИЕ: принято решение Одиночные новости, актуальные только один день оценивать сразу как РЕЛ-, если новость не содержит никакой аналитической информации, и явно на следующий день уже будет неинтересна. Например, промежуточную новость про пожары в Москве http://rus.ruvr.ru/2010/08/10/15199920.html даже в день публикации 10го августа можно было оценить как РЕЛ-, тк ситуация менялась очень быстро, и эта новость уже на следующий день была бы совершенно неактуальна, а никакой более общей информации на странице нет. НО: если страница будет актуальна больше одного дня (несколько дней, неделю и тп), ее уже стоит оценивать положительно и ставить срок устаревания месяц.

2) ВНИМАНИЕ: было решено считать Википедию неустаревающей, т.к. пользователи обновляют ее своевременно, и переоценивать страницы Википедии смысла нет. Им можно смело ставить оценку «никогда не устареет». Как оценивать устаревшие документы? Устаревшие новости и другие страницы, которые не заслуживают положительной оценки в силу своей неактуальности, могут быть оценены как РЕЛ-, так и НЕРЕЛ, в зависимости от того, несут ли они хоть какую-то значимую ценность. Если устаревший документ отвечает на запрос косвенно или неполно, то его стоит оценить РЕЛ-. А если он даёт совсем незначительное количество (неактуальной) информации об объекте поиска, то лучше оценить такой URL как НЕРЕЛ. Понятно, что актуальность чаще всего теряется не скачком, а постепенно. То есть, нельзя сказать, что РЕЛ+ документ в какой-то момент резко превращается в НЕРЕЛ. Однако документы с оценкой РЕЛ- мы не переоцениваем, поэтому если кажется, что на момент оценки новость ещё тянет на РЕЛ-, но ещё немного, и это будет верный НЕРЕЛ, лучше поставить НЕРЕЛ сразу. 

Примеры:

[дубль гис] (Челябинск) http://chelyabinsk.ru/conference/2gis.html?p=1&qp=2 НЕРЕЛ Короткая новость, имела ценность только пока была свежей. Ныне никакой полезной информации не даёт, ибо посвящена давнему событию и не представляет никакой полезной информации о самом дубль гисе.

[katy perry] (Нижний Новгород) http://www.openspace.ru/news/details/29985/ НЕРЕЛ Новость была уместна, пока была свежа. Никакой ценности, будучи уже устаревшей, она не несёт.

[Авангард] (Москва) http://www.fc-avangard.ru/new/2011/000557/ НЕРЕЛ Типичный пример. По запросу про какой-либо спортклуб инфа об одном каком-то текущем матче (даже и более подробная) заслуживает оценки НЕРЕЛ, когда она перестаёт быть актуальной.

[вооружение России] (Красноярск) http://www.radiorus.ru/news.html?rid=2534&date=12-09-2011&id=571346 НЕРЕЛ Короткое и малоинформативное интервью, посвящённое празднованию дня танкиста. На запрос не отвечает совершенно.

[средняя з/плата] (Москва) http://otvet.mail.ru/question/25010668/ НЕРЕЛ Очень коротко и старо, на запрос не отвечает.

[липецкая администрация] (Липецк) http://gorod48.ru/news/47695/ НЕРЕЛ Новость о каком-то судебном процессе. Полезной информации об адмнистрации она не даёт. Поскольку речь идёт об устаревшей уже новости, правильная её оценка – НЕРЕЛ.

[возраст надежды бабкиной] (Москва )http://www.woman.ru/stars/events/article/55405/ РЕЛ- Статья является устаревшей и не даёт прямого ответа, однако из неё несложно высчитать, сколько лет Бабкиной сейчас, так что правильная оценка – РЕЛ-.

[Продьюссер Верки Сердючки] (Москва) http://www.livestory.com.ua/culture/2009/04/22/141923.html РЕЛ- Даже если это и бывший продюсер, РЕЛ- поставить можно, тк из статьи понятно, как его зовут.

[Морозов Олег Викторович] (Набережные Челны) http://www.ladno.ru/person/morozov/bio/ РЕЛ- Неактуальная короткая биография политика. Положительной оценки она не получит из-за краткости и неактуальности, но и совсем НЕРЕЛевантной её считать не стоит.

Добавить комментарий

Войти с помощью: 


Обратный звонок
[]
1 Step 1
Как Вас зовут?your full name
Номер телефона для связиyour full name
Адрес вашего сайтаyour full name
Времяof appointment
Previous
Next
×