begun

Dec

18

Перед поисковыми системами давно стоит проблема определения первоисточника контента в интернете. Иногда издательство выкладывает свои тексты в сеть позже, чем это делают пользователи. Бывает, что у автора контента вообще нет сайта в интернете. Всё чаще встречаются случаи автоматизированного копирования текстов с целью их размещения на спам-сайтах, созданных исключительно для манипулирования алгоритмами поисковых систем, о чём мы можем судить по жалобам в нашу службу поддержки.

Определение первоисточника текста, размещённого в сети, это сложная задача, которая ещё не решена в общем виде. Однако нам удалось построить алгоритм, который во многих случаях по косвенным признакам определяет, какая из группы страниц с одинаковым текстом является оригиналом. Этот алгоритм уже работает в российской формуле ранжирования, а через некоторое время он будет включён и для всех остальных стран. Дальше


Comments

Name (required)

Email (required)

Website

Spam protection: Sum of

Speak your mind

J2J.RU



Последние записи

Blogroll