Компания Google запатентовала инструмент выявления спам-контента

20 Декабря 2013

 Page Rank - важнейший показатель авторитетности ресурса - теперь будет автоматически понижаться, если новый алгоритм работы Google распознает на сайте контент низкого качества, в том числе сгенерированный искусственно или заимствованный с других сайтов. Патент на данную разработку уже оформлен на компанию Google. Документ содержит детальное описание некачественного контента. В нем большое значение придается так называемому «спам-контенту» с использованием большого числа ключевых слов.

Известно, что многие веб-мастера не придают значения содержательности страниц. Интернет заполняет ворованный контент, стянутый с чужих сайтов методом полного копипаста или частичной нарезки, путем машинного перевода с другого языка, или методом привлечения низкоквалифицированных вебрайтеров. Главной чертой низкокачественного контента, по мнению аналитиков Google, является наличие большого числа разговорных оборотов, игнорирование синтаксических и орфографических правил, грамматические ошибки, инверсии в предложении (нарушение порядка слов) и другое.

Другой чертой спам-ресурса аналитики определяют наличие на сайте массы рекламных объявлений, проплаченных ссылок на чужие сайты, партнерские ссылки, зашкаливающее число рекламных блоков и другое.

Эти и другие характеристики некачественного контента нашли отражение в новом патенте Google на алгоритм, который, по идее разработчиков, должен будет очистить выдачу лидера поиска от низкопробных ресурсов. Ранее Google получил патент на выявление собственным методов ссылочного спама.