Как исключить дубли контента

#
Как исключить дубли контента
Яндекс Вебмастер показывает как ошибочные адреса вида



Не суть важно, что здесь динамический адрес от hostcms - вполне может быть и другой. Есть и совсем уже странные адреса типа

Трудно понять, откуда Яндекс их находит, но плохо то, что Яндекс считает их за дубли основных страниц.

Что можно сделать, чтобы динамические страницы выдавали 404?
Модератор
#
Re: Как исключить дубли контента
1. Настройте в опциях метрики не передавать адрес на сервер Яндекса, так он не узнает об этих страницах.
2. Раздел novosti на какой ТДС сделан?
#
Re: Как исключить дубли контента
HostCMS писал(а):
1. Настройте в опциях метрики не передавать адрес на сервер Яндекса, так он не узнает об этих страницах.

Это можно, но она в любом случае в списке несуществующих останется.


HostCMS писал(а):
2. Раздел novosti на какой ТДС сделан?

Не совсем понятен вопрос. Дистрибутив ТДС доработан по потребностям.  Версии страницы или чего-то такого я на ней не обнаружил.
#
Re: Как исключить дубли контента
Антон,
делайте в ТДС проверку на GET параметры, если есть, то 404 ошибку отдавайте
HostDev.pw - модули для HostCMS, Telegram: @hostdev
#
Re: Как исключить дубли контента
Спасибо,  это должно сработать.

Пожалуй что, это проще всего решить в макете.
#
Re: Как исключить дубли контента
Антон,
чтобы исключить из индексации, страница должна быть запрещена либо правилом в robots.txt, либо отдавать ошибку 404

EugenyP,
так не совсем правильно, например по таким техническим ссылкам нельзя отдавать ошибку 404, которые передают рекламные параметры "/?yclid=xxxxxxx", "/?gclid=xxxxxxx", "/?utm_source=abc", никогда конечно их не видел в индексации, потому что поисковики наверно и сами понимают что их не нужно добавлять, все таки это их параметры (я про Яндекс и Google), но в robots.txt запретить их для надежности можно
www.morozovpimnev.ru - создание, поддержка и продвижение сайтов | Наш канал https://asmp.su/channel
#
Re: Как исключить дубли контента
alexpimnev писал(а):
по таким техническим ссылкам нельзя отдавать ошибку 404, которые передают рекламные параметры "/?yclid=xxxxxxx", "/?gclid=xxxxxxx", "/?utm_source=abc",


А это, в основном, ссылки из Директа и баннерных сетей. Запрещать страницы с таким адресами, конечно же, нельзя. Тут уместнее всего был бы
<link rel="canonical" href="http://example.com/product/"/>


Но, как я понимаю, HostCMS автоматически создавать эти записи не умеет.
Авторизация