Dinaris

Закрыть индексации страниц ?page=2 и убрать бесконечные страницы

Recommended Posts

Начну скорее всего с бесконечных страниц.

 

На страницах http://site.ru/prodaja-kvartir?page=2если поменять в конце ссылки цифры "2" на скажем "100" страница доступна. Получается дубли страниц. Это бы устранить!

 

Далее вопрос такой, нужно эти станицы закрыть от индексации в <meta name="robots" content="noindex,nofollow" />

Как это реализовать? В robots.txt пытался поковыряться, что то не выходит закрыть. Может кто нибудь подскажет?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Прописал в robots.txt вот это Disallow: /*page* 

Вроде помогло.

Если просто закроете весь page - то будут проблемы с индексацией страниц, которые находятся в ?page=N

В новых версиях прикроем несуществующие номера PAGE

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Мне и не нужно что бы страницы ?page=N индекцировались. Для каждой категории своя статья, а этажа статья будет показываться и на этих страницах. Эти страницы не выдают полезную информацию и не заточены под поисковик. Зачем их индекцировать!? Будет только дубли страниц.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Посредством этих страниц поисковики добираются до далеких страниц объявлений.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Это понятно что добираются, но мне не нужно что бы они индекцировались, а добраться еще смогут через категории и похожих объектов. У меня в шаблоне для этих страниц на ссылки прописан nofollow? т.е не переходить. Лишние дубли не нужны. Если бы она была заточена под другие какие то запросы, открыл бы страницы. ИМХО.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Могу Вам сказать по опыту etown.ru поисковики уже давно научились сами определять ненужные страницы )

Посмотрите результаты индекса для etown.ru

И я там не запрещал page.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Тут в принципе можно и дальше думать.

Например стоит ли ставить "жесткий" контроль на необрабатываемые параметры. Например 

http://site.ru/prodaja-kvartir?unexisting_parameter=2zr 

?

Они ведь точно так же могут проиндексироваться как и несуществующе страницы.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Убрать бы такие ссылки вообще.

 

Их в принципе нет. Ссылок. Сайт их не порождает. Так что проблема не в убрать, а в том, что кому-то придется четко определиться со списком "допустимых" параметров гет-запроса (та еще, по своей увлекательности, задача) и убивать урлы с параметрами не из этого списка 404-кой.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

я об этом писал:)

и проблема не в том, что движок такое не создает, а в том что конкуренты не спят и с помощью такого дописывания белеберды к урлу, могут создать бесконечное количество дублей.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Еще одна проблема со ссылками! Честно говоря я уже замучился со ссылками. Косяк на косяке. Не как у других разработчиков. Гугл уже скушал по разному.

 

История такая, страница открывается и так и сяк: 

 

site.ru/prodaja-kvartir/1-komn/realty18 - 1-komn была изменена на kupit-1-komnatnuyu-kvartiru
site.ru/prodaja-kvartir/kupit-1-komnatnuyu-kvartiru/realty18
site.ru/prodaja-kvartir/kupit-1-komnatnuyu-kvartiru5555555/realty18
 
Было бы хорошо сделать редирект на нормальную ссылку, если это возможно.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
Dinaris

я вам больше скажу, у вас на сайте realty18 доступно, как

site.ru/prodaja-kvartir/kupit-1-komnatnuyu-kvartiru/realty18

так и на

site.ru/prodaja-kvartir/realty18

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

При определении странички объявления сейчас анализируется только часть realtyNNNN, в новых версиях будем править.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

как с дублями вопрос?

у меня уже в выдаче штук 100 страниц такого плана:

site.ru/ads/sdam-garazh/

site.ru/?attachment_id=790

site.ru/vcard.php?p=/vizitki-zakazat-kalyazin.php

site.ru/?p=5409

 

все возможное закрою редиректом на главную, но если будет десятки тысяч страниц, то отслеживать будет нереально каждый апдейт яндекса.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

как с дублями вопрос?

у меня уже в выдаче штук 100 страниц такого плана:

site.ru/ads/sdam-garazh/

site.ru/?attachment_id=790

site.ru/vcard.php?p=/vizitki-zakazat-kalyazin.php

site.ru/?p=5409

 

все возможное закрою редиректом на главную, но если будет десятки тысяч страниц, то отслеживать будет нереально каждый апдейт яндекса.

Совсем непонятные адреса, это откуда такие?

Наш скрипт такие не генерирует, может от старого сайта остались?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

да, движок не генерит такого.

часть старого и часть кто-то ссылается на меня такой фигней

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас