wmmail.ru – cервис почтовых рассылок на главную
написать письмо
карта сайта

С чего начать?РекламодательПравилаFAQСтатистикаБиржа статейTOP100ФоткиКонтакты
Логин:
Пароль: 
Регистрация   Забыли пароль?
WMLogin
Пользователей всего:

512959

Пользователей сегодня:

8

Пользователей online:

91

Выплачено ($): 7`606`118,89
Выплат: 8`115`300
Писем прочитано: 1`024`955`759

 
 
Online 0
Все ответы
 
 

Вопрос #9074

Внимание! В разделе вопрос-ответ запрещается:

  • Мат, оскорбления, флуд, реклама
  • Сообщения, не являющиеся вопросами/ответами
  • Нарушение законодательства РФ
  • Попрошайничество в любой форме

Выделите текст и нажмите для цитирования  #  
+1   [10.10.2010 13:08] Rade442 Рейтинг 0.00     Стена пользователя Rade442 +97

Закрытый вопрос от пользователя Rade442 индексация

Какой должен быть файл robots.txt, чтобы яндекс мог проиндексировать сайт на юкозе?
Раздел: Интернет, последний комментарий: 10.10.2010 13:17
Проголосовали: fanatos, ananda, waterfall

Ответы
Ответов всего: 4  вопрос закрыт 
Выделите текст и нажмите для цитирования  #  
0   [10.10.2010 13:12] #766339   Все ответы пользователя

В смысле какой ? Тебе начинку дать файла "robots.txt"
Выделите текст и нажмите для цитирования  #  
0   [10.10.2010 13:13] Rade442 Рейтинг 0.00     Стена пользователя Rade442 +97  Все ответы пользователя Rade442

#766339 пишет В смысле какой ? Тебе начинку дать файла "robots.txt"

да
Выделите текст и нажмите для цитирования  #  
+1   [10.10.2010 13:14] #766339   Все ответы пользователя

Как видите, файл robots.txt нужно класть исключительно в корень сайта.
Что писать в файл robots.txt

В файл robots.txt обычно пишут нечто вроде:

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/

В этом примере запрещена индексация трех директорий.

Затметьте, что каждая директория указана на отдельной строке – нельзя написать «Disallow: /cgi-bin/ /tmp/». Нельзя также разбивать одну инструкцию Disallow или User-agent на несколько строк, т.к. перенос строки используется для отделения инструкций друг от друга.

Регулярные выражения и символы подстановки так же нельзя использовать. «Звездочка» (*) в инструкции User-agent означает «любой робот». Инструкции вида «Disallow: *.gif» или «User-agent: Ya*» не поддерживаются.

Конкретные инструкции в robots.txt зависят от вашего сайта и того, что вы захотите закрыть от индексации. Вот несколько примеров:
Запретить весь сайт для индексации всеми роботами

User-agent: *
Disallow: /

Разрешить всем роботам индексировать весь сайт

User-agent: *
Disallow:

Или можете просто создать пустой файл «/robots.txt».
Закрыть от индексации только несколько каталогов

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /private/

Запретить индексацию сайта только для одного робота

User-agent: BadBot
Disallow: /

Разрешить индексацию сайта одному роботу и запретить всем остальным

User-agent: Yandex
Disallow:

User-agent: *
Disallow: /

Запретить к индексации все файлы кроме одного

Это довольно непросто, т.к. не существует инструкции “Allow”. Вместо этого можно переместить все файлы кроме того, который вы хотите разрешить к индексации в поддиректорию и запретить ее индексацию:

User-agent: *
Disallow: /docs/

Либо вы можете запретить все запрещенные к индексации файлы:

User-agent: *
Disallow: /private.html
Disallow: /foo.html
Disallow: /bar.html

Добавлено спустя 51 секунду
Можешь написать мне в ЛС более подробно расскажу! :cool:
Проголосовали: Rade442
Выделите текст и нажмите для цитирования  #  
0   [10.10.2010 13:17] Rade442 Рейтинг 0.00     Стена пользователя Rade442 +97  Все ответы пользователя Rade442

#766339 пишет Как видите, файл robots.txt нужно класть исключительно в корень сайта.
Что писать в файл robots.txt

В файл robots.txt обычно пишут нечто вроде:

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/

В этом примере запрещена индексация трех директорий.

Затметьте, что каждая директория указана на отдельной строке – нельзя написать «Disallow: /cgi-bin/ /tmp/». Нельзя также разбивать одну инструкцию Disallow или User-agent на несколько строк, т.к. перенос строки используется для отделения инструкций друг от друга.

Регулярные выражения и символы подстановки так же нельзя использовать. «Звездочка» (*) в инструкции User-agent означает «любой робот». Инструкции вида «Disallow: *.gif» или «User-agent: Ya*» не поддерживаются.

Конкретные инструкции в robots.txt зависят от вашего сайта и того, что вы захотите закрыть от индексации. Вот несколько примеров:
Запретить весь сайт для индексации всеми роботами

User-agent: *
Disallow: /

Разрешить всем роботам индексировать весь сайт

User-agent: *
Disallow:

Или можете просто создать пустой файл «/robots.txt».
Закрыть от индексации только несколько каталогов

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /private/

Запретить индексацию сайта только для одного робота

User-agent: BadBot
Disallow: /

Разрешить индексацию сайта одному роботу и запретить всем остальным

User-agent: Yandex
Disallow:

User-agent: *
Disallow: /

Запретить к индексации все файлы кроме одного

Это довольно непросто, т.к. не существует инструкции “Allow”. Вместо этого можно переместить все файлы кроме того, который вы хотите разрешить к индексации в поддиректорию и запретить ее индексацию:

User-agent: *
Disallow: /docs/

Либо вы можете запретить все запрещенные к индексации файлы:

User-agent: *
Disallow: /private.html
Disallow: /foo.html
Disallow: /bar.html

ставлю пусто во второй строке, он опять эту кренделю ставит:angry:

Видеоурок

Вопрос-ответ

НОВОСТИ
03.04.2024Выплаты
подробнее>>
21.02.2024QIWI
подробнее>>

© 2004-2024 «WMMAIL» Пользовательское соглашение