ID do artigo: 217103 - Última revisão: segunda-feira, 7 de julho de 2008 - Revisão: 4.2

Como gravar um arquivo robots.txt

Dica do SistemaEste artigo aplica-se a um sistema operativo diferente do que está a utilizar. Foi desactivado o conteúdo do artigo, que pode não ser relevante para si.
É altamente recomendável que todos os usuários atualizem para Microsoft (IIS) versão 7.0 em execução no Microsoft Windows Server 2008. O IIS 7.0 aumenta significativamente a segurança de infra-estrutura da Web. Para obter mais informações sobre tópicos relacionados à segurança do IIS, visite o seguinte site:
http://www.microsoft.com/technet/security/prodtech/IIS.mspx (http://www.microsoft.com/technet/security/prodtech/IIS.mspx)
Para obter mais informações sobre o IIS 7.0, visite o seguinte site:
http://www.iis.net/default.aspx?tabid=1 (http://www.iis.net/default.aspx?tabid=1)
Expandir tudo | Recolher tudo

Sumário

Rastreadores da Web, chamados de robôs, são os mecanismos de pesquisa da Web que "rastrear" entre as páginas de índice e de Internet em servidores Web. Spider uma Web, em seguida, será que informações de catálogo e torne-disponíveis com a Internet para pesquisa. Isso torna mais fácil para os usuários localizar informações específicas na Internet, permitindo que "one-stop compras" através Web site da Spider. A maioria dos robôs também priorizar documentos que estão na Internet, permitindo que os resultados da pesquisa a ser "pontuados" ou organizados em ordem de mais prováveis em uma pesquisa.

Um arquivo robots.txt é um arquivo de texto especiais que sempre é localizado no diretório raiz de seu servidor Web. Este arquivo contém as restrições de rastreadores da Web, informando onde têm permissão para pesquisar. É preciso observar que Web Robots não são necessárias para respeitar arquivos robots.txt, mas mais bem escrito rastreadores da Web seguem as regras que você definir.

Mais Informações

Um robô se identifica quando ele navega seu site, que é conhecido como "Usuário-agente" e aparece nos logs de para IIS. Geralmente, o fluxo de eventos quando uma Web Spider rastreia seu site é semelhante à seguinte:
  1. O robô pede o arquivo /robots.txt e procura por um "agente de usuário:" linha que se refere especificamente a ele.
    • Se encontrar uma entrada para si, como "agente de usuário: WebRobot," em seguida, ele segue as regras que pertencem a ele.
    • Se é não encontrar uma entrada para si mesma, ele procura por um conjunto global de regras, como "agente de usuário: *," e obeys essas regras.
    • Se o robô tem uma entrada para si mesmo e um conjunto de regras global também está presente, regras de pessoais do robô substitui as regras globais.
  2. Regras para um agente de usuário são configuradas como "não permitir:" instruções que informam a um robô onde ele não é possível pesquisar. Uma instrução de proibição é aplicada a qualquer endereço pode ter sido solicitado pelo robô. Por exemplo:
    • "Proibir: /Test" faz com que uma Web Spider ignorar /test/index.htm e assim por diante.
    • "Proibir: /" faz com que um Spider Web ignorar o site inteiro; às vezes isso é desejável.
    • "Proibir:" permite que um Spider Web rastrear todo o site.
  3. Linhas que começam com o símbolo de libra (#) indicam comentários, que podem ser útil ao criar longo conjuntos de regras. exemplos

    • Este exemplo não permite a todos os rastreadores da Web para todo o site:
      # Make changes for all web spiders
      User-agent: *
      Disallow: / 
      						
    • O exemplo a seguir não permite um robô chamado "WebSpider" de caminhos virtuais "/ marketing" e "/ vendas":
      # Tell "WebSpider" where it can't go
      User-agent: WebSpider
      Disallow: /marketing
      Disallow: /sales
      
      # Allow all other robots to browse everywhere
      User-agent: *
      Disallow:
      						
    • Este exemplo permite que somente um Spider Web chamado "SpiderOne" em um site, ao negar todos os outros rastreadores:
      # Allow "SpiderOne" in the site
      User-agent: SpiderOne
      Disallow:
      
      # Deny all other spiders
      User-agent: *
      Disallow: / 
      						
    • Esse último exemplo não permite caminhos relacionadas no FrontPage a raiz do seu site:
      # Ignore FrontPage files
      User-agent: *
      Disallow: /_borders
      Disallow: /_derived
      Disallow: /_fpclass
      Disallow: /_overlay
      Disallow: /_private
      Disallow: /_themes
      Disallow: /_vti_bin
      Disallow: /_vti_cnf
      Disallow: /_vti_log
      Disallow: /_vti_map
      Disallow: /_vti_pvt
      Disallow: /_vti_txt
      						
Para mais informações sobre gravação de arquivos robots.txt, consulte os seguintes sites:
http://www.robotstxt.org/orig.html (http://www.robotstxt.org/orig.html)

http://www.robotstxt.org/wc/faq.html (http://www.robotstxt.org/wc/faq.html)

http://www.robotstxt.org/ (http://www.robotstxt.org/)

A informação contida neste artigo aplica-se a:
  • Microsoft Internet Information Services 6.0
  • Microsoft Internet Information Server 1.0
  • Microsoft Internet Information Server 2.0
  • Microsoft Internet Information Server 3.0
  • Microsoft Internet Information Server 4.0
  • Microsoft Internet Information Services 5.0
  • Microsoft Internet Information Services 7.0
Palavras-chave: 
kbmt kbhowto KB217103 KbMtpt
Tradução automáticaTradução automática
IMPORTANTE: Este artigo foi traduzido por um sistema de tradução automática (também designado por Machine Translation ou MT), não tendo sido portanto traduzido ou revisto por pessoas. A Microsoft possui artigos traduzidos por aplicações (MT) e artigos traduzidos por tradutores profissionais, com o objetivo de oferecer em português a totalidade dos artigos existentes na base de dados de suporte. No entanto, a tradução automática não é sempre perfeita, podendo conter erros de vocabulário, sintaxe ou gramática. A Microsoft não é responsável por incoerências, erros ou prejuízos ocorridos em decorrência da utilização dos artigos MT por parte dos nossos clientes. A Microsoft realiza atualizações freqüentes ao software de tradução automática (MT). Obrigado.
Clique aqui para ver a versão em Inglês deste artigo: 217103  (http://support.microsoft.com/kb/217103/en-us/ )