Αναγν. άρθρου: 217103 - Τελευταία αναθεώρηση: Κυριακή, 19 Δεκεμβρίου 2010 - Αναθεώρηση: 2.0

Τρόπος εγγραφής αρχείου Robots.txt

Συμβουλή συστήματοςΑυτό το άρθρο ισχύει για διαφορετικό λειτουργικό σύστημα από αυτό που χρησιμοποιείτε. Το περιεχόμενο του άρθρου που ενδέχεται να μην σας αφορά έχει απενεργοποιηθεί.
Συνιστούμε ότι όλες οι χρήστες κάνουν αναβάθμιση σε Microsoft Internet Information Services (IIS) έκδοση 7.0 λειτουργεί με Microsoft Windows Server 2008. Οι υπηρεσίες IIS 7.0 αυξάνει σημαντικά Web υποδομή ασφαλείας. Για περισσότερες πληροφορίες σχετικά με θέματα που σχετίζονται με την ασφάλεια των υπηρεσιών IIS, επισκεφθείτε την ακόλουθη τοποθεσία της Microsoft στο Web:
http://www.microsoft.com/technet/security/prodtech/iis.mspx (http://www.microsoft.com/technet/security/prodtech/IIS.mspx)
Για περισσότερες πληροφορίες σχετικά με τις υπηρεσίες IIS 7.0, επισκεφθείτε την ακόλουθη τοποθεσία της Microsoft στο Web:
http://www.IIS.NET/Default.aspx?tabid=1 (http://www.iis.net/default.aspx?tabid=1)
Ανάπτυξη όλων | Σύμπτυξη όλων

Περίληψη

Spiders Web, συχνά ονομάζονται Robots, οι μηχανισμοί αναζήτησης στο WWW που "Ανίχνευση" σε δύο σελίδες του Internet και τα ευρετήρια σε διακομιστές Web. Μια Αράχνη Web θα δημιουργηθεί κατάλογος με αυτές τις πληροφορίες και να διαθέσετε στο Internet για αναζήτηση. Αυτό διευκολύνει τους χρήστες στην εύρεση συγκεκριμένων πληροφοριών στο Internet, επιτρέποντας "Αγορές μία διακοπής" έως την Αράχνη την τοποθεσία WWW. Οι περισσότεροι ανιχνευτών ιεράρχηση επίσης έγγραφα που βρίσκονται στο Internet, επιτρέποντας σε αποτελέσματα αναζήτησης να "σκορ" ή να διευθετηθούν σε σειρά πιο πιθανές επιλογές σε μια αναζήτηση.

Ένα αρχείο Robots.txt είναι ένα αρχείο ειδικό κείμενο που βρίσκεται πάντα στο ριζικό κατάλογο του διακομιστή σας Web. Αυτό το αρχείο περιέχει τους περιορισμούς για Spiders Web, που σας πληροφορεί τους όπου έχουν δικαιώματα για να κάνετε αναζήτηση. Πρέπει να σημειωθεί ότι ανιχνευτών Web δεν είναι απαραίτητο να ακολουθούν τις Robots.txt αρχεία, αλλά πιο well-written Spiders Web ακολουθούν τους κανόνες που ορίσατε.

Περισσότερες πληροφορίες

Ένα ρομπότ αναγνωρίζει μόνο όταν το μεταβεί την τοποθεσία σας, το οποίο είναι γνωστό ως το "User-agent" και εμφανίζεται στα αρχεία καταγραφής των υπηρεσιών IIS. Γενικά, η ροή των συμβάντων κατά μια Αράχνη Web ανιχνεύει την τοποθεσία σας είναι παρόμοιο με το ακόλουθο:
  1. Το ρομπότ ζητά το αρχείο /robots.txt και αναζητά ένα "User-agent:" γραμμή που αναφέρεται ρητά.
    • Εάν εντοπίσει μια καταχώρηση για τον εαυτό του, όπως "User-agent: WebRobot," τότε το ακολουθεί τους κανόνες που αφορούν σε αυτόν.
    • Αν είναι δεν εντοπίσει μια καταχώρηση για τον εαυτό του, αναζητά ένα καθολικό σύνολο κανόνων, όπως "User-agent: *," και obeys αυτούς τους κανόνες.
    • Εάν το ρομπότ έχει μια καταχώρηση για τον εαυτό και υπάρχει επίσης ένα καθολικό σύνολο κανόνων, κανόνες προσωπικής το ρομπότ θα αντικαθιστά καμία από τις καθολικές κανόνες.
  2. Κανόνες για έναν παράγοντα χρήστη έχουν ρυθμιστεί ως "Disallow:" Οι προτάσεις που σας ενημερώνουν ένα ρομπότ όπου δεν είναι δυνατή η αναζήτηση. Μια δήλωση disallow εφαρμόζεται σε οποιαδήποτε διεύθυνση που ενδέχεται να έχουν γίνει ζητήθηκε από το ρομπότ. Για παράδειγμα:
    • "Disallow: /test" causes a Web Spider to ignore /test/index.htm, and so on.
    • "Disallow: /" causes a Web Spider to ignore the whole site; sometimes this is desirable.
    • "Disallow: " allows a Web Spider to crawl the whole site.
  3. Lines that begin with the pound symbol (#) denote comments, which can be useful when creating long sets of rules.Παραδείγματα

    • This example disallows all Web Spiders for the entire site:
      # Make changes for all web spiders
      User-agent: *
      Disallow: / 
      						
    • The following example disallows a Robot named "WebSpider" from the virtual paths "/marketing" and "/sales":
      # Tell "WebSpider" where it can't go
      User-agent: WebSpider
      Disallow: /marketing
      Disallow: /sales
      
      # Allow all other robots to browse everywhere
      User-agent: *
      Disallow:
      						
    • This example allows only a Web Spider named "SpiderOne" into a site, while denying all other Spiders:
      # Allow "SpiderOne" in the site
      User-agent: SpiderOne
      Disallow:
      
      # Deny all other spiders
      User-agent: *
      Disallow: / 
      						
    • This last example disallows FrontPage-related paths in the root of your Web site:
      # Ignore FrontPage files
      User-agent: *
      Disallow: /_borders
      Disallow: /_derived
      Disallow: /_fpclass
      Disallow: /_overlay
      Disallow: /_private
      Disallow: /_themes
      Disallow: /_vti_bin
      Disallow: /_vti_cnf
      Disallow: /_vti_log
      Disallow: /_vti_map
      Disallow: /_vti_pvt
      Disallow: /_vti_txt
      						
For more information on writing Robots.txt files, see the following Web sites:
http://www.robotstxt.org/orig.html (http://www.robotstxt.org/orig.html)

http://www.robotstxt.org/wc/faq.html (http://www.robotstxt.org/wc/faq.html)

http://www.robotstxt.org/ (http://www.robotstxt.org/)

Οι πληροφορίες σε αυτό το άρθρο ισχύουν για:
  • Οδηγός Microsoft Internet Information Services 6.0
  • Microsoft Internet Information Server 1.0
  • Microsoft Internet Information Server 2.0
  • Microsoft Internet Information Server 3.0
  • Microsoft Internet Information Services 5.0
  • Microsoft Internet Information Services 7.0
Λέξεις-κλειδιά: 
kbhowto kbmt KB217103 KbMtel
Μηχανικά μεταφρασμένοΜηχανικά μεταφρασμένο
ΣΗΜΑΝΤΙΚΟ: Αυτό το άρθρο είναι προϊόν λογισμικού μηχανικής μετάφρασης της Microsoft και όχι ανθρώπινης μετάφρασης. Η Microsoft σάς προσφέρει άρθρα που είναι προϊόντα ανθρώπινης αλλά και μηχανικής μετάφρασης έτσι ώστε να έχετε πρόσβαση σε όλα τα άρθρα της Γνωσιακής Βάσης μας στη δική σας γλώσσα. Ωστόσο, ένα άρθρο που έχει προκύψει από μηχανική μετάφραση δεν είναι πάντα άριστης ποιότητας. Ενδέχεται να περιέχει λεξιλογικά, συντακτικά ή γραμματικά λάθη, όπως ακριβώς τα λάθη που θα έκανε ένας μη φυσικός ομιλητής επιχειρώντας να μιλήσει τη γλώσσα σας. Η Microsoft δεν φέρει καμία ευθύνη για τυχόν ανακρίβειες, σφάλματα ή ζημίες που προκύψουν λόγω τυχόν παρερμηνειών στη μετάφραση του περιεχομένου ή χρήσης του από τους πελάτες της. Επίσης, η Microsoft πραγματοποιεί συχνά ενημερώσεις στο λογισμικό μηχανικής μετάφρασης.
Η αγγλική έκδοση αυτού του άρθρου είναι η ακόλουθη:217103  (http://support.microsoft.com/kb/217103/en-us/ )