Αναγν. άρθρου: 837847 - Τελευταία αναθεώρηση: Πέμπτη, 23 Δεκεμβρίου 2010 - Αναθεώρηση: 2.0

Τρόπος προσαρμογής του SharePoint Portal Server 2003 ή του Office SharePoint Server 2007 χρησιμοποιώντας IFilters επουσιώδους λέξης αρχείων και αρχείων θησαυρού

Συμβουλή συστήματοςΑυτό το άρθρο ισχύει για διαφορετικό λειτουργικό σύστημα από αυτό που χρησιμοποιείτε. Το περιεχόμενο του άρθρου που ενδέχεται να μην σας αφορά έχει απενεργοποιηθεί.

Σε αυτήν τη σελίδα

Ανάπτυξη όλων | Σύμπτυξη όλων

Περίληψη

Αυτό το άρθρο περιγράφει τον τρόπο χρήσης του IFilters όπως το φίλτρο TIFF, επουσιώδους λέξης αρχείων, αρχείων θησαυρού και το αρχείο Robots.txt για να προσαρμόσετε το Microsoft SharePoint Portal Server 2003 και Microsoft Office SharePoint Server 2007.

This article describes how to enable optical character recognition for Tagged Image File Format (TIFF) files, how to change the TIFF file size limit, how to enable automatic file rotation, and how to log TIFF error messages to the application event log. This article also contains information about how to change noise word files and about how to change thesaurus files that are included in SharePoint Portal Server 2003 and in SharePoint Server 2007.

ΕΙΣΑΓΩΓΗ

This article describes how to use the Tagged Image File Format (TIFF) IFilter, noise word files, thesaurus files, and the Robots.txt file to customize SharePoint Portal Server 2003 and SharePoint Server 2007.

Overview of IFilters

ΣΗΜΕΙΩΣΗIn SharePoint Server 2007, the TIFF filter feature is removed.

To crawl documents that have proprietary file extensions, you have to register the IFilter for that file type in SharePoint Portal Server 2003. When you configure a content source, you can specify the file types that you want to include in the content index. For example, you might want to include files that have an .xyzextension and a .yyyextension in the content index. The inclusion of a file type applies only to content that is stored outside the portal site and that is included in the content index by using content sources. The inclusion of a file type does not apply to content that is stored in the portal site.

If a file type has an IFilter that is associated with that file type, you have to register the IFilter for a particular file type on the SharePoint Portal Server 2003 computer that crawls that file type. After you register the IFilter, SharePoint Portal Server 2003 can crawl documents that use that file type and include those documents in the content index. If you add a file type, and you do not register the IFilter for that file type, SharePoint Portal Server 2003 only includes the file properties in the content index.

The steps that you follow to register an IFilter vary according to the IFilter that you want to register. For more information about how to register an IFilter, see the documentation that is included with the IFilter that you want to register. SharePoint Portal Server 2003 includes filters for the following items:
  • Microsoft Office documents, including Microsoft Publisher documents and Microsoft Visio documents
  • HTML files
  • TIFF files
  • Text files
SharePoint Portal Server 2003 also accepts third-party IFilters for custom file types.

The TIFF IFilter

When you install SharePoint Portal Server 2003, the Setup program automatically installs an IFilter for TIFF files. The TIFF filter handles both the .tif extension and the .tiff extension. The following sections explain how to do the following tasks:
  • Enable optical character recognition (OCR) for TIFF files
  • Change the TIFF file size limit
  • Enable automatic file rotation
  • Log TIFF error messages to the application event log
ΣΗΜΕΙΩΣΗAfter you edit registry entries that are associated with TIFF files, you have to restart the Microsoft Search service.

How to enable optical character recognition in TIFF Files

When SharePoint Portal Server 2003 crawls TIFF files, SharePoint Portal Server 2003 only looks at the file properties. If you enable optical character recognition, SharePoint Portal Server scans the TIFF file and tries to recognize characters in the document so that additional information can be included in the index.

To enable optical character recognition in TIFF files, use one of the following methods.
Method 1: Manually edit the registry
Add the PerformOCR registry entry to the following registry subkey, and then set the PerformOCR registry entry to a value of 1:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
To enable optical character recognition in TIFF files, follow these steps.

ΣημαντικόΑυτή ενότητα, μέθοδο ή εργασία περιέχει βήματα που θα σας πληροφορήσει πώς να τροποποιήσετε το μητρώο. Ωστόσο, ενδέχεται να προκύψουν σοβαρά προβλήματα εάν δεν τροποποιήσετε σωστά το μητρώο. Κατά συνέπεια, βεβαιωθείτε ότι ακολουθείτε προσεκτικά τα εξής βήματα. Για επιπλέον προστασία, δημιουργήστε αντίγραφα ασφαλείας του μητρώου προτού το τροποποιήσετε. Με αυτόν τον τρόπο, μπορείτε να επαναφέρετε το μητρώο εάν προκύψει πρόβλημα. Για περισσότερες πληροφορίες σχετικά με τον τρόπο δημιουργίας αντιγράφων ασφαλείας και επαναφοράς του μητρώου, κάντε κλικ στον αριθμό του άρθρου παρακάτω για να προβάλετε το άρθρο της Γνωσιακής βάσης της Microsoft:
322756  (http://support.microsoft.com/kb/322756/ ) Τρόπος δημιουργίας αντιγράφων ασφαλείας και επαναφοράς του μητρώου στα Windows
  1. Κάντε κλικStart, και στη συνέχεια κάντε κλικ στο κουμπίΕκτέλεση.
  2. ΣτοOpenπληκτρολογήστεRegedit, και στη συνέχεια κάντε κλικ στο κουμπίOk.
  3. Εντοπίστε και, στη συνέχεια, κάντε κλικ στο ακόλουθο δευτερεύον κλειδί μητρώου:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. Στο διακομιστήΕπεξεργαστείτε τη διαδρομήμενού, σημείοΝέα, και στη συνέχεια κάντε κλικ στο κουμπίΤιμή DWORD.
  5. TYPEPerformOCRκαι κατόπιν πατήστε το πλήκτρο ENTER.
  6. Στο διακομιστήΕπεξεργαστείτε τη διαδρομήμενού, κάντε κλικ στο κουμπίΤροποποίηση (Modify).
  7. To enable optical character recognition, type1ΣτοΔεδομένα τιμήςπλαίσιο και στη συνέχεια κάντε κλικOk.

    ΣΗΜΕΙΩΣΗTo disable optical character recognition, set the PerformOCR registry entry to 0 (zero).
  8. Κλείστε τον Επεξεργαστή Μητρώου.
  9. Restart the Microsoft Search service. Για να το κάνετε αυτό, ακολουθήστε τα εξής βήματα: (Use the tools in the Windows Recovery Environment to repair Windows Vista. To do this, follow these steps:):
    1. Κάντε κλικStart, τοποθετήστε το δείκτηΕργαλεία διαχείρισης, και στη συνέχεια κάντε κλικ στο κουμπίSERVICES.
    2. Κάντε δεξιό κλικ στο στοιχείοMicrosoft Search, και στη συνέχεια κάντε κλικ στο κουμπίΕπανεκκίνηση (Restart).
Method 2: Use the Tiff_ocr_on.reg file
Use the Tiff_ocr-on.reg file to add the PerformOCR registry entry to the following registry subkey:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
ΣημαντικόΑυτή ενότητα, μέθοδο ή εργασία περιέχει βήματα που θα σας πληροφορήσει πώς να τροποποιήσετε το μητρώο. Ωστόσο, ενδέχεται να προκύψουν σοβαρά προβλήματα εάν δεν τροποποιήσετε σωστά το μητρώο. Κατά συνέπεια, βεβαιωθείτε ότι ακολουθείτε προσεκτικά τα εξής βήματα. Για επιπλέον προστασία, δημιουργήστε αντίγραφα ασφαλείας του μητρώου προτού το τροποποιήσετε. Με αυτόν τον τρόπο, μπορείτε να επαναφέρετε το μητρώο εάν προκύψει πρόβλημα. Για περισσότερες πληροφορίες σχετικά με τον τρόπο δημιουργίας αντιγράφων ασφαλείας και επαναφοράς του μητρώου, κάντε κλικ στον αριθμό του άρθρου παρακάτω για να προβάλετε το άρθρο της Γνωσιακής βάσης της Microsoft:
322756  (http://support.microsoft.com/kb/322756/ ) Τρόπος δημιουργίας αντιγράφων ασφαλείας και επαναφοράς του μητρώου στα Windows
  1. Locate the Support\Tools folder on the SharePoint Portal Server 2003 CD, and then double-click theTiff_ocr_on.regFILE.
  2. Restart the Microsoft Search service. Για να το κάνετε αυτό, ακολουθήστε τα εξής βήματα: (Use the tools in the Windows Recovery Environment to repair Windows Vista. To do this, follow these steps:):
    1. Κάντε κλικStart, τοποθετήστε το δείκτηΕργαλεία διαχείρισης, και στη συνέχεια κάντε κλικ στο κουμπίSERVICES.
    2. Κάντε δεξιό κλικ στο στοιχείοMicrosoft Search, και στη συνέχεια κάντε κλικ στο κουμπίΕπανεκκίνηση (Restart).

How to change the TIFF file size limit

By default, when optical character recognition is enabled, SharePoint Portal Server 2003 does not include any single-page TIFF files that are larger than 1 megabyte (MB) in the content index. To change the size limit for TIFF files, change the MaxImageSize registry entry in the following registry subkey:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
ΣημαντικόΑυτή ενότητα, μέθοδο ή εργασία περιέχει βήματα που θα σας πληροφορήσει πώς να τροποποιήσετε το μητρώο. Ωστόσο, ενδέχεται να προκύψουν σοβαρά προβλήματα εάν δεν τροποποιήσετε σωστά το μητρώο. Κατά συνέπεια, βεβαιωθείτε ότι ακολουθείτε προσεκτικά τα εξής βήματα. Για επιπλέον προστασία, δημιουργήστε αντίγραφα ασφαλείας του μητρώου προτού το τροποποιήσετε. Με αυτόν τον τρόπο, μπορείτε να επαναφέρετε το μητρώο εάν προκύψει πρόβλημα. Για περισσότερες πληροφορίες σχετικά με τον τρόπο δημιουργίας αντιγράφων ασφαλείας και επαναφοράς του μητρώου, κάντε κλικ στον αριθμό του άρθρου παρακάτω για να προβάλετε το άρθρο της Γνωσιακής βάσης της Microsoft:
322756  (http://support.microsoft.com/kb/322756/ ) Τρόπος δημιουργίας αντιγράφων ασφαλείας και επαναφοράς του μητρώου στα Windows
  1. Κάντε κλικStart, και στη συνέχεια κάντε κλικ στο κουμπίΕκτέλεση.
  2. ΣτοOpenπληκτρολογήστεRegedit, και στη συνέχεια κάντε κλικ στο κουμπίOk.
  3. Εντοπίστε και, στη συνέχεια, κάντε κλικ στο ακόλουθο δευτερεύον κλειδί μητρώου:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. Κάντε δεξιό κλικ στο στοιχείοMaxImageSize, και στη συνέχεια κάντε κλικ στο κουμπίΤροποποίηση (Modify).
  5. TYPE100.000ΣτοΔεδομένα τιμήςπλαίσιο και στη συνέχεια κάντε κλικOk.

    ΣΗΜΕΙΩΣΗΗ τιμή 100.000 είναι ίσο με το μέγιστο μέγεθος αρχείου 1 MB.
  6. Κλείστε τον Επεξεργαστή Μητρώου.
  7. Ξεκινήστε πάλι την υπηρεσία αναζήτησης της Microsoft. Για να το κάνετε αυτό, ακολουθήστε τα εξής βήματα: (Use the tools in the Windows Recovery Environment to repair Windows Vista. To do this, follow these steps:):
    1. Κάντε κλικStart, τοποθετήστε το δείκτηΕργαλεία διαχείρισης, και στη συνέχεια κάντε κλικ στο κουμπίSERVICES.
    2. Κάντε δεξιό κλικ στο στοιχείοΤης αναζήτησης της Microsoft, και στη συνέχεια κάντε κλικ στο κουμπίΕπανεκκίνηση (Restart).

Τρόπος ενεργοποίησης του αρχείου αυτόματης περιστροφής

Εάν ενεργοποιήσετε την οπτική αναγνώριση χαρακτήρων και αν ορισμένες TIFF αρχεία προσανατολίζονται ανάποδα ή πλάγια, μπορείτε να ενεργοποιήσετε το αρχείο αυτόματης περιστροφής για να αυξήσετε την ακρίβεια της σάρωσης.

Εάν ενεργοποιήσετε την οπτική αναγνώριση χαρακτήρων, μπορείτε επίσης να ενεργοποιήσετε το αρχείο αυτόματης περιστροφής. Εάν ενεργοποιήσετε το αρχείο αυτόματης περιστροφής, το φίλτρο Περιστρέφει τα αρχεία TIFF που προσανατολίζονται ανάποδα ή πλάγια. Το φίλτρο περιστρέφεται επίσης το αρχείο TIFF στη μνήμη, πριν από το φίλτρο σαρώνει το αρχείο TIFF. Παρόλο που η περιστροφή του αρχείου χρησιμοποιεί πόρους, τα αποτελέσματα από τη σάρωση ενός αρχείου που έχει προσανατολισμό ανάποδα ή πλάγια ενδέχεται να είναι χαμηλές. Εάν γνωρίζετε ότι όλα τα αρχεία TIFF έχουν προσανατολισμό upright, δεν χρειάζεται να ενεργοποιήσετε αυτήν την επιλογή.

Για να ενεργοποιήσετε το αρχείο αυτόματης περιστροφής, ορίστε την καταχώρηση μητρώου AutoRotation στο ακόλουθο δευτερεύον κλειδί μητρώου στην τιμή 1:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Από προεπιλογή, το αρχείο αυτόματης περιστροφής ενεργοποιείται κατά την εγκατάσταση του SharePoint Portal Server 2003. Ωστόσο, εάν η καταχώρηση μητρώου PerformOCR έχει οριστεί σε 0 (μηδέν) ή δεν υπάρχει, η καταχώρηση μητρώου AutoRotation δεν έχει αποτέλεσμα.

Για να ενεργοποιήσετε το αρχείο αυτόματης περιστροφής, ακολουθήστε τα εξής βήματα.

ΣημαντικόΑυτή ενότητα, μέθοδο ή εργασία περιέχει βήματα που θα σας πληροφορήσει πώς να τροποποιήσετε το μητρώο. Ωστόσο, ενδέχεται να προκύψουν σοβαρά προβλήματα εάν δεν τροποποιήσετε σωστά το μητρώο. Κατά συνέπεια, βεβαιωθείτε ότι ακολουθείτε προσεκτικά τα εξής βήματα. Για επιπλέον προστασία, δημιουργήστε αντίγραφα ασφαλείας του μητρώου προτού το τροποποιήσετε. Με αυτόν τον τρόπο, μπορείτε να επαναφέρετε το μητρώο εάν προκύψει πρόβλημα. Για περισσότερες πληροφορίες σχετικά με τον τρόπο δημιουργίας αντιγράφων ασφαλείας και επαναφοράς του μητρώου, κάντε κλικ στον αριθμό του άρθρου παρακάτω για να προβάλετε το άρθρο της Γνωσιακής βάσης της Microsoft:
322756  (http://support.microsoft.com/kb/322756/ ) Τρόπος δημιουργίας αντιγράφων ασφαλείας και επαναφοράς του μητρώου στα Windows
  1. Κάντε κλικStart, και στη συνέχεια κάντε κλικ στο κουμπίΕκτέλεση.
  2. ΣτοOpenπληκτρολογήστεRegedit, και στη συνέχεια κάντε κλικ στο κουμπίOk.
  3. Εντοπίστε και, στη συνέχεια, κάντε κλικ στο ακόλουθο δευτερεύον κλειδί μητρώου:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. Κάντε δεξιό κλικ στο στοιχείοAutoRotation, και στη συνέχεια κάντε κλικ στο κουμπίΤροποποίηση (Modify).
  5. TYPE1ΣτοΔεδομένα τιμήςπλαίσιο και στη συνέχεια κάντε κλικOk.

    ΣΗΜΕΙΩΣΗΓια να απενεργοποιήσετε το αρχείο αυτόματης περιστροφής, ορίστε την καταχώρηση μητρώου AutoRotation σε 0 (μηδέν).
  6. Κλείστε τον Επεξεργαστή Μητρώου.
  7. Ξεκινήστε πάλι την υπηρεσία αναζήτησης της Microsoft. Για να το κάνετε αυτό, ακολουθήστε τα εξής βήματα: (Use the tools in the Windows Recovery Environment to repair Windows Vista. To do this, follow these steps:):
    1. Κάντε κλικStart, τοποθετήστε το δείκτηΕργαλεία διαχείρισης, και στη συνέχεια κάντε κλικ στο κουμπίSERVICES.
    2. Κάντε δεξιό κλικ στο στοιχείοΤης αναζήτησης της Microsoft, και στη συνέχεια κάντε κλικ στο κουμπίΕπανεκκίνηση (Restart).

Τρόπος καταγραφής TIFF μηνύματα λάθους στο αρχείο καταγραφής συμβάντων εφαρμογής

Από προεπιλογή, ο SharePoint Portal Server 2003 καταγράφει μηνύματα λάθους που σχετίζονται με τα αρχεία TIFF στο αρχείο καταγραφής της υπηρεσίας συγκέντρωσης. Εάν θέλετε το SharePoint Portal Server 2003 για να καταγράψει τα μηνύματα λάθους που σχετίζονται με τα αρχεία TIFF στο αρχείο καταγραφής συμβάντων της εφαρμογής, ορίστε την καταχώρηση μητρώου LoggingLevel στο ακόλουθο δευτερεύον κλειδί μητρώου στην τιμή που θέλετε:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application\Microsoft Office Document Imaging
Μπορείτε να ορίσετε το
LoggingLevel
η καταχώρηση μητρώου σε μία από τις ακόλουθες τιμές:
  • Για να απενεργοποιήσετε την καταγραφή, ορίστε την καταχώρηση μητρώου LoggingLevel στην τιμή 0 (μηδέν). Αυτή είναι η προεπιλεγμένη ρύθμιση.
  • Για να καταγράψετε πληροφορίες μηνύματα και τα μηνύματα σφάλματος, ορίστε την καταχώρηση μητρώου LoggingLevel στην τιμή 1.
  • To log warning messages and error messages, set the LoggingLevel registry entry to a value of 2.
  • To log all messages, set the LoggingLevel registry entry to a value of 3.
  • To log only error messages, set the LoggingLevel registry entry to a value of 4.
To enable logging of TIFF file messages in the application event log, follow these steps:
  1. Κάντε κλικStart, και στη συνέχεια κάντε κλικ στο κουμπίΕκτέλεση.
  2. ΣτοOpenπληκτρολογήστεRegedit, και στη συνέχεια κάντε κλικ στο κουμπίOk.
  3. Εντοπίστε και, στη συνέχεια, κάντε κλικ στο ακόλουθο δευτερεύον κλειδί μητρώου:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application\Microsoft Office Document Imaging
  4. Κάντε δεξιό κλικ στο στοιχείοLoggingLevel, και στη συνέχεια κάντε κλικ στο κουμπίΤροποποίηση (Modify).
  5. Type the value that you want in theΔεδομένα τιμήςπλαίσιο και στη συνέχεια κάντε κλικOk.
  6. Κλείστε τον Επεξεργαστή Μητρώου.
  7. Restart the Microsoft Search service. Για να το κάνετε αυτό, ακολουθήστε τα εξής βήματα: (Use the tools in the Windows Recovery Environment to repair Windows Vista. To do this, follow these steps:):
    1. Κάντε κλικStart, τοποθετήστε το δείκτηΕργαλεία διαχείρισης, και στη συνέχεια κάντε κλικ στο κουμπίSERVICES.
    2. Κάντε δεξιό κλικ στο στοιχείοMicrosoft Search, και στη συνέχεια κάντε κλικ στο κουμπίΕπανεκκίνηση (Restart).

Noise word files

A noise word is a word that is not useful in a search. For example, the following words are noise words:
  • Για να
  • an
A list of noise words for a language is stored in the noise word file for that language. SharePoint Portal Server 2003 and SharePoint Server 2007 include noise word files for the following languages:
  • Chinese-Simplified (Noisechs.txt)
  • Chinese-Traditional (Noisecht.txt)
  • Czech (Noisecsy.txt)
  • Dutch (Noisenld.txt)
  • English-International (Noiseeng.txt)
  • English-US (Noiseenu.txt)
  • Finnish (Noisefin.txt)
  • French (Noisefra.txt)
  • German (Noisedeu.txt)
  • Hungarian (Noisehun.txt)
  • Italian (Noiseita.txt)
  • Japanese (Noisejpn.txt)
  • Korean (Noisekor.txt)
  • Polish (Noiseplk.txt)
  • Portuguese (Brazil) (Noiseptb.txt)
  • Russian (Noiserus.txt)
  • Spanish (Noiseesn.txt)
  • Swedish (Noisesve.txt)
  • Thai (Noisetha.txt)
  • Turkish (Noisetrk.txt)
If a noise word list does not exist for a language, SharePoint Portal Server 2003 and SharePoint Server 2007 use the neutral Noiseneu.txt noise word file. The word breaker for the language parses noise words.

By default, SharePoint Portal Server 2003 noise word files are stored in the following location on the server:
Drive:\Program Files\SharePoint Portal Server\Data\Config
If you installed SharePoint Portal Server 2003 in a location that is different from the default location, the Data folder is located in a different folder on your server.

By default, SharePoint Server 2007 stores noise word files in the following location on the server:
Drive:\Program Files\Microsoft Office Servers\12.0\Data\Config
You can change the noise word file. If you add noise words, the accuracy of your searches may decrease. However, the size of the content index also decreases. A smaller content index helps increase performance. You can delete noise words if you want searches to return those words.

If you remove words from the noise word file, the changes do not take effect until you reset the content indexes and perform a full update of the content indexes in SharePoint Portal Server 2003 and in SharePoint Server 2007. If you remove words from the noise word file, the words are removed from files before the files are included in an index. You must update the content index after you modify the noise word list. Otherwise, documents that contain the removed noise words are not returned in queries.

Do not delete noise word files. If you do not want noise words removed during an update or a query, remove those specific entries from the file. If you delete the noise word file, all single characters are removed as noise words. If you removeΌλεςnoise words from your noise word file, you will experience errors during crawling. Therefore, you must have at least one noise word in the file, even if the noise word is something as simple as a period character.

By default, noise word files in SharePoint Portal Server 2003 are copied to the following folder:
Drive\Program Files\SharePoint Portal Server\DATA\Applications\ProgramUID\Config
By default, noise word files in SharePoint Server 2007 are copied to the following folder:
Drive:\Program Files\Microsoft Office Servers\12.0\Data\Applications\ProgramUID\Config
You can specify noise words at the program level instead of at the server level or at the server farm level. For example, if SharePoint Portal Server 2003 or SharePoint Server 2007 and Microsoft SQL Server are installed on the same server, you can specify one noise word list for SharePoint Portal Server 2003 or for SharePoint Server 2007 and a different noise word list for SQL Server.

How to change the noise word file

To change the noise word file, follow these steps:
  1. Start Notepad, and then open the noise word file.
  2. Add or delete the words that you want.
  3. Save the noise word file, and then exit Notepad.
  4. In SharePoint Portal Server 2003, restart the Microsoft SharePointPS Search service. In SharePoint Server 2007, restart the Windows SharePoint Services Search service. Για να το κάνετε αυτό, ακολουθήστε τα εξής βήματα: (Use the tools in the Windows Recovery Environment to repair Windows Vista. To do this, follow these steps:):
    1. Κάντε κλικStart, τοποθετήστε το δείκτηΕργαλεία διαχείρισης, και στη συνέχεια κάντε κλικ στο κουμπίSERVICES.
    2. Κάντε δεξιό κλικ στο στοιχείοMicrosoft SharePointPS SearchήWindows SharePoint Services Search, και στη συνέχεια κάντε κλικ στο κουμπίΕπανεκκίνηση (Restart).
  5. Perform a full update of the content index.
ΣΗΜΕΙΩΣΗWhen you search the portal site, SharePoint Portal Server 2003 and SharePoint Server 2007 may discard some query terms as noise words even if the query term itself is not a noise word. This behavior occurs in situations when the query term is an inflectional form of the noise word. For example, if the noise word file contains the word "be," and if you search for the word "am," the word "am" is treated as a noise word because it is a form of "be."

Thesaurus files

The thesaurus is a query-expansion search feature in SharePoint Portal Server 2003 and in SharePoint Server 2007. The thesaurus permits you to type a phrase in a search query and to receive results for words that are related to the phrase that you typed. For example, you can search for the word "run" and receive results that contain either the words "run" or "jog" if the two terms are related in the thesaurus. Additionally, the thesaurus permits the server farm administrator to configure search rankings by assigning different weights to words. SharePoint Portal Server 2003 and SharePoint Server 2007 include thesaurus files for the following languages:
  • Chinese-Simplified (Tschs.xml)
  • Chinese-Traditional (Tscht.xml)
  • Czech (Tscsy.xml)
  • Dutch (Tsnld.xml)
  • English-International (Tseng.xml)
  • English-US (Tsenu.xml)
  • Finnish (Tsfin.xml)
  • French (Tsfra.xml)
  • German (Tsdeu.xml)
  • Hungarian (Tshun.xml)
  • Italian (Tsita.xml)
  • Japanese (Tsjpn.xml)
  • Korean (Tskor.xml)
  • Polish (Tsplk.xml)
  • Portuguese (Brazil) (Tsptb.xml)
  • Russian (Tsrus.xml)
  • Spanish (Tsesn.xml)
  • Swedish (Tssve.xml)
  • Thai (Tstha.xml)
  • Turkish (Tstrk.xml)
The thesaurus files contain inactive sample content. The neutral Tsneu.xml thesaurus file is applied to queries that do not have a thesaurus file that is associated with the query language. The neutral thesaurus file is always applied to queries, even when there is a specific thesaurus file that is associated with the query language.

By default, SharePoint Portal Server 2003 stores thesaurus files in the following folder on the server:
Drive:\Program Files\Microsoft Office Servers\12.0\Data\Office Server\Applications
If you installed SharePoint Portal Server 2003 in a location that is different from the default location, the Data folder is located in a different folder on your server.

ΣΗΜΕΙΩΣΗThe path to the correct thesaurus file can be found as the value for "DefaultApplicationsPath" in the registry at
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Global\Gathering Manager
.

By default, SharePoint Server 2007 stores thesaurus files in the following folder on the server:
Drive:\Program Files\Microsoft Office Servers\12.0\Data\Config
Thesaurus files for SharePoint Portal Server 2003 are also copied to the following folder:
Drive\Program Files\SharePoint Portal Server\Data\Applications\Application UID\Config
This occurs for each instance of the Microsoft Search service or of the Microsoft SharePointPS Search service.

Thesaurus files for SharePoint Server 2007 are also copied to the following folder:
Drive:\Program Files\Microsoft Office Servers\12.0\Data\Applications\Application UID\Config
This occurs for each instance of the Microsoft Search service or of the Windows SharePoint Services Search service.

You can modify the thesaurus at the program level instead of at the server level or at the server farm level. For example, if SharePoint Portal Server 2003 or SharePoint Server 2007 and SQL Server are installed on the same server, you can specify one thesaurus file for SharePoint Portal Server 2003 or for SharePoint Server 2007 and a different thesaurus file for SQL Server.

You can change the thesaurus entries by changing the thesaurus file in a text editor. The thesaurus file must use well-formed XML that contains matching opening and closing tags around each entry. If the XML is malformed, SharePoint Portal Server 2003 and SharePoint Server 2007 log an error in the application event log.

When you change the thesaurus file, make sure that you do not change the case of the tags. Only the XML tags use uppercase letters. All other tags use lowercase letters. For example, the <replacement> tag must use lowercase letters.</replacement>

ΣημαντικόA file that is named Tsschema.xml is installed together with the thesaurus files. Do not modify the Tsschema.xml file.

Thesaurus files contain two types of thesaurus entries. These types are replacement sets and expansion sets. Thesaurus files also permit you to configure the word weighting and word stemming options in a replacement set or an expansion set.

ΣημαντικόFrom a performance perspective, it is important to be aware of how many entries are defined in the thesaurus file. Additionally, it is important to be mindful not to exceed the recommendation of 1,000/10,000 (typical/max) entries as outlined in the capacity planner. To view the capacity planner, visit the following Microsoft Web site:
http://office.microsoft.com/en-us/sharepointportaladmin/HA011647581033.aspx (http://office.microsoft.com/en-us/sharepointportaladmin/HA011647581033.aspx)
Additionally, be aware that each <sub> and <pat> tag counts as an entry that goes against the recommended values. </pat></sub>

Replacement sets

A replacement set specifies a pattern that is replaced by one or more substitutions in a search query. For example, you can add a replacement set whereW2Kis the pattern and whereWINDOWS 2000is the substitution. If you query the termW2K, SharePoint Portal Server 2003 and SharePoint Server 2007 return only search results that contain the termWINDOWS 2000. You do not receive items in the search results that contain the termW2K.

Each replacement set is enclosed in a <replacement> tag. In the replacement tag, you specify one or more patterns by enclosing the patterns in a <pat> tag. You specify one or more substitutions by enclosing the substitutions in a <sub> tag. Patterns and substitutions can contain a word or a sequence of words. For example, to add a replacement set where </sub></pat></replacement>W2Kis the pattern andWINDOWS 2000is the substitution, use the following:
 <replacement>
<pat>W2K</pat>
<sub>Windows 2000</sub>
</replacement> 
You can have more than one substitution for each pattern that you specify. By default, patterns are case sensitive. For example, if your thesaurus file contains the termW2K, and if a user searches for the termw2k, SharePoint Portal Server 2003 and SharePoint Server 2007 do not return search results that contain the termWINDOWS 2000. SharePoint Portal Server 2003 and SharePoint Server 2007 do not recognize the termw2kas being the same as the termW2Kbecause the case of the text is different.

You can specify patterns to be case sensitive or not to be case sensitive if you add a tag to the thesaurus file for your language. For example, if you specify that patterns are not case sensitive, the <pat> and <sub> terms match query terms regardless of the case of the query term.</sub></pat>

Όταν υποβάλλετε ερώτημα χρησιμοποιώντας τη σύνταξη ΠΕΡΙΈΧΕΙ FORMSOF, ο θησαυρός λειτουργεί όπως περιγράφηκε προηγουμένως. Για περισσότερες πληροφορίες σχετικά με τη σύνταξη ΠΕΡΙΈΧΕΙ FORMSOF, ανατρέξτε στην ενότητα του Microsoft SharePoint προϊόντων και των τεχνολογιών 2003 Software Development Kit.

Από προεπιλογή, μια τοποθεσία πύλης χρησιμοποιεί τον τύπο του ερωτήματος FREETEXT. FREETEXT ερωτήματα αυτόματο άνοιγμα του θησαυρού. Ωστόσο, εάν πληκτρολογήσετε τους όρους αναζήτησης μέσα σε εισαγωγικά, του SharePoint Portal Server 2003 και του SharePoint Server 2007 απενεργοποιήσετε το ερώτημα FREETEXT και δεν θέλετε να χρησιμοποιήσετε το θησαυρό. Επομένως, του SharePoint Portal Server 2003 και του SharePoint Server 2007 επιστρέφουν αποτελέσματα με βάση τον όρο αναζήτησης ακριβή ή τους όρους που περικλείονται από τα εισαγωγικά. Εάν ο θησαυρός αντικαθιστά μίας λέξης της φράσης με μια άλλη λέξη, ένα ερώτημα FREETEXT επιστρέφει τα αποτελέσματα της νέας έκδοσης του ολόκληρη τη φράση.

Για την αντικατάσταση οριστεί όπου ο όροςWINDOWS 2000αντικαθιστά τον όροW2K, ο ακόλουθος πίνακας παρουσιάζει τα αποτελέσματα που προκύπτουν βάσει των στοιχείων από το χρήστη διαφορετικό από το περιβάλλον αναζήτησης στην τοποθεσία πύλης. Το παράδειγμα αυτό θεωρεί ότι ο θησαυρός ορίζεται ως διάκριση πεζών-κεφαλαίων και ότι στην αναζήτηση δεν γίνεται διάκριση πεζών-κεφαλαίων.
Σύμπτυξη αυτού του πίνακαΑνάπτυξη αυτού του πίνακα
Εισαγωγή από το χρήστηΑν χρησιμοποιείται ένα θησαυρόΚείμενο σε έγγραφα που επιστρέφονται στα αποτελέσματα αναζήτησης
W2KYES. Ερώτημα FREETEXT.W2k, W2K, w2k ή w2K.

Αποτελέσματα επιστρέφονται για τα Windows 2000, επειδή το μοτίβο στο θησαυρό είναι κεφαλαία W2K.
"w2k"ΟΧΙ,W2K,W2K,W2K, ήw2K.
W2KYES. FREETEXT ένα ερώτημα.WINDOWS 2000,WINDOWS 2000,W2K,W2K,w2K, ή την περίπτωση συνδυασμούς όπωςWINDOWS 2000.

Επιστρέφονται αποτελέσματα γιαW2K.
"W2K"ΟΧΙ,W2K,W2K,W2K, ήw2K.
Διακομιστής W2KYES. FREETEXT ένα ερώτημα.WINDOWS 2000,WINDOWS 2000, και την περίπτωση συνδυασμούς όπωςWINDOWS 2000;W2K,W2K, ήw2K;SERVER,SERVER, και την περίπτωση συνδυασμούς όπωςSERVER;Διακομιστής W2Kκαι συνδυασμούς πεζών συγκεκριμένο όρο.

Επιστρέφονται αποτελέσματα γιαW2K λειτουργικού συστήματος.
"W2K διακομιστή"ΟΧΙ,Διακομιστής W2K,w2k Server,W2k Server,Διακομιστής w2K,Διακομιστής W2K,w2k διακομιστή,W2k διακομιστή, ήδιακομιστής w2K.
ΣΗΜΕΙΩΣΗΣε κάθε ένα από τα προηγούμενα παραδείγματα στον πίνακα, η ρύθμιση διάκριση πεζών-κεφαλαίων για αναζήτηση καθορίζεται ως false. Εάν η ρύθμιση διάκριση πεζών-κεφαλαίων καθορίζεται ως true, όλες οι διαφορές πεζών έχουν σημασία όταν πραγματοποιείται η αντιστοιχία υποδείγματος. Εάν δύο σύνολα αντικατάστασης που έχουν παρόμοια μοτίβα που συμφωνούν, το μεγαλύτερο από τα σύνολα δύο αντικατάστασης προηγείται. Για παράδειγμα, εάν έχετε τα εξής δύο σύνολα αντικατάστασης, ο όροςInternet Explorerέχει προτεραιότητα έναντι του όρουInternet:
 <replacement>
<pat>Internet</pat>
<sub>intranet</sub>
</replacement> 
 <replacement>
<pat>Internet Explorer</pat>
<sub>IE</sub>
<sub>IE 5</sub>
</replacement> 
Για αυτό το σύνολο αντικατάστασης, ο παρακάτω πίνακας εμφανίζει τα αποτελέσματα που προκύπτουν βάσει των στοιχείων από το χρήστη από το περιβάλλον αναζήτησης στην τοποθεσία πύλης.
Σύμπτυξη αυτού του πίνακαΑνάπτυξη αυτού του πίνακα
Εισαγωγή από το χρήστηΑν χρησιμοποιείται ένα θησαυρόΚείμενο σε έγγραφα που επιστρέφονται στα αποτελέσματα αναζήτησης
InternetYES. FREETEXT ένα ερώτημα.Intranet,intranet, ή την περίπτωση συνδυασμούς όπωςiNtranEt. Επιστρέφονται αποτελέσματα γιαIEήIE 5.
Internet ExplorerYES. Α Ερώτημα FREETEXT.

IE,IE 5, και την περίπτωση συνδυασμούς όπωςiEήIE 5. Επιστρέφονται αποτελέσματα γιαInternet,Internet Explorer, ήintranet.

Σύνολα επέκτασης

Ένα σύνολο επέκτασης είναι μια ομάδα αντικαταστάσεις που είναι συνώνυμα μεταξύ τους. Ερωτήματα που περιέχουν συμφωνίες σε μία υποκατάστασης αναπτύσσονται για να συμπεριλάβετε όλα τα άλλα υποκατάστατα του συνόλου της επέκτασης. Για παράδειγμα, μπορείτε να προσθέσετε ένα σύνολο επέκτασης όπου τις ακόλουθες αντικαταστάσεις είναι συνώνυμα:
  • Writer
  • Συντάκτης
  • journalist
Εάν το ερώτημα στον όροΣυντάκτηςΕπίσης επιστρέφουν αποτελέσματα αναζήτησης που περιέχουν τον όρο του SharePoint Portal Server 2003 και του SharePoint Server 2007Writerκαι ο όροςjournalist.

Κάθε σύνολο επέκτασης μέσα σε μια ετικέτα <expansion>. Στην ετικέτα επέκτασης, μπορείτε να καθορίσετε μία ή περισσότερες αντικαταστάσεις που περικλείονται από μια ετικέτα <sub>. Για το παράδειγμα που περιγράφεται παραπάνω, προσθέστε τις ακόλουθες γραμμές:</sub></expansion>
 <expansion>
<sub>writer</sub>
<sub>author</sub>
<sub>journalist</sub>
</expansion> 

Το Word stemming

Το Word stemming αντιστοιχίζεται ένα στέλεχος γλωσσικά όλες τις λέξεις που ταιριάζουν. You can specify word stemming in pattern entries and substitution entries. For example, in English, the stemΑγοράmatches the following:
  • bought
  • buying
  • buys
You can specify word stemming by adding two asterisks to the end of the string. SharePoint Portal Server 2003 and SharePoint Server 2007 then return matches for variations of the word. For example, you might want to create queries for the termrunthat also return the following terms:
  • running
  • jog
  • jogging
To do this, modify the expansion set as follows:
 <expansion>
<sub weight="0.5">run**</sub>
<sub weight="0.5">jog**</sub>
</expansion>
If you query the termrunor the termrunning, the search results include the termjogand the termjogging. If you query the termrunning, you receive the same search results that you receive when you query the termrun.

For example, if your thesaurus file includes the <pat>User1 ran to the store** </pat> pattern or the <sub> User1 ran to the store**</sub> substitution, the query returns the following strings, or search adds the following strings to the query:
  • User1 runs to the store
  • User1 running to the store
  • User1 ran to the store
  • User1 runs to the stores
  • User1 running to the stores
  • User1 ran to the stores

How to change a thesaurus file

To change the thesaurus file, follow these steps:
  1. Start Notepad, and then open the thesaurus file.

    ΣΗΜΕΙΩΣΗIf the thesaurus file contains double-byte character set (DBCS) characters, you must save the thesaurus file in Unicode format code before you change the thesaurus file.
  2. If you are changing the thesaurus file for the first time, remove the following comment lines that appear at the beginning and the end of the file:
     <!---Commented out---> 
  3. If you do not want the patterns to be case sensitive, add the following tag at the beginning of the file:
    <case caseflag="false"></case>
    If you want the patterns to be case sensitive later in the file, change the setting from "false" to "true" in the tag as follows:
    <case caseflag="true"></case>
  4. Make the changes that you want. Add, modify, or delete a replacement set or an expansion set. Add, modify, or delete the weighting or the stemming that is configured for a set.

    ΣΗΜΕΙΩΣΗThe entries that you add to the thesaurus file cannot contain only special characters or only noise words. However, you can have blank entries. For example, if you want to make sure that queries for a specific term return no results, change the entry. In the following example, queries for the termwindowsdo not return results:
    <replacement>
    <pat>windows</pat>
    <sub></sub>
    </replacement>
  5. Save the thesaurus file, and then quit Notepad.

How to use the Robots.txt file and HTML tags to prevent access to content on the portal site

You can use a Robots.txt file to control where robots (Web crawlers) can go on a Web site. You can also use the Robots.txt file to indicate whether to exclude specific crawlers. Web servers use these rules to control access to Web sites by preventing robots from accessing certain areas. SharePoint Portal Server 2003 and SharePoint Server 2007 look for this file when it crawls, and it obeys the restrictions that are contained in the Robots.txt file.

Μπορείτε να εμποδίσετε κάποιον άλλο διακομιστή από την ανίχνευση περιεχομένου στην τοποθεσία πύλης, τροποποιώντας το αρχείο Robots.txt. Για παράδειγμα, μπορεί να θέλετε να περιορίσετε μια συγκεκριμένη ρομπότ από την πρόσβαση στο διακομιστή, επειδή η συχνότητα των αιτήσεων από το ρομπότ αποκλείει την τοποθεσία Web. Μπορεί επίσης να θέλετε να Περιορισμός όλων των ανιχνευτών από ορισμένες περιοχές στο διακομιστή.

Μην εγκαταστήσετε ένα αρχείο Robots.txt του SharePoint Portal Server 2003 και του SharePoint Server 2007. Ωστόσο, μπορείτε να δημιουργήσετε ένα αρχείο Robots.txt και να τοποθετήσετε το αρχείο Robots.txt του κεντρικού καταλόγου της προεπιλεγμένης τοποθεσίας Web στο διακομιστή. Για τον καθορισμό του κεντρικού καταλόγου της προεπιλεγμένης τοποθεσίας Web στο διακομιστή, ακολουθήστε τα εξής βήματα:
  1. Ξεκινήστε τη Διαχείριση των υπηρεσιών Internet Information Services (IIS) (Internet Information Services (IIS) Manager).
  2. expandΌνομα_διακομιστήκαι, στη συνέχεια, αναπτύξτε το στοιχείοΤοποθεσίες Web.
  3. Κάντε δεξιό κλικ στο στοιχείοΠροεπιλεγμένη τοποθεσία Web, και στη συνέχεια κάντε κλικ στο κουμπίΙδιότητες (Properties).
  4. Κάντε κλικ στην καρτέλαΚεντρικός κατάλογοςTAB.
  5. Σημειώστε τη διαδρομή που εμφανίζεται με τοΤοπική διαδρομήπλαίσιο και στη συνέχεια κάντε κλικΆκυρο (Cancel).

    Για να τοποθετήσετε το αρχείο Robots.txt στη διαδρομή που εμφανίζεται στο πλαίσιο τουΤοπική διαδρομή"Τύπος" (Type). Για παράδειγμα, αν η διαδρομή είναι D:\Inetpub\Wwwroot, τοποθετήστε την Robots.txt στο φάκελο D:\Inetput\Wwwroot στο διακομιστή. Για να επιβεβαιώσετε ότι το αρχείο Robots.txt βρίσκεται στον σωστό φάκελο στο διακομιστή, ξεκινήστε το πρόγραμμα περιήγησής σας και στη συνέχεια πληκτρολογήστεhttp://Όνομα_διακομιστή/robots.txt.
Μπορείτε να περιορίσετε την πρόσβαση σε συγκεκριμένα έγγραφα χρησιμοποιώντας META ΓΛΏΣΣΑΣ HTML ετικέτες. HTML META tags tell the robot whether a document can be included in the index and whether the robot can follow the links in the document by using the INDEX/NOINDEX attribute and the FOLLOW/NOFOLLOW attributes in the tag. For example, you can mark a document with the following if you do not want the document crawled and you do not want links in the document followed:
<meta name="robots" content="NOINDEX, NOFOLLOW">
SharePoint Portal Server 2003 and SharePoint Server 2007 automatically obey the restrictions that are contained in the Robots.txt file.

ΣΗΜΕΙΩΣΗfor Microsoft Office SharePoint Server2007, you must restart the Office SharePoint Server Search service before thesaurus updates are applied to search queries. Also, changes to thesaurus files must be manually copied to every server in the farm that is serving search queries. To be thorough and allow for topology chagnes, you can copy the changes to all servers in the farm.

Αναφορές

For more information about how to administer and configure SharePoint Portal Server 2003, see theMicrosoft Office SharePoint Portal Server 2003 Administrator's Guide. Για ναMicrosoft Office SharePoint Portal Server 2003 Administrator's Guide(Help.chm του διαχειριστή) βρίσκεται στο φάκελο "έγγραφα" στον ριζικό κατάλογο από το CD του SharePoint Portal Server 2003.

For more information about SharePoint Portal Server 2003, visit the following Microsoft Web site:
http://technet.microsoft.com/office/sharepointserver/bb267364.aspx (http://technet.microsoft.com/office/sharepointserver/bb267364.aspx)
For more information about SharePoint Server 2007, visit the following Microsoft Web site:
http://office.microsoft.com/en-us/sharepointserver/HA101656531033.aspx (http://office.microsoft.com/en-us/sharepointserver/HA101656531033.aspx)

Οι πληροφορίες σε αυτό το άρθρο ισχύουν για:
  • Microsoft Office SharePoint Server 2007
  • Microsoft Office SharePoint Portal Server 2003
Λέξεις-κλειδιά: 
kbregistration kbhowtomaster kbmt KB837847 KbMtel
Μηχανικά μεταφρασμένοΜηχανικά μεταφρασμένο
ΣΗΜΑΝΤΙΚΟ: Αυτό το άρθρο είναι προϊόν λογισμικού μηχανικής μετάφρασης της Microsoft και όχι ανθρώπινης μετάφρασης. Η Microsoft σάς προσφέρει άρθρα που είναι προϊόντα ανθρώπινης αλλά και μηχανικής μετάφρασης έτσι ώστε να έχετε πρόσβαση σε όλα τα άρθρα της Γνωσιακής Βάσης μας στη δική σας γλώσσα. Ωστόσο, ένα άρθρο που έχει προκύψει από μηχανική μετάφραση δεν είναι πάντα άριστης ποιότητας. Ενδέχεται να περιέχει λεξιλογικά, συντακτικά ή γραμματικά λάθη, όπως ακριβώς τα λάθη που θα έκανε ένας μη φυσικός ομιλητής επιχειρώντας να μιλήσει τη γλώσσα σας. Η Microsoft δεν φέρει καμία ευθύνη για τυχόν ανακρίβειες, σφάλματα ή ζημίες που προκύψουν λόγω τυχόν παρερμηνειών στη μετάφραση του περιεχομένου ή χρήσης του από τους πελάτες της. Επίσης, η Microsoft πραγματοποιεί συχνά ενημερώσεις στο λογισμικό μηχανικής μετάφρασης.
Η αγγλική έκδοση αυτού του άρθρου είναι η ακόλουθη:837847  (http://support.microsoft.com/kb/837847/en-us/ )