Artigo: 837847 - Última revisão: terça-feira, 26 de Fevereiro de 2008 - Revisão: 6.3

Como personalizar o SharePoint Portal Server 2003 ou o Office SharePoint Server 2007 utilizando IFilters, ficheiros de palavras irrelevantes e ficheiros do dicionário de sinónimos

Dica do SistemaEste artigo aplica-se a um sistema operativo diferente do que está a utilizar. Foi desactivado o conteúdo do artigo, que pode não ser relevante para si.
Importante: este artigo contém informações sobre como modificar o registo. Certifique-se de que cria uma cópia de segurança do registo antes de o modificar. Certifique-se de que sabe como restaurar o registo se ocorrer um problema. Para mais informações sobre como efectuar uma cópia de segurança, restaurar e modificar o registo, clique no número de artigo que se segue para visualizar o artigo na Base de Dados de Conhecimento da Microsoft:
322756  (http://support.microsoft.com/kb/322756/ ) Como fazer cópias de segurança, editar e restaurar o registo no Windows XP e no Windows Server 2003

Nesta página

Expandir tudo | Reduzir tudo

Sumário

Este artigo descreve como utilizar IFilters, como o filtro TIFF, ficheiros de palavras irrelevantes, ficheiros do dicionário de sinónimos e um ficheiro Robot.txt para personalizar o Microsoft SharePoint Portal Server 2003 e o Microsoft Office SharePoint Server 2007.

Este artigo descreve como activar o reconhecimento óptico de caracteres para ficheiros TIFF (Tagged Image File Format), como alterar o limite de tamanho do ficheiro TIFF, como activar a rotação automática de ficheiros e como registar mensagens de erro de TIFF no registo de eventos de aplicações. Este artigo também contém informações sobre como alterar ficheiros de palavras irrelevantes e ficheiros do dicionário de sinónimos incluídos no SharePoint Portal Server 2003 e no SharePoint Server 2007.

INTRODUÇÃO

Este artigo descreve como utilizar o IFilter TIFF (Tagged Image File Format), ficheiros de palavras irrelevantes, ficheiros do dicionário de sinónimos e o ficheiro Robots.txt para personalizar o SharePoint Portal Server 2003 e o SharePoint Server 2007.

Descrição geral dos IFilters

Nota: no SharePoint Server 2007, a funcionalidade de filtro TIFF foi removida.

Para pesquisar documentos com extensões de ficheiro proprietárias, tem de registar o IFilter para esse tipo de ficheiro no SharePoint Portal Server 2003. Quando configura uma origem de conteúdo, pode especificar os tipos de ficheiro que pretende incluir no índice de conteúdo. Por exemplo, poderá pretender incluir ficheiros com as extensões .xyz e .yyy no índice de conteúdo. A inclusão de um tipo de ficheiro aplica-se apenas ao conteúdo armazenado fora do site de portal e que está incluído no índice de conteúdo utilizando origens de conteúdo. A inclusão de um tipo de ficheiro não se aplica ao conteúdo armazenado no site de portal.

Se um tipo de ficheiro tiver um IFilter associado, terá de registar o IFilter para um determinado tipo de ficheiro no computador com o SharePoint Portal Server 2003 que pesquisa esse tipo de ficheiro. Depois de registar o IFilter, o SharePoint Portal Server 2003 consegue pesquisar documentos que utilizam esse tipo de ficheiro e incluir esses documentos no índice de conteúdo. Se adicionar um tipo de ficheiro e não registar o IFilter para esse tipo de ficheiro, o SharePoint Portal Server 2003 apenas incluirá as propriedades do ficheiro no índice de conteúdo.

Os passos que tem de seguir para registar um IFilter variam de acordo com o IFilter que pretende registar. Para mais informações sobre como registar um IFilter, consulte a documentação fornecida com o IFilter que pretende registar. O SharePoint Portal Server 2003 inclui filtros para os seguintes itens:
  • Documentos do Microsoft Office, incluindo documentos do Microsoft Publisher e do Microsoft Visio
  • Ficheiros HTML
  • Ficheiros TIFF
  • Ficheiros de texto
O SharePoint Portal Server 2003 também aceita IFilters de outros fabricantes para tipos de ficheiros personalizados.

O IFilter TIFF

Quando instala o SharePoint Portal Server 2003, o programa de configuração instala automaticamente um IFilter para ficheiros TIFF. O filtro TIFF processa as extensões .tif e .tiff. As secções que se seguem explicam como executar as seguintes tarefas:
  • Activar o reconhecimento óptico de caracteres (OCR) para ficheiros TIFF
  • Alterar o limite de tamanho de ficheiros TIFF
  • Activar a rotação automática de ficheiros
  • Registar mensagens de erro de TIFF no registo de eventos de aplicações
Nota: depois de editar as entradas de registo associadas aos ficheiros TIFF, tem de reiniciar o serviço Microsoft Search.

Como activar o reconhecimento óptico de caracteres em Ficheiros TIFF

Quando o SharePoint Portal Server 2003 pesquisa ficheiros TIFF, o SharePoint Portal Server 2003 apenas verifica as propriedades de ficheiro. Se activar o reconhecimento óptico de caracteres, o SharePoint Portal Server pesquisará o ficheiro TIFF e tentará reconhecer caracteres no documento de forma a incluir informações adicionais no índice.

Para activar o reconhecimento óptico de caracteres em ficheiros TIFF, utilize um dos seguintes métodos.
Método 1: Editar manualmente o registo
Adicione a entrada de registo PerformOCR à seguinte subchave de registo e defina a entrada de registo PerformOCR com um valor de 1:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Para activar o reconhecimento óptico de caracteres em ficheiros TIFF, siga estes passos.

Aviso: poderão ocorrer problemas graves se modificar o registo de forma incorrecta utilizando o Editor de Registo ou qualquer outro método. Estes problemas poderão forçar a reinstalação do sistema operativo. A Microsoft não garante que estes problemas possam ser resolvidos. Todo e qualquer risco decorrente da modificação do registo é da responsabilidade do utilizador.
  1. Clique em Iniciar e, em seguida, clique em Executar.
  2. Na caixa Abrir, escreva regedit e clique em OK.
  3. Localize e clique na seguinte subchave do registo:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. No menu Editar, aponte para Novo e clique em Valor DWORD.
  5. Escreva PerformOCR e prima ENTER.
  6. No menu Editar, clique em Modificar.
  7. Para activar o reconhecimento óptico de caracteres, escreva 1 na caixa Dados do valor e, em seguida, clique em OK.

    Nota: para desactivar o reconhecimento óptico de caracteres, defina a entrada de registo PerformOCR como 0 (zero).
  8. Saia do Editor de Registo.
  9. Reinicie o serviço Microsoft Search. Para o fazer, siga estes passos:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do rato em Microsoft Search e, em seguida, clique em Reiniciar.
Método 2: Utilizar o ficheiro Tiff_ocr_on.reg
Utilize o ficheiro Tiff_ocr-on.reg para adicionar a entrada de registo PerformOCR à seguinte subchave de registo:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Aviso: poderão ocorrer problemas graves se modificar o registo de forma incorrecta utilizando o Editor de Registo ou qualquer outro método. Estes problemas poderão forçar a reinstalação do sistema operativo. A Microsoft não garante que estes problemas possam ser resolvidos. Todo e qualquer risco decorrente da modificação do registo é da responsabilidade do utilizador.
  1. Localize a pasta Support\Tools no CD do SharePoint Portal Server 2003 e faça duplo clique no ficheiro Tiff_ocr_on.reg.
  2. Reinicie o serviço Microsoft Search. Para o fazer, siga estes passos:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do rato em Microsoft Search e, em seguida, clique em Reiniciar.

Como alterar o limite de tamanho de ficheiros TIFF

Por predefinição, quando o reconhecimento óptico de caracteres está activado, o SharePoint Portal Server 2003 não inclui quaisquer ficheiros TIFF de página única com um tamanho superior a 1 megabyte (MB) no índice de conteúdo. Para alterar o limite de tamanho de ficheiros TIFF, altere a entrada de registo MaxImageSize na seguinte subchave de registo:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Aviso: poderão ocorrer problemas graves se modificar o registo de forma incorrecta utilizando o Editor de Registo ou qualquer outro método. Estes problemas poderão forçar a reinstalação do sistema operativo. A Microsoft não garante que estes problemas possam ser resolvidos. Todo e qualquer risco decorrente da modificação do registo é da responsabilidade do utilizador.
  1. Clique em Iniciar e, em seguida, clique em Executar.
  2. Na caixa Abrir, escreva regedit e clique em OK.
  3. Localize e clique na seguinte subchave do registo:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. Clique com o botão direito do rato em MaxImageSize e clique em Modificar.
  5. Escreva 100.000 na caixa Dados do valor e clique em OK.

    Nota: um valor de 100.000 é igual a um limite de tamanho de ficheiro de 1 MB.
  6. Saia do Editor de Registo.
  7. Reinicie o serviço Microsoft Search. Para o fazer, siga estes passos:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do rato em Microsoft Search e, em seguida, clique em Reiniciar.

Como activar a rotação automática de ficheiros

Se activar o reconhecimento óptico de caracteres, e se alguns ficheiros TIFF estiverem invertidos ou de lado, poderá activar a rotação automática de ficheiros para obter maior exactidão na pesquisa.

Se activar o reconhecimento óptico de caracteres, também poderá activar a rotação automática de ficheiros. Se activar a rotação automática de ficheiros, o filtro rodará ficheiros TIFF que estejam invertidos ou de lado. O filtro também rodará o ficheiro TIFF da memória antes de pesquisar o ficheiro TIFF. Embora a rotação de ficheiros utilize recursos, os resultados da pesquisa de um ficheiro que se encontra invertido ou de lado poderão ser fracos. Se tem a certeza de que todos os ficheiros TIFF estão correctamente orientados, não é necessário activar esta opção.

Para activar a rotação automática de ficheiros, defina a entrada de registo AutoRotation na seguinte subchave de registo com um valor de 1:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Por predefinição, a rotação automática de ficheiros é activada quando instala o SharePoint Portal Server 2003. No entanto, se a entrada de registo PerformOCR estiver definida como 0 (zero) ou não existir, a entrada de registo AutoRotation não surtirá qualquer efeito.

Para activar a rotação automática de ficheiros, siga estes passos.

Aviso: poderão ocorrer problemas graves se modificar o registo de forma incorrecta utilizando o Editor de Registo ou qualquer outro método. Estes problemas poderão forçar a reinstalação do sistema operativo. A Microsoft não garante que estes problemas possam ser resolvidos. Todo e qualquer risco decorrente da modificação do registo é da responsabilidade do utilizador.
  1. Clique em Iniciar e, em seguida, clique em Executar.
  2. Na caixa Abrir, escreva regedit e clique em OK.
  3. Localize e clique na seguinte subchave do registo:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. Clique com o botão direito do rato em AutoRotation e clique em Modificar.
  5. Escreva 1 na caixa Dados do valor e clique em OK.

    Nota: para desactivar a rotação automática de ficheiros, defina a entrada de registo AutoRotation como 0 (zero).
  6. Saia do Editor de Registo.
  7. Reinicie o serviço Microsoft Search. Para o fazer, siga estes passos:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do rato em Microsoft Search e, em seguida, clique em Reiniciar.

Como registar mensagens de erro de TIFF no registo de eventos de aplicações

Por predefinição, o SharePoint Portal Server 2003 regista mensagens de erro associadas aos ficheiros TIFF no registo do colector. Se pretende que o SharePoint Portal Server 2003 registe mensagens de erro associadas aos ficheiros TIFF no registo de eventos de aplicações, defina a entrada de registo LoggingLevel na seguinte subchave de registo com o valor que pretender:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application\Microsoft Office Document Imaging
Pode definir a entrada de registo
LoggingLevel
com um dos seguintes valores:
  • Para desactivar o registo, defina a entrada de registo LoggingLevel com um valor de 0 (zero). Esta é a predefinição.
  • Para registar mensagens informativas e de erro, defina a entrada de registo LoggingLevel com um valor de 1.
  • Para registar mensagens de aviso e de erro, defina a entrada de registo LoggingLevel com um valor de 2.
  • Para registar todas as mensagens, defina a entrada de registo LoggingLevel com um valor de 3.
  • Para registar apenas mensagens de erro, defina a entrada de registo LoggingLevel com um valor de 4.
Para activar o registo de mensagens de ficheiros TIFF no registo de eventos de aplicações, siga estes passos:
  1. Clique em Iniciar e, em seguida, clique em Executar.
  2. Na caixa Abrir, escreva regedit e clique em OK.
  3. Localize e clique na seguinte subchave do registo:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application\Microsoft Office Document Imaging
  4. Clique com o botão direito do rato em LoggingLevel e clique em Modificar.
  5. Escreva o valor pretendido na caixa Dados do valor e clique em OK.
  6. Saia do Editor de Registo.
  7. Reinicie o serviço Microsoft Search. Para o fazer, siga estes passos:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do rato em Microsoft Search e, em seguida, clique em Reiniciar.

Ficheiros de palavras irrelevantes

Uma palavra irrelevante é uma palavra que não é útil numa pesquisa. Por exemplo, as seguintes palavras são palavras irrelevantes:
  • o
  • um
O ficheiro de palavras irrelevantes de um idioma contém uma lista de palavras irrelevantes. O SharePoint Portal Server 2003 e o SharePoint Server 2007 incluem ficheiros de palavras irrelevantes para os seguintes idiomas:
  • Chinês Simplificado (Noisechs.txt)
  • Chinês Tradicional (Noisecht.txt)
  • Checo (Noisecsv.txt)
  • Neerlandês (Noisenld.txt)
  • Inglês internacional (Noiseeng.txt)
  • Inglês dos E.U.A. (Noiseenu.txt)
  • Finlandês (Noisefin.txt)
  • Francês (Noisefra.txt)
  • Alemão (Noisedeu.txt)
  • Húngaro (Noisehun.txt)
  • Italiano (Noiseita.txt)
  • Japonês (Noisejpn.txt)
  • Coreano (Noisekor.txt)
  • Polaco (Noiseplk.txt)
  • Português (Brasil) (Noiseptb.txt)
  • Russo (Noiserus.txt)
  • Espanhol (Noiseesn.txt)
  • Sueco (Noisesve.txt)
  • Tailandês (Noisetha.txt)
  • Turco (Noisetrk.txt)
Se não existir uma lista de palavras irrelevantes para um idioma, o SharePoint Portal Server 2003 e o SharePoint Server 2007 utilizam o ficheiro de palavras irrelevantes neutro Noiseneu.txt. O separador de palavras do idioma analisa palavras irrelevantes.

Por predefinição, os ficheiros de palavras irrelevantes do SharePoint Portal Server 2003 são armazenados na seguinte localização no servidor:
Unidade:\Programas\SharePoint Portal Server\Data\Config
Caso tenha instalado o SharePoint Portal Server 2003 numa localização diferente da predefinida, a pasta Data estará localizada numa pasta diferente no servidor.

Por predefinição, o SharePoint Server 2007 armazena ficheiros de palavras irrelevantes na seguinte localização no servidor:
Unidade:\Programas\Microsoft Office Servers\12.0\Data\Config
Pode alterar o ficheiro de palavras irrelevantes. Se adicionar palavras irrelevantes, o nível de exactidão das pesquisas poderá diminuir. No entanto, o tamanho do índice de conteúdo também diminuirá. Um índice de conteúdo mais pequeno ajuda a optimizar o desempenho. Pode eliminar palavras irrelevantes se pretender que as pesquisas devolvam essas palavras.

Se remover palavras de um ficheiro de palavras irrelevantes, as alterações não entrarão em vigor enquanto não efectuar a reposição dos índices de conteúdo e efectuar uma actualização completa dos mesmos no SharePoint Portal Server 2003 e no SharePoint Server 2007. Se remover palavras do ficheiro de palavras irrelevantes, as palavras serão removidas dos ficheiros antes de estes serem incluídos num índice. Tem de actualizar o índice de conteúdo depois de modificar a lista de palavras irrelevantes. Caso contrário, os documentos que contenham as palavras irrelevantes não serão devolvidos nas consultas.

Não elimine ficheiros de palavras irrelevantes. Se não pretende que as palavras irrelevantes sejam removidas durante uma actualização ou consulta, remova essas entradas específicas do ficheiro. Se eliminar o ficheiro de palavras irrelevantes, todos os caracteres individuais serão removidos como palavras irrelevantes. Se remover todas as palavras irrelevantes do ficheiro de palavras irrelevantes, ocorrerão erros durante a pesquisa. Por conseguinte, tem de ter pelo menos uma palavra irrelevante no ficheiro, mesmo que esta seja tão simples como um ponto final.

Por predefinição, os ficheiros de palavras irrelevantes no SharePoint Portal Server 2003 são copiados para a seguinte pasta:
Unidade\Programas\SharePoint Portal Server\DATA\Applications\UIDPrograma\Config
Por predefinição, os ficheiros de palavras irrelevantes no SharePoint Server 2007 são copiados para a seguinte pasta:
Unidade:\Programas\Microsoft Office Servers\12.0\Data\Applications\UIDPrograma\Config
Pode especificar palavras irrelevantes ao nível do programa em vez de ao nível do servidor ou ao nível do farm de servidor. Por exemplo, se o SharePoint Portal Server 2003 ou o SharePoint Server 2007 e o Microsoft SQL Server estiverem instalados no mesmo servidor, poderá especificar uma lista de palavras irrelevantes para o SharePoint Portal Server 2003 ou para o SharePoint Server 2007 e uma lista de palavras irrelevantes diferente para o SQL Server.

Como alterar o ficheiro de palavras irrelevantes

Para alterar o ficheiro de palavras irrelevantes, siga estes passos:
  1. Inicie o Bloco de Notas e abra o ficheiro de palavras irrelevantes.
  2. Adicione ou elimine as palavras pretendidas.
  3. Guarde o ficheiro de palavras irrelevantes e saia do Bloco de Notas.
  4. No SharePoint Portal Server 2003, reinicie o serviço Microsoft SharePointPS Search. No SharePoint Server 2007, reinicie o serviço Windows SharePoint Services Search. Para o fazer, siga estes passos:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do rato em Microsoft SharePointPS Search ou em Windows SharePoint Services Search e clique em Reiniciar.
  5. Efectue uma actualização completa do índice de conteúdo.
Nota: quando efectua procuras no site de portal, o SharePoint Portal Server 2003 e o SharePoint Server 2007 poderão ignorar alguns termos de consulta, como palavras irrelevantes, mesmo que o termo de consulta não seja uma palavra irrelevante. Este comportamento ocorre em situações em que o termo de consulta é uma forma flexional da palavra irrelevante. Por exemplo, se o ficheiro de palavras irrelevantes contiver a palavra "ser" e se pesquisar a palavra "sou", a palavra "sou" é tratada como uma palavra irrelevante porque é uma forma do verbo "ser".

Ficheiros do dicionário de sinónimos

Os dicionários de sinónimos são uma funcionalidade de procura de expansão da consulta no SharePoint Portal Server 2003 e no SharePoint Server 2007. Os dicionários de sinónimos permitem escrever uma expressão numa consulta de procura e receber resultados de palavras relacionadas com a expressão introduzida. Por exemplo, pode pesquisar a palavra "correr" e receber resultados que contenham as palavras "correr" ou "corrida" se os dois termos estiverem relacionados no dicionário de sinónimos. Além disso, o dicionário de sinónimos permite que o administrador do farm de servidor configure classificações de procura atribuindo importâncias diferentes às palavras. O SharePoint Portal Server 2003 e o SharePoint Server 2007 incluem ficheiros do dicionário de sinónimos para os seguintes idiomas:
  • Chinês Simplificado (Tschs.xml)
  • Chinês Tradicional (Tscht.xml)
  • Checo (Tscsv.xml)
  • Neerlandês (Tsnld.xml)
  • Inglês internacional (Tseng.xml)
  • Inglês dos E.U.A. (Tsenu.xml)
  • Finlandês (Tsfin.xml)
  • Francês (Tsfra.xml)
  • Alemão (Tsdeu.xml)
  • Húngaro (Tshun.xml)
  • Italiano (Tsita.xml)
  • Japonês (Tsjpn.xml)
  • Coreano (Tskor.xml)
  • Polaco (Tsplk.xml)
  • Português (Brasil) (Tsptb.xml)
  • Russo (Tsrus.xml)
  • Espanhol (Tsesn.xml)
  • Sueco (Tssve.xml)
  • Tailandês (Tstha.xml)
  • Turco (Tstrk.xml)
Os ficheiros do dicionário de sinónimos contêm conteúdo de exemplo inactivo. O ficheiro do dicionário de sinónimos neutro Tsneu.xml aplica-se às consultas que não têm um ficheiro do dicionário de sinónimos associado ao idioma de consulta. O ficheiro do dicionário de sinónimos neutro aplica-se sempre às consultas, mesmo quando existe um ficheiro do dicionário de sinónimos específico associado ao idioma de consulta.

Por predefinição, o SharePoint Portal Server 2003 armazena ficheiros do dicionário de sinónimos na seguinte pasta no servidor:
Unidade:\Programas\SharePoint Portal Server\Data\Config.
Caso tenha instalado o SharePoint Portal Server 2003 numa localização diferente da predefinida, a pasta Data estará localizada numa pasta diferente no servidor.

Por predefinição, o SharePoint Server 2007 armazena ficheiros do dicionário de sinónimos na seguinte pasta no servidor:
Unidade:\Programas\Microsoft Office Servers\12.0\Data\Config
Os ficheiros do dicionário de sinónimos do SharePoint Portal Server 2003 também são copiados para a seguinte pasta:
Unidade\Programas\SharePoint Portal Server\Data\Applications\Application UID\Config
Isto ocorre para cada instância do serviço Microsoft Search ou do serviço Microsoft SharePointPS Search.

Os ficheiros do dicionário de sinónimos do SharePoint Server 2007 também são copiados para a seguinte pasta:
Unidade:\Programas\Microsoft Office Servers\12.0\Data\Applications\Application UID\Config
Isto ocorre para cada instância do serviço Microsoft Search ou do serviço Windows SharePoint Services Search.

Pode modificar o dicionário de sinónimos ao nível do programa em vez de ao nível do servidor ou ao nível do farm de servidor. Por exemplo, se o SharePoint Portal Server 2003 ou o SharePoint Server 2007 e o SQL Server estiverem instalados no mesmo servidor, poderá especificar um ficheiro do dicionário de sinónimos para o SharePoint Portal Server 2003 ou para o SharePoint Server 2007 e um ficheiro do dicionário de sinónimos diferente para o SQL Server.

É possível alterar as entradas do dicionário de sinónimos alterando o ficheiro do dicionário de sinónimos num editor de texto. O ficheiro do dicionário de sinónimos tem de utilizar XML correctamente concebido e as entradas deverão estar entre tags de abertura e de fecho correspondentes. Se o XML for incorrectamente concebido, o SharePoint Portal Server 2003 e o SharePoint Server 2007 registarão um erro no registo de eventos de aplicações.

Quando alterar o ficheiro do dicionário de sinónimos, certifique-se de que não altera as maiúsculas e minúsculas das tags. Apenas as tags XML utilizam letras maiúsculas. Todas as outras tags utilizam letras minúsculas. Por exemplo, a tag <replacement> tem de utilizar letras minúsculas.

Importante: é instalado um ficheiro com o nome Tsschema.xml juntamente com os ficheiros do dicionário de sinónimos. Não modifique o ficheiro Tsschema.xml.

Os ficheiros do dicionário de sinónimos contêm dois tipos de entradas do dicionário de sinónimos. Estes tipos são conjuntos de substituição e conjuntos de expansão. Os ficheiros do dicionário de sinónimos também permitem configurar opções de ponderação e de radicais de palavras num conjunto de substituição ou conjunto de expansão.

Importante: numa perspectiva de desempenho, é importante saber quantas entradas estão definidas no ficheiro de sinónimos. Além disso, deverá ter atenção para não exceder a recomendação de 1.000/10.000 (normal/máx.) entradas conforme descrito no planeador de capacidade. Para ver o planeador de capacidade, visite o seguinte Web site da Microsoft:
http://office.microsoft.com/en-us/sharepointportaladmin/HA011647581033.aspx (http://office.microsoft.com/en-us/sharepointportaladmin/HA011647581033.aspx)
Além disso, certifique-se de que cada tag <sub> e <pat> é contabilizada como uma entrada que cumpre os valores recomendados.

Conjuntos de substituição

Um conjunto de substituição especifica um padrão que é substituído por uma ou mais substituições numa consulta de procura. Por exemplo, pode adicionar um conjunto de substituição em que W2K é o padrão e em que Windows 2000 é a substituição. Se consultar o termo W2K, o SharePoint Portal Server 2003 e o SharePoint Server 2007 devolverão apenas os resultados da procura que contêm o termo Windows 2000. Nos resultados da procura não receberá itens que contenham o termo W2K.

Cada conjunto de substituição é escrito entre tags <replacement>. Na tag de substituição, deve especificar um ou mais padrões entre tags <pat>. Especifique uma ou mais substituições introduzindo-as entre tags <sub>. Os padrões e substituições podem conter uma palavra ou uma sequência de palavras. Por exemplo, para adicionar um conjunto de substituição em que W2K é o padrão e Windows 2000 é a substituição, utilize o seguinte:
 <replacement>
<pat>W2K</pat>
<sub>Windows 2000</sub>
</replacement> 
Pode ter mais do que uma substituição para cada padrão que especificar. Por predefinição, os padrões são sensíveis às maiúsculas e minúsculas. Por exemplo, se o ficheiro do dicionário de sinónimos contiver o termo W2K, e se um utilizador procurar o termo w2k, o SharePoint Portal Server 2003 e o SharePoint Server 2007 não devolverão resultados de procura que contenham o termo Windows 2000. O SharePoint Portal Server 2003 e o SharePoint Server 2007 não reconhecem o termo w2k como sendo o mesmo que W2K porque existe uma diferença de maiúsculas e minúsculas.

Pode especificar os padrões como sensíveis às maiúsculas e minúsculas se adicionar uma tag ao ficheiro do dicionário de sinónimos relativo ao idioma. Por exemplo, se especificar que os padrões não são sensíveis às maiúsculas e minúsculas, os termos &lt;pat&gt; e &lt;sub&gt; corresponderão aos termos de consulta independentemente das maiúsculas e minúsculas do termo de consulta.

Quando efectua uma consulta utilizando a sintaxe CONTAINS FORMSOF, os dicionários de sinónimos funcionam como descrito anteriormente. Para mais informações sobre a sintaxe CONTAINS FORMSOF, consulte o Microsoft SharePoint Products and Technologies 2003 Software Development Kit.

Por predefinição, um site de portal utiliza o tipo de consulta FREETEXT. As consultas FREETEXT abrem automaticamente os dicionários de sinónimos. No entanto, se introduzir os termos da procura entre aspas, o SharePoint Portal Server 2003 e o SharePoint Server 2007 desactivam a consulta FREETEXT e não utilizam o dicionário de sinónimos. Assim, o SharePoint Portal Server 2003 e o SharePoint Server 2007 devolverão resultados baseados no termo ou termos exactos da procura que se encontram entre aspas. Se o dicionário de sinónimos substituir uma palavra de uma expressão por outra palavra, uma consulta FREETEXT devolverá resultados para a nova versão da expressão completa.

Para o conjunto de substituição em que o termo Windows 2000 substitui o termo W2K, a seguinte tabela mostra os resultados obtidos baseados em dados diferentes do utilizador a partir da interface de procura no site de portal. Este exemplo pressupõe que o dicionário de sinónimos está definido como sensível às maiúsculas e minúsculas e que a procura não é sensível às maiúsculas e minúsculas.
Reduzir esta tabelaExpandir esta tabela
Dados do utilizadorUtilização do dicionário de sinónimosTexto em documentos devolvidos nos resultados da procura
w2kSim. Uma consulta FREETEXT. W2k, W2K, w2k ou w2K.

Não são devolvidos resultados para o Windows 2000 porque o padrão do dicionário de sinónimos é W2K em letras maiúsculas.
"w2k"NãoW2K, w2k, W2k ou w2K.
W2KSim. Uma consulta FREETEXT.Windows 2000, windows 2000, w2k, W2k, w2K ou combinações de maiúsculas e minúsculas, como wInDows 2000.

Não são devolvidos resultados para W2K.
"W2K"NãoW2K, w2k, W2k ou w2K.
W2K ServerSim. Uma consulta FREETEXT.Windows 2000, windows 2000 e combinações de maiúsculas e minúsculas, como wInDows 2000; w2k, W2k ou w2K; Server, server e combinações de maiúsculas e minúsculas, como SeRvEr; W2K Server e combinações de maiúsculas e minúsculas desse termo.

Não são devolvidos resultados para sistema operativo W2K.
"W2K Server"NãoW2K Server, w2k Server, W2k Server, w2K Server, W2K server, w2k server, W2k server ou w2K server.
Nota: em cada um dos exemplos anteriores da tabela, a definição de maiúsculas e minúsculas para procuras é especificada como ?false?. Se a definição de maiúsculas e minúsculas for especificada como ?true?, todas as diferenças de maiúsculas e minúsculas serão significativas quando for efectuada a correspondência de padrões. Se está a tentar estabelecer uma correspondência entre dois conjuntos de substituição com padrões semelhantes, o conjunto de substituição mais extenso terá precedência. Por exemplo, se tiver os seguintes conjuntos de substituição, o termo Internet Explorer terá precedência sobre o termo Internet:
 <replacement>
<pat>Internet</pat>
<sub>intranet</sub>
</replacement> 
 <replacement>
<pat>Internet Explorer</pat>
<sub>IE</sub>
<sub>IE 5</sub>
</replacement> 
Para este conjunto de substituição, a seguinte tabela mostra os resultados obtidos baseados em dados diferentes do utilizador a partir da interface de procura no site de portal.
Reduzir esta tabelaExpandir esta tabela
Dados do utilizadorUtilização do dicionário de sinónimosTexto em documentos devolvidos nos resultados da procura
InternetSim. Uma consulta FREETEXT. Intranet, intranet ou combinações de maiúsculas e minúsculas, como iNtranEt. Não são devolvidos resultados para IE ou IE 5.
Internet ExplorerSim. Uma consulta FREETEXT.

IE, IE 5 e combinações de maiúsculas e minúsculas, como iE ou Ie 5. Não são devolvidos resultados para Internet, Internet Explorer ou intranet.

Conjuntos de expansão

Um conjunto de expansão é um grupo de substituições sinónimas entre si. As consultas que contêm correspondências numa substituição são expandidas para incluir todas as outras substituições no conjunto de expansão. Por exemplo, pode adicionar um conjunto de expansão se as seguintes substituições forem sinónimas:
  • escritor (writer)
  • autor (author)
  • jornalista (journalist)
Se consultar o termo autor, o SharePoint Portal Server 2003 e o SharePoint Server 2007 também devolverão resultados de procura com o termo escritor e o termo jornalista.

Cada conjunto de expansão é escrito entre tags &lt;expansion&gt;. Na tag de expansão, deve especificar uma ou mais substituições entre tags &lt;sub&gt;. Para o exemplo descrito anteriormente, adicione as seguintes linhas:
 <expansion>
<sub>writer</sub>
<sub>author</sub>
<sub>journalist</sub>
</expansion> 

Radicais de palavras

Os radicais de palavras associam um radical linguístico a todas as palavras correspondentes. Pode especificar radicais de palavras em entradas de padrões e entradas de substituição. Por exemplo, em português, o radical comprar corresponde ao seguinte:
  • comprou
  • comprando
  • compra
Pode especificar radicais de palavras adicionando dois asteriscos no fim da cadeia. Deste modo, o SharePoint Portal Server 2003 e o SharePoint Server 2007 devolverão as correspondências para as variações da palavra. Por exemplo, poderá pretender criar consultas para o termo correr (run) que também devolvam os seguintes termos:
  • a correr (running)
  • corrida (jog)
  • correndo (jogging)
Para o fazer, modifique o conjunto de expansão da seguinte forma:
 <expansion>
<sub weight="0.5">run**</sub>
<sub weight="0.5">jog**</sub>
</expansion>
Se consultar o termo correr ou o termo a correr, os resultados da procura incluirão o termo corrida e o termo correndo. Se consultar o termo a correr, receberá os mesmos resultados de procura da consulta do termo correr.

Por exemplo, se o dicionário de sinónimos incluir o padrão &lt;pat&gt;Utilizador1 correu para a loja** &lt;/pat&gt; ou a substituição &lt;sub&gt; Utilizador1 correu para a loja**&lt;/sub&gt;, a consulta devolverá ou adicionará as seguintes cadeias à consulta:
  • Utilizador1 corre para a loja
  • Utilizador1 está a correr para a loja
  • Utilizador1 correu para a loja
  • Utilizador1 corre para as lojas
  • Utilizador1 está a correr para as lojas
  • Utilizador1 correu para as lojas

Como alterar um ficheiro do dicionário de sinónimos

Para alterar o ficheiro do dicionário de sinónimos, siga estes passos:
  1. Inicie o Bloco de Notas e abra o ficheiro do dicionário de sinónimos.

    Nota: se o ficheiro do dicionário de sinónimos contiver caracteres do conjunto de caracteres de byte duplo (DBCS), terá de guardar o ficheiro do dicionário de sinónimos no formato Unicode antes de alterar o ficheiro do dicionário de sinónimos.
  2. Se estiver a alterar o ficheiro do dicionário de sinónimos pela primeira vez, remova as seguintes linhas de comentário que aparecem no início e no fim do ficheiro:
     <!---Commented out---> 
  3. Se não pretende que os padrões sejam sensíveis às maiúsculas e minúsculas, adicione a seguinte tag no início do ficheiro:
    &lt;case caseflag="false"&gt;&lt;/case&gt;
    Se pretende que os padrões sejam sensíveis às maiúsculas e minúsculas mais à frente no ficheiro, altere a definição de "false" para "true" na tag, do seguinte modo:
    &lt;case caseflag="true"&gt;&lt;/case&gt;
  4. Efectue as alterações necessárias. Adicione, modifique ou elimine um conjunto e substituição ou um conjunto de expansão. Adicione, modifique ou elimine a ponderação ou os radicais configurados para um conjunto.

    Nota: as entradas que adicionar ao ficheiro do dicionário de sinónimos não poderão conter apenas caracteres especiais ou palavras irrelevantes. No entanto, poderão existir entradas em branco. Por exemplo, se pretender certificar-se de que as consultas para um determinado termo não devolverão resultados, altere a entrada. No seguinte exemplo, as consultas para o termo windows não devolverão resultados:
    <replacement>
    <pat>windows</pat>
    <sub></sub>
    </replacement>
  5. Guarde o ficheiro do dicionário de sinónimos e feche o Bloco de Notas.

Como utilizar o ficheiro Robots.txt e as tags HTML para impedir o acesso ao conteúdo no site de portal

Pode utilizar um ficheiro Robots.txt para controlar o acesso de robots (Web crawlers) num Web site. Também pode utilizar o ficheiro Robots.txt para indicar se pretende excluir crawlers específicos. Os servidores Web utilizam estas regras para controlarem o acesso aos Web sites impedindo que os robots tenham acesso a determinadas áreas. O SharePoint Portal Server 2003 e o SharePoint Server 2007 procuram este ficheiro nas pesquisas e cumprem as restrições incluídas no ficheiro Robots.txt.

Pode impedir que outro servidor pesquise conteúdo no site de portal modificando o ficheiro Robots.txt. Por exemplo, poderá pretender restringir o acesso ao servidor a um robot específico uma vez que a frequência de pedidos de robot está a bloquear o Web site. Também poderá pretender restringir o acesso de todos os robots a determinadas áreas no servidor.

O SharePoint Portal Server 2003 e o SharePoint Server 2007 não instalam um ficheiro Robots.txt. No entanto, pode criar um ficheiro Robots.txt e colocá-lo no directório de raiz do Web site predefinido no servidor. Para determinar o directório de raiz do Web site predefinido no servidor, siga estes passos:
  1. Inicie o Gestor de Serviços de Informação Internet (IIS).
  2. Expanda nome do servidor, e expanda Web sites.
  3. Clique com o botão direito do rato em Web site predefinido e clique em Propriedades.
  4. Clique no separador Directório inicial.
  5. Anote o caminho que é apresentado na caixa Caminho local e clique em Cancelar.

    Coloque o ficheiro Robots.txt no caminho apresentado na caixa Caminho local. Por exemplo, se o caminho for D:\Inetpub\Wwwroot, coloque o Robots.txt na pasta D:\Inetput\Wwwroot no servidor. Para confirmar que o ficheiro Robots.txt está na pasta correcta no servidor, inicie o browser e escreva http://nome do servidor/robots.txt.
Pode restringir o acesso a determinados documentos utilizando tags META HTML. As tags META HTML indicam ao robot se é possível incluir um documento num índice e se o robot pode aceder às hiperligações do documento utilizando o atributo INDEX/NOINDEX e os atributos FOLLOW/NOFOLLOW na tag. Por exemplo, pode assinalar um documento com o seguinte se não pretender que sejam efectuadas pesquisas no documento e que as hiperligações do documento sejam acedidas:
&lt;META name="robots" content= "NOINDEX, NOFOLLOW"&gt;
O SharePoint Portal Server 2003 e o SharePoint Server 2007 cumprem automaticamente as restrições incluídas no ficheiro Robots.txt.

Referências

Para mais informações sobre como administrar e configurar o SharePoint Portal Server 2003, consulte o Microsoft Office SharePoint Portal Server 2003 Administrator's Guide. O Microsoft Office SharePoint Portal Server 2003 Administrator's Guide (Administrator's Help.chm) está na pasta Docs na raiz do CD do SharePoint Portal Server 2003.

Para mais informações sobre o SharePoint Portal Server 2003, visite o seguinte Web site da Microsoft:
http://technet.microsoft.com/pt-pt/office/sharepointserver/bb267364(en-us).aspx (http://technet.microsoft.com/pt-pt/office/sharepointserver/bb267364(en-us).aspx)
Para mais informações sobre o SharePoint Server 2007, visite o seguinte Web site da Microsoft:
http://office.microsoft.com/pt-pt/sharepointserver/HA101656532070.aspx (http://office.microsoft.com/pt-pt/sharepointserver/HA101656532070.aspx)

A informação contida neste artigo aplica-se a:
  • Microsoft Office SharePoint Server 2007
  • Microsoft Office SharePoint Portal Server 2003
Palavras-chave: 
kbhowtomaster kbregistration KB837847