ID do artigo: 837847 - Última revisão: quinta-feira, 20 de março de 2008 - Revisão: 7.0

Como personalizar o SharePoint Portal Server 2003 ou Office SharePoint Server 2007 usando o IFilters, arquivos de palavras de ruído e arquivos de dicionário de sinônimos

Dica do SistemaEste artigo aplica-se a um sistema operativo diferente do que está a utilizar. Foi desactivado o conteúdo do artigo, que pode não ser relevante para si.
Importante Este artigo contém informações sobre como modificar o Registro. Certifique-se de fazer backup do Registro antes de modificá-lo. Certifique-se de que saiba como restaurá-lo caso ocorra algum problema. Para obter mais informações sobre como fazer backup, restaurar e modificar o Registro, clique no número abaixo para ler o artigo na Base de Dados de Conhecimento Microsoft:
322756  (http://support.microsoft.com/kb/322756/ ) Como fazer backup e restaurar o Registro no Windows XP e Windows Vista

Nesta página

Expandir tudo | Recolher tudo

Sumário

Este arquivo descreve como usar o IFilters, por exemplo, filtro TIFF, arquivos de palavras de ruído, arquivos de dicionário de sinônimos e arquivo Robots.txt, para personalizar o Microsoft SharePoint Portal Server 2003 e Microsoft Office SharePoint Server 2007.

Este artigo descreve como habilitar o reconhecimento óptico de caracteres para arquivos TIFF (Tagged Image File Format), como alterar o limite de tamanho de arquivo TIFF, como habilitar a rotação automática de arquivo e como registras mensagens de erro TIFF no log de evento do aplicativo. Este artigo também contém informações sobre como alterar os arquivos de palavras de ruído e de dicionário de sinônimos, incluídos no SharePoint Portal Server 2003 e no SharePoint Server 2007.

INTRODUÇÃO

Este arquivo descreve como usar o IFilter do formato TIFF, os arquivos de palavras de ruído e de dicionário de sinônimos e o arquivo Robots.txt para personalizar o SharePoint Portal Server 2003 e SharePoint Server 2007.

Visão geral do IFilters

Observação No SharePoint Server 2007, o recurso de filtro TIFF foi removido.

Para rastrear documentos com extensões de arquivo de propriedade, é necessário registrar o IFilter para esse tipo de arquivo no SharePoint Portal Server 2003. Ao configurar a fonte de conteúdo, você pode especificar os tipos de arquivo que deseja incluir no índice conteúdo. Por exemplo, você pode incluir os arquivos com uma extensão xyz e uma extensão yyy no índice conteúdo. A inclusão de um tipo de arquivo se aplica apenas ao conteúdo armazenado fora do site de portal e incluído no índice conteúdo usando as fontes de conteúdo. A inclusão de um tipo de arquivo não se aplica ao conteúdo armazenado no site de portal.

Se um tipo de arquivo tiver um IFilter associado a esse tipo de arquivo, será necessário registrar o IFilter para um determinado tipo de arquivo no computador SharePoint Portal Server 2003 que rastreie esse tipo de arquivo. Depois de registrar o IFilter, o SharePoint Portal Server 2003 pode rastrear documentos que usem esse tipo de arquivo e incluir esses documentos no índice conteúdo. Se você adicionar um tipo de arquivo e não registrar o IFilter para esse tipo de arquivo, o SharePoint Portal Server 2003 incluirá apenas as propriedades de arquivo no índice conteúdo.

As etapas que você seguiu para registrar um IFilter variam de acordo com o IFilter que você deseja registrar. Para obter mais informações sobre como registrar um IFilter, consulte a documentação incluída no IFilter que você deseja registrar. O SharePoint Portal Server 2003 inclui filtros ara os seguintes itens:
  • Documentos do Microsoft Office, incluindo o Microsoft Publisher e o Microsoft Visio.
  • Arquivos HTML
  • Arquivos TIFF
  • Arquivos de texto
O SharePoint Portal Server 2003 também aceita IFilters de terceiros para tipos de arquivos personalizados.

O IFilter TIFF

Ao instalar o SharePoint Portal Server 2003, o programa de Instalação instala automaticamente um IFilter para arquivos TIFF. O filtro TIFF as extensões .tif e .tiff identifica. As seções a seguir explicam como realizar as seguintes tarefas:
  • Habilitar o OCR (reconhecimento óptico de caracteres) para arquivos TIFF
  • Alterar o limite de tamanho de arquivo TIFF
  • Habilitar a rotação automática de arquivo
  • Registrar mensagens de erro TIFF no log de evento do aplicativo
Observação Depois de editar as entradas do Registro associadas aos arquivos TIFF, você tem de reiniciar o serviço do Microsoft Search.

Como habilitar o reconhecimento óptico de caractere nos Arquivos TIFF

Quando o SharePoint Portal Server 2003 rastreia arquivos TIFF, o SharePoint Portal Server 2003 apenas procura nas propriedades do arquivo. Se você habilitar o reconhecimento óptico de caractere, o SharePoint Portal Server verifica os arquivos TIFF e tenta reconhecer caracteres no documento para que informações adicionais possam ser incluídas no índice.

Para habilitar o reconhecimento óptico de caractere nos arquivos TIFF, use um dos métodos a seguir.
Método 1: Editar manualmente o Registro
Adicione a entrada do Registro PerformOCR na seguinte subchave do Registro e defina a entrada do Registro para um valor de 1:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Para habilitar o reconhecimento óptico de caractere nos arquivos TIFF, execute as seguintes etapas:

Aviso O uso incorreto do Editor do Registro, ou outro método, pode causar sérios problemas. Estes problemas talvez exijam a reinstalação do sistema operacional. A Microsoft não garante que os problemas resultantes do uso incorreto do Editor de Registro possam ser solucionados. A modificação do Registro é de sua responsabilidade.
  1. Clique em Iniciar e em Executar.
  2. Na caixa Abrir, digite regedit e clique em OK.
  3. Localize e clique na seguinte subchave do Registro:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. No menu Editar, aponte para Novo e clique em Valor DWORD.
  5. Digite PerformOCR e pressione ENTER.
  6. No menu Editar, clique em Modificar.
  7. Para habilitar o reconhecimento óptico de caractere, digite 1 na caixa Dados do valor e clique em OK.

    Observação Para desabilitar o reconhecimento óptico de caractere, defina a entrada do Registro PerformOCR como 0 (zero).
  8. Encerre o Editor do Registro.
  9. Reinicie o serviço do Microsoft Search. Para fazer isto, execute as seguintes etapas:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do mouse em Microsoft Search e clique em Reiniciar.
Método 2: Usar o arquivo Tiff_ocr_on.reg
Use o arquivo Tiff_ocr-on.reg para adicionar a entrada do Registro PerformOCR na seguinte subchave do Registro:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Aviso O uso incorreto do Editor do Registro, ou outro método, pode causar sérios problemas. Estes problemas talvez exijam a reinstalação do sistema operacional. A Microsoft não garante que os problemas resultantes do uso incorreto do Editor de Registro possam ser solucionados. A modificação do Registro é de sua responsabilidade.
  1. Localize a pasta Support\Tools no CD do SharePoint Portal Server 2003 e clique duas vezes no arquivo Tiff_ocr_on.reg.
  2. Reinicie o serviço do Microsoft Search. Para fazer isto, execute as seguintes etapas:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do mouse em Microsoft Search e clique em Reiniciar.

Como alterar o limite de tamanho de arquivo TIFF

Por padrão, quando o reconhecimento óptico de caractere está habilitado, o SharePoint Portal Server 2003 não inclui nenhum arquivo TIFF de página única maior que 1 MB no índice contexto. Para alterar o limite de tamanho para os arquivos TIFF, altere a entrada do Registro MaxImageSize na seguinte subchave do Registro:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Aviso O uso incorreto do Editor do Registro, ou outro método, pode causar sérios problemas. Estes problemas talvez exijam a reinstalação do sistema operacional. A Microsoft não garante que os problemas resultantes do uso incorreto do Editor de Registro possam ser solucionados. A modificação do Registro é de sua responsabilidade.
  1. Clique em Iniciar e em Executar.
  2. Na caixa Abrir, digite regedit e clique em OK.
  3. Localize e clique na seguinte subchave do Registro:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. Clique com o botão direito do mouse em MaxImageSize e clique em Modificar.
  5. Digite 100.000 na caixa Dados do valor e clique em OK.

    Observação Um valor de 100.000 é igual a um limite de tamanho de arquivo de 1 MB.
  6. Encerre o Editor do Registro.
  7. Reinicie o serviço do Microsoft Search. Para fazer isto, execute as seguintes etapas:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do mouse em Microsoft Search e clique em Reiniciar.

Como habilitar a rotação automática de arquivo

Se você habilitar o reconhecimento óptico de caractere e se alguns arquivos TIFF estiverem orientados de cabeça para baixo ou lateral, será possível habilitar a rotação automática de arquivo para aumentar a precisão da verificação.

Se você habilitar o reconhecimento óptico de caractere, também habilitará a rotação automática de arquivo. Se você habilitar a rotação automática de arquivo, o filtro gira os arquivos TIFF orientados de cabeça para baixo ou na lateral. O filtro também gira o arquivo TIFF na memória antes de verificá-lo. Apesar de a rotação de arquivo usar recursos, os resultados da verificação de um arquivo orientado de cabeça para baixou ou na lateral pode ser ruim. Se você souber que todos os arquivos TIFF são orientados na vertical, não será necessário habilitar essa opção.

Para habilitar a rotação automática de arquivo, defina a entrada do Registro AutoRotation na seguinte subchave do Registro para um valor de 1:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Por padrão, rotação automática de arquivo é habilitada ao instalar o SharePoint Portal Server 2003. No entanto, se a entrada do Registro PerformOCR estiver definida como 0 (zero) ou não existir, a entrada do Registro AutoRotation não terá efeito.

Para habilitar a rotação automática de arquivo, execute as etapas a seguir.

Aviso O uso incorreto do Editor do Registro, ou outro método, pode causar sérios problemas. Estes problemas talvez exijam a reinstalação do sistema operacional. A Microsoft não garante que os problemas resultantes do uso incorreto do Editor de Registro possam ser solucionados. A modificação do Registro é de sua responsabilidade.
  1. Clique em Iniciar e em Executar.
  2. Na caixa Abrir, digite regedit e clique em OK.
  3. Localize e clique na seguinte subchave do Registro:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
  4. Clique com o botão direito do mouse em AutoRotation e clique em Modificar.
  5. Digite 1 na caixa Dados do valor e clique em OK.

    Observação Para desabilitar a rotação automática de arquivo, defina a entrada do Registro AutoRotation como 0 (zero).
  6. Encerre o Editor do Registro.
  7. Reinicie o serviço do Microsoft Search. Para fazer isto, execute as seguintes etapas:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do mouse em Microsoft Search e clique em Reiniciar.

Como registrar mensagens de erro TIFF no log de eventos do aplicativo

Por padrão, o SharePoint Portal Server 2003 registra mensagens de erro associadas aos arquivos TIFF no log . Se você quiser que o SharePoint Portal Server 2003 registre as mensagens de erro associadas aos arquivos TIFF em um log de eventos do aplicativo, defina a entrada do Registro LoggingLevel na seguinte subchave do Registro para o valor desejado:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application\Microsoft Office Document Imaging
Você pode definir a entrada do Registro
LoggingLevel
como um dos seguintes valores:
  • Para desabilitar o registro, defina a entrada do Registro LoggingLevel como uma valor 0 (zero). Esta configuração é a configuração padrão.
  • Para registrar as mensagens de informações e de erro, defina a entrada do Registro LoggingLevel como um valor 1.
  • Para registrar mensagens de aviso e de erro, defina a entrada do Registro como um valor 2.
  • Para registrar todas as mensagens, defina a entrada do Registro LoggingLevel como um valor 3.
  • Para registrar apenas as mensagens de erro, defina a entrada do Registro LoggingLevel como um valor 4.
Para habilitar as mensagens de erro TIFF no log de eventos do aplicativo, execute as seguintes etapas:
  1. Clique em Iniciar e em Executar.
  2. Na caixa Abrir, digite regedit e clique em OK.
  3. Localize e clique na seguinte subchave do Registro:
    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application\Microsoft Office Document Imaging
  4. Clique com o botão direito do mouse em LoggingLevel e clique em Modificar.
  5. Digite o valor desejado na caixa Dados do valor e clique em OK.
  6. Encerre o Editor do Registro.
  7. Reinicie o serviço do Microsoft Search. Para fazer isto, execute as seguintes etapas:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do mouse em Microsoft Search e clique em Reiniciar.

Arquivos de palavras de ruído

Uma palavra de ruído que não é útil em uma pesquisa. Por exemplo, as seguintes palavras são palavras de ruído:
  • a/o
  • um/uma
Uma lista de palavras de ruído para um idioma está armazenado no arquivo de palavras de ruído para esse idioma. O SharePoint Portal Server 2003 e o SharePoint Server 2007 incluem arquivos de palavras de ruído para os seguintes idiomas:
  • Chinês ? Simplificado (Noisechs.txt)
  • Chinês ? Tradicional (Noisecht.txt)
  • Tcheco (Noisecsv.txt)
  • Holandês (Noisenld.txt)
  • Inglês ? Internacional (Noiseeng.txt)
  • Inglês ? Americano (Noiseenu.txt)
  • Finlandês (Noisefin.txt)
  • Francês (Noisefra.txt)
  • Alemão (Noisedeu.txt)
  • Húngaro (Noisehun.txt)
  • Italiano (Noiseita.txt)
  • Japonês (Noisejpn.txt)
  • Coreano (Noisekor.txt)
  • Polonês (Noiseplk.txt)
  • Português (Brasil) (Noiseptb.txt)
  • Russo (Noiserus.txt)
  • Espanhol (Noiseesn.txt)
  • Sueco (Noisesve.txt)
  • Tailandês (Noisetha.txt)
  • Turco (Noisetrk.txt)
Se uma lista de palavras de ruído não existir em um idioma, o SharePoint Portal Server 2003 e SharePoint Server 2007 usam o arquivo de palavras de ruído Noiseneu.txt neutro. O separador de palavras para o idioma analisa palavras de ruído.

Por padrão, os arquivos de palavras de ruído do SharePoint Portal Server 2003 são armazenadas no seguinte local no servidor:
Unidade:\Arquivos de programa\SharePoint Portal Server\Data\Config
Se você instalou o SharePoint Portal Server 2003 em um local diferente do local padrão, a pasta Data está armazenada em uma pasta diferente no servidor.

Por padrão, SharePoint Server 2007armazena arquivos de palavras de ruído no seguinte local no servidor:
Unidade:\Arquivos de programa\Microsoft Office Servers\12.0\Data\Config
É possível alterar um arquivo de palavras de ruído. Se você adicionar palavras de ruído, a precisão da pesquisa poderá diminuir. No entanto, o tamanho do índice conteúdo também diminui. Um índice conteúdo menor ajuda a melhorar o desempenho. Você pode excluir palavras de ruído se quiser pesquisas para retornar a essas palavras.

Se remover palavras do arquivo de palavras de ruído, as alterações não têm efeito até que você reinicie os índices conteúdos e realize uma atualização total dos índices conteúdo no SharePoint Portal Server 2003 e no SharePoint Server 2007. Se você remover palavras o arquivo de palavras de ruído, as palavras serão removidas dos arquivos antes de os arquivos serem incluídos em um índice. É necessário atualizar o índice conteúdo depois de modificar a lista de palavras de ruído. Caso contrário, os documentos que contêm as palavras de ruído removidas não são retornados às consultas.

Não exclua os arquivos de palavras de ruído. Se você não quiser que as palavras de ruído sejam removidas durante uma atualização ou consulta, remova as entradas específicas do arquivo. Se você excluir o arquivo de palavra de ruído, todos os caracteres únicos serão removidos como palavras de ruído. Se remover todas as palavras de ruído do arquivo de palavras de ruído, você irá enfrentar erros durante o rastreamento. Por isso, é necessário ter pelo menos uma palavra de ruído no arquivo, mesmo se ela for tão simples quanto um caractere de ponto.

Por padrão, os arquivos de palavras de ruído no SharePoint Portal Server 2003 são copiados na seguinte pasta:
Unidade\Arquivos de programa\SharePoint Portal Server\DATA\Applications\ProgramUID\Config
Por padrão, os arquivos de palavras de ruído no SharePoint Server 2007 são copiados na seguinte pasta:
Unidade:\Arquivos de programa\Microsoft Office Servers\12.0\Data\Applications\ProgramUID\Config
É possível especificar as palavras de ruído no nível de programa em vez no servidor ou no farm de servidores. Por exemplo, se o SharePoint Portal Server 2003 ou SharePoint Server 2007 e o Microsoft SQL Server estiverem instalados no mesmo servidor, será possível especificar uma lista de palavras de ruído para o SharePoint Portal Server 2003 ou SharePoint Server 2007 e uma lista de palavras de ruído diferente para o SQL Server.

Como alterar o arquivo de palavras de ruído

Para alterar o arquivo de palavras de ruído, execute as seguintes etapas:
  1. Inicie o Bloco de Notas e abra o arquivo de palavras de ruído.
  2. Adicione ou exclua as palavras desejadas.
  3. Salve o arquivo de palavras de ruído e saia do Bloco de Notas.
  4. No SharePoint Portal Server 2003, reinicie o serviço do Microsoft SharePointPS Search. No SharePoint Server 2007, reinicie o serviço do Windows SharePoint Services Search. Para fazer isto, execute as seguintes etapas:
    1. Clique em Iniciar, aponte para Ferramentas administrativas e clique em Serviços.
    2. Clique com o botão direito do mouse em Microsoft SharePointPS Search ou Windows SharePoint Services Search e clique em Reiniciar.
  5. Realize uma atualização completa do índice conteúdo.
Observação Ao pesquisar um site de portal, o SharePoint Portal Server 2003 e o SharePoint Server 2007 poderão descartar alguns termos de consulta como palavras de ruído, mesmo se o próprio termo de consulta não for uma palavra de ruído. Este compota mento ocorre quando o termo de consulta for uma forma não flexiva da palavra de ruído. Por exemplo, se o arquivo de palavras de ruído contiver a palavra "be", e se você procurar a palavra "am", a palavra "am" será tratada como uma palavra de ruído, já que ela é uma forma de "be".

Arquivos de dicionário de sinônimos

O dicionário de sinônimos é um recurso de pesquisa no SharePoint Portal Server 2003 e no SharePoint Server 2007. P dicionário de sinônimos permite que você digite uma frase em uma solicitação de consulta e receba os resultados das palavras relacionadas à frase digitada. Por exemplo, você pode procurar a palavra "run" e receber resultados que contenham as palavras "run" ou "jog" se os dois termos estiverem relacionados no dicionário de sinônimos. Além disso, o dicionário de sinônimos permite que um administrador do farm de servidores configure Pesquisar classificação ao atribuir diferentes pesos às palavras. O SharePoint Portal Server 2003 e o SharePoint Server 2007 incluem arquivos de dicionário de sinônimos para os seguintes idiomas:
  • Chinês - Simplificado (Tschs.xml)
  • Chinês ? Tradicional (Tscht.xml)
  • Tcheco (Tscsv.xml)
  • Holandês (Tsnld.xml)
  • Inglês ? Internacional (Tseng.xml)
  • Inglês ? Americano (Tsenu.xml)
  • Finlandês (Tsfin.xml)
  • Francês (Tsfra.xml)
  • Alemão (Tsdeu.xml)
  • Húngaro (Tshun.xml)
  • Italiano (Tsita.xml)
  • Japonês (Tsjpn.xml)
  • Coreano (Tskor.xml)
  • Polonês (Tsplk.xml)
  • Português (Brasil) (Tsptb.xml)
  • Russo (Tsrus.xml)
  • Espanhol (Tsesn.xml)
  • Sueco (Tssve.xml)
  • Tailandês (Tstha.xml)
  • Turco (Tstrk.xml)
Os arquivos do dicionário de sinônimos contêm um conteúdo de exemplo inativo. O arquivo de dicionário de sinônimos Tsneu.xml neutro é aplicado às consultas sem um arquivo de dicionário de sinônimos associado ao idioma de consulta. O arquivo de dicionário de sinônimos sempre é aplicado às consultas, mesmo quando há um arquivo de dicionário de sinônimos associado ao idioma de consulta.

Por padrão, SharePoint Portal Server 2003 armazena arquivos de palavras de ruído na seguinte pasta no servidor:
Unidade:\Arquivos de programa\Microsoft Office Servers\12.0\Data\Office Server\Applications
Se você instalou o SharePoint Portal Server 2003 em um local diferente do local padrão, a pasta Data está armazenada em uma pasta diferente no servidor.

Observação O caminho do arquivo de dicionário de sinônimos podem ser localizados como o valor "DefaultApplicationsPath" no Registro em
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Global\Gathering Manager
.

Por padrão, SharePoint Server 2007 armazena arquivos de dicionário de sinônimos na seguinte pasta no servidor:
Unidade:\Arquivos de programa\Microsoft Office Servers\12.0\Data\Config
Os arquivos de dicionário de sinônimos do SharePoint Portal Server 2003 também são copiados na seguinte pasta:
Unidade\Arquivos de programa\SharePoint Portal Server\Data\Applications\Application UID\Config
Isto ocorre para cada instância do serviço do Microsoft Search ou do Microsoft SharePointPS Search.

Os arquivos de dicionário de sinônimos para o SharePoint Server 2007 também são copiados na seguinte pasta:
Unidade\Arquivos de programa\Microsoft Office Servers\12.0\Data\Applications\Application UID\Config
Isto ocorre para cada instância do serviço do Microsoft Search ou do Windows SharePoint Services Search.

É possível modificar o dicionário de sinônimos no nível de programa em vez no servidor ou no farm de servidores. Por exemplo, se o SharePoint Portal Server 2003 ou SharePoint Server 2007 e SQL Server estiverem instalados no mesmo servidor, será possível especificar um arquivo de dicionário de sinônimos para o SharePoint Portal Server 2003 ou SharePoint Server 2007 e um arquivo de dicionário de sinônimos para o SQL Server.

Você pode altera as entradas do dicionário de sinônimos ao alterar o arquivo de dicionário de sinônimos em um editor de texto. O arquivo de dicionário de sinônimos deve usar XML bem formatado que contenha marcas de aberturas e fechamento correspondentes em cada entrada. Se o XML estiver mal formatado, o SharePoint Portal Server 2003 e o SharePoint Server 2007 registra um erro no log de eventos do aplicativo.

Ao alterar o arquivo de dicionário de sinônimos, verifique se você não alterou as caixas das marcas. Apenas as marcas do XML usam letras maiúsculas. Todas as outras marcas usam letras minúsculas. Por exemplo, a marca <replacement> deve usar letras minúsculas.

Importante Um arquivo chamado Tsschema.xml está instalado com os arquivos de dicionario de sinônimos. Não modifique o arquivo Tsschema.xml.

Os arquivos de dicionário de sinônimos contêm dois tipos de entradas do dicionário de sinônimos. Esses tipos são conjuntos de substituição e de expansão. Os arquivos de dicionário de sinônimos também permitem que você configure as opções de relevância e de lematização em um conjunto de substituição ou expansão.

Importante De uma perspectiva de desempenho, é importante estar ciente de quantas entradas são definidas no arquivo de dicionário de sinônimos. Além disso, é importante que você fique atento para não exceder a recomendação de 1.000/10.000 (típica/máx.) entradas, conforme destacado no capacity planner. Para exibir o capacity planner, visite o seguinte site da Microsoft (em inglês):
http://office.microsoft.com/en-us/sharepointportaladmin/HA011647581033.aspx (http://office.microsoft.com/en-us/sharepointportaladmin/HA011647581033.aspx)
Além disso, esteja ciente de que cada marca <sub> and <pat> conta com uma entrada que vai além dos valores recomendados.

Conjuntos de substituição

Um conjunto de substituição especifica um padrão que é substituído por uma ou mais substituições em uma solicitação de pesquisa. Por exemplo, é possível adicionar um conjunto de substituição em que W2K é o padrão e o Windows 2000 é a substituição. Se você consultar o termo W2K, o SharePoint Portal Server 2003 e o SharePoint Server 2007 retornam apenas resultados de pesquisa que contenham o termo Windows 2000. Você não recebe itens nos resultados da pesquisa que contenham o termo W2K.

Cada conjunto de substituição é incluída em uma marca <replacement>. Na marca de substituição, você especifica um ou mais padrões ao incluí-los em uma marca <pat>. Você especifica uma ou mais substituições ao incluí-las na marca <sub>. Os padrões e substituições podem conter uma palavra ou seqüência de palavras. Por exemplo, para adicionar um conjunto de substituição, no qual W2K é o padrão e Windows 2000 é a substituição, use o seguinte:
<replacement><pat>W2K</pat><sub>Windows 2000</sub></replacement>
Você pode tem mais de uma substituição para cada padrão especificado. Por padrão, os padrões diferenciam maiúsculas de minúsculas. Por exemplo, se o arquivo de dicionário de sinônimos contém o termo W2K e se um usuário pesquisar o termo w2k, o SharePoint Portal Server 2003 e o SharePoint Server 2007 não retornam resultados de pesquisa que contenham o termo Windows 2000. O SharePoint Portal Server 2003 e o SharePoint Server 2007 não reconhecem o termo w2k como sendo o termo W2K, pois a caixa do texto é diferente.

É possível especificar padrões para diferenciarem, ou não, maiúsculas de minúsculas se você adicionar uma marca ao arquivo de dicionário de sinônimos de seu idioma. Por exemplo, se você especificar que os padrões não diferenciam maiúsculas de minúsculas, os termos <pat> e <sub> correspondem os termos de consulta, independentemente da caixa do termo de consulta.

Ao consultar usando a sintaxe CONTAINS FORMSOF, o dicionário de sinônimos funciona conforme descrito anteriormente. Para obter mais informações sobre a sintaxe CONTAINS FORMSOF, consulte Microsoft SharePoint Products e Technologies 2003 Software Development Kit.

Por padrão, um site de portal usa o tipo de consulta FREETEXT. As consultas FREETEXT abrem automaticamente o dicionário de sinônimos. No entanto, se você digitar seus temos de consulta entre aspas, o SharePoint Portal Server 2003 e o SharePoint Server 2007 desabilitam a consulta FREETEXT e não usam o dicionário de sinônimos. Por isso, o SharePoint Portal Server 2003 e o SharePoint Server 2007 retornam resultados com base no termo ou termos de pesquisa exato entre aspas. Se o dicionário de sinônimos substituir uma palavra de uma frase por outra palavra, uma consulta FREETEXT retorna resultados para a nova versão da frase inteira.

Para o conjunto de substituição no qual o termo Windows 2000 substitui o termo W2K, a tabela a seguir mostra os resultados que ocorrem com base em uma entrada de usuário diferente da interface de pesquisa no site de portal. Este exemplo presume que o dicionário de sinônimos é um conjunto que diferencia maiúsculas de minúsculas, mas que a pesquisa não.
Recolher esta tabelaExpandir esta tabela
Entrada do usuárioSe o dicionário de sinônimos for usadoO texto nos documentos retornados nos resultados de pesquisa
w2kSim. Uma consulta FREETEXT. W2k, W2K, w2k ou w2K.

Nenhum resultado é retornado para o Windows 2000, pois o padrão no dicionário de sinônimos é W2K em caixa alta.
"w2k"NãoW2K, w2k, W2k ou w2K.
W2KSim. Uma consulta FREETEXT.Windows 2000, windows 2000, w2k, W2k, w2K ou combinações de caixa como wInDows 2000.

Nenhum resultado retornado para W2K.
"W2K"NãoW2K, w2k, W2k ou w2K.
W2K ServerSim. Uma consulta FREETEXT.Windows 2000, windows 2000 e combinações de caixa como wInDows 2000; w2k, W2k ou w2K; Server, server e combinações de caixa como SeRvEr; W2K Server e combinações de caixa desse termo.

Nenhum resultado retornado para sistema operacional W2K.
"W2K Server"NãoW2K Server, w2k Server, W2k Server, w2K Server, W2K server, w2k server, W2k server ou w2K server.
Observação Em cada um dos exemplos anteriores na tabela, a configuração de diferenciação de maiúsculas e minúsculas para a pesquisa é especificado como falsa. Se a configuração que diferencia maiúscula de minúscula for especificado como verdadeiro, todas as diferenças de caixa são significativas quando a correspondência de padrão for realizado. Nos dois conjuntos de substituição com padrões similares estão sendo correspondidos, a prioridade é do conjunto maior. Por exemplo, se você tiver os dois conjuntos a seguir, o termo Internet Explorer tem prioridade sobre o termo Internet:
<replacement><pat>Internet</pat><sub>intranet</sub></replacement> 
<replacement><pat>Internet Explorer</pat><sub>IE</sub><sub>IE 5</sub></replacement>
Para esse conjunto de substituição, a tabela a seguir mostra os resultados que ocorrem com base na entrado do usuário de cada interface de pesquisa no site de portal.
Recolher esta tabelaExpandir esta tabela
Entrada do usuárioSe o dicionário de sinônimos for usadoO texto nos documentos retornados nos resultados de pesquisa
InternetSim. Uma consulta FREETEXT. Intranet, intranet ou combinações de caixa como iNtranEt. Nenhum resultado é retornado para IE ou IE 5.
Internet ExplorerSim. Uma consulta FREETEXT.

IE, IE 5 e combinações de caixa como iE ou Ie 5. Nenhum resultado retornado para Internet, Internet Explorer ou intranet.

Conjuntos de expansão

Um conjunto de expansão é um grupo de substituições que são sinônimas. As consultas que contém correspondência em uma substituição são expandidas para excluir todas as outras substituições no conjunto de expansão. Por exemplo, é possível adicionar um conjunto de expansão no qual as seguintes substituições são sinônimos:
  • writer
  • author
  • journalist
Se você consultar o termo author, o SharePoint Portal Server 2003 e o SharePoint Server 2007 também retornam resultados de pesquisa que contenham os termos writer e journalist.

Cada conjunto de expansão é incluída em uma marca <expansion>. Na marca de expansão, você especifica uma ou mais substituições entre uma marca <sub>. Para o exemplo descrito anteriormente, adicione os seguintes itens:
<expansion><sub>writer</sub><sub>author</sub><sub>journalist</sub></expansion>

Lematização de palavra

A lematização de palavra mapeia um lematizador lingüístico para todas as palavras correspondentes. Você pode especificar a lematização de palavras em entradas de padrão e substituição. Por exemplo, em inglês, a lematização buy corresponde a:
  • bought
  • buying
  • buys
Você pode especificar a lematização de palavra ao adicionar dois asteriscos no final da seqüência de caracteres. O SharePoint Portal Server 2003 e o SharePoint Server 2007 retornam correspondências para várias palavras. Por exemplo, você pode criar consultas para o termo run que também retorna os seguintes termos:
  • running
  • jog
  • jogging
Para fazer isto, modifique o conjunto de expansão da seguinte forma:
<expansion><sub weight="0.5">run**</sub><sub weight="0.5">jog**</sub></expansion>
Se você consultar o termo run ou o termo running, os resultados de pesquisa incluem os termos jog e jogging. Se você consultar o termo running, os mesmos resultados de pesquisa serão exibidos quando consultar o termo run.

Por exemplo, se o arquivo de dicionário de sinônimos incluir o <pat>User1 executado para o padrão store** </pat> ou o <sub> User1 executado para a substituição store**</sub>, a consulta retorna as seguintes seqüências de caractere ou adiciona-as a seguinte consulta:
  • User1 executa para armazenamento
  • User1 executando para armazenamento
  • User1 executou para armazenamento
  • User1 executa para armazenamentos
  • User1 executando para armazenamentos
  • User1 executou para armazenamentos

Como alterar um arquivo de dicionário de sinônimos

Para alterar um arquivo de dicionário de sinônimos, execute as seguintes etapas:
  1. Inicie o Bloco de notas da Microsoft e abra o arquivo de dicionário de sinônimos.

    Observação Se o arquivo de dicionário de sinônimos contiver caracteres DBCS (conjunto de caracteres de dois bytes), será necessário salvar o arquivo de dicionário de sinônimos no código do formato Unicode antes de alterá-lo.
  2. Se estiver alterando o arquivo de dicionário de sinônimos pela primeira vez, remova a seguintes linhas de comentário que aparecem no início e final do arquivo:
     <!---Commented out---> 
  3. Se você não quiser que os padrões diferenciem maiúsculas de minúscula, adicione a seguinte marca ao início do arquivo:
    <case caseflag="false"></case>
    Se quiser que os padrões diferenciem maiúsculas de minúsculas posteriormente no arquivo, altere a configuração de "falso" para "verdadeiro" na marca da seguinte forma:
    <case caseflag="true"></case>
  4. Altere o que desejar. Adicione, modifique ou exclua um conjunto de substituição ou de expansão. Adicione, modifique ou exclua a relevância ou lematização configurada para um conjunto.

    Observação As entradas adicionadas ao arquivo de dicionário de sinônimos não podem conter apenas caracteres especiais ou palavras de ruído. No entanto, entradas em branco podem existir. Por exemplo, para verificar se as consultas para um termo específico não retornam resultados, altere a entrada. No seguinte exemplo, as consultas para o termo windows não retornam resultados:
    <replacement><pat>windows</pat><sub></sub></replacement>
  5. Salve o arquivo de dicionário de sinônimos e encerre o Bloco de Notas.

Como usar o arquivo Robots.txt e a marca HTML para impedir o acesso de conteúdo no site de portal

Você pode usar um arquivo Robots.txt para controlar onde os robôs (rastreadores da Web) podem ir em um site. Também é possível usar o arquivo Robots.txt para indicar se deseja excluir rastreadores específicos. Servidores da Web usam essas regras para controlar o acesso a site ao impedir que robôs acessem determinadas áreas. O SharePoint Portal Server 2003 e o SharePoint Server 2007 procuram esse arquivo ao rastrear e obedecem as restrições contidas no arquivo Robots.txt.

Você pode impedir que outro servidor rastreie o conteúdo no site de portal ao modificar o arquivo Robots.txt. Por exemplo, você pode evitar que um robô específico acesse o servidor, pois a freqüência de solicitações do robô está bloqueando o site. Você também pode restringir o acesso de todos os robôs a determinadas áreas no servidor.

O SharePoint Portal Server 2003 e o SharePoint Server 2007 não instalam um arquivo Robots.txt. No entanto, você pode criar um arquivo Robots.txt e colocá-lo no diretório base do site padrão no servidor. Para determinar o diretório base do site padrão no servidor, execute as seguintes etapas:
  1. Inicie o Gerenciador do IIS (Serviços de informações da Internet).
  2. Expanda server name e expanda Web Sites.
  3. Clique com o botão direito do mouse em Site Padrão e clique em Propriedades.
  4. Clique na guia Diretório base.
  5. Anote o caminho que aparece na caixa Caminho local e clique em Cancelar.

    Coloque o arquivo Robots.txt no caminho que aparece na caixa Caminho local. Por exemplo, se o caminho for D:\Inetpub\Wwwroot, coloque o Robots.txt na pasta D:\Inetput\Wwwroot no servidor. Para verificar se o arquivo Robots.txt está na pasta correta no servidor, inicie o navegador da Web e digite http://server name/robots.txt.
Você restringir o acesso a determinados documentos usando as marcas HTML META. As marcas HTML META dizem ao robô se um documento pode ser incluído no índice e se o robô pode seguir os links no documento usando os atributos INDEX/NOINDEX e FOLLOW/NOFOLLOW na marca. Por exemplo, você pode marcar um documento com o seguinte se não quiser que o documento seja rastreado e os links no documento sejam seguidos:
<META name="robots" content= "NOINDEX, NOFOLLOW">
O SharePoint Portal Server 2003 e o SharePoint Server 2007 obedece automaticamente as restrições contidas no arquivo Robots.txt.

Observação para o Microsoft Office SharePoint Server2007, é necessário reiniciar o serviço do Office SharePoint Server Search antes das atualizações do dicionário de sinônimos serem aplicadas às solicitações de pesquisa. Além disso, as alterações nos arquivos do dicionário de sinônimos devem ser copiadas manualmente em cada servidor na farm que está servindo as consultas de pesquisa. Para ser completo e permitir alterações de topologia, você pode copiar as alterações a todos os servidores na farm.

Referências

Para obter mais informações sobre como administrar e configurar o SharePoint Portal Server 2003, consulte o Guia do Administrador do Microsoft Office SharePoint Portal Server 2003. O Guia do Administrador do Microsoft Office SharePoint Portal Server 2003 (Administrator's Help.chm) está localizado na pasta Docs na raiz do CD do SharePoint Portal Server 2003.

Para obter mais informações sobre o SharePoint Portal Server 2003, visite o seguinte site da Microsoft (em inglês):
http://technet.microsoft.com/office/sharepointserver/bb267364.aspx (http://technet.microsoft.com/office/sharepointserver/bb267364.aspx)
Para obter mais informações sobre o SharePoint Portal Server 2007, visite o seguinte site da Microsoft (em inglês):
http://office.microsoft.com/en-us/sharepointserver/HA101656531033.aspx (http://office.microsoft.com/en-us/sharepointserver/HA101656531033.aspx)

A informação contida neste artigo aplica-se a:
  • Microsoft Office SharePoint Server 2007
  • Microsoft Office SharePoint Portal Server 2003
Palavras-chave: 
kbregistration kbhowtomaster KB837847