ID do artigo: 837847 - Última revisão: quinta-feira, 20 de março de 2008 - Revisão: 7.0 Como personalizar o SharePoint Portal Server 2003 ou Office SharePoint Server 2007 usando o IFilters, arquivos de palavras de ruído e arquivos de dicionário de sinônimos
Importante Este artigo contém informações sobre como modificar o Registro. Certifique-se de fazer backup do Registro antes de modificá-lo. Certifique-se de que saiba como restaurá-lo caso ocorra algum problema. Para obter mais informações sobre como fazer backup, restaurar e modificar o Registro, clique no número abaixo para ler o artigo na Base de Dados de Conhecimento Microsoft: 322756
(http://support.microsoft.com/kb/322756/
)
Como fazer backup e restaurar o Registro no Windows XP e Windows Vista Nesta páginaSumárioEste arquivo descreve como usar o IFilters, por exemplo, filtro TIFF, arquivos de palavras de ruído, arquivos de dicionário de sinônimos e arquivo Robots.txt, para personalizar o Microsoft SharePoint Portal Server 2003 e Microsoft Office SharePoint Server 2007. Este artigo descreve como habilitar o reconhecimento óptico de caracteres para arquivos TIFF (Tagged Image File Format), como alterar o limite de tamanho de arquivo TIFF, como habilitar a rotação automática de arquivo e como registras mensagens de erro TIFF no log de evento do aplicativo. Este artigo também contém informações sobre como alterar os arquivos de palavras de ruído e de dicionário de sinônimos, incluídos no SharePoint Portal Server 2003 e no SharePoint Server 2007. INTRODUÇÃOEste arquivo descreve como usar o IFilter do formato TIFF, os arquivos de palavras de ruído e de dicionário de sinônimos e o arquivo Robots.txt para personalizar o SharePoint Portal Server 2003 e SharePoint Server 2007. Visão geral do IFiltersObservação No SharePoint Server 2007, o recurso de filtro TIFF foi removido.Para rastrear documentos com extensões de arquivo de propriedade, é necessário registrar o IFilter para esse tipo de arquivo no SharePoint Portal Server 2003. Ao configurar a fonte de conteúdo, você pode especificar os tipos de arquivo que deseja incluir no índice conteúdo. Por exemplo, você pode incluir os arquivos com uma extensão xyz e uma extensão yyy no índice conteúdo. A inclusão de um tipo de arquivo se aplica apenas ao conteúdo armazenado fora do site de portal e incluído no índice conteúdo usando as fontes de conteúdo. A inclusão de um tipo de arquivo não se aplica ao conteúdo armazenado no site de portal. Se um tipo de arquivo tiver um IFilter associado a esse tipo de arquivo, será necessário registrar o IFilter para um determinado tipo de arquivo no computador SharePoint Portal Server 2003 que rastreie esse tipo de arquivo. Depois de registrar o IFilter, o SharePoint Portal Server 2003 pode rastrear documentos que usem esse tipo de arquivo e incluir esses documentos no índice conteúdo. Se você adicionar um tipo de arquivo e não registrar o IFilter para esse tipo de arquivo, o SharePoint Portal Server 2003 incluirá apenas as propriedades de arquivo no índice conteúdo. As etapas que você seguiu para registrar um IFilter variam de acordo com o IFilter que você deseja registrar. Para obter mais informações sobre como registrar um IFilter, consulte a documentação incluída no IFilter que você deseja registrar. O SharePoint Portal Server 2003 inclui filtros ara os seguintes itens:
O IFilter TIFFAo instalar o SharePoint Portal Server 2003, o programa de Instalação instala automaticamente um IFilter para arquivos TIFF. O filtro TIFF as extensões .tif e .tiff identifica. As seções a seguir explicam como realizar as seguintes tarefas:
Como habilitar o reconhecimento óptico de caractere nos Arquivos TIFFQuando o SharePoint Portal Server 2003 rastreia arquivos TIFF, o SharePoint Portal Server 2003 apenas procura nas propriedades do arquivo. Se você habilitar o reconhecimento óptico de caractere, o SharePoint Portal Server verifica os arquivos TIFF e tenta reconhecer caracteres no documento para que informações adicionais possam ser incluídas no índice.Para habilitar o reconhecimento óptico de caractere nos arquivos TIFF, use um dos métodos a seguir. Método 1: Editar manualmente o RegistroAdicione a entrada do Registro PerformOCR na seguinte subchave do Registro e defina a entrada do Registro para um valor de 1:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper Aviso O uso incorreto do Editor do Registro, ou outro método, pode causar sérios problemas. Estes problemas talvez exijam a reinstalação do sistema operacional. A Microsoft não garante que os problemas resultantes do uso incorreto do Editor de Registro possam ser solucionados. A modificação do Registro é de sua responsabilidade.
Método 2: Usar o arquivo Tiff_ocr_on.regUse o arquivo Tiff_ocr-on.reg para adicionar a entrada do Registro PerformOCR na seguinte subchave do Registro:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Como alterar o limite de tamanho de arquivo TIFFPor padrão, quando o reconhecimento óptico de caractere está habilitado, o SharePoint Portal Server 2003 não inclui nenhum arquivo TIFF de página única maior que 1 MB no índice contexto. Para alterar o limite de tamanho para os arquivos TIFF, altere a entrada do Registro MaxImageSize na seguinte subchave do Registro:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper
Como habilitar a rotação automática de arquivoSe você habilitar o reconhecimento óptico de caractere e se alguns arquivos TIFF estiverem orientados de cabeça para baixo ou lateral, será possível habilitar a rotação automática de arquivo para aumentar a precisão da verificação.Se você habilitar o reconhecimento óptico de caractere, também habilitará a rotação automática de arquivo. Se você habilitar a rotação automática de arquivo, o filtro gira os arquivos TIFF orientados de cabeça para baixo ou na lateral. O filtro também gira o arquivo TIFF na memória antes de verificá-lo. Apesar de a rotação de arquivo usar recursos, os resultados da verificação de um arquivo orientado de cabeça para baixou ou na lateral pode ser ruim. Se você souber que todos os arquivos TIFF são orientados na vertical, não será necessário habilitar essa opção. Para habilitar a rotação automática de arquivo, defina a entrada do Registro AutoRotation na seguinte subchave do Registro para um valor de 1: HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\MSPaper Para habilitar a rotação automática de arquivo, execute as etapas a seguir. Aviso O uso incorreto do Editor do Registro, ou outro método, pode causar sérios problemas. Estes problemas talvez exijam a reinstalação do sistema operacional. A Microsoft não garante que os problemas resultantes do uso incorreto do Editor de Registro possam ser solucionados. A modificação do Registro é de sua responsabilidade.
Como registrar mensagens de erro TIFF no log de eventos do aplicativoPor padrão, o SharePoint Portal Server 2003 registra mensagens de erro associadas aos arquivos TIFF no log . Se você quiser que o SharePoint Portal Server 2003 registre as mensagens de erro associadas aos arquivos TIFF em um log de eventos do aplicativo, defina a entrada do Registro LoggingLevel na seguinte subchave do Registro para o valor desejado:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Eventlog\Application\Microsoft Office Document Imaging LoggingLevel como um dos seguintes valores:
Arquivos de palavras de ruídoUma palavra de ruído que não é útil em uma pesquisa. Por exemplo, as seguintes palavras são palavras de ruído:
Por padrão, os arquivos de palavras de ruído do SharePoint Portal Server 2003 são armazenadas no seguinte local no servidor: Unidade:\Arquivos de programa\SharePoint Portal Server\Data\Config Se você instalou o SharePoint Portal Server 2003 em um local diferente do local padrão, a pasta Data está armazenada em uma pasta diferente no servidor.Por padrão, SharePoint Server 2007armazena arquivos de palavras de ruído no seguinte local no servidor: Unidade:\Arquivos de programa\Microsoft Office Servers\12.0\Data\Config É possível alterar um arquivo de palavras de ruído. Se você adicionar palavras de ruído, a precisão da pesquisa poderá diminuir. No entanto, o tamanho do índice conteúdo também diminui. Um índice conteúdo menor ajuda a melhorar o desempenho. Você pode excluir palavras de ruído se quiser pesquisas para retornar a essas palavras.Se remover palavras do arquivo de palavras de ruído, as alterações não têm efeito até que você reinicie os índices conteúdos e realize uma atualização total dos índices conteúdo no SharePoint Portal Server 2003 e no SharePoint Server 2007. Se você remover palavras o arquivo de palavras de ruído, as palavras serão removidas dos arquivos antes de os arquivos serem incluídos em um índice. É necessário atualizar o índice conteúdo depois de modificar a lista de palavras de ruído. Caso contrário, os documentos que contêm as palavras de ruído removidas não são retornados às consultas. Não exclua os arquivos de palavras de ruído. Se você não quiser que as palavras de ruído sejam removidas durante uma atualização ou consulta, remova as entradas específicas do arquivo. Se você excluir o arquivo de palavra de ruído, todos os caracteres únicos serão removidos como palavras de ruído. Se remover todas as palavras de ruído do arquivo de palavras de ruído, você irá enfrentar erros durante o rastreamento. Por isso, é necessário ter pelo menos uma palavra de ruído no arquivo, mesmo se ela for tão simples quanto um caractere de ponto. Por padrão, os arquivos de palavras de ruído no SharePoint Portal Server 2003 são copiados na seguinte pasta: Unidade\Arquivos de programa\SharePoint Portal Server\DATA\Applications\ProgramUID\Config Por padrão, os arquivos de palavras de ruído no SharePoint Server 2007 são copiados na seguinte pasta: Unidade:\Arquivos de programa\Microsoft Office Servers\12.0\Data\Applications\ProgramUID\Config É possível especificar as palavras de ruído no nível de programa em vez no servidor ou no farm de servidores. Por exemplo, se o SharePoint Portal Server 2003 ou SharePoint Server 2007 e o Microsoft SQL Server estiverem instalados no mesmo servidor, será possível especificar uma lista de palavras de ruído para o SharePoint Portal Server 2003 ou SharePoint Server 2007 e uma lista de palavras de ruído diferente para o SQL Server.Como alterar o arquivo de palavras de ruídoPara alterar o arquivo de palavras de ruído, execute as seguintes etapas:
Arquivos de dicionário de sinônimosO dicionário de sinônimos é um recurso de pesquisa no SharePoint Portal Server 2003 e no SharePoint Server 2007. P dicionário de sinônimos permite que você digite uma frase em uma solicitação de consulta e receba os resultados das palavras relacionadas à frase digitada. Por exemplo, você pode procurar a palavra "run" e receber resultados que contenham as palavras "run" ou "jog" se os dois termos estiverem relacionados no dicionário de sinônimos. Além disso, o dicionário de sinônimos permite que um administrador do farm de servidores configure Pesquisar classificação ao atribuir diferentes pesos às palavras. O SharePoint Portal Server 2003 e o SharePoint Server 2007 incluem arquivos de dicionário de sinônimos para os seguintes idiomas:
Por padrão, SharePoint Portal Server 2003 armazena arquivos de palavras de ruído na seguinte pasta no servidor: Unidade:\Arquivos de programa\Microsoft Office Servers\12.0\Data\Office Server\Applications Se você instalou o SharePoint Portal Server 2003 em um local diferente do local padrão, a pasta Data está armazenada em uma pasta diferente no servidor.Observação O caminho do arquivo de dicionário de sinônimos podem ser localizados como o valor "DefaultApplicationsPath" no Registro em HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Global\Gathering Manager .Por padrão, SharePoint Server 2007 armazena arquivos de dicionário de sinônimos na seguinte pasta no servidor: Unidade:\Arquivos de programa\Microsoft Office Servers\12.0\Data\Config Os arquivos de dicionário de sinônimos do SharePoint Portal Server 2003 também são copiados na seguinte pasta: Unidade\Arquivos de programa\SharePoint Portal Server\Data\Applications\Application UID\Config Isto ocorre para cada instância do serviço do Microsoft Search ou do Microsoft SharePointPS Search. Os arquivos de dicionário de sinônimos para o SharePoint Server 2007 também são copiados na seguinte pasta: Unidade\Arquivos de programa\Microsoft Office Servers\12.0\Data\Applications\Application UID\Config Isto ocorre para cada instância do serviço do Microsoft Search ou do Windows SharePoint Services Search.É possível modificar o dicionário de sinônimos no nível de programa em vez no servidor ou no farm de servidores. Por exemplo, se o SharePoint Portal Server 2003 ou SharePoint Server 2007 e SQL Server estiverem instalados no mesmo servidor, será possível especificar um arquivo de dicionário de sinônimos para o SharePoint Portal Server 2003 ou SharePoint Server 2007 e um arquivo de dicionário de sinônimos para o SQL Server. Você pode altera as entradas do dicionário de sinônimos ao alterar o arquivo de dicionário de sinônimos em um editor de texto. O arquivo de dicionário de sinônimos deve usar XML bem formatado que contenha marcas de aberturas e fechamento correspondentes em cada entrada. Se o XML estiver mal formatado, o SharePoint Portal Server 2003 e o SharePoint Server 2007 registra um erro no log de eventos do aplicativo. Ao alterar o arquivo de dicionário de sinônimos, verifique se você não alterou as caixas das marcas. Apenas as marcas do XML usam letras maiúsculas. Todas as outras marcas usam letras minúsculas. Por exemplo, a marca <replacement> deve usar letras minúsculas. Importante Um arquivo chamado Tsschema.xml está instalado com os arquivos de dicionario de sinônimos. Não modifique o arquivo Tsschema.xml. Os arquivos de dicionário de sinônimos contêm dois tipos de entradas do dicionário de sinônimos. Esses tipos são conjuntos de substituição e de expansão. Os arquivos de dicionário de sinônimos também permitem que você configure as opções de relevância e de lematização em um conjunto de substituição ou expansão. Importante De uma perspectiva de desempenho, é importante estar ciente de quantas entradas são definidas no arquivo de dicionário de sinônimos. Além disso, é importante que você fique atento para não exceder a recomendação de 1.000/10.000 (típica/máx.) entradas, conforme destacado no capacity planner. Para exibir o capacity planner, visite o seguinte site da Microsoft (em inglês): http://office.microsoft.com/en-us/sharepointportaladmin/HA011647581033.aspx
(http://office.microsoft.com/en-us/sharepointportaladmin/HA011647581033.aspx)
Além disso, esteja ciente de que cada marca <sub> and <pat> conta com uma entrada que vai além dos valores recomendados. Conjuntos de substituiçãoUm conjunto de substituição especifica um padrão que é substituído por uma ou mais substituições em uma solicitação de pesquisa. Por exemplo, é possível adicionar um conjunto de substituição em que W2K é o padrão e o Windows 2000 é a substituição. Se você consultar o termo W2K, o SharePoint Portal Server 2003 e o SharePoint Server 2007 retornam apenas resultados de pesquisa que contenham o termo Windows 2000. Você não recebe itens nos resultados da pesquisa que contenham o termo W2K.Cada conjunto de substituição é incluída em uma marca <replacement>. Na marca de substituição, você especifica um ou mais padrões ao incluí-los em uma marca <pat>. Você especifica uma ou mais substituições ao incluí-las na marca <sub>. Os padrões e substituições podem conter uma palavra ou seqüência de palavras. Por exemplo, para adicionar um conjunto de substituição, no qual W2K é o padrão e Windows 2000 é a substituição, use o seguinte: É possível especificar padrões para diferenciarem, ou não, maiúsculas de minúsculas se você adicionar uma marca ao arquivo de dicionário de sinônimos de seu idioma. Por exemplo, se você especificar que os padrões não diferenciam maiúsculas de minúsculas, os termos <pat> e <sub> correspondem os termos de consulta, independentemente da caixa do termo de consulta. Ao consultar usando a sintaxe CONTAINS FORMSOF, o dicionário de sinônimos funciona conforme descrito anteriormente. Para obter mais informações sobre a sintaxe CONTAINS FORMSOF, consulte Microsoft SharePoint Products e Technologies 2003 Software Development Kit. Por padrão, um site de portal usa o tipo de consulta FREETEXT. As consultas FREETEXT abrem automaticamente o dicionário de sinônimos. No entanto, se você digitar seus temos de consulta entre aspas, o SharePoint Portal Server 2003 e o SharePoint Server 2007 desabilitam a consulta FREETEXT e não usam o dicionário de sinônimos. Por isso, o SharePoint Portal Server 2003 e o SharePoint Server 2007 retornam resultados com base no termo ou termos de pesquisa exato entre aspas. Se o dicionário de sinônimos substituir uma palavra de uma frase por outra palavra, uma consulta FREETEXT retorna resultados para a nova versão da frase inteira. Para o conjunto de substituição no qual o termo Windows 2000 substitui o termo W2K, a tabela a seguir mostra os resultados que ocorrem com base em uma entrada de usuário diferente da interface de pesquisa no site de portal. Este exemplo presume que o dicionário de sinônimos é um conjunto que diferencia maiúsculas de minúsculas, mas que a pesquisa não. Recolher esta tabela
Recolher esta tabela
Conjuntos de expansãoUm conjunto de expansão é um grupo de substituições que são sinônimas. As consultas que contém correspondência em uma substituição são expandidas para excluir todas as outras substituições no conjunto de expansão. Por exemplo, é possível adicionar um conjunto de expansão no qual as seguintes substituições são sinônimos:
Cada conjunto de expansão é incluída em uma marca <expansion>. Na marca de expansão, você especifica uma ou mais substituições entre uma marca <sub>. Para o exemplo descrito anteriormente, adicione os seguintes itens: Lematização de palavraA lematização de palavra mapeia um lematizador lingüístico para todas as palavras correspondentes. Você pode especificar a lematização de palavras em entradas de padrão e substituição. Por exemplo, em inglês, a lematização buy corresponde a:
Por exemplo, se o arquivo de dicionário de sinônimos incluir o <pat>User1 executado para o padrão store** </pat> ou o <sub> User1 executado para a substituição store**</sub>, a consulta retorna as seguintes seqüências de caractere ou adiciona-as a seguinte consulta:
Como alterar um arquivo de dicionário de sinônimosPara alterar um arquivo de dicionário de sinônimos, execute as seguintes etapas:
Como usar o arquivo Robots.txt e a marca HTML para impedir o acesso de conteúdo no site de portalVocê pode usar um arquivo Robots.txt para controlar onde os robôs (rastreadores da Web) podem ir em um site. Também é possível usar o arquivo Robots.txt para indicar se deseja excluir rastreadores específicos. Servidores da Web usam essas regras para controlar o acesso a site ao impedir que robôs acessem determinadas áreas. O SharePoint Portal Server 2003 e o SharePoint Server 2007 procuram esse arquivo ao rastrear e obedecem as restrições contidas no arquivo Robots.txt.Você pode impedir que outro servidor rastreie o conteúdo no site de portal ao modificar o arquivo Robots.txt. Por exemplo, você pode evitar que um robô específico acesse o servidor, pois a freqüência de solicitações do robô está bloqueando o site. Você também pode restringir o acesso de todos os robôs a determinadas áreas no servidor. O SharePoint Portal Server 2003 e o SharePoint Server 2007 não instalam um arquivo Robots.txt. No entanto, você pode criar um arquivo Robots.txt e colocá-lo no diretório base do site padrão no servidor. Para determinar o diretório base do site padrão no servidor, execute as seguintes etapas:
<META name="robots" content= "NOINDEX, NOFOLLOW"> O SharePoint Portal Server 2003 e o SharePoint Server 2007 obedece automaticamente as restrições contidas no arquivo Robots.txt.Observação para o Microsoft Office SharePoint Server2007, é necessário reiniciar o serviço do Office SharePoint Server Search antes das atualizações do dicionário de sinônimos serem aplicadas às solicitações de pesquisa. Além disso, as alterações nos arquivos do dicionário de sinônimos devem ser copiadas manualmente em cada servidor na farm que está servindo as consultas de pesquisa. Para ser completo e permitir alterações de topologia, você pode copiar as alterações a todos os servidores na farm. ReferênciasPara obter mais informações sobre como administrar e configurar o SharePoint Portal Server 2003, consulte o Guia do Administrador do Microsoft Office SharePoint Portal Server 2003. O Guia do Administrador do Microsoft Office SharePoint Portal Server 2003 (Administrator's Help.chm) está localizado na pasta Docs na raiz do CD do SharePoint Portal Server 2003. Para obter mais informações sobre o SharePoint Portal Server 2003, visite o seguinte site da Microsoft (em inglês): http://technet.microsoft.com/office/sharepointserver/bb267364.aspx
(http://technet.microsoft.com/office/sharepointserver/bb267364.aspx)
Para obter mais informações sobre o SharePoint Portal Server 2007, visite o seguinte site da Microsoft (em inglês): http://office.microsoft.com/en-us/sharepointserver/HA101656531033.aspx
(http://office.microsoft.com/en-us/sharepointserver/HA101656531033.aspx)
| Outros Recursos Outros Sites de Suporte
ComunidadesObtenha Ajuda AgoraTraduções deste artigo
|






Windows Live
Facebook
Twitter
Linkedin
Digg it
Yahoo
Delicious
StumbleUpon
Yammer
Reddit
Technorati
FriendFeed
Email
Voltar para o início