A extrair informações de ficheiros do Office utilizando formatos de ficheiro do Office e esquemas

Traduções de Artigos Traduções de Artigos
Artigo: 840817 - Ver produtos para os quais este artigo se aplica.
Expandir tudo | Reduzir tudo

Nesta página

Sumário

Se pretender extrair informações de livros do Microsoft Excel, apresentações do Microsoft PowerPoint ou documentos do Microsoft Word, pode utilizar vários métodos. Estes métodos incluem API programação chamadas, Office Open XML, XML, RTF ou HTML. Se estes métodos não corrigirem as suas necessidades, poderá ser elegível para participar no programa formato de ficheiro Royalty-Free e receber documentação técnica para determinados formatos de ficheiro binário do Microsoft Office.

INTRODUÇÃO

Este artigo descreve várias técnicas que estão disponíveis para extrair informações de livros do Excel, apresentações do PowerPoint e documentos do Word.

Mais Informação

Office Open XML

Os formatos Open XML do Office estão concebidos para que várias aplicações em várias plataformas podem criar e aceder a documentos Open XML do Office. Utilizando o formato Office Open XML, pode manipular directamente o formato de ficheiro. Não é necessário utilizar aplicações do Microsoft Office para criar ou aceder aos ficheiros.

Vantagens do Office Open XML

  • Está aberta. Office Open XML openly é licenciado e documentada. É sofisticado no processo de Ecma aberto para que funciona através de uma grande variedade de plataformas, aplicações e utilizações.
  • É XML. Office Open XML é uma tecnologia padrão que muitas ferramentas e aplicações podem facilmente e utilizam de forma transparente.
  • É retro-compatíveis e interoperáveis. Isto permite-lhe manter documentos no seu formato original, enquanto estes são convertidos para um formato aberto e Moderno. Além disso, as aplicações diferentes podem utilizar o formato Office Open XML com resultados previsíveis.
  • Funciona com ter através do suporte de esquema XML personalizado, através de actualizações gratuitas para versões existentes do Office e através do suporte de funções de acessibilidade importantes para trabalhadores desactivados.
  • Está pronto para o futuro. Com o Office Open XML, pode utilizar todas as funcionalidades nos programas do Microsoft Office de 2007 para criar documentos. Open XML do Office fornece formas de subconjunto ou expandir estas funcionalidades enquanto é mantém conformity.
  • Pode ajudar a melhorar a segurança. Procedimentos de segurança IT e aplicações mais facilmente podem detectar e corrigir potenciais problemas, documentos são menos probabilidades de estar danificado.
Para obter mais informações sobre o formato Office Open XML, leia o rascunho de v1.0 Open XML do Office no seguinte Ecma International Web site:
http://www.ecma-international.org/news/TC45_current_work/TC45-2006-50_final_draft.htm
Além disso, visite o seguinte OpenXMLDeveloper.org site:
http://openxmldeveloper.org
Os formatos Open XML do Office utilizam as convenções de distribuição abrir para armazenar as informações de ficheiro Open XML do Office no disco. Para mais informações sobre as convenções de distribuição abrir conforme utilizado pelo Office Open XML, consulte o rascunho de v1.0 Office Open XML, parte 2, "Abrir convenções de distribuição".

Interfaces de programação de aplicações do Office (API)

Formatos de ficheiro binário do Office foram concebidos para ser acedido através de interfaces do Office programação de aplicações (API, Application Programming Interfaces), em vez de por directa manipulação do formato de ficheiro. Devido a complexidade dos formatos, manipulação directa pode causar danos e é aconselhável a sua utilização.

Para obter mais informações sobre as APIs do Office, visite o seguinte Web site da Microsoft:
http://msdn2.microsoft.com/en-us/library/aa165081(office.10).aspx
Os formatos de ficheiro binário do Office 97-2003 utilizam o armazenamento estruturado Windows API. As informações específicas do Office são armazenadas como sequências neste formato mais generalizado. Os elementos comuns, tais como as propriedades do documento, podem ser acedidos através de API de armazenamento estruturado e não requerem o acesso a documentação de formato de ficheiro binário do Office.

Para obter mais informações sobre a API de armazenamento estruturado do Windows, visite o seguinte Web site da Microsoft:
http://msdn2.microsoft.com/en-us/library/aa380369.aspx
O formato binário do Microsoft Excel 2007 (*.xlsb) armazena os registos binários. Este formato utiliza a mesma parte e tecnologias de embalagem que se encontrem SpreadsheetML. SpreadsheetML faz parte do formato Office Open XML.

importante Ler ou manipular a estrutura directamente pode causar danos e é aconselhável a sua utilização.

XML

XML é uma metalinguagem texto simples, baseado em Unicode (uma linguagem de definição de linguagens de markup). XML não está associada a qualquer linguagem de programação, sistema operativo ou fornecedor de software. XML fornece acesso a um plethora de tecnologias para manipular, estruturar, transformação e consultar dados. Como aumentou a utilização de XML, é agora normalmente aceite que XML só não é útil para descrever novos formatos de documento para a Web, mas também é adequado descrever dados estruturados. Os exemplos de dados estruturados incluem a informação contida normalmente em folhas de cálculo, ficheiros de configuração do programa e protocolos de rede.

Microsoft Office inclui suporte para esquemas XML. A Microsoft mantém um programa de licenciamento para determinados XML do Office esquemas.

Para obter mais informações sobre esquemas XML do Office, visite o seguinte Web site da Microsoft para visualizar o Microsoft Office System e XML: Bringing XML para o ambiente de trabalho artigo:
http://msdn2.microsoft.com/en-us/library/aa159914(office.11).aspx

Rich Text Format (RTF)

A especificação Rich Text Format (RTF) é um método de codificação de texto formatado e gráficos para transferência fácil entre programas. O formato RTF especificação fornece um formato para intercâmbio de texto e gráficos que pode ser utilizado com diferentes dispositivos de saída, ambientes operativos e sistemas operativos. RTF utiliza o ANSI American National Standards Institute (), conjunto de caracteres PC-8, Macintosh ou IBM PC para controlar a representação e a formatação de um documento no ecrã e na impressão. Com o RTF especificação, documentos criados em diferentes sistemas operativos e que são criados utilizando programas podem ser transferidos entre esses sistemas operativos e os programas de software diferente.

Para obter mais informações sobre como escrever ou sobre como implementar um leitor RTF exemplo, visite o seguinte Web site da Microsoft e, em seguida, escreva o Leitor de RTF na caixa de Procura da MSDN para :
http://msdn.microsoft.com

Esquema XML do Visio

A documentação da Microsoft e uma licença royalty-free, clientes e parceiros podem tirar partido do esquema XML na sua ferramenta de efeitos visuais de criação de diagramas e dados. A disponibilidade do esquema do Visio fornece uma completa e descrição W3C compatível com o formato do ficheiro XML (Extensible Markup Language) do Visio, activar organizações para aceder a informações capturadas na respectivo Visio diagramas e utiliza-lo com outros programas activados para XML, tais como gestão de relação de clientes (CRM) e sistemas de planeamento (ERP) de recursos de empresa, como parte dos processos de negócio. Para obter mais informações e transferências capacidades, visite o seguinte Web site da Microsoft:
http://www.microsoft.com/downloads/details.aspx?FamilyID=fe118952-3547-420a-a412-00a2662442d9

HTML

Ficheiros HTML são ficheiros de texto que incluem as informações que os utilizadores verão e tags que especificar formatação informações sobre como as informações serão apresentadas para apresentam fins. Pode utilizar HTML para armazenar, distribuir e apresentar documentos do Office e os dados num formato que pode ser visualizado utilizando a maior parte dos Web browsers mantendo o conteúdo rico e a funcionalidade de documentos do Office.

Nota No Microsoft Excel 2007, o formato de ficheiro HTML não guarda funcionalidades específicas para o Excel. Além disso, o formal de HTML não suporta ou apresentar todas as funcionalidades no Excel 2007, quando guarda um livro como HTML.

Para mais informações sobre como editar HTML, visite o seguinte Web site da Microsoft:
http://msdn2.microsoft.com/en-us/library/aa730778(vs.71).aspx
Para obter mais informações sobre como trabalhar com código HTML e ficheiros de recursos, visite o seguinte Web site da Microsoft:
http://msdn2.microsoft.com/en-us/library/efc4xwkb(vs.71).aspx

Programas de formato de ficheiro Royalty-Free

Formatos de ficheiro binário do Microsoft Office

A Microsoft disponibiliza o .doc, .xls, .xlsb e especificações de formato de ficheiros binários .ppt num covenant royalty-free não para sue para qualquer pessoa que pretende implementar todo ou parte destas especificações nos seus produtos. Implementação inclui a capacidade para utilizar a documentação de especificação para análise e fins de referência forenses.

Formato de ficheiro do Microsoft Office desenho de 2007 e o Visual Basic for Applications (VBA) formato do ficheiro de 2007 também estão disponíveis neste programa. A documentação que abranja as especificações de formato de ficheiro binário é cumulativa e abrange o formulário mais actual de formatos de ficheiro binário, bem como versões anteriores.

Especificações de formato de ficheiro binário do Office estão disponíveis em Abrir compromisso de especificação. Para obter documentação, visite o seguinte Web site da Microsoft:
http://www.microsoft.com/interop/docs/officebinaryformats.mspx

Propriedades

Artigo: 840817 - Última revisão: 26 de fevereiro de 2008 - Revisão: 8.1
A informação contida neste artigo aplica-se a:
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
  • Microsoft Excel 2002 Standard Edition
  • Microsoft Excel 2000 Standard Edition
  • Microsoft Excel 97 Standard Edition
  • Microsoft Office PowerPoint 2007
  • Microsoft Office PowerPoint 2003
  • Microsoft PowerPoint 2002 Standard Edition
  • Microsoft PowerPoint 2000 Standard Edition
  • Microsoft PowerPoint 97 Standard Edition
  • Microsoft Office Word 2007
  • Microsoft Office Word 2003
  • Microsoft Word 2002 Standard Edition
  • Microsoft Word 2000 Standard Edition
  • Microsoft Word 97 Standard Edition
Palavras-chave: 
kbmt kbhowto kbexpertiseinter kbinfo KB840817 KbMtpt
Tradução automática
IMPORTANTE: Este artigo foi traduzido por um sistema de tradução automática (também designado por Machine translation ou MT), não tendo sido portanto revisto ou traduzido por humanos. A Microsoft tem artigos traduzidos por aplicações (MT) e artigos traduzidos por tradutores profissionais. O objectivo é simples: oferecer em Português a totalidade dos artigos existentes na base de dados do suporte. Sabemos no entanto que a tradução automática não é sempre perfeita. Esta pode conter erros de vocabulário, sintaxe ou gramática? erros semelhantes aos que um estrangeiro realiza ao falar em Português. A Microsoft não é responsável por incoerências, erros ou estragos realizados na sequência da utilização dos artigos MT por parte dos nossos clientes. A Microsoft realiza actualizações frequentes ao software de tradução automática (MT). Obrigado.
Clique aqui para ver a versão em Inglês deste artigo: 840817

Submeter comentários

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com