Como extrair informações de arquivos do Office usando formatos de arquivo do Office e esquemas

Traduções deste artigo Traduções deste artigo
ID do artigo: 840817 - Exibir os produtos aos quais esse artigo se aplica.
Expandir tudo | Recolher tudo

Neste artigo

Sumário

Se você tiver que extrair informações de pastas de trabalho do Microsoft Excel, apresentações do Microsoft PowerPoint ou documentos do Microsoft Word, você pode usar vários métodos. Esses métodos incluem API de programação chamadas, XML abertos do Office, XML, RTF ou HTML. Se esses métodos não endereço suas necessidades, você pode estar qualificados para participar de um programa de formato de arquivo Royalty-Free e receber documentação técnica para determinados formatos de arquivo binário do Microsoft Office.

INTRODUÇÃO

Este artigo descreve várias técnicas que estão disponíveis para extrair informações de pastas de trabalho do Excel, apresentações do PowerPoint e documentos do Word.

Mais Informações

XML abertos do Office

Os formatos XML abertos do Office são criados para que vários aplicativos em várias plataformas podem criar e acessar documentos XML abertos do Office. Usando o formato XML aberto do Office, você pode manipular diretamente o formato de arquivo. Não é necessário usar aplicativos do Microsoft Office para criar ou acessar os arquivos.

Vantagens do XML abertos do Office

  • Ele está aberto. XML abertos do Office abertamente é licenciado e documentado. Ele é refinado no processo de Ecma aberto para que ele funciona em uma grande variedade de plataformas, aplicativos e usos.
  • Ela é XML. XML abertos do Office é uma tecnologia padrão que muitas ferramentas e aplicativos podem facilmente e usam de forma transparente.
  • É com versões anteriores compatíveis e interoperável. Isso lhe permite preservar documentos em sua forma original e eles são convertidos em um formato aberto, moderno. Além disso, aplicativos diferentes podem usar o formato XML aberto do Office com resultados previsíveis.
  • Ele funciona com o que você tiver através de suporte a esquema XML personalizado, por meio de atualizações gratuitas para versões existentes do Office e através de suporte de funções de acessibilidade importante para os operadores de desativado.
  • Ele está pronto para o futuro. Com XML abertos do Office, você pode usar todos os recursos nos programas do Microsoft Office 2007 para criar documentos. XML abertos do Office fornece maneiras de subconjunto ou estender esses recursos enquanto ele mantém conformidade.
  • Pode ajudar a melhorar a segurança. Procedimentos de segurança IT e aplicativos mais facilmente podem descobrir e corrigir problemas em potencial, enquanto documentos têm menos probabilidade de ser corrompido.
Para obter mais informações sobre o formato XML aberto do Office, leia o rascunho de v1.0 XML abertos do Office no seguinte site do Ecma internacional:
http://www.ecma-international.org/news/TC45_current_work/TC45-2006-50_final_draft.htm
Além disso, visite o seguinte site do OpenXMLDeveloper.org:
http://openxmldeveloper.org
Os formatos XML abertos do Office usam as Open Packaging Conventions para armazenar as informações do arquivo XML abertos do Office no disco. Para obter mais informações sobre as Open Packaging Conventions como usado por XML abertos do Office, consulte o rascunho da v1.0 XML abertos do Office, parte 2, "Open Packaging Conventions".

Office Application Programming Interfaces (APIs)

Formatos de arquivo binário do Office são projetados para serem acessados pelas interfaces de programação de Office aplicativos (APIs), em vez de pela manipulação direta do formato de arquivo. Devido à complexidade dos formatos, manipulação direta pode causar corrupção e é altamente desencorajada.

Para obter mais informações sobre as APIs do Office, visite o seguinte site:
http://msdn2.microsoft.com/en-us/library/aa165081(office.10).aspx
Os formatos de arquivo binário do Office 97-2003 usam o armazenamento estruturado Windows APIs. As informações específicas do Office são armazenadas como fluxos neste formato mais generalizado. Elementos comuns, tais como propriedades do documento, podem ser acessados por meio de APIs do armazenamento estruturado e não requerem acesso a documentação do formato de arquivo binário do Office.

Para obter mais informações sobre as APIs do armazenamento estruturado do Windows, visite o seguinte site:
http://msdn2.microsoft.com/en-us/library/aa380369.aspx
O formato binário do Microsoft Excel 2007 (*.xlsb) armazena registros binários. Esse formato usa a mesma parte e tecnologias de compactação que são encontradas no SpreadsheetML. SpreadsheetML é parte do formato XML aberto do Office.

importante Ler ou manipular a estrutura diretamente pode causar corrupção e é altamente desencorajado.

XML

O XML é uma metalinguagem texto sem formatação, baseados em Unicode (uma linguagem para definição de linguagens de marcação). XML não está vinculada a qualquer linguagem de programação, o sistema operacional ou o fornecedor de software. XML fornece acesso a uma grande quantidade de tecnologias para manipular, estruturar, transformar e consultar dados. Como o uso do XML cresceu, ele é agora geralmente aceito que XML não é somente útil para descrever os novos formatos de documento para a Web, mas também é adequado descrever dados estruturados. Exemplos de dados estruturados incluem informações que geralmente está presente em planilhas, arquivos de configuração do programa e protocolos de rede.

Microsoft Office inclui suporte para esquemas XML. A Microsoft mantém um programa de licenciamento para determinados XML do Office esquemas.

Para saber mais sobre esquemas XML do Office, visite o seguinte site Microsoft para exibir o Microsoft Office System e XML: trazendo o XML na área de trabalho artigo:
http://msdn2.microsoft.com/en-us/library/aa159914(office.11).aspx

Formato Rich Text (RTF)

A especificação de Rich Text Format (RTF) é um método de codificação de texto formatado e elementos gráficos para a transferência fácil entre programas. O RTF especificação fornece um formato para troca de texto e elementos gráficos que pode ser usada com dispositivos de saída diferentes, ambientes operacionais e sistemas operacionais. RTF usa o American National Standards Institute (ANSI), conjunto de caracteres IBM PC, Macintosh ou PC-8 para controlar a representação e a formatação de um documento na tela e na impressão. Com o RTF especificação, documentos que são criados em diferentes sistemas operacionais e que são criados por meio de programas podem ser transferidos entre esses sistemas operacionais e os programas de software diferente.

Para obter mais informações sobre como escrever ou como implementar um leitor RTF do exemplo, visite o seguinte site e, em seguida, digite Leitor RTF na caixa Pesquisa MSDN para :
http://msdn.microsoft.com

Esquema XML do Visio

Por meio de documentação da Microsoft e uma licença de royalties, clientes e parceiros podem aproveitar o esquema XML na sua ferramenta de visualização diagramação e dados. A disponibilidade de esquema do Visio fornece um completo e compatível com W3C descrição do formato de arquivo Visio (XML), permite às organizações acesso informações capturadas no Visio seu diagramas e usa-lo com outros programas habilitados para XML, como gerenciamento de relacionamento com clientes (CRM) e sistemas ERP (planejamento) de recurso de empresa, como parte de seus processos de negócios. Para obter mais informações e baixar recursos, visite o seguinte site da Microsoft:
http://www.microsoft.com/downloads/details.aspx?FamilyID=fe118952-3547-420a-a412-00a2662442d9

HTML

Arquivos HTML são arquivos de texto que incluem as informações que os usuários verão, e marcas que especifique informações de formatação sobre como as informações serão apresentadas para fins de exibição. Você pode usar o HTML para armazenar, distribuir e apresentar os documentos do Office e dados em um formato que pode ser exibido usando a maioria dos navegadores da Web mantendo o conteúdo rich e a funcionalidade de documentos do Office.

Observação No Microsoft Excel 2007, o formato de arquivo HTML não salva recursos que são específicos para o Excel. Além disso, o formal de HTML não oferece suporte ou processar todos os recursos do Excel 2007 quando você salva uma pasta de trabalho como HTML.

Para obter mais informações sobre como editar HTML, visite o seguinte site:
http://msdn2.microsoft.com/en-us/library/aa730778(vs.71).aspx
Para obter mais informações sobre como trabalhar com código, HTML e arquivos de recurso, visite o seguinte site:
http://msdn2.microsoft.com/en-us/library/efc4xwkb(vs.71).aspx

Programas de formato de arquivo Royalty-Free

Formatos de arquivo binário do Microsoft Office

A Microsoft disponibiliza sua .doc, .xls, .xlsb e .ppt especificações de formato de arquivo binário em um covenant de royalties para não lançou para qualquer pessoa que deseja implementar todo ou parte dessas especificações em seus produtos. Implementação inclui a capacidade de usar a documentação de especificação para análise e para fins de referência forense.

Formato de arquivo desenho do Microsoft Office de 2007 e do Visual Basic for Applications (VBA) formato de arquivo para 2007 também estão disponíveis neste programa. A documentação que aborda as especificações de formato de arquivo binário é cumulativa e aborda o formulário mais atual de formatos de arquivo binário bem como versões anteriores.

Especificações de formato de arquivo binário do Office estão disponíveis na promessa de especificação aberta. Para obter documentação, visite o seguinte site:
http://www.microsoft.com/interop/docs/officebinaryformats.mspx

Propriedades

ID do artigo: 840817 - Última revisão: terça-feira, 26 de fevereiro de 2008 - Revisão: 8.1
A informação contida neste artigo aplica-se a:
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
  • Microsoft Excel 2002 Standard Edition
  • Microsoft Excel 2000 Standard Edition
  • Microsoft Excel 97 Standard Edition
  • Microsoft Office PowerPoint 2007
  • Microsoft Office PowerPoint 2003
  • Microsoft PowerPoint 2002 Standard Edition
  • Microsoft PowerPoint 2000 Standard Edition
  • Microsoft PowerPoint 97 Standard Edition
  • Microsoft Office Word 2007
  • Microsoft Office Word 2003
  • Microsoft Word 2002 Standard Edition
  • Microsoft Word 2000 Standard Edition
  • Microsoft Word 97 Standard Edition
Palavras-chave: 
kbmt kbhowto kbexpertiseinter kbinfo KB840817 KbMtpt
Tradução automática
IMPORTANTE: Este artigo foi traduzido por um sistema de tradução automática (também designado por Machine Translation ou MT), não tendo sido portanto traduzido ou revisto por pessoas. A Microsoft possui artigos traduzidos por aplicações (MT) e artigos traduzidos por tradutores profissionais, com o objetivo de oferecer em português a totalidade dos artigos existentes na base de dados de suporte. No entanto, a tradução automática não é sempre perfeita, podendo conter erros de vocabulário, sintaxe ou gramática. A Microsoft não é responsável por incoerências, erros ou prejuízos ocorridos em decorrência da utilização dos artigos MT por parte dos nossos clientes. A Microsoft realiza atualizações freqüentes ao software de tradução automática (MT). Obrigado.
Clique aqui para ver a versão em Inglês deste artigo: 840817

Submeter comentários

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com