Как извлечь данные из файлов Microsoft Office с помощью форматов файлов Office и схем

Переводы статьи Переводы статьи
Код статьи: 840817 - Vizualiza?i produsele pentru care se aplic? acest articol.
Развернуть все | Свернуть все

В этой статье

Аннотация

Если для извлечения сведений из книги Microsoft Excel, презентации Microsoft PowerPoint или документов Microsoft Word, можно использовать несколько методов. Эти методы включают API-Интерфейс программирования вызовов, Office Open XML, XML, формат RTF или HTML. Если эти методы не отвечающее вашим требованиям, может быть право участвовать в программе формат файла отчислений и для получения технической документации для форматами двоичных файлов Microsoft Office.

ВВЕДЕНИЕ

В данной статье описано несколько методов, доступных для извлечения данных из книги Excel, презентации PowerPoint, и Документы Word.

Дополнительная информация

Office Open XML

Форматы Office Open XML разработаны таким образом, можно создавать и использовать документы Office Open XML несколько приложений на различных платформах. Используя формат Office Open XML, можно напрямую управлять формат файла. Не нужно создавать или доступ к файлам с помощью приложения Microsoft Office.

Преимущества Office Open XML

  • Она была открыта. Office Open XML открыто лицензированы и задокументированы. Она совершенствуется в открытой Ecma процесса таким образом, чтобы он работает с множеством платформ приложений и случаи использования.
  • Он является XML. Office Open XML является стандартной технологии, многие средства и приложения можно легко и прозрачно использовать.
  • Обратной совместимости и взаимодействия. Это позволяет сохранять документы в исходную форму, хотя они преобразуются в открытой, современный формат. Кроме того различные приложения могут использовать формат Office Open XML с предсказуемыми результатами.
  • Она работает с имеют через поддержка настраиваемых XML-схемы, через бесплатные обновления для существующих версий Office и поддержку отключенных сотрудникам важных специальных функций.
  • Он готов в будущем. Office Open XML можно использовать все функции в приложениях Microsoft Office 2007 для создания документов. Office Open XML предоставляет способы подмножество или расширить эти возможности во время его обеспечивает соответствие.
  • Он помогает улучшить безопасность. Процедуры безопасности ИТ и приложений можно легче обнаруживать и устранения потенциальных проблем, хотя документы являются менее вероятно, поврежден.
Для получения дополнительных сведений о формате Office Open XML чтение черновик Office Open XML версии 1.0 на Ecma International веб-узла:
http://www.ECMA-International.org/News/TC45_current_work/TC45-2006-50_final_draft.htm
Кроме того по адресу OpenXMLDeveloper.org веб-узла:
http://openxmldeveloper.org
Форматы Office Open XML с помощью спецификации Open Packaging Conventions для хранения сведений о Office Open XML файла на диске. Для получения дополнительных сведений о спецификации Open Packaging Conventions, используемого в Office Open XML просмотра черновика v1.0 Office Open XML, часть 2, «Open Packaging Conventions».

Прикладного программирования (API) Microsoft Office

Двоичные форматы файлов разработаны для вызова через Office интерфейсов прикладного программирования (API), вместо по прямой обработки формата файла. Из-за сложности форматы прямой изменения могут привести к повреждению и настоятельно не рекомендуется.

Для Дополнительные сведения об API-интерфейсы Office посетите следующий веб-узла корпорации Майкрософт веб-узел:
http://msdn2.Microsoft.com/en-us/library/aa165081 (office.10) .aspx
Форматы двоичных файлов Office 97-2003 с помощью структурированного хранилища Windows API-интерфейсы. Сведения об особенностях Office сохраняется как потоки в этом более обобщенный формат. Общие элементы, такие как свойства документа могут быть через API-интерфейсов структурированного хранилища и не требуют доступа к Документация формат двоичных файлов Office.

Для получения дополнительных сведений о структурированного хранилища API Windows посетите следующий веб-узла корпорации Майкрософт веб-узел:
http://msdn2.Microsoft.com/en-us/library/aa380369.aspx
Двоичный формат Microsoft Excel 2007 (*.xlsb) хранит двоичные записей. Данный формат использует же части и технологии, которые были найдены в квалификатором. Квалификатором входит в формате Office Open XML.

Важные Чтение или непосредственно Обработка структуры может привести к повреждение и настоятельно не рекомендуется.

XML

XML — это обычный текст, на основе Юникода metalanguage (язык для Определение языка разметки). XML не привязаны к любой язык программирования операционная система или поставщику программного обеспечения. XML предоставляет доступ к массой технологии для манипулирования, структурирование, преобразование и запросы к данным. Как Использование XML возросла, он теперь обычно принимается XML — это не только полезными для описания нового документа форматы для веб-страниц, но также подходит для описания структурированных данных. Структурированные данные примеры информации, обычно содержится в электронные таблицы, файлы конфигурации программы, и сетевые протоколы.

Microsoft Office включена поддержка XML-схемы. Корпорация Майкрософт поддерживает программа лицензирования для определенных Office XML схемы.

Дополнительные сведения о схемах Office XML, посетите веб-узел Веб-узел Майкрософт для просмотра Системы Microsoft Office и XML: использование XML для настольных ПК статья:
http://msdn2.Microsoft.com/en-us/library/aa159914 (office.11) .aspx

Форматированный текст (RTF)

Спецификация форматированный текст (RTF) — это метод кодирования форматированный текст и графику для переноса данных между программами. RTF Спецификация предоставляет формат для обмена текст и рисунки, которые могут быть с различные устройства вывода, операционными системами и операционных систем систем. Формат RTF используется американский национальный институт стандартов (ANSI), PC-8 Набор для управления представлением символов Macintosh или IBM PC и форматирование документа на экране и печати. С RTF спецификации, документы, созданные под управлением разных операционных систем и созданные с помощью другого программного обеспечения, программ может быть передано между этими операционными системами и этих программ.

Для получения дополнительных получить информацию о записи и реализовать считыватель образец RTF следующий веб-узел корпорации Майкрософт, а затем введите ФОРМАТ RTF Средство чтения В диалоговом окне Поиск веб-узлах MSDN поле:

Схема Visio XML

Документация корпорации Майкрософт и бесплатные лицензии, Клиенты и партнеры могут использовать преимущества XML-схемы в его создание диаграмм и средство визуализации данных. Предоставляет список доступных схем Visio Описание полной и стандартам W3C расширяемый язык разметки Visio Формат файла (XML), позволяя организациям получить доступ к данным собранных в их Visio диаграммы и использует его с другими программами, поддерживающими XML, такие как управления отношениями с клиентами (CRM) и ресурсами предприятия (ERP) системы, как часть своих бизнес-процессов. Для получения дополнительных сведений и загрузки возможности, посетите следующий веб-узел корпорации Майкрософт:
http://www.Microsoft.com/downloads/details.aspx?FamilyID = fe118952-3547-420a-a412-00a2662442d9

HTML

HTML-файлы представляют собой текстовые файлы, содержащие информацию, пользователи будет см и теги, определяющие форматирование как информация будет предоставлена в целях отображения. Для хранения, можно использовать HTML распространение и представление документов Office и данных в формат, который может быть просмотреть с помощью большинства веб-обозревателей при сохранении сложных элементов и функциональные возможности документов Office.

Примечание В Microsoft Excel 2007 в формате HTML не сохраняет функции, относящиеся к Microsoft Excel. Кроме того формальных HTML не поддерживает или отображают все функции в Excel 2007 при сохранении книги в формате HTML.

Для получения дополнительных сведений о том, как Редактирование HTML, посетите следующий веб-узел корпорации Майкрософт:
http://msdn2.Microsoft.com/en-us/library/aa730778 (vs.71) .aspx
Для получения дополнительных сведений о работе с кодом, HTML, и файлы ресурсов, посетите следующий веб-узел корпорации Майкрософт:
http://msdn2.Microsoft.com/en-us/library/efc4xwkb (vs.71) .aspx

Бесплатные программы формат файла

Двоичных форматов файлов Microsoft Office

Корпорация Майкрософт .doc, .xls, .xlsb и спецификации формата двоичный файл .ppt доступен в разделе бесплатные covenant не для Татьяна тех, кто хочет реализовать все или часть этих спецификаций в своих продуктах. Реализация включает возможность использования спецификации документации для анализа и юридически справочных целях.

Формат файла рисования Microsoft Office 2007 и Visual Basic для приложений (VBA) формата файлов 2007 также доступны в рамках этой программы. Документацией, охватывающей спецификации формата двоичный файл является накопительным и охватывает самую последнюю форму двоичных форматов файлов, а также более ранних версий.

Спецификации двоичный формат файла Office можно найти в разделе Обещание в отношении открытых спецификаций. Чтобы получить документацию, посетите веб-узел корпорации Майкрософт:
http://www.Microsoft.COM/Interop/docs/officebinaryformats.mspx

Свойства

Код статьи: 840817 - Последний отзыв: 16 июня 2011 г. - Revision: 4.0
Информация в данной статье относится к следующим продуктам.
  • Microsoft Office Excel 2007
  • Microsoft Excel 2002 Standard Edition
  • Microsoft Excel 2000 Standard Edition
  • Microsoft Excel 97 Standard Edition
  • Microsoft Office PowerPoint 2007
  • Microsoft Office PowerPoint 2003
  • Microsoft PowerPoint 2002 Standard Edition
  • Microsoft PowerPoint 2000 Standard Edition
  • Microsoft PowerPoint 97 Standard Edition
  • Microsoft Office Word 2007
  • Microsoft Word 2002 Standard Edition
  • Microsoft Word 2000 Standard Edition
  • Microsoft Word 97 Standard Edition
Ключевые слова: 
kbhowto kbexpertiseinter kbinfo kbmt KB840817 KbMtru
Переведено с помощью машинного перевода
ВНИМАНИЕ! Перевод данной статьи был выполнен не человеком, а с помощью программы машинного перевода, разработанной корпорацией Майкрософт. Корпорация Майкрософт предлагает вам статьи, переведенные как людьми, так и средствами машинного перевода, чтобы у вас была возможность ознакомиться со статьями базы знаний KB на родном языке. Однако машинный перевод не всегда идеален. Он может содержать смысловые, синтаксические и грамматические ошибки, подобно тому как иностранец делает ошибки, пытаясь говорить на вашем языке. Корпорация Майкрософт не несет ответственности за неточности, ошибки и возможный ущерб, причиненный в результате неправильного перевода или его использования. Корпорация Майкрософт также часто обновляет средства машинного перевода.
Эта статья на английском языке:840817

Отправить отзыв

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com