Select the product you need help with
Comment faire pour extraire des informations de fichiers Office à l'aide de formats de fichier et de schémas Office.Numéro d'article: 840817 - Voir les produits auxquels s'applique cet article SommaireRésuméSi vous devez extraire des informations de classeurs Microsoft Excel, de présentations Microsoft PowerPoint, ou de documents Microsoft Word, vous pouvez utiliser plusieurs méthodes. Ces méthodes incluent des appels de programmation API, des formats XML ouverts Office, XML, RTF ou HTML. Si ces méthodes ne répondent pas à vos besoins, vous pouvez être éligibles pour la participation à un programme de format de fichier non soumis à redevance et la réception d'une documentation technique pour certains formats de fichier binaires Microsoft Office. INTRODUCTIONCet article décrit plusieurs techniques disponibles pour l'extraction d'informations de classeurs Excel, de présentations PowerPoint et de documents Word. Plus d'informationsFormats XML ouverts OfficeLes formats XML ouverts Office sont conçus de sorte que plusieurs applications sur plusieurs plateformes peuvent créer et utiliser des documents au format XML ouvert Office. Grâce au format XML ouvert Office, vous pouvez manipuler directement le format de fichier. Vous n'avez pas à utiliser des applications Microsoft Office pour créer ou utiliser des fichiers.Avantages du format XML ouvert Office
http://www.ecma-international.org/news/TC45_current_work/TC45-2006-50_final_draft.htm Vous pouvez également vous reporter au site Web OpenXMLDeveloper.org à l'adresse suivante (en anglais) :
(http://www.ecma-international.org/news/TC45_current_work/TC45-2006-50_final_draft.htm)
http://openxmldeveloper.org Les formats XML ouverts Office utilisent les spécifications Open Packaging Conventions pour stocker les informations de fichier XML ouvert Office sur le disque. Pour plus d'informations sur les spécifications Open Packaging Conventions utilisées par XML ouvert Office, consultez la partie 2 « Open Packaging Conventions » du document « Office Open XML v1.0 draft ».
(http://openxmldeveloper.org)
Interfaces de programmation d'applications (API) OfficeLes formats de fichier binaire Office sont conçus pour être accessibles via les interfaces de programmation d'applications (API), au lieu d'une manipulation directe du format de fichier. Étant donné la complexité des formats, la manipulation directe peut provoquer une corruption et est vivement déconseillée.Pour plus d'informations sur les API Office, reportez-vous au site Web de Microsoft à l'adresse suivante (en anglais) : http://msdn2.microsoft.com/en-us/library/aa165081(office.10).aspx Les formats de fichier binaires Office 97-2003 utilisent les API Windows Structured Storage. Les informations spécifiques à Office sont stockées en tant que flux dans ce format plus généralisé. Les éléments courants, par exemple les propriétés de document, sont accessibles via les API Structured Storage et ne requièrent pas d'accès à la documentation du format de fichier binaire Office.
(http://msdn2.microsoft.com/en-us/library/aa165081(office.10).aspx)
Pour plus d'informations sur les API Structured Storage Windows, reportez-vous au site Web de Microsoft à l'adresse suivante (en anglais) : http://msdn2.microsoft.com/en-us/library/aa380369.aspx Le format binaire Microsoft Excel 2007 (* .xlsb) stocke des enregistrements binaires. Ce format utilise les mêmes technologies de composant et de packaging que SpreadsheetML. SpreadsheetML fait partie du format XML ouvert Office.
(http://msdn2.microsoft.com/en-us/library/aa380369.aspx)
Important La lecture ou manipulation directe de la structure peut provoquer une corruption et est vivement déconseillée. XMLXML est un métalangage en texte brut (langage pour la définition des langages de balisage) basé sur Unicode. XML n'est lié à aucun langage de programmation, aucun système d'exploitation ou fournisseur de logiciels. XML offre l'accès à un grand nombre de technologies pour manipuler, structurer, transformer, et interroger des données. Avec l'utilisation grandissante de XML, il est maintenant généralement accepté que XML n'est pas seulement utile pour décrire de nouveaux formats de documents pour le Web, mais il convient également pour décrire des données structurées. Les données structurées peuvent inclure, par exemple, des informations généralement contenues dans les feuilles de calcul, des fichiers de configuration de programme et des protocoles réseau.Microsoft Office inclut une prise en charge des schémas XML. Microsoft gère un programme de gestion des licences pour certains schémas XML Office. Pour en savoir plus sur les schémas XML Office, reportez-vous au site Web de Microsoft à l'adresse suivante pour consulter l'article (en anglais) Microsoft Office System and XML: Bringing XML to the Desktop : http://msdn2.microsoft.com/en-us/library/aa159914(office.11).aspx
(http://msdn2.microsoft.com/en-us/library/aa159914(office.11).aspx)
Format RTF (Rich Text Format)La spécification du format RTF (RTF) est une méthode de codage de texte et de graphiques mis en forme pour un transfert facile entre les programmes. La spécification RTF fournit un format pour les textes et les échange graphiques qui peut être utilisé avec différents périphériques de sortie, environnements d'exploitation et systèmes d'exploitation. RTF utilise le jeu de caractères ANSI (American National Standards Institute), PC-8, Macintosh ou IBM PC pour contrôler la représentation et la mise en forme d'un document, à la fois à l'écran et à l'impression. Avec la spécification RTF, les documents qui sont créés sous différents systèmes d'exploitation et à l'aide de différents logiciels peuvent être transférés entre ces systèmes d'exploitation et ces programmes.Pour plus d'informations sur la façon d'écrire ou de mettre en oeuvre un exemple de lecteur RTF, reportez-vous au site Web de Microsoft à l'adresse suivante, puis tapez RTF Reader (Lecteur RTF) dans la zone Search MSDN For (Rechercher dans MSDN) : http://msdn.microsoft.com
(http://msdn.microsoft.com)
Schéma XML VisioGrâce à la documentation Microsoft et une licence non soumise à redevance, clients et partenaires peuvent exploiter le schéma XML dans son outil de visualisation de diagrammes et de données. La disponibilité du schéma Visio fournit une description complète et conforme à W3C du format de fichier XML (Extensible Markup Language) Visio, ce qui permet aux organisations d'accéder aux informations capturées dans leurs diagrammes Visio et des utilisations avec d'autres programmes activés par XML, tels que les systèmes de gestion de la relation client (CRM) et les systèmes de planification des ressources de l'entreprise (ERP), dans le cadre de leurs processus d'entreprise. Pour obtenir plus d'informations et télécharger ces fonctions, reportez-vous au site Web de Microsoft à l'adresse suivante (en anglais) :http://www.microsoft.com/downloads/details.aspx?FamilyID=fe118952-3547-420a-a412-00a2662442d9
(http://www.microsoft.com/downloads/details.aspx?FamilyID=fe118952-3547-420a-a412-00a2662442d9)
HTMLLes fichiers HTML sont des fichiers texte qui comportent des informations que les utilisateurs vont voir, et des balises qui indiquent des informations de mise en forme sur le mode d'affichage des informations. Vous pouvez utiliser des fichiers HTML pour stocker, distribuer et présenter des documents et des données Office dans un format qui peut être affiché par la plupart des navigateurs Web tout en conservant le contenu riche et les fonctionnalités des documents Office.Remarque Dans Microsoft Excel 2007, le format de fichier HTML n'enregistre pas les fonctionnalités qui sont spécifiques à Excel. En outre, le format HTML ne prend pas en charge ou ne restitue pas toutes les fonctionnalités dans Excel 2007 lorsque vous enregistrez un classeur au format HTML. Pour plus d'informations sur la façon de modifier du HTML, reportez-vous au site Web de Microsoft à l'adresse suivante (en anglais) : http://msdn2.microsoft.com/en-us/library/aa730778(vs.71).aspx Pour plus d'informations sur la gestion du code, du HTML et des fichiers de ressources, consultez le site Web de Microsoft à l'adresse suivante (en anglais) :
(http://msdn2.microsoft.com/en-us/library/aa730778(vs.71).aspx)
http://msdn2.microsoft.com/en-us/library/efc4xwkb(vs.71).aspx
(http://msdn2.microsoft.com/en-us/library/efc4xwkb(vs.71).aspx)
Programmes aux formats de fichier non soumis à redevanceFormats de fichier binaires Microsoft OfficeMicrosoft met à disposition des spécifications de format de fichier binaire .doc, .xls, xlsb et .ppt dans le cadre d'un engagement non soumis à redevance de ne pas poursuivre quiconque souhaite implémenter tout ou partie de ces spécifications dans ses produits. L'implémentation inclut la possibilité d'utiliser la documentation des spécifications à des fins d'analyse et de référence légale.Les formats de fichier Dessin Microsoft Office pour 2007 et Visual Basic pour Applications (VBA) pour 2007 sont également disponibles dans le cadre de ce programme. La documentation qui couvre les spécifications de format de fichier binaire est cumulative et concerne la forme courante des formats de fichier binaire ainsi que les versions antérieures. Les spécifications de format de fichier binaire Office sont disponibles dans le cadre de l'Open Specification Promise. Pour obtenir la documentation, consultez le site Web de Microsoft à l'adresse suivante (en anglais) : http://www.microsoft.com/interop/docs/officebinaryformats.mspx
(http://www.microsoft.com/interop/docs/officebinaryformats.mspx)
PropriétésNuméro d'article: 840817 - Dernière mise à jour: mercredi 30 avril 2008 - Version: 8.1 Les informations contenues dans cet article s'appliquent au(x) produit(s) suivant(s):
L'INFORMATION CONTENUE DANS CE DOCUMENT EST FOURNIE PAR MICROSOFT SANS GARANTIE D'AUCUNE SORTE, EXPLICITE OU IMPLICITE. L'UTILISATEUR ASSUME LE RISQUE DE L'UTILISATION DU CONTENU DE CE DOCUMENT. CE DOCUMENT NE PEUT ETRE REVENDU OU CEDE EN ECHANGE D'UN QUELCONQUE PROFIT. | Traductions disponibles
|


Retour au début








