XML למתחילים

ייתכן ששמעת על Extensible Markup Language (XML) ושמעת סיבות רבות לכך שהארגון שלך צריך להשתמש בו. אך מהו XML, בדיוק? מאמר זה מסביר את היסודות של XML – מה הוא ואיך הוא פועל.

במאמר זה

מבט קצר על סימון, סימון ותגיות

אז מה הופך אותו ל- XML?

מילה אודות נתונים מעוצבים היטב

מבט מהיר על סכימות

מבט מהיר על המרות

מבט מהיר ב- XML ב- Microsoft Office System

מבט קצר על סימון, סימון ותגיות

כדי להבין XML, זה עוזר להבין את הרעיון של סימון נתונים. אנשים יצרו מסמכים במשך מאות שנים, וכל עוד הם סימנו מסמכים אלה. לדוגמה, מורים בבית הספר מסימון מסמכי תלמידים כל הזמן. הם אומרים לתלמידים להעביר פיסקאות, להבהיר משפטים, לתקן שגיאות איות, וכך הלאה. סימון מסמך הוא אופן הגדרת המבנה, המשמעות והמראה החזותי של המידע במסמך. אם השתמשת פעם בתכונה 'מעקב אחר שינויים' ב- Microsoft Office Word, השתמשת בצורת סימון ממוחשבת.

במחשוב, "סימון" התפתח גם הוא ל"סימון". סימון הוא תהליך השימוש בקודים הנקראים תגיות (או לעתים אסימונים) כדי להגדיר את המבנה, את המראה החזותי , ו - במקרה של XML - המשמעות של נתונים כלשהם.

קוד ה- HTML עבור מאמר זה הוא דוגמה טובה של סימון מחשב בעבודה. אם תעיין בו (ב- Microsoft Internet Explorer, לחץ באמצעות לחצן העכבר הימני על הדף ולאחר מכן לחץ על הצג מקור),תראה שילוב של טקסט קריא ותגי Hypertext Markup Language (HTML), כגון <p> ו- <h2>. קל לזהות תגיות במסמכי HTML ו- XML מכיוון שהן מוקפות בסוגריים זוויתיים. בקוד המקור של מאמר זה, תגי ה- HTML כוללים מגוון משימות, כגון הגדרת ההתחלה והסיום של כל פיסקה (<p> ... </p>) ולסמן את המיקום של כל תמונה.

אז מה הופך אותו ל- XML?

מסמכי HTML ו- XML מכילים נתונים המוקפים תגיות, אך זה המקום שבו הדמיון בין שתי השפות מסתיים. ב- HTML, התגיות מגדירות את להביט ולרגישות של הנתונים שלך - הכותרות יתונו כאן, הפיסקה מתחילה שם, וכך הלאה. ב- XML התגיות מגדירות את המבנה והמשמעות של הנתונים שלך - מהם הנתונים.

כאשר אתה מתאר את המבנה והמשמעות של הנתונים שלך, ניתן לעשות שימוש חוזר בנתונים אלה במספר דרכים. לדוגמה, אם יש לך בלוק של נתוני מכירות וכל פריט בבלוק מזוהה בבירור, באפשרותך לטעון רק את הפריטים שאתה זקוק להם ב- sales הדוח ולטען פריטים אחרים במסד נתונים של חשבונאות. שים שיטה אחרת, באפשרותך להשתמש במערכת אחת כדי ליצור את הנתונים שלך ולסמן אותם באמצעות תגיות XML ולאחר מכן לעבד נתונים אלה במספר מערכות אחרות, ללא קשר לפלטפורמת החומרה או למערכת ההפעלה. ניידות זו היא הסיבה ש- XML הפך לא אחת מהטכנולוגיות הפופולריות ביותר להחלפת נתונים.

זכור את העובדות הבאות בהמשך העבודה:

  • לא ניתן להשתמש ב- HTML במקום ב- XML. עם זאת, באפשרותך לעטוף את נתוני ה- XML שלך בתיגי HTML ולהציג אותם בדף אינטרנט.

  • HTML מוגבל לערכה מוגדרת מראש של תגיות שכל המשתמשים משתפים.

  • XML מאפשר לך ליצור כל תגית שתצטרך כדי לתאר את הנתונים ואת המבנה של נתונים אלה. לדוגמה, אמור כי עליך לאחסן ולשתף מידע אודות חיות מחמד. באפשרותך ליצור את קוד ה- XML הבא:

    <?xml version="1.0"?>
    <CAT>
      <NAME>Izzy</NAME>
      <BREED>Siamese</BREED>
      <AGE>6</AGE>
      <ALTERED>yes</ALTERED>
      <DECLAWED>no</DECLAWED>
      <LICENSE>Izz138bod</LICENSE>
      <OWNER>Colin Wilcox</OWNER>
    </CAT>
    

באפשרותך לראות שתגיות XML יתאפשרו לך לדעת בדיוק איזה סוג של נתונים אתה מסתכל. לדוגמה, אתה יודע שנתונים אלה כוללים חתול, ואתה יכול למצוא בקלות את שם החתול, גילו, וכך הלאה. היכולת ליצור תגיות המגדירות כמעט כל מבנה נתונים היא מה שהופך את XML ל"ניתן להרחבה".

אך אל תבלבל בין התגיות בדוגמה זו של קוד לתגיות בקובץ HTML. לדוגמה, אם תדביק מבנה XML זה בקובץ HTML ותצפה בקובץ בדפדפן שלך, התוצאות י להיראות כך:

Izzy Siamese 6 yes no Izz138bod Colin Wilcox

הדפדפן מתעלם מהתגיות XML ומציג רק את הנתונים.

מילה אודות נתונים מעוצבים היטב

ייתכן שתשמע מישהו ממחלקת ה- IT שלך מזכיר XML "מעוצב היטב". קובץ XML בנוי היטב תואם לערכה של כללים מחמירים מאוד החלים על XML. אם קובץ אינו תואם לכללים אלה, XML מפסיק לפעול. לדוגמה, בדוגמת הקוד הקודמת, לכל תגית פתיחה יש תגית סוגרת, כך שהדוגמה דבקה באחד הכללים לצורה טובה. אם תסיר תגית ותנסה לפתוח קובץ זה באחת מתוכניות Office, תראה הודעת שגיאה, והתוכנית תעצור אותך משימוש בקובץ.

אין צורך בהכרח לדעת את הכללים ליצירת XML בעל מבנה טוב (למרות שקל להבין אותם), אך עליך לזכור כי באפשרותך לשתף נתוני XML בין תוכניות ומערכות רק אם נתונים אלה נוצרו בצורה טובה. אם אינך יכול לפתוח קובץ XML, רוב הסיכויים שהקובץ אינו מעוצב היטב.

XML הוא גם לא תלוי בפלטפורמה, כלומר שכל תוכנית שנבנתה לשימוש ב- XML יכולה לקרוא ולעבד את נתוני ה- XML שלך, ללא קשר לחומרה או למערכת ההפעלה. לדוגמה, עם תגי ה- XML הנכון, באפשרותך להשתמש בתוכנית שולחן עבודה כדי לפתוח ולעבד עם נתונים ממחשב mainframe. בנוסף, ללא קשר למי יוצר גוף של נתוני XML, באפשרותך לעבוד עם אותם נתונים בכמה תוכניות Office. מאחר שהוא כל כך נייד, XML הפך לא אחת הטכנולוגיות הפופולריות ביותר להחלפת נתונים בין מסדי נתונים ושולחנות עבודה של משתמשים.

XML הנמצא בשימוש של תוכניות אחרות

בנוסף לנתונים מתויגים, נוצרים היטב, מערכות XML משתמשות בדרך כלל בשני רכיבים נוספים: סכימות והמרות. הסעיפים הבאים מסבירים כיצד פועלים רכיבים נוספים אלה.

מבט מהיר על סכימות

אל תיתן לטווח "סכימה" להפחיד אותך. סכימה היא רק קובץ XML המכיל את הכללים עבור מה יכול או לא יכול ל שוכנים בקובץ נתוני XML. קבצי סכימה משתמשים בדרך כלל בסיומת שם הקובץ .xsd, בעוד שקבצי נתוני XML משתמשים בסיומת .xml

סכימות מאפשרות לתוכניות לאמת נתונים. הם מספקים את המסגרת להבניית נתונים ומבטיחים שהיא הגיונית ליוצר ולמשתמשים אחרים. לדוגמה, אם משתמש מזנ נתונים לא חוקיים, כגון טקסט בשדה תאריך, התוכנית יכולה לבקש מהמשתמש להזין את הנתונים הנכונים. כל עוד הנתונים בקובץ XML תואמים לכללים בסכימה ניתנת, כל תוכנית התומכת ב- XML יכולה להשתמש בסכימה זו כדי לקרוא, לפרש ולעבד את הנתונים. לדוגמה, כפי שמוצג באיור הבא, Excel יכול לאמת את <CAT> הנתונים מול סכימת CAT.

סכימות מאפשרות ליישומים לשתף נתוני XML.

סכימות יכולות להיות מורכבות, וללמד אותך כיצד ליצור תרשים זה מעבר להיקף של מאמר זה. (חוץ מזה, סביר להניח שיש לך מחלקת IT שיודעת כיצד לעשות זאת.) עם זאת, זה עוזר לדעת איך סכימות נראים. הסכימה הבאה מגדירה את הכללים עבור <CAT> ... </CAT> תגים.

<xsd:element name="CAT">  
  <xsd:complexType>  
    <xsd:sequence>
      <xsd:element name="NAME" type="xsd:string"/>
      <xsd:element name="BREED" type="xsd:string"/>
      <xsd:element name="AGE" type="xsd:positiveInteger"/>
      <xsd:element name="ALTERED" type="xsd:boolean"/>
      <xsd:element name="DECLAWED" type="xsd:boolean"/>
      <xsd:element name="LICENSE" type="xsd:string"/>
      <xsd:element name="OWNER" type="xsd:string"/>        
    </xsd:sequence>
  </xsd:complexType>
</xsd:element>

אל תדאג לגבי הבנת כל מה במדגם. רק זכור עובדות אלה:

  • פריטי השורה בסכימה לדוגמה נקראים הצהרות. אם אתה זקוק למידע נוסף אודות בעל חיים, כגון הצבע או הסיימון שלו, סביר מאוד שמחלקת ה- IT תוסיף הצהרה לסכימה. באפשרותך לשנות את מערכת ה- XML שלך כאשר צרכי העסק שלך מתפתחים.

  • הצהרות מספקות שליטה עצומה במבנה הנתונים. לדוגמה, הצהרת <xsd:sequence> פירושה שהתיוגים, כגון <NAME> ו- <BREED> , חייבים להתרחש בסדר שהם מפורטים לעיל. הצהרות יכולות גם לשלוט בסוגי הנתונים שמשתמשים יכולים להזין. לדוגמה, הסכימה לעיל דורשת מספר חיובי עבור גיל החתול, וערכים בוליאניים (TRUE או FALSE) עבור התגיות ALTERED ו- DECLAWED.

  • כאשר הנתונים בקובץ XML תואמים לכללים שסופקו על-ידי סכימה, הנתונים האלה הם חוקיים. תהליך בדיקת קובץ נתוני XML מול סכימה נקרא אימות (באופן הגיוני). היתרון הגדול בשימוש בסכימות הוא שהם יכולים לסייע במניעת נתונים פגומים. הם גם עושים את זה קל למצוא נתונים פגומים מכיוון ש- XML מפסיק כאשר הוא נתקל בבעיה.

מבט מהיר על המרות

כפי שהזכרנו קודם לכן, XML מספק גם דרכים רבות עוצמה לשימוש או שימוש חוזר בנתונים. מנגנון ההפעלה מחדש של נתונים נקרא המרת שפת גליון סגנונות מורחבת (XSLT), או פשוט המרה.

אתה (בסדר, מחלקת ה- IT) יכול גם להשתמש בהת המרות כדי להחליף נתונים בין מערכות קצה-קצה, כגון מסדי נתונים. לדוגמה, נגיד שמסד נתונים A מאחסן את נתוני המכירות במבנה טבלה שעובד היטב עבור מחלקת המכירות. מסד נתונים ב' מאחסן את נתוני ההכנסות וההוצאות במבנה טבלה המותאם עבור מחלקת החשבונות. מסד נתונים ב' יכול להשתמש בה המרה כדי לקבל נתונים מ- A ולכתוב נתונים אלה לטבלאות הנכונות.

השילוב של קובץ נתונים, סכימה והצורה מהווה מערכת XML בסיסית. האיור הבא מראה כיצד מערכות כאלה פועלות בדרך כלל. קובץ הנתונים מאומת מול הסכימה ולאחר מכן מעובד במספר דרכים לשימוש על-ידי המרה. במקרה זה, המרה פורסת את הנתונים בטבלה בדף אינטרנט.

מבנה קובץ XML בסיסי עם סכימה והמרה

דוגמת הקוד הבאה מציגה דרך אחת לכתוב המרה. הוא טוען את <CAT> הנתונים לטבלה בדף אינטרנט. שוב, הנקודה של המדגם אינה מראה לך כיצד לכתוב המרה, אלא כדי להציג לך טופס אחד שצורה יכולה לקחת.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0"> 
<TABLE>
  <TR>
    <TH>Name</TH>
    <TH>Breed</TH>
    <TH>Age</TH>
    <TH>Altered</TH>
    <TH>Declawed</TH>    
    <TH>License</TH>
    <TH>Owner</TH>
  </TR>
  <xsl:for-each select="CAT">
  <TR ALIGN="LEFT" VALIGN="TOP">
    <TD>
      <xsl:value-of select="NAME"/>
    </TD>
    <TD>
      <xsl:value-of select="BREED"/>
    </TD>
    <TD>
      <xsl:value-of select="AGE"/>
    </TD>
    <TD>
      <xsl:value-of select="ALTERED"/>
    </TD>
    <TD>
      <xsl:value-of select="DECLAWED"/>
    </TD>
    <TD>
      <xsl:value-of select="LICENSE"/>
    </TD>
    <TD>
      <xsl:value-of select="OWNER"/>
    </TD>
  </TR>
</xsl:for-each>
</TABLE>

דוגמה זו מראה כיצד סוג אחד של המרה עשוי להיראות כאשר הוא מקודד, אך זכור כי באפשרותך פשוט לתאר את מה שאתה צריך מהנתונים באנגלית פשוטה. לדוגמה, באפשרותך לעבור אל מחלקת ה- IT שלך ותן לך לומר שאתה צריך להדפיס את נתוני המכירות עבור אזורים מסוימים עבור השנתיים האחרונות, "ואני זקוק לה כדי להיראות כך". לאחר מכן, מחלקת ה- IT שלך יכולה לכתוב (או לשנות) המרה כדי לעשות משימה זו.

מה שהופך את כל זה לנוחה עוד יותר הוא ש- Microsoft ומספר גדל והולך של ספקים אחרים יוצרים המרות עבור משימות מכל צורה. בעתיד, רוב הסיכויים שתוכל להוריד המרה שמתאים לצרכיך או שתוכל להתאים אותה למטרה שלך. משמעות הדבר היא ש- XML יעלה פחות לשימוש לאורך זמן.

מבט מהיר ב- XML ב- Microsoft Office System

המהדורות המקצועיות של Office מספקות תמיכה מקיפה ב- XML. החל מ- Microsoft Office system 2007, Microsoft Office משתמש בתבניות הקובץ המבוססות על XML, כגון .docx, .xlsx ו- .pptx מאחר ש- XML מאחסן נתונים בתבנית טקסט במקום בתבנית בינארית קניינית, הלקוחות שלך יכולים להגדיר סכימות משלהם ולהשתמש בנתונים שלך בדרכים נוספות, וכל זאת מבלי לשלם תמלוגים. לקבלת מידע נוסף אודות התבניות החדשות, ראה פתיחת תבניות XML והרחבות שמות קבצים. יתרונות אחרים כוללים:

  • גודלי קבצים קטנים יותר. התבנית החדשה משתמשת ב- ZIP ובטכנולוגיות דחיסה אחרות כדי להקטין את גודל הקובץ ב- 75 אחוז בהשוואה לתבניות הבינאריות המשמשות בגירסאות קודמות של Office.

  • שחזור מידע קל יותר ואבטחה גדולה יותר. XML הוא אדם קריא, כך שאם קובץ נפגם, באפשרותך לפתוח את הקובץ ב- Microsoft Notepad או בקורא טקסט אחר ולשחזר לפחות חלק מהמידע שלך. כמו כן, הקבצים החדשים מאובטחים יותר מכיוון שהם אינם יכולים להכיל קוד Visual Basic for Applications (VBA). אם אתה משתמש בתבנית החדשה כדי ליצור תבניות, כל פקדי ActiveX ופקודות המאקרו של VBA שוכנים במקטע נפרד ומאובטח יותר של הקובץ. בנוסף, באפשרותך להשתמש בכלים, כגון מפקח המסמכים, כדי להסיר נתונים אישיים. לקבלת מידע נוסף אודות השימוש במפקח המסמכים, עיין במאמר הסרת נתונים מוסתרים ומידע אישי על-ידי בדיקת מסמכים.

עד כה הכל טוב, אך מה אם יש לך נתוני XML ללא סכימה? תוכניות Office התומכות ב- XML כוללות גישות משלהן שעוזרות לך לעבוד עם הנתונים. לדוגמה, Excel מסיק סכימה אם אתה פותח קובץ XML שאין לו עדיין סכימה. לאחר מכן, Excel מספק לך את האפשרות לטעון נתונים אלה לטבלת XML. באפשרותך להשתמש ברשימות ובטבלאות XML כדי למיין, לסנן או להוסיף חישובים לנתונים.

הפיכת כלי ה- XML לזמינים ב- Office

הכרטיסיה מפתחים אינה מוצגת כברירת מחדל, אך יהיה עליך להוסיף אותה לרצועת הכלים כאשר ברצונך להשתמש בפקודות XML ב- Office.

זקוק לעזרה נוספת?

הרחב את הכישורים שלך
סייר בהדרכה
קבל תכונות חדשות לפני כולם
הצטרף למשתתפי Microsoft insider

האם מידע זה היה שימושי?

תודה על המשוב!

תודה על המשוב! נראה שכדאי לקשר אותך לאחד מנציגי התמיכה של Office.

×