เคยสงสัยไหมว่าทำไมไฟล์เอกสารอย่าง .docx, .xlsx หรือ .pptx ที่เราใช้กันในปัจจุบัน ถึงมีตัว “x” พ่วงท้ายมาด้วย? ตัว x นั้นย่อมาจาก XML ซึ่งเป็นส่วนหนึ่งของมาตรฐานไฟล์ที่เรียกว่า Office Open XML (OOXML) นั่นเอง
Office Open XML คืออะไร?
Office Open XML (OOXML) คือ มาตรฐานรูปแบบไฟล์ที่พัฒนาโดย Microsoft เพื่อใช้สำหรับจัดเก็บข้อมูลเอกสารประเภทต่าง ๆ เช่น ประมวลผลคำ (Word processing), ตารางคำนวณ (Spreadsheets) และการนำเสนอผลงาน (Presentations)
ก่อนปี 2007 Microsoft Office เคยใช้ฟอร์แมตไฟล์แบบ Binary (เช่น .doc, .xls, .ppt) ซึ่งเป็นระบบปิดและยากต่อการที่โปรแกรมอื่นจะนำไปเปิดหรือแก้ไข แต่การมาของ OOXML ทำให้อุตสาหกรรมซอฟต์แวร์เปลี่ยนมาใช้ รูปแบบเปิด (Open Format) ที่เป็นมาตรฐานสากล (ISO/IEC 29500)
โครงสร้างภายใน: ตัวจริงคือ “ไฟล์ซิป”
ความลับที่น่าสนใจของไฟล์ .docx หรือ .xlsx คือ พวกมันไม่ใช่ไฟล์เดี่ยว ๆ แต่เป็นไฟล์ ZIP ที่มัดรวมไฟล์ XML หลาย ๆ ไฟล์เข้าด้วยกัน หากคุณลองเปลี่ยนนามสกุลไฟล์จาก document.docx ให้เป็น document.zip แล้วแตกไฟล์ออก คุณจะพบกับโครงสร้างโฟลเดอร์ที่บรรจุข้อมูลแยกย่อยไว้ เช่น
[Content_Types].xml: ไฟล์ที่บอกว่าในแพ็กเกจนี้มีไฟล์ประเภทไหนอยู่บ้าง_rels/: โฟลเดอร์ที่เก็บความสัมพันธ์ (Relationships) ระหว่างส่วนต่าง ๆ ของเอกสารword/(หรือxl/,ppt/): โฟลเดอร์หลักที่เก็บเนื้อหาจริงเอาไว้ เช่นdocument.xml(เก็บข้อความที่เราพิมพ์)styles.xml(เก็บรูปแบบฟอนต์ สี และขนาด)media/(โฟลเดอร์เก็บรูปภาพทั้งหมดที่ใส่ไว้ในเอกสาร)
เปรียบเทียบความแตกต่าง: แบบเก่า VS แบบใหม่
| คุณสมบัติ | ฟอร์แมตเก่า (Binary: .doc, .xls) | ฟอร์แมตใหม่ (OOXML: .docx, .xlsx) |
| โครงสร้างไฟล์ | เป็นโค้ดฐานสอง (Binary) อ่านยาก | เป็น XML บีบอัดด้วย ZIP โครงสร้างชัดเจน |
| ขนาดไฟล์ | ขนาดใหญ่กว่า | ขนาดเล็กกว่ามาก (ลดลงประมาณ 50-75%) |
| ความเสียหายของไฟล์ | หากไฟล์เสีย มักจะเปิดไม่ได้เลยทั้งไฟล์ | หากเสีย มักจะยังกู้คืนข้อความหรือรูปภาพแยกกันได้ |
| ความเป็นระบบเปิด | ค่อนข้างปิด พัฒนาต่อยอดร่วมกับระบบอื่นยาก | เป็นมาตรฐานเปิด โปรแกรมค่ายอื่น (เช่น OpenOffice, Google Docs) รองรับได้ดี |
ประโยชน์หลักของ Office Open XML
- ขนาดไฟล์ที่เล็กลง: เนื่องจากมีการบีบอัดข้อมูลแบบ ZIP ในตัว ทำให้ประหยัดพื้นที่จัดเก็บและส่งอีเมลได้รวดเร็วขึ้น
- กู้คืนข้อมูลง่ายและปลอดภัยกว่า: หากไฟล์เกิดความเสียหาย โอกาสที่จะสูญเสียข้อมูลทั้งหมดจะน้อยลง เพราะเราสามารถแกะเอาไฟล์รูปภาพหรือข้อความดิบ (Raw text) ออกมาจากโครงสร้าง XML ได้
- ทำงานร่วมกันได้ดี (Interoperability): นักพัฒนาซอฟต์แวร์สามารถเขียนโปรแกรมเพื่อสร้าง แก้ไข หรืออ่านข้อมูลจากไฟล์เอกสารเหล่านี้ได้โดยตรง โดยไม่จำเป็นต้องติดตั้งโปรแกรม Microsoft Office ไว้บนเครื่องเลยด้วยซ้ำ
- ความปลอดภัยทางข้อมูล: ไฟล์ XML ไม่สามารถรันโค้ดอันตรายหรือฝังไวรัสประเภท Macro ข้ามระบบได้ง่ายเหมือนไฟล์ Binary สมัยก่อน (หากต้องการใช้ Macro จะต้องใช้ฟอร์แมตเฉพาะเช่น
.docm)
สรุป
Office Open XML ไม่ได้เป็นเพียงแค่การเปลี่ยนนามสกุลไฟล์ให้ยาวขึ้น แต่เป็นก้าวสำคัญที่เปลี่ยนให้เอกสารออฟฟิศกลายเป็นมาตรฐานสากลที่เปิดกว้าง มีประสิทธิภาพ และปลอดภัยยิ่งขึ้น เป็นจุดเริ่มต้นให้เราเขียนโปรแกรมในการที่จะ export ไฟล์ออกมาเป็น Word, excel ได้ง่ายขึ้น ซึ่งช่วยให้การรับส่งและจัดการข้อมูลในโลกดิจิทัลไร้รอยต่อมาจนถึงทุกวันนี้
อ่านเพิ่มเติม