ป้ายกำกับ: Ontology

รู้จัก MARC 21: ภาษาลับหลังบ้านที่ทำให้ระบบห้องสมุดทั่วโลกคุยกันรู้เรื่องรู้จัก MARC 21: ภาษาลับหลังบ้านที่ทำให้ระบบห้องสมุดทั่วโลกคุยกันรู้เรื่อง

เวลาเราเดินเข้าห้องสมุดแล้วคีย์ค้นหาหนังสือสักเล่มในระบบสืบค้นออนไลน์ (OPAC) ไม่ว่าจะเป็นชื่อผู้แต่ง ชื่อเรื่อง หรือสำนักพิมพ์ ระบบจะแสดงผลข้อมูลออกมาอย่างเป็นระเบียบภายในเสี้ยววินาที ทราบไหมครับว่าเบื้องหลังความแม่นยำนั้น มีมาตรฐานระดับโลกที่มีอายุเก่าแก่แต่ยังทรงอิทธิพลอย่าง MARC 21 ทำหน้าที่เป็นโครงกระดูกเชื่อมโยงข้อมูลทั้งหมดอยู่


🏛️ MARC 21 คืออะไร?

MARC ย่อมาจาก MAchine-Readable Cataloging (การลงรายการที่คอมพิวเตอร์อ่านได้) ส่วนเลข 21 หมายถึงการปรับปรุงมาตรฐานเพื่อก้าวเข้าสู่คริสต์ศตวรรษที่ 21 (เป็นการรวมกันของมาตรฐาน USMARC ของอเมริกา และ CANMARC ของแคนาดา)

พูดให้เข้าใจง่ายที่สุด MARC 21 ไม่ใช่ซอฟต์แวร์ แต่เป็น “ไวยากรณ์หรือมาร์กอัป (Markup)” ที่กำหนดว่า ข้อมูลบรรณานุกรมของหนังสือ 1 เล่ม (หรือสื่อใด ๆ ) จะต้องถูกจัดเก็บในรูปแบบ Text-based อย่างไร เพื่อให้คอมพิวเตอร์ต่างระบบ ต่างค่าย สามารถอ่าน แปลผล และแลกเปลี่ยนข้อมูลกันได้โดยไม่ผิดเพี้ยน


🧬 โครงสร้างหลักของ MARC 21

หากเราเปิดดูไฟล์ดิบของ MARC 21 (มักบันทึกเป็นนามสกุล .mrc หรือ .dat) มนุษย์ทั่วไปอาจจะมึนตึ้บ เพราะมันจะเต็มไปด้วยตัวเลข 3 หลัก และสัญลักษณ์แปลก ๆ โครงสร้างหลักของมันถูกแบ่งออกเป็น 3 ส่วนสำคัญ

เลขระบุประเภทข้อมูล (Tags)

MARC 21 จะใช้ตัวเลข 3 หลัก (000-999) เป็นตัวบอกคอมพิวเตอร์ว่า ข้อความที่กำลังจะตามมาคือข้อมูลอะไร ตัวเลขที่คนทำงานห้องสมุดคุ้นเคยกันดี เช่น

  • Tag 245: ชื่อเรื่อง (Title Statement)
  • Tag 100: ชื่อผู้แต่งหลัก (Main Entry – Personal Name)
  • Tag 260 หรือ 264: ข้อมูลการพิมพ์ (สำนักพิมพ์, ปีที่พิมพ์)
  • Tag 020: เลข ISBN

รหัสกำหนดลักษณะข้อมูล (Indicators)

เป็นตัวเลข 2 ตำแหน่งที่ตามหลัง Tag ทันที ทำหน้าที่บอกคอมพิวเตอร์ว่าจะให้ “ประมวลผล” หรือ “แสดงผล” ข้อมูลในฟิลด์นั้นอย่างไร

ตัวอย่างเช่น: ใน Tag 245 (ชื่อเรื่อง) ถ้าตัวชี้ตำแหน่งที่สองเป็นเลข 4 หมายความว่าเวลาคอมพิวเตอร์จะเรียงลำดับอักษร ให้ข้ามคำนำหน้านามภาษาอังกฤษ 4 ตัวแรกไป (เช่น คำว่า “The “)

รหัสฟิลด์ย่อย (Subfields)

ภายใน Tag หนึ่ง ๆ ยังมีข้อมูลย่อย ๆ ซ่อนอยู่ MARC 21 จะใช้สัญลักษณ์ (มักใช้เครื่องหมาย $ หรือ ǂ) ตามด้วยตัวอักษรเพื่อแยกข้อมูล

ตัวอย่างเช่น: ใน Tag 245 (ชื่อเรื่อง)

  • $a = ชื่อเรื่องหลัก
  • $b = ชื่อเรื่องย่อย
  • $c = ข้อความแสดงความรับผิดชอบ (ชื่อผู้แต่งบนหน้าปก)

📝 ตัวอย่างการเขียน MARC 21 แบบดั้งเดิม

สมมติว่าเราต้องการลงรายการหนังสือเรื่อง “แฮร์รี่ พอตเตอร์ กับศิลาอาถรรพ์” เขียนโดย J.K. Rowling ข้อมูลหลังบ้านของ MARC 21 จะถูกเขียนในรูปแบบ Text-based หน้าตาประมาณนี้ครับ

100 1_ $a Rowling, J. K., $e author.
245 10 $a แฮร์รี่ พอตเตอร์ กับศิลาอาถรรพ์ / $c เจ.เค. โรว์ลิ่ง ; เจน จิรา, แปล.
260 __ $a กรุงเทพฯ : $b นานมีบุ๊คส์ พับลิเคชั่นส์, $c 2543.
300 __ $a 384 หน้า : $b ภาพประกอบ ; $c 21 ซม.
  • มนุษย์อ่าน: จะเข้าใจทันทีว่านี่คือหนังสือแฮร์รี่ พอตเตอร์ พิมพ์ปี 2543 หนา 384 หน้า
  • คอมพิวเตอร์อ่าน: จะรู้ทันทีว่าคำว่า “Rowling, J. K.” ใน 100 $a ต้องถูกนำไปใส่ในดัชนีรายชื่อผู้แต่ง เพื่อเวลาผู้ใช้ค้นหาคำว่า “Rowling” หนังสือเล่มนี้จะได้เด้งขึ้นมา

🚀 ทำไม MARC 21 ถึงยังสำคัญในยุคปัจจุบัน?

แม้ว่าปัจจุบันเราจะมีเทคโนโลยีใหม่อย่าง JSON, XML หรือโปรโตคอลล้ำๆ แต่ MARC 21 ก็ยังไม่หายไปไหน ด้วยเหตุผลหลักๆ คือ

  • การแลกเปลี่ยนข้อมูลระดับโลก (Data Sharing): ถ้าห้องสมุดมหาวิทยาลัย A ซื้อหนังสือต่างประเทศมา 1,000 เล่ม แทนที่จะต้องมานั่งพิมพ์ข้อมูลเองทีละเล่ม บรรณารักษ์สามารถไปดาวน์โหลดไฟล์ MARC 21 จาก Library of Congress (หอสมุดรัฐสภาอเมริกัน) หรือฐานข้อมูลร่วมอย่าง OCLC Worldcat มา Import เข้า Flint ระบบตัวเองได้ภายในไม่กี่นาที
  • ความละเอียดขั้นสูง: ไม่มีมาตรฐานมาร์กอัปไหนที่ออกแบบมาเพื่อ “หนังสือและสื่อสิ่งพิมพ์” ได้ละเอียดเท่า MARC อีกแล้ว มันสามารถระบุได้กระทั่งว่า หนังสือเล่มนี้มีแผนที่แนบท้ายไหม เป็นวิทยานิพนธ์หรือไม่ หรือเป็นหนังสืออักษรเบรลล์สำหรับผู้พิการทางสายตา
  • Legacy Data ขนาดมหาศาล: ข้อมูลหนังสือหลายพันล้านเล่มทั่วโลกถูกบันทึกอยู่ในรูปแบบ MARC 21 มานานหลายสิบปี การจะล้างระบบแล้วเปลี่ยนใหม่ทั้งหมดเป็นเรื่องที่ต้องใช้ทุนและเวลามหาศาล

🔮 อนาคตของ MARC 21

แม้จะแข็งแกร่ง แต่อติตของ MARC 21 ที่ถูกออกแบบมาตั้งแต่ยุคคอมพิวเตอร์แถบบันทึกแม่เหล็ก (Magnetic Tape) ก็เริ่มพบข้อจำกัดเมื่อเจอกับโลกยุค Web 3.0 หรือ Semantic Web ที่เน้นการเชื่อมโยงข้อมูลแบบโครงข่าย (Linked Data)

ปัจจุบัน วงการสารสนเทศกำลังอยู่ในช่วงเปลี่ยนผ่านจาก MARC 21 ไปสู่มาตรฐานใหม่ที่ชื่อว่า BIBFRAME (Bibliographic Framework) ซึ่งเปลี่ยนจากโครงสร้าง Tag ตัวเลขแบบเดิม มาเป็นรูปแบบออนโทโลยี (Ontology) ที่ใช้มาตรฐานคอมพิวเตอร์ยุคใหม่อย่าง RDF และสัญกรณ์พวก XML/JSON-LD เพื่อให้ข้อมูลของห้องสมุดสามารถลิงก์กับข้อมูลอื่น ๆ บนโลกอินเทอร์เน็ต (เช่น Wikipedia หรือ Google) ได้อย่างไร้รอยต่อ


สรุป

MARC 21 คือผู้อยู่เบื้องหลังความสำเร็จในการจัดระเบียบความรู้ของมนุษยชาติในยุคดิจิทัล ถึงแม้ในอนาคตมันอาจจะถูกแปลงร่างไปอยู่ในรูปแบบใหม่อย่าง BIBFRAME แต่หลักการคิดในการจำแนกองค์ประกอบของสื่ออย่างละเอียดของ MARC ก็ยังคงเป็นรากฐานสำคัญที่คนทำงานสายข้อมูลปฏิเสธไม่ได้ครับ


อ่านเพิ่มเติม