ป้ายกำกับ: SemanticSearch

Thesaurus: รูปแบบ SKOS RDF/XML Format สถาปัตยกรรม Semantic Web สากลสำหรับระบบฐานข้อมูลความรู้ชั้นสูงThesaurus: รูปแบบ SKOS RDF/XML Format สถาปัตยกรรม Semantic Web สากลสำหรับระบบฐานข้อมูลความรู้ชั้นสูง

เมื่อคลังคำศัพท์ต้องการขยายขีดความสามารถเพื่อเชื่อมต่อกับระบบภายนอกแบบสากลผ่าน Linked Data หรือระบบ Semantic Search มาตรฐานสากลระบุให้แปลงข้อมูลไปสู่รูปแบบ SKOS (Simple Knowledge Organization System) บนโครงสร้าง RDF/XML ซึ่งได้รับการรับรองโดย W3C รูปแบบนี้จะเปลี่ยนคำศัพท์ทั่วไปให้กลายเป็น “ทรัพยากรสารสนเทศที่มีที่อยู่ระบุตัวตนชัดเจน” (URI/IRI) ทำให้ระบบ Enterprise Search, บ็อตค้นหาของ Google หรือระบบ AI ระดับองค์กร สามารถไต่ตามลิงก์โครงข่ายเพื่อสืบค้นข้อมูลเชิงความหมายที่มีความซับซ้อนได้อย่างเที่ยงตรง 100%


โครงสร้างและไวยากรณ์ (Syntax)

SKOS RDF/XML ใช้โครงสร้างของ XML Schema โดยครอบข้อมูลด้วย xmlns:skos และมองทุกคำศัพท์เป็น <skos:Concept> ความสัมพันธ์ของคำศัพท์จะถูกจัดเก็บในรูปแบบไวยากรณ์ Triple (Subject-Predicate-Object) ผ่านแอตทริบิวต์หลักดังนี้

  • rdf:about : ตัวระบุตำแหน่ง URI ประจำตัวของคำศัพท์นั้น ๆ (Unique Identifier)
  • skos:prefLabel : คำหลักมาตรฐาน (Preferred Term) บังคับระบุแอตทริบิวต์ xml:lang
  • skos:altLabel : คำพ้องความหมาย (Used For) สำหรับใช้ดักคำค้นทางเลือก
  • skos:scopeNote : ข้อความอธิบายขอบเขตความหมาย
  • skos:broader / skos:narrower / skos:related : แท็กระบุลิงก์ความสัมพันธ์ โดยค่าข้างใน (Object) จะต้องอ้างอิงผ่าน rdf:resource ของคำศัพท์ปลายทางเสมอ

ตัวอย่างมาร์กอัปใช้งานจริง

<?xml version="1.0" encoding="utf-8"?>
<rdf:RDF
  xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
  xmlns:skos="http://www.w3.org/2004/02/skos/core#">

  <!-- บล็อกข้อมูลคำศัพท์: Spot Deal -->
  <skos:Concept rdf:about="http://plusmagi.com/thesaurus/spot-deal">
    <skos:prefLabel xml:lang="en">Spot Deal</skos:prefLabel>
    <skos:altLabel xml:lang="th">ธุรกรรมซื้อขายทันที</skos:altLabel>
    <skos:altLabel xml:lang="th">สัญญารายครั้ง</skos:altLabel>
    <skos:altLabel xml:lang="en">Spot Contract</skos:altLabel>
    <skos:scopeNote xml:lang="th">ข้อตกลงในการซื้อขายสินทรัพย์ในราคาตลาดปัจจุบัน ชำระเงินและส่งมอบภายใน 2 วันทำการ</skos:scopeNote>
    
    <!-- ลิงก์เชื่อมโยงความสัมพันธ์ผ่านระบบ URI -->
    <skos:broader rdf:resource="http://plusmagi.com/thesaurus/deal-type"/>
    <skos:related rdf:resource="http://plusmagi.com/thesaurus/fixed-price"/>
    <skos:related rdf:resource="http://plusmagi.com/thesaurus/floating-price"/>
  </skos:Concept>

  <!-- บล็อกข้อมูลคำศัพท์: Deal Type (เพื่อใช้เป็นปลายทางลิงก์ของ Broader) -->
  <skos:Concept rdf:about="http://plusmagi.com/thesaurus/deal-type">
    <skos:prefLabel xml:lang="en">Deal Type</skos:prefLabel>
    <skos:prefLabel xml:lang="th">ประเภทดีล</skos:prefLabel>
    <skos:narrower rdf:resource="http://plusmagi.com/thesaurus/spot-deal"/>
  </skos:Concept>

</rdf:RDF>

ข้อดีและข้อจำกัด

  • ข้อดี: เป็นมาตรฐานสูงสุดระดับสากล สามารถอัปโหลดเข้าโปรแกรมจัดการคลังข้อมูลชั้นนำและฐานข้อมูล Graph Database (Triple Store) ได้ทันที, รองรับการสืบค้นผ่านภาษา SPARQL
  • ข้อจำกัด: โครงสร้าง XML มีความเทอะทะและหนาแน่น (Verbose), ตัวไฟล์อ่านและแก้ไขด้วยมือได้ยาก, ใช้ทรัพยากรระบบในการ Parse ข้อมูลสูงกว่ารูปแบบอื่น

อ่านเพิ่มเติม