หน้าหลัก > คู่มือการใช้งาน

คู่มือการใช้งาน

เนื้อหา

เครื่องมือค้นหาความถี่ (Frequency Tool)

เครื่องมือค้นหาความถี่ หรือ Frequency Tool คือ เครื่องมือสำหรับนับจำนวนคำหรือรูปแบบภาษาที่ปรากฏในคลังข้อมูล เหมาะสำหรับผู้ใช้ที่ต้องการดูว่า คำ คำผสม หรือหน่วยทางภาษาต่าง ๆ ใช้บ่อยเพียงใดตามช่วงเวลาต่าง ๆ หรือตามหนังสือประเภทต่าง ๆ เป็นต้น

วิธีการใช้งานเบื้องต้น
  • 1.) กรอกคำที่ต้องการค้นหาหรือสนใจลงในช่องค้นหา โดยสามารถเลือกรูปแบบการค้นหา
  • • คำค้น – ค้นหาด้วยรูปเขียนปัจจุบัน ระบบจะเสนอรูปเขียนที่เกี่ยวข้องกับคำค้นดังกล่าว
  • • รูปเขียน – ค้นหาโทเค็นทั้งหมดที่สะกดแบบเดียวกับรูปเขียนที่คุณกรอก
  • 2.) เลือกปุ่ม "ตัวกรอง" เพื่อกำหนดเกี่ยวกับช่วงเวลา เกี่ยวกับประเภทหนังสือ หรือเกี่ยวกับผู้สร้างสรรค์ที่ต้องการค้นหา
  • **หากไม่กำหนด ระบบจะค้นหาจากหนังสือและตัวบททั้งหมดภายในคลังข้อมูล**
  • 3.) เลือกปุ่ม "ค้นหา"

ระบบจะแสดงผลลัพธ์ความถี่ของคำที่คุณค้นหา พร้อมแสดงจำนวนครั้งที่พบในแต่ละช่วงเวลาหรือแหล่งข้อมูลที่เลือกไว้

Frequency_Tool_Pic

ในเมนู "ค้นหาจากหนังสือ" ขอบเขตในการค้นหาและการคำนวณจะค้นหาเฉพาะภายในหนังสือและตัวบทที่คุณเลือกเท่านั้น

เครื่องมือค้นหาความถี่ (Frequency Tool)

คำปรากฏร่วม หรือ Collocate Tool คือ เครื่องมือสำหรับสืบดูคำที่มักจะปรากฏร่วมกับคำที่คุณสนใจ ช่วยให้คุณเข้าใจบริบทของคำและวิเคราะห์รูปแบบการใช้ภาษา ตามช่วงเวลาต่าง ๆ หรือตามหนังสือประเภทต่าง ๆ เป็นต้น

วิธีการใช้งานเบื้องต้น
  • 1.) กรอกคำที่ต้องการค้นหาหรือสนใจลงในช่องค้นหา โดยสามารถเลือกรูปแบบการค้นหา
  • • คำค้น – ค้นหาด้วยรูปเขียนปัจจุบัน ระบบจะเสนอรูปเขียนที่เกี่ยวข้องกับคำค้นดังกล่าว
  • • รูปเขียน – ค้นหาโทเค็นทั้งหมดที่สะกดแบบเดียวกับรูปเขียนที่คุณกรอก
  • 2.) กรอกคำที่ต้องการดูว่าปรากฏร่วมกันหรือไม่ ในช่อง "คำปรากฏร่วม" (ถ้ามี)
  • หากถ้าไม่กรอก ระบบจะแสดงคำทั้งหมดที่ปรากฏร่วมกับคำหลักโดยอัตโนมัติ หรือ สามารถใส่ " * " เพื่อแสดงคำปรากฏร่วมทั้งหมดเช่นกัน
  • 3.) กำหนด "ระยะรอบข้าง" (span)
  • เลือกจำนวนคำรอบ ๆ คำค้นที่อนุญาตให้ค้นหาเป็นคำร่วม
  • 4.) เลือกปุ่ม "ตัวกรอง" เพื่อกำหนดเกี่ยวกับช่วงเวลา เกี่ยวกับประเภทหนังสือ หรือเกี่ยวกับผู้สร้างสรรค์ที่ต้องการค้นหา
  • **หากไม่กำหนด ระบบจะค้นหาจากหนังสือและตัวบททั้งหมดภายในคลังข้อมูล**
  • 5.) เลือกปุ่ม "ค้นหา"

ระบบจะแสดงผลลัพธ์ความถี่ของคำที่คุณค้นหา พร้อมแสดงจำนวนครั้งที่พบในแต่ละช่วงเวลาหรือแหล่งข้อมูลที่เลือกไว้

Frequency_Tool_Pic

ในเมนู "ค้นหาจากหนังสือ" ขอบเขตในการค้นหาและการคำนวณจะค้นหาเฉพาะภายในหนังสือและตัวบทที่คุณเลือกเท่านั้น

ศัพท์เฉพาะที่สำคัญในผลลัพธ์

  • • เปอร์เซ็นต์ (%)
  • แสดงร้อยละของการปรากฏร่วมกันระหว่างคำปรากฏร่วม หรือ คำร่วม กับคำที่ค้นหา โดยค่านี้เปรียบเทียบจากความถี่ของคำร่วมที่พบเฉพาะกับคำค้นเทียบ กับความถี่รวมทั้งหมดของคำค้นภายในหนังสือหรือตัวบทนั้น ๆ
  • • MI หรือ Mutual Information
  • ค่าทางสถิติเพื่อวัดระดับความสัมพันธ์ระหว่างคำสองคำ โดยเปรียบเทียบความถี่ของการปรากฏร่วมระหว่างคำทั้งสองกับความถี่ที่คาดว่าจะเกิดขึ้น หากคำ ทั้งสองปรากฏอย่างอิสระจากกันในคลังข้อมูล หากค่า MI สูง อาจบ่งชี้ว่าคำทั้งสองมีแนวโน้มจะปรากฏร่วมกันมากกว่าที่คาดจากความถี่ของแต่ละคำโดยอิสระ และสะท้อนความสัมพันธ์เชิงความหมายหรือการใช้ในบริบทเดียวกัน หากค่า MI ที่ต่ำอาจบ่งชี้ว่าการปรากฏร่วมเป็นเพียงผลจากความบ่อยของคำทั่วไป เช่น คำเชื่อม
  • • ความถี่ทั้งหมด
  • จำนวนครั้งที่ "คำปรากฏร่วม" ปรากฏในบริบทของ "คำค้น" ภายในระยะที่กำหนดทั้งหมด
  • • ความถี่การเกิดร่วม
  • ความถี่รวมของคำปรากฏร่วมที่ปรากฏในคลังข้อมูลทั้งหมด ไม่จำกัดเฉพาะบริบทของคำค้น และใช้เป็นฐานในการคำนวณค่าทางสถิติ เช่น Mutual Information เพื่อเปรียบเทียบกับความถี่ที่คาดการณ์ เป็นต้น

เครื่องมือเปรียบเทียบ (Compare Tool)

เปรียบเทียบ หรือ Compare Tool คือ เครื่องมือสำหรับเปรียบเทียบคำปรากฏร่วมของคำสองคำที่คุณสนใจ เพื่อวิเคราะห์ความแตกต่างในการใช้งานหรือความหมาย และเพื่อช่วยให้เห็นว่าคำใดมีแนวโน้มปรากฏร่วมกับคำอื่นมากกว่า หรือ มีบริบทที่ต่างกันอย่างไร เป็นต้น

วิธีการใช้งานเบื้องต้น
  • 1.) กรอกคำที่ต้องการค้นหาหรือสนใจทั้ง 2 คำ ลงในช่องค้นหาแต่ละช่อง โดยสามารถเลือกรูปแบบการค้นหา
  • • คำค้น – ค้นหาด้วยรูปเขียนปัจจุบัน ระบบจะเสนอรูปเขียนที่เกี่ยวข้องกับคำค้นดังกล่าว
  • • รูปเขียน – ค้นหาโทเค็นทั้งหมดที่สะกดแบบเดียวกับรูปเขียนที่คุณกรอก
  • 2.) กรอกคำที่ต้องการดูว่าปรากฏร่วมกันหรือไม่ ในช่อง "คำปรากฏร่วม" (ถ้ามี)
  • หากถ้าไม่กรอก ระบบจะแสดงคำทั้งหมดที่ปรากฏร่วมกับคำหลักโดยอัตโนมัติ หรือ สามารถใส่ " * " เพื่อแสดงคำปรากฏร่วมทั้งหมดเช่นกัน
  • 3.) กำหนด "ระยะรอบข้าง" (span)
  • เลือกจำนวนคำรอบ ๆ คำค้นที่อนุญาตให้ค้นหาเป็นคำร่วม
  • 4.) เลือกปุ่ม "ตัวกรอง" เพื่อกำหนดเกี่ยวกับช่วงเวลา เกี่ยวกับประเภทหนังสือ หรือเกี่ยวกับผู้สร้างสรรค์ที่ต้องการค้นหา
  • **หากไม่กำหนด ระบบจะค้นหาจากหนังสือและตัวบททั้งหมดภายในคลังข้อมูล**
  • 5.) เลือกปุ่ม "ค้นหา"

ระบบจะแสดงตารางรายการคำทั้งหมดที่ปรากฏร่วมกับคำที่ 1 เปรียบเทียบกับคำค้นที่ 2 ที่คุณค้นหา หรือ อัตราการปรากฏร่วมกับคำค้น กรณีที่กรอก "คำปรากฏร่วม"

Frequency_Tool_Pic

ในเมนู "ค้นหาจากหนังสือ" ขอบเขตในการค้นหาและการคำนวณจะค้นหาเฉพาะภายในหนังสือและตัวบทที่คุณเลือกเท่านั้น

ศัพท์เฉพาะที่สำคัญในผลลัพธ์

  • • ความถี่ร่วมกับคำที่ 1 และ ความถี่ร่วมกับคำที่ 2
  • หมายถึง จำนวนครั้งที่คำปรากฏร่วมกับคำค้นแต่ละคำ
  • • ความถี่ร่วมกับคำที่ 1 หมายถึง จำนวนครั้งที่คำปรากฏร่วมเกิดร่วมกับคำค้นที่ 1
  • • ความถี่ร่วมกับคำที่ 2 หมายถึง จำนวนครั้งที่คำปรากฏร่วมเกิดร่วมกับคำค้นที่ 2
  • • สัดส่วน
  • หมายถึง อัตราส่วนของความถี่คำปรากฏร่วมระหว่างคำที่ 1 และคำที่ 2 โดยใช้สูตร
  • • ตารางคำที่ 1 : ความถี่คำที่ 1/ความถี่คำที่ 2
  • • ตารางคำที่ 2 : ความถี่คำที่ 2/ความถี่คำที่ 1

ในกรณีที่ความถี่ของคำใดคำหนึ่งเป็นศูนย์ ระบบจะหารด้วยค่า 0.5 แทน เพื่อป้องกันการหาค่าไม่ได้

  • • MI หรือ Mutual Information
  • ค่าทางสถิติเพื่อวัดระดับความสัมพันธ์ระหว่างคำสองคำ โดยเปรียบเทียบความถี่ของการปรากฏร่วมระหว่างคำทั้งสองกับความถี่ที่คาดว่าจะเกิดขึ้น หากคำ ทั้งสองปรากฏอย่างอิสระจากกันในคลังข้อมูล หากค่า MI สูง อาจบ่งชี้ว่าคำทั้งสองมีแนวโน้มจะปรากฏร่วมกันมากกว่าที่คาดจากความถี่ของแต่ละคำโดยอิสระ และสะท้อนความสัมพันธ์เชิงความหมายหรือการใช้ในบริบทเดียวกัน หากค่า MI ที่ต่ำอาจบ่งชี้ว่าการปรากฏร่วมเป็นเพียงผลจากความบ่อยของคำทั่วไป เช่น คำเชื่อม

เครื่องมือสร้างรายการคำ (Word List Tool)

รายการคำ หรือ Word List Tool คือ เครื่องมือที่แสดงคำทั้งหมดที่ปรากฏภายในหนังสือหรือตัวบทที่คุณเลือก พร้อมด้วยความถี่ของแต่ละคำ เพื่อช่วยวิเคราะห์คำที่มีความถี่สูงสุดหรือต่ำสุดในตัวบท หรือ ระบุคำที่อาจเป็นลักษณะเฉพาะของหนังสือหรือตัวบทนั้น ๆ เป็นต้น

วิธีการใช้งานเบื้องต้น
  • 1.) เลือกหนังสือที่คุณสนใจจากเมนู "ค้นหาจากหนังสือ"
  • 2.) เลือกตัวบทที่ต้องการใช้ในการค้นหา
  • 3.) เลือก "รูปแบบการเรียงลำดับผลลัพธ์" ตามต้องการ
  • 4.) เลือกปุ่ม "ค้นหา"
  • ระบบจะแสดงตารางรายการคำและความถี่ของคำภายในหนังสือหรือตัวบทนั้น ๆ

    Frequency_Tool_Pic Frequency_Tool_Pic

    ศัพท์เฉพาะที่สำคัญในผลลัพธ์

    • • เปอร์เซ็นต์ (%)
    • แสดงร้อยละของการปรากฏร่วมกันระหว่างคำปรากฏร่วม หรือ คำร่วม กับคำที่ค้นหา โดยค่านี้เปรียบเทียบจากความถี่ของคำร่วมที่พบเฉพาะกับคำค้นเทียบ กับความถี่รวมทั้งหมดของคำค้นภายในหนังสือหรือตัวบทนั้น ๆ

คำหลักในบริบท (Keyword in Context: KWIC)

คำหลักในบริบท หรือ Keyword in Context (KWIC) คือ การแสดงผลการค้นหาของคำค้นพร้อมบริบท (ตัวอย่างคำ) โดยรอบที่ปรากฏในคลังข้อมูล โดยจัดคำค้น ให้อยู่กึ่งกลางของบรรทัดและแสดงคำที่อยู่ด้านซ้ายและขวาของคำค้น สามารถเข้าถึงได้โดยการกดเลือกตัวเลขในช่องความถี่ที่คุณสนใจ นอกจากนี้ คุณสามารถกดที่ รหัสตัวบท เพื่อดูบริบทโดยย่อเพิ่มเติมจากผลการค้นหาดังกล่าว

Frequency_Tool_Pic

การตั้งค่าการค้นหาอื่น ๆ

รูปแบบการค้นหา

ประกอบด้วย 2 รูปแบบ คือ คำค้น และ รูปคำ

  • • คำค้น : กรอกคำที่คุณสนใจด้วยรูปเขียนปัจจุบัน ระบบแสดงรูปเขียนที่รวมอยู่ในการค้นหา เพื่อครอบคลุมและแก้ปัญหาเรื่องไม่สามารถค้นคำได้เมื่อ คำที่สนใจสะกดต่างกันตามยุคสมัย
  • • รูปคำ : กรอกรูปเขียนที่คุณสนใจ ระบบจะค้นหาโทเค็นทั้งหมดที่สะกดแบบเดียวกับรูปเขียนที่คุณกรอก

หมายเหตุ : แม้ว่าทั้งสองรูปแบบจะดูแตกต่างกัน แต่ระบบจะให้ผลลัพธ์เหมือนกันหากกรอกรูปเขียนตรงกัน การแยกรูปแบบการค้นหาออกเป็น 2 ทางเลือกมีไว้เพื่ออำนวยความสะดวกให้กับผู้ใช้ที่อาจเริ่มจาก "คำปัจจุบัน" หรือ "รูปเขียน" ตามความถนัดและเป้าหมายการใช้งาน

รูปแบบการแสดงผล

ประกอบด้วยการแสดงผล 2 รูปแบบ คือ ความถี่ดิบ และ ต่อพัน

  • • ความถี่ดิบ (Raw frequecy) คือ จำนวนความถี่ของคำค้นที่ปรากฏจริงในคลังข้อมูล
  • • ต่อพัน หรือ ความถี่ต่อพัน (Frequency per mille: %) คือ จำนวนความถี่ของคำค้นที่ปรากฏในคลังข้อมูลโดยผ่านการทำให้เป็นปรกติ (Normalization) คำนวณตามสูตร
ความถี่ต่อพัน (%) =
ความถี่ดิบ
จำนวนคำทั้งหมดในคลัง หรือ จำนวนคำทั้งหมดในช่วงหนึ่ง ๆ
× 1,000

คัดข้อมูล

คัดข้อมูล คือ ตัวกรองประเภทหนึ่ง โดยจะคัดหนังสือหรือตัวบทที่มีข้อมูลหนังสือประเภท "ไม่ทราบ" ออกจากการค้นหา ซึ่งได้แก่

  • • ไม่ทราบปีพุทธศักราชที่แต่ง
  • • ไม่ทราบยุคที่แต่ง
  • • ไม่ทราบเพศผู้แต่ง

ความถี่ขั้นต่ำ

ความถี่ขั้นต่ำ หมายถึง จำนวนความถี่ดิบต่ำสุดที่ระบบใช้เป็นเกณฑ์ในการแสดงผลหรือในการคำนวณเพื่อวิเคราะห์ข้อมูลในคลังข้อมูล โดยหากคำใดมีความถี่ดิบต่ำกว่า ค่าที่กำหนดไว้ ระบบจะไม่นำคำนั้นเข้าสู่กระบวนการวิเคราะห์หรือแสดงในผลลัพธ์

การตั้งค่าความถี่ขั้นต่ำช่วยลดการรบกวนจากข้อมูลที่ไม่สำคัญ เช่น คำที่ปรากฏเพียงครั้งเดียวหรือไม่สอดคล้องกับการวิเคราะห์เชิงสถิติ ซึ่งมักไม่ส่งผลอย่างมีนัยสำคัญ ในการวิเคราะห์คำปรากฏร่วมหรือความถี่

คำสำคัญอื่น ๆ

"หนังสือ" และ "ตัวบท"

  • • หนังสือ หมายถึง ตัวเอกสารที่นำมาแปลงเป็นข้อมูลดิจิทัล ประกอบด้วยหน่วยย่อย คือ ตัวบท
  • • ตัวบท หมายถึง บทต่าง ๆ ของหนังสือ เช่น คำนำ เนื้อหา และบรรณานุกรม

ข้อมูลหนังสือ

ข้อมูลหนังสือ หมายถึง ข้อมูลกำกับเกี่ยวกับรายละเอียดของหนังสือ ได้แก่

  • • ปีพุทธศักราชที่แต่ง
  • • ยุคสมัยที่แต่ง
  • • ลักษณะงานเขียน
  • • ประเภทเนื้อหา
  • • ประเภทเอกสาร
  • • ชื่อผู้สร้างสรรค์
  • • เพศผู้สร้างสรรค์
  • • ประเภทผู้สร้างสรรค์
  • • ชื่อต้นฉบับ
  • • ปีที่พิมพ์
  • • ผู้เผยแพร่
  • • ชื่อบรรณาธิการ
  • • ข้อมูลสำคัญอื่น ๆ

ทั้งนี้ คลังข้อมูลภาษาไทยเชิงประวัติแห่งชาติ จะกำกับข้อมูลหนังสือในระดับของตัวบทเท่านั้น