Research at FourCorners

งานวิจัย

ทีม FourCorners เผยแพร่ผลงานวิจัยด้านเทคโนโลยีกฎหมายไทยอย่างต่อเนื่อง ตั้งแต่การสร้างเบนช์มาร์ก การออกแบบสถาปัตยกรรมข้อมูล ไปจนถึงการปรับแต่งโมเดลภาษาให้ตอบโจทย์ข้อกฎหมายไทยได้อย่างแม่นยำและตรวจสอบได้ ทุกชิ้นงานได้รับการตีพิมพ์ในเวทีระดับนานาชาติด้านการประมวลผลภาษาธรรมชาติ

ผลงานทั้งหมด
8
เวทีตีพิมพ์
4
พรีพรินต์
3

Conference & Workshop

ตีพิมพ์ในงานประชุมวิชาการ

งานวิจัยที่ผ่านการพิจารณาจาก peer-review ครอบคลุมเบนช์มาร์กกฎหมายไทย การเรียงข้อความเชิงโครงสร้าง และการปรับแต่งโมเดลสำหรับงานทางกฎหมายโดยเฉพาะ

ACL IndustryApr 2026

FourCorners: A Production Knowledge Graph Unifying Thailand's Legal System

Pawitsapak Akarajaradwong, Sarana Nutanong, Chompakorn Chaksangchaichot

โดเมนที่ผูกกับเขตอำนาจ เช่น กฎหมาย มักไม่มีรูปแบบข้อมูลที่เครื่องอ่านได้และเป็นมาตรฐาน ทำให้ต้องมีโครงสร้างพื้นฐานข้อมูลที่แข็งแรงก่อนนำไปต่อยอด เราจึงนำเสนอ ThLexGraph กราฟความรู้เชิงเวลา (temporal knowledge graph) ตัวแรกที่รวมข้อมูลกฎหมายไทยไว้ในที่เดียว ครอบคลุมกฎหมาย 3,840 ฉบับ (6,273 เวอร์ชัน) และคำพิพากษาฎีกา 87,394 คดี อัปเดตทุกวัน กราฟนี้เก็บลำดับชั้น เวอร์ชันตามเวลา การอ้างอิงระหว่างฉบับ และลำดับมาตรา ซึ่งทั้งหมดสกัดมาจากเอกสารทางการที่ไม่มีโครงสร้างมาก่อน การทดสอบ 5 รูปแบบบน NitiBench-Tax ชี้ชัดว่าโครงสร้างข้อมูลคือตัวแปรหลัก โดยการสืบค้นผ่านกราฟทำคะแนน Citation F1 ได้ 0.812 เทียบกับการค้นเว็บแบบมืออาชีพที่ 0.666 และเวกเตอร์แบบแบนที่ 0.685 ทั้งที่ค้นจากคลังที่ใหญ่กว่า 53 เท่า

EMNLP MainNov 2025

NitiBench: Benchmarking LLM Frameworks on Thai Legal Question Answering Capabilities

Pawitsapak Akarajaradwong, Pirat Pothavorn, Chompakorn Chaksangchaichot et al.

เรานำเสนอเบนช์มาร์กสำหรับประเมินโมเดลภาษาในงานถาม-ตอบกฎหมายไทย พร้อมชุดข้อมูล 2 ชุดที่ครอบคลุมกฎหมายการเงินและคำวินิจฉัยภาษีไทย รวมถึงเมตริกการประเมินเฉพาะทาง เราเปรียบเทียบแนวทาง retrieval-augmented generation กับโมเดลแบบ long-context พร้อมทดสอบเทคนิคเฉพาะโดเมน เช่น การตัดข้อความตามลำดับชั้นและการเชื่อมโยงการอ้างอิง พบว่าเทคนิคเฉพาะทางให้ผลดีขึ้นเพียงเล็กน้อย ขณะที่ระบบสืบค้นปัจจุบันยังตอบคำถามกฎหมายที่ซับซ้อนได้ไม่ดี และโมเดล long-context ก็มีข้อจำกัดในการตีความกฎหมายอย่างสม่ำเสมอ

NLLP WorkshopNov 2025

Aligning LLMs for Thai Legal Question Answering with Efficient Semantic-Similarity Rewards

Pawitsapak Akarajaradwong, Chompakorn Chaksangchaichot, Pirat Pothavorn et al.

ประสิทธิภาพของระบบ Retrieval-Augmented Generation (RAG) ในงานถาม-ตอบกฎหมายไทยยังมีข้อจำกัด โดยเฉพาะคำถามที่ต้องอาศัยการให้เหตุผลทางกฎหมายที่ซับซ้อน เรานำเสนอแนวทางที่ใช้ทรัพยากรอย่างประหยัด ในการปรับ Large Language Model ให้อ้างอิงกฎหมายแม่นยำขึ้นและตอบได้คุณภาพดีขึ้น ด้วยเทคนิค Group-Relative Policy Optimization (GRPO) โดยใช้ embedding จาก BGE-M3 เป็น reward เชิงความหมายที่ต้นทุนต่ำ ลดต้นทุนการคำนวณได้ถึง 2.5 เท่าเมื่อเทียบกับ reward model ที่ใช้ LLM ผลทดลองบน NitiBench แสดงให้เห็น Citation F1 ที่ดีขึ้นถึง 90% เทียบกับโมเดลตั้งต้น และเมตริกคุณภาพรวมดีขึ้น 31% เทียบกับการทำ instruction tuning

JUST-NLP WorkshopDec 2025

A Budget Recipe for Finetuning a Long-form Legal Summarization Model

Chompakorn Chaksangchaichot, Pawitsapak Akarajaradwong

เรานำเสนอระบบต้นทุนต่ำที่คว้าอันดับ 1 ในงาน JUST-NLP 2025 L-SUMM ซึ่งสรุปคำพิพากษาศาลอินเดียที่ยาวมาก (สูงสุดถึง 857k ตัวอักษร) โดยใช้ GPU 80GB เพียงตัวเดียวและงบประมาณรวมประมาณ $50 ไปป์ไลน์ของเราเริ่มจากการกรองข้อมูลที่ความยาว-สรุปผิดปกติออก จากนั้นทำ LoRA SFT แบบสองขั้นบน Qwen3-4B-Instruct-2507 เพื่อเรียนสไตล์และขยายบริบท แล้วจึงปรับด้วย RLVR โดยใช้ BLEU, ROUGE-2 และ ROUGE-L เป็นรางวัล ผลคือ SFT สองขั้นดีกว่าขั้นเดียว และ RLVR ให้ผลเพิ่มขึ้นมากที่สุด ทำคะแนน 32.71 ภายใน เทียบกับโมเดลตั้งต้น 16.15 และ 29.91 บนลีดเดอร์บอร์ดการทดสอบ

JUST-NLP WorkshopDec 2025

Cold Starts and Hard Cases: A Two-Stage SFT–RLVR Approach for Legal Machine Translation

Pawitsapak Akarajaradwong, Chompakorn Chaksangchaichot

ระบบของเราสำหรับงาน Shared Task ของ JUST-NLP 2025 ด้านการแปลภาษาเครื่องกฎหมายจากอังกฤษเป็นฮินดี เรานำเสนอแนวทางสองขั้นที่เน้นข้อมูลเป็นหลัก เริ่มจากการแบ่งระดับความยากของข้อมูลฝึกฝนเป็นชุดง่ายและชุดยาก ทำ SFT บนชุดง่ายเพื่อสร้าง 'cold start' ที่แข็งแรง แล้วจึงประยุกต์ RLVR เฉพาะบนชุดยาก โดยใช้เมตริกการแปลภาษาเป็นสัญญาณรางวัล กลยุทธ์นี้ให้ผลที่ดีกว่าโมเดล baseline ที่แข็งแกร่งอย่างมีนัยสำคัญในงานแปลกฎหมาย

Preprint & Technical Report

พรีพรินต์และรายงานทางเทคนิค

งานวิจัยที่กำลังเผยแพร่หรืออยู่ระหว่างการ peer-review เพื่อเปิดให้ชุมชนวิจัยทดลองใช้และให้ฟีดแบ็ก

arXivMay 2026

A Two-Phase Stability Study of LLM Judges and Bar Council Examiners on Thai Bar-Exam Free-Form Essays

Pawitsapak Akarajaradwong, Wuttikrai Lertprasertphakorn, Chompakorn Chaksangchaichot et al.

เราตรวจสอบว่า LLM ที่ทำหน้าที่เป็นผู้ตัดสินสามารถจำลองความสม่ำเสมอของผู้เชี่ยวชาญในการประเมินเรียงความกฎหมายได้หรือไม่ โดยใช้ข้อสอบเนติบัณฑิตไทยเป็นวัตถุดิบ ภายใต้โปรโตคอลอินพุตเดียวกัน กรรมการเนติบัณฑิต 3 ท่านและโมเดล LLM 26 ตัวให้คะแนนคำตอบเดียวกัน 15 ชุด เมื่อเกณฑ์ชัดเจน ผู้ตัดสินทั้ง 29 รายเห็นพ้องกัน แต่ในเคสกำกวม 5 ข้อ ผู้ตรวจมนุษย์แบ่งเป็น 2 กลุ่มที่มีเหตุผลของตัวเอง ขณะที่กลุ่ม LLM ไม่ได้แบ่งอย่างสมดุล โดย 22 จาก 26 ตัวให้คะแนนอยู่ในย่าน B/C ที่เป็นที่ถกเถียง และไม่มี LLM ตัวใดในแผงผู้ตัดสิน 26 ตัวที่ตีความตามฝั่งเสียงข้างน้อยของมนุษย์ในกรณีถกเถียงเลย แผงโมเดล 3 ตัวให้ค่า inter-rater reliability สูงกว่ามนุษย์ (α = 0.77 vs 0.36) สะท้อนการเอนเข้าหาคำตอบกลางๆ มากกว่าการแสดงทั้งสองมุมมองอย่างสมดุล

arXivJul 2025

Can Group Relative Policy Optimization Improve Thai Legal Reasoning and Question Answering?

Pawitsapak Akarajaradwong, Chompakorn Chaksangchaichot, Pirat Pothavorn et al.

เราแก้ปัญหาข้อจำกัดของระบบ retrieval-augmented generation ในงานถาม-ตอบกฎหมายไทย ด้วยการนำเสนอแนวทาง Group-Relative Policy Optimization เพื่อเพิ่มความแม่นยำในการอ้างอิงกฎหมายและคุณภาพของคำตอบ โดยใช้ embedding จาก BGE-M3 เป็น reward เชิงความหมายที่ต้นทุนต่ำ ลดค่าใช้จ่ายการคำนวณได้ถึง 2.5 เท่าเมื่อเทียบกับการใช้ LLM เป็นผู้ตัดสิน บนเบนช์มาร์ก NitiBench วิธีของเราทำคะแนน Citation F1 ดีขึ้นอย่างมีนัยสำคัญ และเมตริกคุณภาพรวมดีขึ้น 31% เทียบกับ instruction tuning พร้อมความทนทานที่ดีกว่าในงานให้เหตุผลทางกฎหมายที่ซับซ้อน

arXivFeb 2025

NitiBench: A Comprehensive Study of LLM Framework Capabilities for Thai Legal Question Answering

Pawitsapak Akarajaradwong, Pirat Pothavorn, Chompakorn Chaksangchaichot et al.

เรานำเสนอเบนช์มาร์กพร้อมชุดข้อมูล 2 ชุดสำหรับงานถาม-ตอบกฎหมายไทย พบว่าการแบ่งข้อความตามมาตรา (section-based chunking) ช่วยให้การสืบค้นและประสิทธิภาพรวมดีขึ้นอย่างชัดเจน ขณะที่ระบบสืบค้นปัจจุบันยังตอบคำถามซับซ้อนได้ไม่ดี และโมเดล long-context ทำได้แย่กว่าแนวทาง retrieval-augmented generation เรานำเสนอเมตริกการประเมินเฉพาะทาง และใช้ LLM-as-judge สำหรับตรวจความครอบคลุมและความขัดแย้ง ซึ่งสะท้อนข้อจำกัดของโซลูชัน NLP กฎหมายไทยและเปิดแหล่งข้อมูลสำหรับงานวิจัยต่อยอด

Research Collaboration

ร่วมมือด้านวิจัยกับเรา

ทีม FourCorners ยินดีร่วมงานกับนักวิจัย อาจารย์ และองค์กรที่สนใจเทคโนโลยีกฎหมายไทย ทั้งในรูปแบบการให้คำปรึกษา การทำวิจัยร่วม และการเข้าถึงข้อมูลหรือ AI ของเรา กรอกรายละเอียดด้านล่างเพื่อให้เราเข้าใจหัวข้อและรูปแบบความร่วมมือที่คุณต้องการ