Chinda LLM 4B — open.iapp

Chinda LLM 4B คืออะไร#

Chinda LLM 4B คือโมเดลภาษาขนาดใหญ่แบบ open-weight ที่เป็น “โมเดลอธิปไตย” ของไทย พัฒนาโดย iApp Technology ร่วมกับ สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) สร้างบนสถาปัตยกรรม Qwen3-4B และปรับแต่งมาเพื่อภาษาไทยโดยเฉพาะ จึงเข้าใจและสร้างภาษาไทยได้ดี พร้อม โหมดคิด (thinking mode) ที่ให้เหตุผลแบบทีละขั้นสำหรับงานคณิตศาสตร์ ตรรกะ และการเขียนโค้ด ทั้งหมดนี้อยู่ในโมเดลขนาด 4 พันล้านพารามิเตอร์ที่รันเองได้

น้ำหนักของโมเดลเปิดภายใต้สัญญาอนุญาต Apache-2.0 ทุกคนจึงดาวน์โหลด ใช้งาน และนำไป fine-tune ได้อย่างอิสระ ทั้งงานวิจัยและงานจริง

ความสามารถเด่น#

เน้นภาษาไทย — ฝึกและปรับแต่งมาเพื่อความเข้าใจและการสร้างภาษาไทยโดยเฉพาะ
โหมดคิด — ให้เหตุผลแบบทีละขั้นสำหรับคณิตศาสตร์ โค้ด และตรรกะ
บริบทยาว — รองรับสูงสุด 40,960 โทเค็น เพียงพอสำหรับเอกสารภาษาไทยยาว ๆ
ประหยัดทรัพยากร — โมเดล 4B รันได้บน GPU ระดับผู้ใช้ทั่วไป (~8 GB) หรือรันในเครื่องผ่าน Ollama / LM Studio / OpenWebUI
เปิดและรองรับ OpenAI API — เปิดน้ำหนักภายใต้ Apache-2.0 พร้อม API ที่เข้ากันได้กับ OpenAI สำหรับการเชื่อมต่อแบบทันที

เกณฑ์วัดประสิทธิภาพ#

เมื่อเทียบแบบ head-to-head กับโมเดลภาษาไทยขนาด 4B ที่แข็งอีกตัวอย่าง Typhoon 2.1 Gemma3 4B Chinda LLM 4B นำหน้าทั้งคะแนนเฉลี่ยรวม และเกือบทุกหมวดทั้งการให้เหตุผล โค้ด และข้อสอบภาษาไทย

เกณฑ์วัด	ภาษา	Chinda 4B	Typhoon 2.1 4B
AIME24	อังกฤษ	0.533	0.100
AIME24	ไทย	0.100	0.000
LiveCodeBench	อังกฤษ	0.665	0.209
LiveCodeBench	ไทย	0.198	0.144
MATH500	อังกฤษ	0.908	0.702
MATH500	ไทย	0.612	0.566
IFEval	อังกฤษ	0.849	0.848
IFEval	ไทย	0.683	0.740
ความแม่นยำภาษา (code-switching)	ไทย	0.984	0.992
OpenThaiEval	ไทย	0.651	0.544
เฉลี่ย		0.569	0.414

ที่มา: ชุดเกณฑ์วัด OpenThaiGPT (2024–2025) ค่ายิ่งสูงยิ่งดี

วิธีใช้งาน#

โหลดโมเดลด้วยไลบรารี Hugging Face Transformers และใช้ chat template:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "iapp/chinda-qwen3-4b"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")

messages = [
    {"role": "user", "content": "สวัสดีครับ ช่วยอธิบายเกี่ยวกับปัญญาประดิษฐ์ให้ฟังหน่อย"}
]
text = tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)

inputs = tokenizer(text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens=512, temperature=0.7)
print(tokenizer.decode(outputs[0][inputs.input_ids.shape[-1]:], skip_special_tokens=True))

นอกจากนี้ยังรันในเครื่องได้ผ่าน Ollama, LM Studio และ OpenWebUI และเรียกใช้ผ่าน API ที่เข้ากันได้กับ OpenAI

กรณีการใช้งาน#

AI สนทนา — แชตบอตและผู้ช่วยเสมือนภาษาไทยที่เป็นธรรมชาติ
การสร้างเนื้อหา — บทความ บทสรุป และข้อความการตลาดภาษาไทย
เข้าใจเอกสาร — อ่านและสรุปเอกสารภาษาไทยยาว ๆ
การให้เหตุผล — คณิตศาสตร์ ตรรกะ และโค้ดแบบคิดทีละขั้น
การศึกษา — ติวและอธิบายเป็นภาษาไทย

ดาวน์โหลดได้แล้ว#

Chinda LLM 4B บน Hugging Face เป็น open weights ภายใต้ Apache-2.0