iApp
open.iapp
Open iApp
NLU Released Large Language Model Apache-2.0

Chinda LLM 4B: โมเดลภาษาอธิปไตยแบบเปิดของไทย

โมเดลภาษาขนาดใหญ่แบบ open-weight ที่เน้นภาษาไทย มีโหมดคิด (thinking mode) พัฒนาบน Qwen3-4B และปล่อยภายใต้ Apache-2.0

Sizes
4B
Languages
Thai, English
Published
March 19, 2025
Authors
iApp Technology, AIEAT

Chinda LLM 4B คืออะไร#

Chinda LLM 4B คือโมเดลภาษาขนาดใหญ่แบบ open-weight ที่เป็น “โมเดลอธิปไตย” ของไทย พัฒนาโดย iApp Technology ร่วมกับ สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) สร้างบนสถาปัตยกรรม Qwen3-4B และปรับแต่งมาเพื่อภาษาไทยโดยเฉพาะ จึงเข้าใจและสร้างภาษาไทยได้ดี พร้อม โหมดคิด (thinking mode) ที่ให้เหตุผลแบบทีละขั้นสำหรับงานคณิตศาสตร์ ตรรกะ และการเขียนโค้ด ทั้งหมดนี้อยู่ในโมเดลขนาด 4 พันล้านพารามิเตอร์ที่รันเองได้

น้ำหนักของโมเดลเปิดภายใต้สัญญาอนุญาต Apache-2.0 ทุกคนจึงดาวน์โหลด ใช้งาน และนำไป fine-tune ได้อย่างอิสระ ทั้งงานวิจัยและงานจริง

ความสามารถเด่น#

  • เน้นภาษาไทย — ฝึกและปรับแต่งมาเพื่อความเข้าใจและการสร้างภาษาไทยโดยเฉพาะ
  • โหมดคิด — ให้เหตุผลแบบทีละขั้นสำหรับคณิตศาสตร์ โค้ด และตรรกะ
  • บริบทยาว — รองรับสูงสุด 40,960 โทเค็น เพียงพอสำหรับเอกสารภาษาไทยยาว ๆ
  • ประหยัดทรัพยากร — โมเดล 4B รันได้บน GPU ระดับผู้ใช้ทั่วไป (~8 GB) หรือรันในเครื่องผ่าน Ollama / LM Studio / OpenWebUI
  • เปิดและรองรับ OpenAI API — เปิดน้ำหนักภายใต้ Apache-2.0 พร้อม API ที่เข้ากันได้กับ OpenAI สำหรับการเชื่อมต่อแบบทันที

เกณฑ์วัดประสิทธิภาพ#

เมื่อเทียบแบบ head-to-head กับโมเดลภาษาไทยขนาด 4B ที่แข็งอีกตัวอย่าง Typhoon 2.1 Gemma3 4B Chinda LLM 4B นำหน้าทั้งคะแนนเฉลี่ยรวม และเกือบทุกหมวดทั้งการให้เหตุผล โค้ด และข้อสอบภาษาไทย

เกณฑ์วัดภาษาChinda 4BTyphoon 2.1 4B
AIME24อังกฤษ0.5330.100
AIME24ไทย0.1000.000
LiveCodeBenchอังกฤษ0.6650.209
LiveCodeBenchไทย0.1980.144
MATH500อังกฤษ0.9080.702
MATH500ไทย0.6120.566
IFEvalอังกฤษ0.8490.848
IFEvalไทย0.6830.740
ความแม่นยำภาษา (code-switching)ไทย0.9840.992
OpenThaiEvalไทย0.6510.544
เฉลี่ย0.5690.414

ที่มา: ชุดเกณฑ์วัด OpenThaiGPT (2024–2025) ค่ายิ่งสูงยิ่งดี

วิธีใช้งาน#

โหลดโมเดลด้วยไลบรารี Hugging Face Transformers และใช้ chat template:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "iapp/chinda-qwen3-4b"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")

messages = [
    {"role": "user", "content": "สวัสดีครับ ช่วยอธิบายเกี่ยวกับปัญญาประดิษฐ์ให้ฟังหน่อย"}
]
text = tokenizer.apply_chat_template(
    messages, tokenize=False, add_generation_prompt=True
)

inputs = tokenizer(text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens=512, temperature=0.7)
print(tokenizer.decode(outputs[0][inputs.input_ids.shape[-1]:], skip_special_tokens=True))

นอกจากนี้ยังรันในเครื่องได้ผ่าน Ollama, LM Studio และ OpenWebUI และเรียกใช้ผ่าน API ที่เข้ากันได้กับ OpenAI

กรณีการใช้งาน#

  • AI สนทนา — แชตบอตและผู้ช่วยเสมือนภาษาไทยที่เป็นธรรมชาติ
  • การสร้างเนื้อหา — บทความ บทสรุป และข้อความการตลาดภาษาไทย
  • เข้าใจเอกสาร — อ่านและสรุปเอกสารภาษาไทยยาว ๆ
  • การให้เหตุผล — คณิตศาสตร์ ตรรกะ และโค้ดแบบคิดทีละขั้น
  • การศึกษา — ติวและอธิบายเป็นภาษาไทย

ดาวน์โหลดได้แล้ว#

Chinda LLM 4B บน Hugging Face เป็น open weights ภายใต้ Apache-2.0

ใช้โมเดลนี้

ดาวน์โหลด weights แล้วเริ่มใช้งานได้เลย