IBM เปิดตัว Granite 4.0 โมเดล AI แบบ Hybrid ลดการใช้หน่วยความจำได้มากกว่า 70%



IBM ประกาศเปิดตัว Granite 4.0 โมเดล AI รุ่นใหม่ที่ใช้สถาปัตยกรรม Hybrid Mamba/Transformer ช่วยลดความต้องการหน่วยความจำอย่างมากโดยยังคงประสิทธิภาพการทำงานไว้ได้ พร้อมเป็นโมเดล Open-source รายแรกที่ได้รับการรับรอง ISO 42001

Credit: IBM

IBM ได้เปิดตัว Granite 4.0 ซึ่งเป็นโมเดล LLM รุ่นใหม่ที่พัฒนาขึ้นโดยใช้สถาปัตยกรรม Hybrid ที่ผสมผสานระหว่าง Mamba-2 และ Transformer ในอัตราส่วน 9:1 ทำให้สามารถลดความต้องการหน่วยความจำ RAM ได้มากกว่า 70% เมื่อเทียบกับโมเดล Transformer แบบดั้งเดิมในขนาดเดียวกัน โดยเฉพาะอย่างยิ่งเมื่อต้องประมวลผล Context ที่ยาวหรือรองรับ Session หลายอันพร้อมกัน ข้อได้เปรียบที่สำคัญคือสามารถทำงานบน GPU ที่มีราคาถูกลงอย่างมาก ช่วยลดต้นทุนในการใช้งานโมเดล AI สำหรับองค์กรได้อย่างมีนัยสำคัญ

Granite 4.0 มาพร้อมกับโมเดลหลายขนาดเพื่อรองรับการใช้งานที่หลากหลาย ได้แก่ Granite-4.0-H-Small แบบ Mixture of Experts (MoE) ขนาด 32B พารามิเตอร์ (ใช้งานจริง 9B), Granite-4.0-H-Tiny แบบ MoE ขนาด 7B พารามิเตอร์ (ใช้งานจริง 1B) และ Granite-4.0-H-Micro แบบ Dense ขนาด 3B พารามิเตอร์ นอกจากนี้ยังมี Granite-4.0-Micro ที่ใช้สถาปัตยกรรม Transformer แบบดั้งเดิมสำหรับแพลตฟอร์มที่ยังไม่รองรับ Hybrid Architecture โมเดลทุกตัวผ่านการฝึกด้วยข้อมูล 22 ล้านล้าน Token ที่คัดสรรมาอย่างดี รองรับ Context Length สูงสุด 512K Token และได้รับการทดสอบประสิทธิภาพที่ 128K Token

ด้านประสิทธิภาพการทำงาน Granite-4.0-H-Small แสดงผลลัพธ์ที่โดดเด่นบน Benchmark สำคัญหลายตัว โดยเฉพาะ IFEval ที่ใช้วัดความสามารถในการปฏิบัติตามคำสั่ง ซึ่งได้คะแนนสูงเป็นอันดับ 2 ในบรรดาโมเดล Open-weight ทั้งหมด รองจากเพียง Llama 4 Maverick ที่มีขนาดใหญ่กว่า 12 เท่า บน Berkeley Function Calling Leaderboard v3 ที่วัดความสามารถในการเรียกใช้ Tool สำหรับ Agentic AI Workflows พบว่า Granite-4.0-H-Small ทำคะแนนได้ทัดเทียมกับโมเดลขนาดใหญ่กว่าหลายเท่า แต่มีต้นทุนการใช้งานที่ต่ำกว่ามาก รวมถึงประสิทธิภาพบน MTRAG Benchmark สำหรับงาน RAG ที่ซับซ้อนก็อยู่ในระดับแนวหน้าเช่นกัน

ในด้านความปลอดภัยและความน่าเชื่อถือ Granite 4.0 เป็นโมเดล Open-source ชุดแรกของโลกที่ได้รับการรับรองมาตรฐาน ISO/IEC 42001:2023 สำหรับระบบจัดการ AI ที่มีความรับผิดชอบ โมเดลทุกตัวมาพร้อมกับลายเซ็นดิจิทัลแบบ Cryptographic เพื่อยืนยันความถูกต้องและแหล่งที่มา IBM ยังร่วมมือกับ HackerOne จัดโปรแกรม Bug Bounty มูลค่าสูงสุด 100,000 ดอลลาร์สำหรับนักวิจัยที่พบช่องโหว่ในโมเดล นอกจากนี้ผู้ใช้งานบน IBM watsonx.ai จะได้รับการคุ้มครองแบบไม่จำกัดวงเงินสำหรับการละเมิดทรัพย์สินทางปัญญาจาก 3rd-party

โมเดล Granite 4.0 พร้อมใช้งานแล้วบนแพลตฟอร์มต่างๆ ทั้ง IBM watsonx.ai, Dell Pro AI Studio, Docker Hub, Hugging Face, Kaggle, LM Studio, NVIDIA NIM, Ollama, OPAQUE และ Replicate โดยใช้ License แบบ Apache 2.0 ที่เปิดกว้างสำหรับการใช้งานเชิงพาณิชย์ รองรับ Framework ยอดนิยมอย่าง vLLM, llama.cpp, MLX และ Hugging Face Transformers รวมถึงมีแผนเปิดตัวโมเดล Reasoning และขนาดเพิ่มเติมภายในสิ้นปี 2025

ที่มา: https://www.ibm.com/new/announcements/ibm-granite-4-0-hyper-efficient-high-performance-hybrid-models

CR:https://www.techtalkthai.com/ibm-launches-granite-4-hybrid-ai-models-reduce-memory-usage-70-percent/
View : 6
เราใช้คุกกี้เพื่อเพิ่มประสิทธิภาพในการให้บริการและปรับปรุงบริการ คุณสามารถเลือกตั้งค่าความยินยอมการใช้คุกกี้ได้ที่ปุ่ม "ตั้งค่าคุกกี้" Privacy Policy    ยอมรับทั้งหมด