یک مدل زبانی قدرتمند و متنباز از شرکت چینی 01.AI است که در سال ۲۰۲۵ معرفی شد. این مدل در زمینههای کدنویسی، ریاضیات، استدلال و درک زبان عملکردی در سطح مدلهای بزرگتر دارد.
در ادامه، جزئیات فنی و ویژگیهای کلیدی Yi-1.5 را مرور میکنیم:
🧠 مشخصات فنی Yi-1.5
سازنده: 01.AI
پلتفرم انتشار: Hugging Face⁽¹⁾
نوع مدل: مدل زبانی بزرگ (LLM) بر پایه معماری LLaMA
مجوز استفاده: Apache 2.0 (متنباز و قابل استفاده تجاری)
🚀 ویژگیهای برجسته
پیشپردازش: آموزش مداوم بر پایه نسخه قبلی Yi با استفاده از ۵۰۰ میلیارد توکن باکیفیت
ریزتنظیم (Fine-tuning): روی ۳ میلیون نمونه متنوع برای بهبود توانایی درک دستور، استدلال و کدنویسی
حجم مدل: نسخه اصلی دارای ۳۴ میلیارد پارامتر است (نسخههای ۶B و ۹B نیز موجودند)
طول زمینه (Context Length): پشتیبانی از ۴K، ۱۶K و ۳۲K توکن برای پردازش متون طولانی
تواناییها:
درک زبان طبیعی و استدلال منطقی
پاسخ به دستورات پیچیده
حل مسائل ریاضی و کدنویسی
درک مطلب و استنتاج
📊 عملکرد در بنچمارکها
Yi-1.5-34B-Chat: در بسیاری از آزمونها با مدلهای بزرگتر رقابت میکند یا از آنها پیشی میگیرد.
Yi-1.5-9B-Chat: بهترین عملکرد را در میان مدلهای متنباز همرده خود دارد.
📦 نسخهها و کاربردها
نسخههای چت: مانند Yi-1.5-34B-Chat و
Yi-1.5-9B-Chat برای مکالمه و تعامل طبیعی
نسخههای پایه: مانند Yi-1.5-34B و Yi-1.5-9B برای
استفاده در پروژههای سفارشی
قابل استفاده در: Hugging Face، ModelScope و
WiseModel