مایکروسافت مدل زبانی کوچک Phi-2 را معرفی کرد؛ قدرتمندتر از Gemini Nano گوگل

این مدل زبانی کوچک مایکروسافت با 2.7 میلیارد پارامتر، قدرتمندتر از Gemini Nano-2 گوگل و Llama-2 متا است.

مایکروسافت مدل زبانی کوچک Phi-2 را معرفی کرد؛ قدرتمندتر از Gemini Nano گوگل

مایکروسافت از انتشار مدل زبانی کوچک Phi-2 خود با 2.7 میلیارد پارامتر خبر داد. Phi-2 یک مدل متن‌به‌متن هوش مصنوعی است که می‌توان آن را روی یک لپ‌تاپ یا گوشی موبایل اجرا کرد. پیش‌ازاین، مایکروسافت مدل‌های Phi-1 و Ph-1.5 را نیز با 1.3 میلیارد پارامتر منتشر کرده بود. مدل هوش مصنوعی جدید مایکروسافت از Gemini Nano-2 گوگل و Llama-2 متا عملکرد بهتری دارد.

در چند ماه گذشته، مایکروسافت مجموعه‌ای از مدل‌های زبانی کوچک (SLM) به نام Phi را منتشر کرده است. Phi-1 ابتدا با 1.3 میلیارد پارامتر یا اتصال بین نورون‌های مصنوعی منتشر شد و مخصوص کدنویسی پایتون بود. در شهریورماه نیز مایکروسافت ریسرچ مدل Phi-1.5 را با 1.3 میلیارد پارامتر منتشر کرد که با یک منبع داده جدید آموزش دیده بود. با وجود اندازه کوچک، Phi-1.5 عملکردی تقریباً پیشرفته را در مقایسه با سایر مدل‌های با اندازه مشابه ارائه می‌کرد.

براساس بلاگ رسمی مایکروسافت ریسرچ، عملکرد مدل Phi-2 با 2.7 میلیارد پارامتر را می‌توان با سایر مدل‌های بسیار بزرگ‌تر ازجمله مدل Llama 2-7B متا و حتی مدل Mistral-7B با 7 میلیارد پارامتر مقایسه کرد.

مقایسه مدل زبانی کوچک Phi-2 با سایر مدل‌های مشابه

18080

                                                                     بنچمارک‌های مدل زبانی کوچک Phi-2 و سایر مدل‌ها 

چند روز پیش، گوگل مجموعه مدل‌های زبان Gemini را معرفی کرد. Gemini Nano کارآمدترین مدل گوگل است که می‌تواند مستقیماً روی تراشه موبایل اجرا شود. مدل زبانی کوچک Gemini Nano ویژگی‌هایی مانند خلاصه‌سازی متن، پاسخ‌های هوشمند متنی و تصحیح دستور زبان پیشرفته را امکان‌پذیر می‌کند. مدل نانو دو نسخه دارد که نسخه نانو دارای پارامترهای بیشتر است.

به گفته مایکروسافت، مدل جدید Phi-2 به‌رغم اندازه کوچک‌تر، مطابق یا حتی بهتر از Gemini Nano-2 گوگل است. علاوه بر عملکرد بهتر Phi-2 نسبت به Gemini Nano-2، این مدل از مدل‌های Mistral و Llama-2 نیز در اکثر معیارها پیشی می‌گیرد.

بااین‌حال، به‌رغم عملکرد قدرتمند مدل جدید مایکروسافت، Phi-2 محدودیت بزرگی دارد؛ درحال‌حاضر این مدل فقط برای اهداف تحقیقاتی مجوز فعالیت دارد و نمی‌توان برای استفاده تجاری از آن بهره‌مند شد.

منبع: دیجیاتو

 

ارسال نظر