مایکروسافت مدل زبانی کوچک Phi-2 را معرفی کرد؛ قدرتمندتر از Gemini Nano گوگل
این مدل زبانی کوچک مایکروسافت با 2.7 میلیارد پارامتر، قدرتمندتر از Gemini Nano-2 گوگل و Llama-2 متا است.
مایکروسافت از انتشار مدل زبانی کوچک Phi-2 خود با 2.7 میلیارد پارامتر خبر داد. Phi-2 یک مدل متنبهمتن هوش مصنوعی است که میتوان آن را روی یک لپتاپ یا گوشی موبایل اجرا کرد. پیشازاین، مایکروسافت مدلهای Phi-1 و Ph-1.5 را نیز با 1.3 میلیارد پارامتر منتشر کرده بود. مدل هوش مصنوعی جدید مایکروسافت از Gemini Nano-2 گوگل و Llama-2 متا عملکرد بهتری دارد.
در چند ماه گذشته، مایکروسافت مجموعهای از مدلهای زبانی کوچک (SLM) به نام Phi را منتشر کرده است. Phi-1 ابتدا با 1.3 میلیارد پارامتر یا اتصال بین نورونهای مصنوعی منتشر شد و مخصوص کدنویسی پایتون بود. در شهریورماه نیز مایکروسافت ریسرچ مدل Phi-1.5 را با 1.3 میلیارد پارامتر منتشر کرد که با یک منبع داده جدید آموزش دیده بود. با وجود اندازه کوچک، Phi-1.5 عملکردی تقریباً پیشرفته را در مقایسه با سایر مدلهای با اندازه مشابه ارائه میکرد.
براساس بلاگ رسمی مایکروسافت ریسرچ، عملکرد مدل Phi-2 با 2.7 میلیارد پارامتر را میتوان با سایر مدلهای بسیار بزرگتر ازجمله مدل Llama 2-7B متا و حتی مدل Mistral-7B با 7 میلیارد پارامتر مقایسه کرد.
مقایسه مدل زبانی کوچک Phi-2 با سایر مدلهای مشابه
بنچمارکهای مدل زبانی کوچک Phi-2 و سایر مدلها
چند روز پیش، گوگل مجموعه مدلهای زبان Gemini را معرفی کرد. Gemini Nano کارآمدترین مدل گوگل است که میتواند مستقیماً روی تراشه موبایل اجرا شود. مدل زبانی کوچک Gemini Nano ویژگیهایی مانند خلاصهسازی متن، پاسخهای هوشمند متنی و تصحیح دستور زبان پیشرفته را امکانپذیر میکند. مدل نانو دو نسخه دارد که نسخه نانو دارای پارامترهای بیشتر است.
به گفته مایکروسافت، مدل جدید Phi-2 بهرغم اندازه کوچکتر، مطابق یا حتی بهتر از Gemini Nano-2 گوگل است. علاوه بر عملکرد بهتر Phi-2 نسبت به Gemini Nano-2، این مدل از مدلهای Mistral و Llama-2 نیز در اکثر معیارها پیشی میگیرد.
بااینحال، بهرغم عملکرد قدرتمند مدل جدید مایکروسافت، Phi-2 محدودیت بزرگی دارد؛ درحالحاضر این مدل فقط برای اهداف تحقیقاتی مجوز فعالیت دارد و نمیتوان برای استفاده تجاری از آن بهرهمند شد.
منبع: دیجیاتو