گروهی از توسعهدهندگان در پلتفرم هوش مصنوعی Hugging Face از عرضه دو مدل جدید هوش مصنوعی خبر دادهاند که به ادعای آنها کوچکترین مدلهای هوش مصنوعی در نوع خود هستند. این مدلها که به نامهای SmolVLM-256M و SmolVLM-500M شناخته میشوند، قادر به تحلیل تصاویر، ویدیوهای کوتاه و متنها هستند.
این مدلها بهطور ویژه برای اجرا بر روی دستگاههای محدود مانند لپتاپهایی با حافظه رم کمتر از ۱ گیگابایت طراحی شدهاند. تیم Hugging Face اعلام کرده که این مدلها برای توسعهدهندگانی که نیاز به پردازش دادههای حجیم با هزینه کم دارند، بسیار مناسب هستند.
مدلهای SmolVLM-256M و SmolVLM-500M به ترتیب دارای ۲۵۶ میلیون و ۵۰۰ میلیون پارامتر هستند. پارامترها در مدلهای هوش مصنوعی معیاری برای توانایی حل مسائل و عملکرد مدلها محسوب میشوند. این مدلها توانایی انجام کارهایی مانند توصیف تصاویر، ویدیوهای کوتاه و پاسخگویی به سوالات درباره اسناد PDF و عناصر درون آنها، از جمله متون اسکن شده و نمودارها را دارند.
برای آموزش این مدلها، تیم Hugging Face از The Cauldron، مجموعهای متشکل از ۵۰ دیتاست با کیفیت بالا در زمینه تصویر و متن، و Docmatix، مجموعهای از اسکنهای فایل همراه با توضیحات دقیق استفاده کرده است. این دیتاستها توسط تیم M4 در Hugging Face توسعه یافتهاند که به کار بر روی تکنولوژیهای هوش مصنوعی چندوجهی میپردازد.
جالب اینجاست که به گفته تیم توسعه، مدلهای SmolVLM-256M و SmolVLM-500M در آزمونهای عملکردی، حتی از مدل بسیار بزرگتر Idefics 80B پیشی گرفتهاند. این آزمونها شامل AI2D است که توانایی مدلها در تحلیل نمودارهای علمی سطح ابتدایی را مورد سنجش قرار میدهد.
این مدلهای کوچک، علاوه بر در دسترس بودن به صورت آنلاین، از طریق وبسایت Hugging Face برای دانلود با مجوز Apache 2.0 نیز عرضه میشوند که به این معناست که میتوان آنها را بدون هیچگونه محدودیتی استفاده کرد.
با این حال، این مدلهای کوچک، اگرچه به دلیل هزینه کم و قابلیتهای چندمنظوره خود جذاب هستند، ممکن است دارای نقصهایی باشند که در مدلهای بزرگتر کمتر دیده میشود. تحقیقی اخیر از Google DeepMind، Microsoft Research و موسسه Mila در کبک نشان داده که مدلهای کوچک اغلب در وظایف پیچیدهتری که نیاز به استدلال دارند، عملکرد کمتری دارند. محققان بر این باورند که این مسئله به دلیل آن است که مدلهای کوچک بیشتر به شناسایی الگوهای سطحی در دادهها پرداخته و در کاربرد آنها در زمینههای جدید دچار مشکل میشوند.
کد خبر ۲۱۲۰۳۱۱۰۷.۰۲۶
منبع خبر: تک کرانچ