مدل‌های هوش مصنوعی Hugging Face کوچک‌ترین راه‌حل‌ها برای تحلیل تصاویر و متن

مدل‌های هوش مصنوعی Hugging Face کوچک‌ترین راه‌حل‌ها برای تحلیل تصاویر و متن
فهرست مطالب

گروهی از توسعه‌دهندگان در پلتفرم هوش مصنوعی Hugging Face از عرضه دو مدل جدید هوش مصنوعی خبر داده‌اند که به ادعای آنها کوچک‌ترین مدل‌های هوش مصنوعی در نوع خود هستند. این مدل‌ها که به نام‌های SmolVLM-256M و SmolVLM-500M شناخته می‌شوند، قادر به تحلیل تصاویر، ویدیوهای کوتاه و متن‌ها هستند.

این مدل‌ها به‌طور ویژه برای اجرا بر روی دستگاه‌های محدود مانند لپ‌تاپ‌هایی با حافظه رم کمتر از ۱ گیگابایت طراحی شده‌اند. تیم Hugging Face اعلام کرده که این مدل‌ها برای توسعه‌دهندگانی که نیاز به پردازش داده‌های حجیم با هزینه کم دارند، بسیار مناسب هستند.

مدل‌های SmolVLM-256M و SmolVLM-500M به ترتیب دارای ۲۵۶ میلیون و ۵۰۰ میلیون پارامتر هستند. پارامترها در مدل‌های هوش مصنوعی معیاری برای توانایی حل مسائل و عملکرد مدل‌ها محسوب می‌شوند. این مدل‌ها توانایی انجام کارهایی مانند توصیف تصاویر، ویدیوهای کوتاه و پاسخ‌گویی به سوالات درباره اسناد PDF و عناصر درون آنها، از جمله متون اسکن شده و نمودارها را دارند.

برای آموزش این مدل‌ها، تیم Hugging Face از The Cauldron، مجموعه‌ای متشکل از ۵۰ دیتاست با کیفیت بالا در زمینه تصویر و متن، و Docmatix، مجموعه‌ای از اسکن‌های فایل همراه با توضیحات دقیق استفاده کرده است. این دیتاست‌ها توسط تیم M4 در Hugging Face توسعه یافته‌اند که به کار بر روی تکنولوژی‌های هوش مصنوعی چندوجهی می‌پردازد.

جالب اینجاست که به گفته تیم توسعه، مدل‌های SmolVLM-256M و SmolVLM-500M در آزمون‌های عملکردی، حتی از مدل بسیار بزرگ‌تر Idefics 80B پیشی گرفته‌اند. این آزمون‌ها شامل AI2D است که توانایی مدل‌ها در تحلیل نمودارهای علمی سطح ابتدایی را مورد سنجش قرار می‌دهد.

این مدل‌های کوچک، علاوه بر در دسترس بودن به صورت آنلاین، از طریق وب‌سایت Hugging Face برای دانلود با مجوز Apache 2.0 نیز عرضه می‌شوند که به این معناست که می‌توان آنها را بدون هیچ‌گونه محدودیتی استفاده کرد.

با این حال، این مدل‌های کوچک، اگرچه به دلیل هزینه کم و قابلیت‌های چندمنظوره خود جذاب هستند، ممکن است دارای نقص‌هایی باشند که در مدل‌های بزرگ‌تر کمتر دیده می‌شود. تحقیقی اخیر از Google DeepMind، Microsoft Research و موسسه Mila در کبک نشان داده که مدل‌های کوچک اغلب در وظایف پیچیده‌تری که نیاز به استدلال دارند، عملکرد کمتری دارند. محققان بر این باورند که این مسئله به دلیل آن است که مدل‌های کوچک بیشتر به شناسایی الگوهای سطحی در داده‌ها پرداخته و در کاربرد آن‌ها در زمینه‌های جدید دچار مشکل می‌شوند.

کد خبر ۲۱۲۰۳۱۱۰۷.۰۲۶

منبع خبر: تک کرانچ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *