علی بابا دو مدل هوش مصنوعی با قدرت درک تصویر معرفی کرد

انتشار: 6 شهریور 1402
کد خبر: 212020606-212

علی بابا روز جمعه یک مدل هوش مصنوعی جدید راه اندازی کرد که به گفته این شرکت می تواند تصاویر را درک کند و مکالمات پیچیده تری را نسبت به محصولات قبلی این شرکت انجام دهد.
این غول فناوری چینی گفت که دو مدل جدیدش، Qwen-VL و Qwen-VL-Chat، متن باز خواهند بود – به این معنی که محققان، دانشگاهیان و شرکت‌ها در سراسر جهان می‌توانند از آنها برای ایجاد برنامه‌های هوش مصنوعی خود بدون نیاز به آموزش سیستم‌های خود استفاده کنند. بنابراین در زمان و هزینه صرفه جویی می شود.
علی‌بابا گفت که Qwen-VL می‌تواند به پرسش‌های باز مرتبط با تصاویر مختلف پاسخ دهد و شرح تصاویر را ایجاد کند.
به گفته علی بابا، Qwen-VL-Chat در عین حال «تعامل پیچیده‌تری» را ارائه می‌کند، مانند مقایسه ورودی‌های تصویر متعدد و پاسخ دادن به چندین دور سؤال. برخی از کارهایی که به گفته ی علی بابا Qwen-VL-Chat می تواند انجام دهد شامل نوشتن داستان و ایجاد تصاویر بر اساس عکس هایی که کاربر وارد می کند و همچنین حل معادلات ریاضی نشان داده شده در یک تصویر است.
یکی از مثال‌هایی که علی‌بابا ارائه کرد مربوط به ورودی است که دارای تابلوی بیمارستان به زبان چینی است. هوش مصنوعی می تواند با تفسیر تصویر علامت، به سؤالات مربوط به مکان بخش های بیمارستانی خاص پاسخ دهد.
تاکنون، بسیاری از هوش مصنوعی مولد بر پاسخ به متن متمرکز شده‌اند. آخرین نسخه ChatGPT OpenAI نیز مانند Qwen-VL-Chat توانایی درک تصاویر و پاسخ به متن را دارد.
دو مدل جدید علی‌بابا بر اساس مدل زبان بزرگ این شرکت به نام Tongyi Qianwen ساخته شده‌اند که اوایل امسال عرضه شد.
شرکتی که دفتر مرکزی آن در هانگژو قرار دارد، در این ماه دو مدل هوش مصنوعی دیگر را با منبع باز عرضه کرد. در حالی که علی‌بابا هیچ هزینه‌ای برای صدور مجوز دریافت نمی‌کند، اما توزیع منبع باز به شرکت کمک می‌کند تا کاربران بیشتری را برای مدل هوش مصنوعی خود جذب کند.