علی بابا روز جمعه یک مدل هوش مصنوعی جدید راه اندازی کرد که به گفته این شرکت می تواند تصاویر را درک کند و مکالمات پیچیده تری را نسبت به محصولات قبلی این شرکت انجام دهد.
این غول فناوری چینی گفت که دو مدل جدیدش، Qwen-VL و Qwen-VL-Chat، متن باز خواهند بود – به این معنی که محققان، دانشگاهیان و شرکتها در سراسر جهان میتوانند از آنها برای ایجاد برنامههای هوش مصنوعی خود بدون نیاز به آموزش سیستمهای خود استفاده کنند. بنابراین در زمان و هزینه صرفه جویی می شود.
علیبابا گفت که Qwen-VL میتواند به پرسشهای باز مرتبط با تصاویر مختلف پاسخ دهد و شرح تصاویر را ایجاد کند.
به گفته علی بابا، Qwen-VL-Chat در عین حال «تعامل پیچیدهتری» را ارائه میکند، مانند مقایسه ورودیهای تصویر متعدد و پاسخ دادن به چندین دور سؤال. برخی از کارهایی که به گفته ی علی بابا Qwen-VL-Chat می تواند انجام دهد شامل نوشتن داستان و ایجاد تصاویر بر اساس عکس هایی که کاربر وارد می کند و همچنین حل معادلات ریاضی نشان داده شده در یک تصویر است.
یکی از مثالهایی که علیبابا ارائه کرد مربوط به ورودی است که دارای تابلوی بیمارستان به زبان چینی است. هوش مصنوعی می تواند با تفسیر تصویر علامت، به سؤالات مربوط به مکان بخش های بیمارستانی خاص پاسخ دهد.
تاکنون، بسیاری از هوش مصنوعی مولد بر پاسخ به متن متمرکز شدهاند. آخرین نسخه ChatGPT OpenAI نیز مانند Qwen-VL-Chat توانایی درک تصاویر و پاسخ به متن را دارد.
دو مدل جدید علیبابا بر اساس مدل زبان بزرگ این شرکت به نام Tongyi Qianwen ساخته شدهاند که اوایل امسال عرضه شد.
شرکتی که دفتر مرکزی آن در هانگژو قرار دارد، در این ماه دو مدل هوش مصنوعی دیگر را با منبع باز عرضه کرد. در حالی که علیبابا هیچ هزینهای برای صدور مجوز دریافت نمیکند، اما توزیع منبع باز به شرکت کمک میکند تا کاربران بیشتری را برای مدل هوش مصنوعی خود جذب کند.