اپن ای آی با نسخه جدید ChatGPT Images به رقابت مستقیم با ابزار تصویری گوگل رفت

انتشار: 29 آذر 1404

شرکت OpenAI از جدیدترین نسخه مدل تولید تصویر خود با نام ChatGPT Images رونمایی کرد؛ مدلی که با تمرکز ویژه بر ابزارهای ویرایش تصویر و اجرای دقیق‌تر دستورات، به‌عنوان پاسخ مستقیم به ابزار پرسر‌و‌صدای Nano Banana Pro گوگل معرفی شده است.

در سال جاری، مدل‌های تولید تصویر مبتنی بر هوش مصنوعی پیشرفت‌های چشمگیری داشته‌اند و انتشار گسترده Nano Banana Pro از سوی گوگل، رقابت در این حوزه را وارد مرحله تازه‌ای کرده است. حالا OpenAI اعلام کرده نسخه جدید ChatGPT Images با بهبودهای قابل‌توجه در کیفیت، سرعت و کنترل ویرایش، تلاش دارد جایگاه خود را در این رقابت تثبیت کند.

این مدل از امروز در دسترس تمامی کاربران ChatGPT در سراسر جهان قرار گرفته و از طریق API نیز با نام GPT-Image-1.5 ارائه شده است. همچنین، یک فضای اختصاصی جدید برای ساخت و ویرایش تصویر در نوار کناری ChatGPT اضافه شده که شامل سبک‌های از پیش‌تعریف‌شده و طرح‌های ترند است؛ تغییری که تجربه تولید تصویر را از گفت‌وگوی ساده متنی فراتر می‌برد.

به گفته OpenAI، مدل ۱.۵ نسبت به نسخه قبلی چهار برابر سریع‌تر شده و توانایی بسیار بهتری در دنبال‌کردن دستورات دقیق دارد. کاربران می‌توانند با استفاده از ابزارهای ویرایشی جدید، اشیای مشخصی را به تصویر اضافه کنند، سبک عناصر را تغییر دهند، لباس‌های مختلف را روی سوژه‌ها امتحان کنند یا بخش‌هایی از تصویر را حذف کنند.

یکی از پیشرفت‌های مهم این نسخه، بهبود قابل‌توجه در تولید متن خوانا داخل تصاویر است؛ قابلیتی که همواره یکی از چالش‌های اصلی مدل‌های تولید تصویر بوده است. هرچند آزمایش‌های اولیه نشانه‌هایی از این بهبود را نشان می‌دهد، اما ارزیابی دقیق‌تر نیازمند بررسی‌های عملی بیشتر است.

این به‌روزرسانی تنها یک هفته پس از توافق OpenAI و دیزنی اعلام شده؛ توافقی که قرار است بیش از ۲۰۰ شخصیت معروف دیزنی را در آینده به ChatGPT Images و ویدئوهای Sora اضافه کند. البته استفاده از این شخصیت‌ها در مدل جدید، طبق برنامه‌ریزی، از اوایل سال ۲۰۲۶ امکان‌پذیر خواهد بود.

زمان‌بندی این معرفی بی‌ارتباط با اقدامات اخیر گوگل نیست. عرضه Nano Banana Pro همراه با مدل Gemini 3، توانایی بالایی در تولید تصاویر فوق‌واقع‌گرایانه با متن خوانا نشان داد و نگرانی‌ها درباره تشخیص محتوای تولیدشده با هوش مصنوعی را دوباره افزایش داد. پس از آن، OpenAI از اعلام یک «وضعیت کد قرمز» داخلی خبر داد که نشان‌دهنده عزم این شرکت برای رقابت جدی‌تر با گوگل است؛ تلاشی که پیش‌تر با انتشار GPT-5.2 نیز دنبال شده بود.

در کنار پیشرفت‌های فنی، بحث‌های حقوقی و اخلاقی پیرامون تولید محتوای هنری با هوش مصنوعی همچنان ادامه دارد. از موج تصاویر الهام‌گرفته از استودیو جیبلی گرفته تا اعتراض هنرمندان، نویسندگان و بازیگران نسبت به استفاده از آثار انسانی در آموزش مدل‌های هوش مصنوعی، موضوع کپی‌رایت به یکی از چالش‌برانگیزترین مسائل عصر هوش مصنوعی تبدیل شده است؛ مسیری که شرکت‌ها در آن یا به توافق می‌رسند یا راه دادگاه را در پیش می‌گیرند.

کد خبر ۲۱۲۰۴۰۹۲۹.۳۰۹

منبع: سنت