پس از موفقیتهای چشمگیر در توسعه مدلهای پیشرفته هوش مصنوعی متنی و تصویری، شرکت OpenAI اکنون منابع خود را بر یک جبهه جدید متمرکز کرده است: هوش مصنوعی صوتی. هدف نهایی این شرکت، عرضه یک دستگاه سختافزاری اختصاصی و شخصیسازیشده است که بهطور کامل متکی بر فناوریهای صوتی باشد.
بر اساس گزارشهای اخیر، OpenAI در دو ماه گذشته، تیمهای مهندسی، محصول و تحقیقاتی متعددی را ادغام کرده تا مدلهای صوتی کنونی خود را بهطور بنیادی بازطراحی کند. این تحولات گسترده با هدف آمادهسازی برای عرضه یک دستگاه تعاملی مبتنی بر صدا صورت میگیرد که انتظار میرود طی یک سال آینده به بازار معرفی شود.
این رویکرد نشاندهنده یک تغییر پارادایم در صنعت فناوری است؛ آیندهای که در آن نمایشگرها نقش محوری خود را از دست میدهند و صدا به رابط اصلی تعامل کاربر با دستگاه تبدیل میشود. دستیارهای صوتی مدتهاست که از طریق اسپیکرهای هوشمند، در خانههای بسیاری از کاربران تثبیت شدهاند و حالا شرکتهای بزرگ فناوری، این ایده را به سطح جدیدی ارتقا میدهند.
رقبای OpenAI نیز در این حوزه بیکار ننشستهاند:
- متا اخیراً قابلیتی را برای عینکهای هوشمند ری-بن (Ray-Ban) خود عرضه کرده که با بهرهگیری از آرایهای از میکروفنها، مکالمات محیطهای شلوغ را با وضوح بیشتری منتقل میکند.
- گوگل در ماه ژوئن آزمایشهای اولیه قابلیت Audio Overviews را آغاز کرد که نتایج جستوجو را به خلاصههای گفتوگومحور صوتی تبدیل میکند.
- تسلا نیز در حال یکپارچهسازی چتبات Grok در خودروهای خود است تا دستیاری صوتی ایجاد کند که بتواند کنترلهای تهویهمطبوع تا مسیریابی را تنها از طریق گفتوگوی طبیعی با راننده انجام دهد.
مدل صوتی آتی OpenAI، که گفته میشود برای عرضه در اوایل ۲۰۲۶ برنامهریزی شده، وعده داده که نه تنها طبیعیتر صحبت کند، بلکه در حین مکالمه، وقفهها را مانند یک انسان واقعی مدیریت خواهد کرد و حتی میتواند همزمان با صحبت کاربر، سخن بگوید؛ قابلیتی که مدلهای کنونی فاقد آن هستند.
شایعات حاکی از آن است که این شرکت به دنبال عرضه مجموعهای از دستگاههای هوش مصنوعی مانند عینک یا اسپیکرهای هوشمند بدون نمایشگر است که کمتر شبیه به ابزار و بیشتر شبیه یک همراه عمل میکنند و نحوه تعامل ما با فناوری را در آیندهای نزدیک متحول خواهند ساخت.
کد خبر ۲۱۲۰۴۱۰۱۵.۸۱۵
منبع: The Information