ElevenLabs ابزار جدیدی برای ساخت دستیارهای هوش مصنوعی مکالمه‌ای معرفی کرد

ElevenLabs ابزار جدیدی برای ساخت دستیارهای هوش مصنوعی مکالمه‌ای معرفی کرد
فهرست مطالب

شرکت ElevenLabs، استارتاپی که در زمینه کلون‌سازی صدا و خدمات تبدیل متن به گفتار فعالیت دارد، روز دوشنبه از قابلیت جدیدی برای ساخت ایجنت‌های هوش مصنوعی مکالمه‌ای رونمایی کرد. این ابزار جدید که روی پلتفرم توسعه‌دهندگان ElevenLabs قرار دارد، به کاربران این امکان را می‌دهد تا ایجنت‌های مکالمه‌ای کاملاً سفارشی‌سازی‌شده بسازند، با قابلیت‌هایی مانند تنظیم لحن صدا، طول پاسخ‌ها و زبان اصلی.

پیش از این، ElevenLabs بیشتر بر روی ارائه صداهای مختلف و ابزارهای هوش مصنوعی برای خدمات تبدیل متن به گفتار تمرکز داشت. با این حال، بسیاری از مشتریان این شرکت قبلاً از خدمات آن برای ایجاد ایجنت‌های هوش مصنوعی مکالمه‌ای استفاده می‌کردند، ولی مشکلاتی مانند یکپارچه‌سازی پایگاه‌های دانش و مدیریت قطع‌های مکالمه از سوی مشتریان وجود داشت. برای حل این مشکل، ElevenLabs تصمیم گرفت یک خط تولید کامل برای ساخت ربات‌های مکالمه‌ای ایجاد کند.

توسعه‌دهندگان حالا می‌توانند وارد حساب کاربری ElevenLabs خود شده و با انتخاب یک قالب یا ایجاد یک پروژه جدید، ایجنت‌های مکالمه‌ای بسازند. در این پلتفرم، آن‌ها می‌توانند مواردی مانند زبان اصلی ایجنت، اولین پیام، و دستور سیستم برای تعیین شخصیت ایجنت را سفارشی‌سازی کنند. همچنین می‌توانند از مدل‌های زبان بزرگی مانند Gemini، GPT یا Claude انتخاب کرده و میزان خلاقیت پاسخ‌ها (از طریق تنظیم دما) و محدودیت‌های توکن را تنظیم کنند.

علاوه بر این، کاربران می‌توانند پایگاه دانش خود را مانند فایل‌ها، URL‌ها یا بلوک‌های متنی برای تقویت ربات مکالمه‌ای اضافه کنند و حتی مدل‌های زبان سفارشی خود را با ربات ادغام کنند. SDK شرکت ElevenLabs با زبان‌های برنامه‌نویسی Python، JavaScript، React و Swift سازگار است و این شرکت همچنین یک API WebSocket برای سفارشی‌سازی بیشتر ارائه می‌دهد.

شرکت‌ها همچنین می‌توانند معیارهایی برای جمع‌آوری داده‌هایی مانند نام و ایمیل مشتریان مکالمه‌کننده با ایجنت تعریف کنند و معیارهای ارزیابی بر اساس زبان طبیعی برای تعیین موفقیت یا شکست مکالمه تعیین کنند. پلتفرم جدید از زیرساخت موجود تبدیل متن به گفتار شرکت ElevenLabs استفاده می‌کند، اما قابلیت‌های تبدیل گفتار به متن همچنان در حال توسعه هستند.

در حال حاضر ElevenLabs API تبدیل گفتار به متن را به صورت مستقل عرضه نمی‌کند، اما ممکن است در آینده این قابلیت را نیز ارائه دهد، که باعث رقابت آن با شرکت‌های بزرگی مانند Google، Microsoft و Amazon و همچنین رقابت با API‌های تخصصی مانند Whisper OpenAI و AssemblyAI خواهد شد. شرکت ElevenLabs که به دنبال جذب سرمایه جدیدی با ارزیابی بیش از ۳ میلیارد دلار است، در رقابت با استارتاپ‌های دیگری مانند Vapi و Retell قرار دارد که آن‌ها نیز در حال ساخت ایجنت‌های مکالمه‌ای هستند و به‌طور خاص رقیب جدی API مکالمات لحظه‌ای OpenAI محسوب می‌شود.

ElevenLabs باور دارد که قابلیت‌های سفارشی‌سازی و امکان تغییر مدل‌های خود، مزیتی قابل توجه در مقابل OpenAI به آن می‌دهد.

کد خبر ۲۱۲۰۳۰۸۳۰.۰۲۶

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *