شرکت ElevenLabs، استارتاپی که در زمینه کلونسازی صدا و خدمات تبدیل متن به گفتار فعالیت دارد، روز دوشنبه از قابلیت جدیدی برای ساخت ایجنتهای هوش مصنوعی مکالمهای رونمایی کرد. این ابزار جدید که روی پلتفرم توسعهدهندگان ElevenLabs قرار دارد، به کاربران این امکان را میدهد تا ایجنتهای مکالمهای کاملاً سفارشیسازیشده بسازند، با قابلیتهایی مانند تنظیم لحن صدا، طول پاسخها و زبان اصلی.
پیش از این، ElevenLabs بیشتر بر روی ارائه صداهای مختلف و ابزارهای هوش مصنوعی برای خدمات تبدیل متن به گفتار تمرکز داشت. با این حال، بسیاری از مشتریان این شرکت قبلاً از خدمات آن برای ایجاد ایجنتهای هوش مصنوعی مکالمهای استفاده میکردند، ولی مشکلاتی مانند یکپارچهسازی پایگاههای دانش و مدیریت قطعهای مکالمه از سوی مشتریان وجود داشت. برای حل این مشکل، ElevenLabs تصمیم گرفت یک خط تولید کامل برای ساخت رباتهای مکالمهای ایجاد کند.
توسعهدهندگان حالا میتوانند وارد حساب کاربری ElevenLabs خود شده و با انتخاب یک قالب یا ایجاد یک پروژه جدید، ایجنتهای مکالمهای بسازند. در این پلتفرم، آنها میتوانند مواردی مانند زبان اصلی ایجنت، اولین پیام، و دستور سیستم برای تعیین شخصیت ایجنت را سفارشیسازی کنند. همچنین میتوانند از مدلهای زبان بزرگی مانند Gemini، GPT یا Claude انتخاب کرده و میزان خلاقیت پاسخها (از طریق تنظیم دما) و محدودیتهای توکن را تنظیم کنند.
علاوه بر این، کاربران میتوانند پایگاه دانش خود را مانند فایلها، URLها یا بلوکهای متنی برای تقویت ربات مکالمهای اضافه کنند و حتی مدلهای زبان سفارشی خود را با ربات ادغام کنند. SDK شرکت ElevenLabs با زبانهای برنامهنویسی Python، JavaScript، React و Swift سازگار است و این شرکت همچنین یک API WebSocket برای سفارشیسازی بیشتر ارائه میدهد.
شرکتها همچنین میتوانند معیارهایی برای جمعآوری دادههایی مانند نام و ایمیل مشتریان مکالمهکننده با ایجنت تعریف کنند و معیارهای ارزیابی بر اساس زبان طبیعی برای تعیین موفقیت یا شکست مکالمه تعیین کنند. پلتفرم جدید از زیرساخت موجود تبدیل متن به گفتار شرکت ElevenLabs استفاده میکند، اما قابلیتهای تبدیل گفتار به متن همچنان در حال توسعه هستند.
در حال حاضر ElevenLabs API تبدیل گفتار به متن را به صورت مستقل عرضه نمیکند، اما ممکن است در آینده این قابلیت را نیز ارائه دهد، که باعث رقابت آن با شرکتهای بزرگی مانند Google، Microsoft و Amazon و همچنین رقابت با APIهای تخصصی مانند Whisper OpenAI و AssemblyAI خواهد شد. شرکت ElevenLabs که به دنبال جذب سرمایه جدیدی با ارزیابی بیش از ۳ میلیارد دلار است، در رقابت با استارتاپهای دیگری مانند Vapi و Retell قرار دارد که آنها نیز در حال ساخت ایجنتهای مکالمهای هستند و بهطور خاص رقیب جدی API مکالمات لحظهای OpenAI محسوب میشود.
ElevenLabs باور دارد که قابلیتهای سفارشیسازی و امکان تغییر مدلهای خود، مزیتی قابل توجه در مقابل OpenAI به آن میدهد.
کد خبر ۲۱۲۰۳۰۸۳۰.۰۲۶