شرکت متا به تازگی نسخهای «باز» از ویژگی تولید پادکست معروف گوگل در NotebookLM را منتشر کرده است. این پروژه که «NotebookLlama» نام دارد، از مدلهای Llama متا برای پردازش بیشتر استفاده میکند و مشابه NotebookLM، قادر است خلاصههای پادکستمانند از فایلهای متنی بارگذاریشده تولید کند.
NotebookLlama ابتدا یک متننگاری از فایل مورد نظر، مانند یک PDF از یک مقاله خبری یا پست وبلاگ، ایجاد میکند. سپس، برای افزودن «درام بیشتر» و وقفهها، این متن را به مدلهای تبدیل متن به گفتار باز feeds میکند.
با این حال، نتایج به اندازه NotebookLM باکیفیت نیستند. در نمونههای NotebookLlama ، صداها به وضوح حالتی روباتیک دارند و در نقاطی نامناسب بر روی هم صحبت میکنند.
محققان متا که این پروژه را ایجاد کردهاند، اعلام کردهاند که کیفیت میتواند با مدلهای قویتر بهبود یابد.
آنها در صفحه GitHub NotebookLlama نوشتند: «مدل تبدیل متن به گفتار محدودیت طبیعی بودن صدا را تعیین میکند.» همچنین، آنها پیشنهاد کردند که یک رویکرد دیگر برای نوشتن پادکست، داشتن دو عامل برای بحث درباره موضوع مورد نظر و نوشتن طرح پادکست باشد.
NotebookLlama نخستین تلاش برای شبیهسازی ویژگی پادکست NotebookLM نیست. برخی پروژهها موفقیت بیشتری نسبت به دیگران داشتهاند، اما هیچکدام — حتی خود NotebookLM — نتوانستهاند مشکل توهم (Hallucination) که گریبانگیر تمام هوش مصنوعیها است را حل کنند.
به عبارت دیگر، پادکستهای تولیدشده توسط هوش مصنوعی به احتمال زیاد شامل مطالب جعلی خواهند بود.
کد خبر ۲۱۳۰۳۰۸۰۷.۰۲۶