متا نسخه «باز» تولید پادکست گوگل را معرفی کرد

انتشار: 7 آبان 1403

شرکت متا به تازگی نسخه‌ای «باز» از ویژگی تولید پادکست معروف گوگل در NotebookLM را منتشر کرده است. این پروژه که «NotebookLlama» نام دارد، از مدل‌های Llama متا برای پردازش بیشتر استفاده می‌کند و مشابه NotebookLM، قادر است خلاصه‌های پادکست‌مانند از فایل‌های متنی بارگذاری‌شده تولید کند.

NotebookLlama ابتدا یک متن‌نگاری از فایل مورد نظر، مانند یک PDF از یک مقاله خبری یا پست وبلاگ، ایجاد می‌کند. سپس، برای افزودن «درام بیشتر» و وقفه‌ها، این متن را به مدل‌های تبدیل متن به گفتار باز feeds می‌کند.

با این حال، نتایج به اندازه NotebookLM باکیفیت نیستند. در نمونه‌های NotebookLlama ، صداها به وضوح حالتی روباتیک دارند و در نقاطی نامناسب بر روی هم صحبت می‌کنند.

محققان متا که این پروژه را ایجاد کرده‌اند، اعلام کرده‌اند که کیفیت می‌تواند با مدل‌های قوی‌تر بهبود یابد.

آن‌ها در صفحه GitHub NotebookLlama نوشتند: «مدل تبدیل متن به گفتار محدودیت طبیعی بودن صدا را تعیین می‌کند.» همچنین، آن‌ها پیشنهاد کردند که یک رویکرد دیگر برای نوشتن پادکست، داشتن دو عامل برای بحث درباره موضوع مورد نظر و نوشتن طرح پادکست باشد.

NotebookLlama نخستین تلاش برای شبیه‌سازی ویژگی پادکست NotebookLM نیست. برخی پروژه‌ها موفقیت بیشتری نسبت به دیگران داشته‌اند، اما هیچ‌کدام — حتی خود NotebookLM — نتوانسته‌اند مشکل توهم (Hallucination) که گریبان‌گیر تمام هوش مصنوعی‌ها است را حل کنند.

به عبارت دیگر، پادکست‌های تولیدشده توسط هوش مصنوعی به احتمال زیاد شامل مطالب جعلی خواهند بود.

کد خبر ۲۱۳۰۳۰۸۰۷.۰۲۶