متا مدلی از هوش مصنوعی را توسعه داده است که قادر به تأیید خودکار صدها هزار نقل قول است. با آموزش بیش از ۱۳۴ میلیون صفحه وب عمومی، مدل منبع باز می تواند بررسی کند که آیا نقل قول ها از ادعاهای مربوطه پشتیبانی می کنند یا خیر.
استنادهای مشکوک را برجسته می کند، و به ویراستاران انسانی اجازه می دهد تا مواردی را که به احتمال زیاد دارای نقص هستند، بدون نیاز به غربال کردن هزاران عبارتی که به درستی استناد شده اند، ارزیابی کنند. اگر نقل قولی نامربوط به نظر برسد، مدل منبع مرتبط تری را توصیه می کند، حتی به قسمت خاصی اشاره می کند که این ادعا را پشتیبانی می کند.
در سپتامبر ۲۰۲۰، متا یک مدل هوش مصنوعی منتشر کرد که بازیابی و تأیید اطلاعات را یکپارچه می کند. از آن زمان، این شرکت روی آموزش شبکههای عصبی کار میکند تا بازنماییهای ظریفتری از زبان را بیاموزند تا بتوانند منابع مرتبط را در مجموعهای از دادهها به اندازه اینترنت بیابند.
با استفاده از تکنیکهای درک زبان طبیعی (NLU)، سیستم احتمال استنباط یک ادعا را از یک منبع تخمین میزند. برای تعیین اینکه آیا یک عبارت از جمله دیگر پشتیبانی می کند یا در تضاد است، مدل ها نمایش های ریاضی معانی کل گزاره ها را در طول جستجو ایجاد و مقایسه می کنند.
مجموعه داده جدید از ۱۳۴ میلیون صفحه وب به عنوان یکی از اجزای اصلی سیستم عمل می کند. متا ۴ میلیون ادعای ویکیپدیا را به الگوریتمها داده است و به آنها یاد میدهد که به یک منبع واحد از مجموعه وسیعی از صفحات وب برای تأیید اعتبار هر عبارت اشاره کنند. از آنجایی که صفحات وب میتوانند حاوی متنهای طولانی باشند، مدلها محتوا را به صورت تکهای ارزیابی میکنند و هنگام تصمیمگیری برای توصیه کردن یک URL، فقط مرتبطترین متن را در نظر میگیرند. این شاخصهای از پیش ساخته شده که محتوای آن ۴۰ برابر بیشتر از سایر نمایههای ویکیپدیا فهرستبندی میشود، در Sphere گنجانده میشود.
شاخصها منابع بالقوه را از طریق یک مدل رتبهبندی شواهد هدایت میکنند که متن جدید را با استناد اصلی مقایسه میکند. این مدل منبع ذکر شده و جایگزین های بازیابی شده را بر اساس احتمال اینکه آنها از این ادعا با استفاده از درک زبانی دقیق پشتیبانی می کنند رتبه بندی می کند. در دنیای واقعی، این مدل مرتبطترین URLها را به عنوان نقلقولهای احتمالی برای ویرایشگر انسانی توصیه میکند تا بررسی و تأیید کند.
هدف نهایی متا ایجاد بستری است که به ویراستاران ویکیپدیا در شناسایی سیستماتیک مشکلات استناد و رفع سریع استناد یا تصحیح محتوای مقاله مربوطه در مقیاس کمک میکند.
این مدل همچنین میتواند راه را برای دستیابی به نتایج بهتر در بسیاری از وظایف دیگر، مانند استنتاج زبان طبیعی کلاسیک، بازیابی در سیستمهای پاسخگویی به سؤال و یادگیری چند مرحلهای، راهنمایی کند.