محققان یک الگوریتم هوش مصنوعی جدید ایجاد کرده اند که از شنیدن صحیح کلمات شما توسط دستگاه های هوشمند مانند الکسا یا سیری در ۸۰ درصد مواقع جلوگیری می کند. این الگوریتم گامی به سوی ارائه نمایندگی شخصی در حفاظت از حریم خصوصی صدای آنها در حضور دستگاه های هوشمند است.
محققان مهندسی کلمبیا سیستم جدیدی ایجاد کردهاند که صداهای آرام و زمزمهای تولید میکند که میتوانید در هر اتاق و در هر موقعیتی پخش کنید تا از جاسوسی دستگاههای هوشمند بر روی شما جلوگیری کند. و پیادهسازی آن بر روی سختافزارهایی مانند رایانهها و تلفنهای هوشمند آسان است و به مردم اجازه میدهد تا از حریم خصوصی صدایشان محافظت کنند.
کارل وندریک، استادیار علوم کامپیوتر، گفت: «یک چالش فنی کلیدی برای دستیابی به این هدف این بود که همه چیز به اندازه کافی سریع کار کند.الگوریتم ما که قادر است در ۸۰ درصد مواقع مانع از شنیدن صحیح کلمات شما توسط میکروفون شود، سریعترین و دقیقترین الگوریتم در بستر آزمایش ما است. حتی زمانی که ما چیزی در مورد میکروفون ، مانند مکان آن، یا حتی نرمافزار رایانهای که روی آن اجرا میشود، نمیدانیم، کار میکند. اساساً صدای شخص را از طریق هوا استتار می کند، آن را از این سیستم های شنیداری پنهان می کند، و بدون ایجاد مزاحمت برای مکالمه بین افراد در اتاق استفاده می شود.»
این محقق یادآور شد: در حالی که نتایج کار این گروه در مخدوش کردن سیستمهای بازشناسی گفتار خودکار از نظر فرضیهای پیشتر در زمینه هوش مصنوعی ممکن شناخته شده بود، رسیدن به این دستاورد با سرعت کافی تا از آن در نرم افزارکارهای کاربردی استفاده شود هنوز دشوار بود. مشکل این بود که وقتی یک صدا سخن گفتن فرد را در یک زمان مشخص مختل می کرد، یک ثانیه بعد این کار را نمی کرد. در حالی که افراد حرف می زدند، صدای آنها به شکل مستمر تغییر می کند زیرا از کلمات متفاوتی استفاده می کنند و سریع حرف می زنند. این تغییرات باعث می شود هیچ دستگاهی نتواند با سرعت سریع سخن گفتن یک فرد خود را همراه کند.
میا چیکوییر محقق ارشد این گروه و دانشجوی دکتری در دانشگاه کلمبیا هم گفت: الگوریتم ما می تواند با پیش بینی چگونگی حرف زدن فرد در آینده به زمان کافی برای تولید نجوای مناسب داشته باشد، روش ما فعلا در مورد بسیاری از کلمات انگلیسی موفقیت آمیز بوده است و قصد داریم این الگوریتم را در مورد زبان های بیشتر توسعه دهیم همچنین در نهایت صدای نجوامانند را کاملا نامحسوس کنیم.
وی افزود: محققان باید الگوریتمی طراحی می کردند که در یک لحظه بتواند شبکه های عصبی مصنوعی را از بین ببرد، به صورت مستمر بازتولید شود چون سخن گفتن مستمر ادامه دارد و قابل اجرا برای اکثریت کلمات یک زبان باشد. حالیکه تلاش های قبلی به طور موفقیت آمیزی یکی از این سه مولفه را در خود داشت، هیچ کدام هر سه مولفه را داشتند.