zoomit

دانشمندان اسپیکری اختراع کرده‌اند که افراد مزاحم را ‌ساکت می‌کند

دانشمندان اسپیکری اختراع کرده‌اند که افراد مزاحم را ‌ساکت می‌کند

پژوهشگران دانشکده علوم کامپیوتر و مهندسی پل آلن دانشگاه واشنگتن، اسپیکر جدیدی اختراع کرده‌اند که می‌تواند با بازتنظیم هفت میکروفون خودمستقرشونده‌، اتاق را به نواحی گفتاری تقسیم و صداهای مختلف را حتی در حین حرکت‌کردن ردیابی و شناسایی کند.

مخترعان اسپیکر می‌گویند مکان‌یابی دقیق میکروفون‌ها به آن‌ها اجازه می‌دهد تا نه‌تنها مکالمه‌های هم‌زمان را تفکیک کنند، بلکه نواحی پرسروصدا یا به عبارت بهتر، افراد پرسروصدا را برای کاربردهایی مانند کنفرانس‌های ویدئویی بی‌صدا کنند. پژوهشگران نتایج پژوهش خود را در نشریه نیچر کامیونیکیشنز منتشر کرده‌اند.

طبق توضیحات مقاله، اسپیکر غیرمتعارف جدید قابلیتی را ارائه می‌دهد که با عنوان ربات‌های گروهی شناخته می‌شود. میکروفون‌های خودمستقرشونده به شکل ربات‌هایی به اندازه انگشتانه هستند که با یکدیگر ارتباط برقرار می‌کنند و مانند رومباهای کوچک (جاروبرقی‌های رباتیک) روی چرخ‌های کوچک خود به نقاط مختلف می‌روند و در صورت نیاز به جایگاه شارژ برمی‌گردند.

ملک ایتانی، یکی از نویسندگان مطالعه می‌گوید: «به کمک ربات‌های گروهی برای اولین بار می‌توانیم موقعیت چندین فرد را که در اتاق صحبت می‌کنند، دنبال کنیم و گفتگوهای آن‌ها را از هم جدا کنیم.»

ربات‌های آزمایشی اولیه برای حرکت در محیط خود از تکنیکی شبیه پژواک‌یابی فرکانس بالا استفاده می‌کنند. میزان تحرک‌پذیری ربات‌ها می‌تواند بسیار مهم باشد.هرچقدر بیشتر میکروفون‌ها پخش شوند، شبکه عصبی پردازشگر داده می‌تواند محاسبات دقیق‌تری انجام دهد. البته در‌حال‌حاضر ربات‌ها فقط قادر به حرکت روی میز هستند؛ زیرا فقط می‌توانند در فضای دو بعدی مکان‌یابی کنند.

تووچائو چن، یکی از نویسندگان توضیح می‌دهد: «شبکه‌های عصبی‌ای را توسعه دادیم که از سیگنال‌هایی با تأخیر زمانی برای جدا کردن گفتار هر شخص و دنبال کردن موقعیت آن‌ها در فضا استفاده می‌کنند. بنابراین می‌توانید چهار نفر را درحال انجام دو مکالمه جداگانه داشته باشید و هر یک از چهار صدا را جدا کنید و هرکدام از صداها را در اتاق مکان‌یابی کنید.»

ادعاهای چن با نتایج آزمایش‌های دنیای واقعی تأیید می‌شود. پژوهشگران ربات‌های گروهی را در مکان‌هایی مانند دفاتر و آشپزخانه، درحالی‌که سه تا پنج نفر در حال صحبت کردن بودند، آزمایش کردند. درحالی‌که سیستم، دانش پیشینی درمورد موقعیت‌ها یا صداها نداشت، قادر بود در ۹۰ درصد از مواقع صداها را در فاصله نیم متری از هم تفکیک کند و میزان خطای آن بسیار پایین بود.

البته سرعت پایین دستگاه کمی ناامیدکننده است. به‌طور متوسط ۱٫۸۳ ثانیه طول می‌کشد تا سیستم صدای سه ثانیه‌ای را پردازش کند که ممکن است در کنفرانس‌های ویدئویی نامطلوب باشد.

پژوهشگران قصد دارند در آینده تکنیک جداسازی و بی‌صدا کردن را به صورت بی‌درنگ اجرا کنند و میکروفون‌ها را طوری طراحی کنند که همچون هدفون‌های حذف نویز این کار را در کل اتاق انجام دهند.

منبع : زومیت

مشاهده بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا