دانشمندان اسپیکری اختراع کردهاند که افراد مزاحم را ساکت میکند
دانشمندان اسپیکری اختراع کردهاند که افراد مزاحم را ساکت میکند
پژوهشگران دانشکده علوم کامپیوتر و مهندسی پل آلن دانشگاه واشنگتن، اسپیکر جدیدی اختراع کردهاند که میتواند با بازتنظیم هفت میکروفون خودمستقرشونده، اتاق را به نواحی گفتاری تقسیم و صداهای مختلف را حتی در حین حرکتکردن ردیابی و شناسایی کند.
مخترعان اسپیکر میگویند مکانیابی دقیق میکروفونها به آنها اجازه میدهد تا نهتنها مکالمههای همزمان را تفکیک کنند، بلکه نواحی پرسروصدا یا به عبارت بهتر، افراد پرسروصدا را برای کاربردهایی مانند کنفرانسهای ویدئویی بیصدا کنند. پژوهشگران نتایج پژوهش خود را در نشریه نیچر کامیونیکیشنز منتشر کردهاند.
طبق توضیحات مقاله، اسپیکر غیرمتعارف جدید قابلیتی را ارائه میدهد که با عنوان رباتهای گروهی شناخته میشود. میکروفونهای خودمستقرشونده به شکل رباتهایی به اندازه انگشتانه هستند که با یکدیگر ارتباط برقرار میکنند و مانند رومباهای کوچک (جاروبرقیهای رباتیک) روی چرخهای کوچک خود به نقاط مختلف میروند و در صورت نیاز به جایگاه شارژ برمیگردند.
ملک ایتانی، یکی از نویسندگان مطالعه میگوید: «به کمک رباتهای گروهی برای اولین بار میتوانیم موقعیت چندین فرد را که در اتاق صحبت میکنند، دنبال کنیم و گفتگوهای آنها را از هم جدا کنیم.»
رباتهای آزمایشی اولیه برای حرکت در محیط خود از تکنیکی شبیه پژواکیابی فرکانس بالا استفاده میکنند. میزان تحرکپذیری رباتها میتواند بسیار مهم باشد.هرچقدر بیشتر میکروفونها پخش شوند، شبکه عصبی پردازشگر داده میتواند محاسبات دقیقتری انجام دهد. البته درحالحاضر رباتها فقط قادر به حرکت روی میز هستند؛ زیرا فقط میتوانند در فضای دو بعدی مکانیابی کنند.
تووچائو چن، یکی از نویسندگان توضیح میدهد: «شبکههای عصبیای را توسعه دادیم که از سیگنالهایی با تأخیر زمانی برای جدا کردن گفتار هر شخص و دنبال کردن موقعیت آنها در فضا استفاده میکنند. بنابراین میتوانید چهار نفر را درحال انجام دو مکالمه جداگانه داشته باشید و هر یک از چهار صدا را جدا کنید و هرکدام از صداها را در اتاق مکانیابی کنید.»
ادعاهای چن با نتایج آزمایشهای دنیای واقعی تأیید میشود. پژوهشگران رباتهای گروهی را در مکانهایی مانند دفاتر و آشپزخانه، درحالیکه سه تا پنج نفر در حال صحبت کردن بودند، آزمایش کردند. درحالیکه سیستم، دانش پیشینی درمورد موقعیتها یا صداها نداشت، قادر بود در ۹۰ درصد از مواقع صداها را در فاصله نیم متری از هم تفکیک کند و میزان خطای آن بسیار پایین بود.
البته سرعت پایین دستگاه کمی ناامیدکننده است. بهطور متوسط ۱٫۸۳ ثانیه طول میکشد تا سیستم صدای سه ثانیهای را پردازش کند که ممکن است در کنفرانسهای ویدئویی نامطلوب باشد.
پژوهشگران قصد دارند در آینده تکنیک جداسازی و بیصدا کردن را به صورت بیدرنگ اجرا کنند و میکروفونها را طوری طراحی کنند که همچون هدفونهای حذف نویز این کار را در کل اتاق انجام دهند.
منبع : زومیت