تحولی در فناوری گفتار مصنوعی: بازگشت صدای بیماران فلج با هوش مصنوعی

تحولی در فناوری گفتار مصنوعی: بازگشت صدای بیماران فلج با هوش مصنوعی
گروهی از محققان دانشگاههای کالیفرنیا در برکلی و سانفرانسیسکو موفق به توسعهی یک رابط مغز و کامپیوتر (BCI) شدهاند که میتواند گفتار طبیعی را برای افراد دارای فلج شدید بازگرداند. این سیستم که پیشرفت بزرگی در زمینه پروتزهای عصبی گفتاری محسوب میشود، با استفاده از هوش مصنوعی قادر است سیگنالهای مغزی را تقریباً بهصورت همزمان به گفتار شنیداری تبدیل کند.
به گزارش نیوزلن و به نقل از تکاسپات، یکی از چالشهای اساسی در فناوریهای مشابه، تأخیر در پردازش گفتار بوده است. اما این تیم تحقیقاتی با بهرهگیری از الگوریتمهای مشابه دستیارهای صوتی مانند الکسا و سیری، توانسته این تأخیر را کاهش داده و جریان پیوستهای از گفتار را ایجاد کند.
این فناوری روی بیماری به نام آن که پس از سکته مغزی ۱۸ سال پیش توانایی تکلم خود را از دست داده بود، آزمایش شد. با کاشت الکترودهایی روی سطح مغز او، سیگنالهای عصبی هنگام تلاش برای بیان کلمات ثبت و توسط مدل هوش مصنوعی آموزشدیده با صدای قبلی آن به گفتار تبدیل شدند. نتایج نشان داد که این روش نهتنها زمان تأخیر را به کمتر از یک ثانیه کاهش داده، بلکه دقت بالایی نیز در بازتولید گفتار دارد.
پژوهشگران همچنین توانایی این مدل در تولید کلمات جدید خارج از مجموعه دادههای آموزشی را بررسی کردند. استفاده از کلماتی مانند Alpha و Bravo نشان داد که سیستم میتواند الگوهای صوتی جدید را شبیهسازی کند. علاوه بر این، آزمایشها نشان دادند که تجربه شنیدن صدای خود در زمان واقعی میتواند احساس ارتباط بیشتر فرد با هویت خود را تقویت کند.
این سیستم با انواع فناوریهای حسگر مغزی، از جمله آرایههای میکروالکترودی (MEA) و حسگرهای الکترومایوگرافی سطحی (sEMG)، سازگار است و میتواند کاربردهای گستردهتری در آینده داشته باشد. این تیم تحقیقاتی در حال کار بر روی افزایش قابلیتهای احساسی و طبیعیتر شدن گفتار با ترکیب ویژگیهایی مانند لحن، زیر و بمی و بلندی صدا است.
این فناوری هنوز در مراحل آزمایشی است اما با حمایت مالی مؤسساتی مانند مؤسسه ملی ناشنوایی و اختلالات ارتباطی آمریکا (NIDCD) و برنامه Moonshot ژاپن، میتواند در دهه آینده بهطور گسترده در دسترس قرار گیرد.