۰۹ فروردین ۱۳۹۵ ۲۳:۰۱

فناوری جدید لب خوانی به کمک ناشنوایان و پلیس می آید

فناوری جدید لب خوانی توسعه یافته در دانشگاه UEA قادر است تا به پلیس برای حل پرونده ها و به افرادی که اختلالات گفتاری یا شنیداری دارند برای برقراری ارتباط با دیگران کمک کند.

به گزارش کلیک، این فناوری تشخیص گفتار بصری که توسط دکتر "هلن ال بیر" و پروفسور "ریچارد هاروی" از بخش علوم رایانه دانشگاه UEA توسعه داده شده است، می تواند در هر مکانی که صدا های صوتی به اندازه کافی شفاف و قابل تشخیص نیست به کار رود تا مفهوم گفته های افراد تشخیص داده شود.

دکتر بیر که اختراعش در ۲۵ ماه مارس در کنفرانس بین المللی آکوستیک در شانگهای به نمایش در می آید، می گوید: وقتی صدای افراد در اختیار ما نیست مشکلات بسیاری با تشخیص گفته های آنان پیدا می کنیم. برای مثال دسترسی به صدای افراد با دوربین های مدار بسته امکان پذیر نیست. همچنین وقتی صدای افراد ضعیف و ناکافی باشد امکان استفاده از آن ها به عنوان سر نخی برای یافتن محتوای صحبت های افراد وجود ندارد. صداهای "پ"، "ب" و "م" همگی هنگام خروج از لب ها شبیه به یکدیگرند، ولی اکنون فناوری جدید ماشین های لب خوانی قادر است تا با طبقه بندی بین حروف مختلف تمایز قائل شده و ترجمه دقیق تری را ارائه دهد.

دکتر بیر می گوید: ما هنوز هم روی دانش بیان بصری (visual speech) و آن چه که مردم برای به رسمیت شناختن یک دستگاه تمام عیار لب خوانی نیاز دارند، در حال کار هستیم، ولی این سیستم طبقه بندی روش های قبلی لب خوانی را با آموزش روش های جدید طبقه بندی بهبود داده است.

یک سیستم لب خوانی قوی تر پتانسیل به کار گیری در موقعیت های زیادی را دارد، از تحقیقات جنایی گرفته تا موقعیت های تفریح و سرگرمی. از این فناوری لب خوانی در لحظات هیجانی مسابقات فوتبال که بازیکنان با عصبانیت کلماتی را بر زبان می آورند استفاده شده است، ولی به کار گیری آن در شرایطی که سر و صدای زیادی در محیط وجود دارد، مثل هنگام استفاده از خودرو و یا در کابین خلبان مفید تر خواهد بود.

اگرچه به طور قطع چنین سیستمی نیاز به پیشرفت بیشتری دارد، ولی در آینده می توان از آن برای اهداف بسیاری استفاده کرد. برای مثال افرادی که اختلالات شنوایی و یا گفتاری دارند قادر خواهند بود تا برای برقراری ارتباط با دیگران از آن استفاده کنند. همچنین امکان به کار گیری سیستم لب خوانی به عنوان بخشی از یک سیستم تشخیص صوتی- بصری نیز وجود دارد.

پروفسور هاروی می گوید: لب خوانی یکی از چالش بر انگیز ترین مشکلات در زمینه هوش مصنوعی به شمار می رود، بنابر این بهتر است سعی کنیم فقط در یک جنبه از آن کار خود را پیشرفت دهیم و آن این است که به ماشین ها آموزش دهیم چگونه ظاهر و شکل لب انسان را تشخیص دهند.

این تحقیق بخشی از یک پروژه سه ساله بوده و توسط انجمن مهندسی و علوم فیزیکی (EPSRC) پشتیبانی می شود.

این مقاله در ۲۵ ماه مارس با عنوان بهینه سازی ماشین های لب خوانی در کنفرانس بین المللی آکوستیک منتشر خواهد شد.

منبع: phys

ارسال به دیگران

۰۹ فروردین ۱۳۹۵ ۲۳:۰۱