کد خبر:1029072
اشتراک گذاری
مرتب‌سازی نظرها براساس:

فناوری جدید لب خوانی به کمک ناشنوایان و پلیس می آید

فناوری جدید لب خوانی توسعه یافته در دانشگاه UEA قادر است تا به پلیس برای حل پرونده ها و به افرادی که اختلالات گفتاری یا شنیداری دارند برای برقراری ارتباط با دیگران کمک کند.

به گزارش کلیک، این فناوری تشخیص گفتار بصری که توسط دکتر "هلن ال بیر" و پروفسور "ریچارد هاروی" از بخش علوم رایانه دانشگاه UEA توسعه داده شده است، می تواند در هر مکانی که صدا های صوتی به اندازه کافی شفاف و قابل تشخیص نیست به کار رود تا مفهوم گفته های افراد تشخیص داده شود.

دکتر بیر که اختراعش در ۲۵ ماه مارس در کنفرانس بین المللی آکوستیک در شانگهای به نمایش در می آید، می گوید: وقتی صدای افراد در اختیار ما نیست مشکلات بسیاری با تشخیص گفته های آنان پیدا می کنیم. برای مثال دسترسی به صدای افراد با دوربین های مدار بسته امکان پذیر نیست. همچنین وقتی صدای افراد ضعیف و ناکافی باشد امکان استفاده از آن ها به عنوان سر نخی برای یافتن محتوای صحبت های افراد وجود ندارد. صداهای "پ"، "ب" و "م" همگی هنگام خروج از لب ها شبیه به یکدیگرند، ولی اکنون فناوری جدید ماشین های لب خوانی قادر است تا با طبقه بندی بین حروف مختلف تمایز قائل شده و ترجمه دقیق تری را ارائه دهد.

دکتر بیر می گوید: ما هنوز هم روی دانش بیان بصری (visual speech) و آن چه که مردم برای به رسمیت شناختن یک دستگاه تمام عیار لب خوانی نیاز دارند، در حال کار هستیم، ولی این سیستم طبقه بندی روش های قبلی لب خوانی را با آموزش روش های جدید طبقه بندی بهبود داده است.

یک سیستم لب خوانی قوی تر پتانسیل به کار گیری در موقعیت های زیادی را دارد، از تحقیقات جنایی گرفته تا موقعیت های تفریح و سرگرمی. از این فناوری لب خوانی در لحظات هیجانی مسابقات فوتبال که بازیکنان با عصبانیت کلماتی را بر زبان می آورند استفاده شده است، ولی به کار گیری آن در شرایطی که سر و صدای زیادی در محیط وجود دارد، مثل هنگام استفاده از خودرو و یا در کابین خلبان مفید تر خواهد بود.

اگرچه به طور قطع چنین سیستمی نیاز به پیشرفت بیشتری دارد، ولی در آینده می توان از آن برای اهداف بسیاری استفاده کرد. برای مثال افرادی که اختلالات شنوایی و یا گفتاری دارند قادر خواهند بود تا برای برقراری ارتباط با دیگران از آن استفاده کنند. همچنین امکان به کار گیری سیستم لب خوانی به عنوان بخشی از یک سیستم تشخیص صوتی- بصری نیز وجود دارد.

پروفسور هاروی می گوید: لب خوانی یکی از چالش بر انگیز ترین مشکلات در زمینه هوش مصنوعی به شمار می رود، بنابر این بهتر است سعی کنیم فقط در یک جنبه از آن کار خود را پیشرفت دهیم و آن این است که به ماشین ها آموزش دهیم چگونه ظاهر و شکل لب انسان را تشخیص دهند.

این تحقیق بخشی از یک پروژه سه ساله بوده و توسط انجمن مهندسی و علوم فیزیکی (EPSRC) پشتیبانی می شود.

این مقاله در ۲۵ ماه مارس با عنوان بهینه سازی ماشین های لب خوانی در کنفرانس بین المللی آکوستیک منتشر خواهد شد.

منبع: phys

نظرها

سر‌خط آخرین خبرها

خبرهای بیشتر
قیمت اینترنت برخی اوپراتورها افزایش یافت

 این افزایش قیمت ها بین 30 تا 50 درصد در اپراتورهای مختلف متغیر است. این افزایش...

تاریخ معرفی ایسوس ROG Phone 7 مشخص شد

 پیش از این گزارش شده بود که ایسوس درحال کار بر روی سری جدید گوشی‌های هوشمند...

مایکروسافت لغو عرضه‌ Redfall روی پلی‌استیشن 5 را تکذیب کرد

شرکت مایکروسافت (Microsoft) اعتقاد دارد که نه‌ تنها جلوی انتشار هیچ بازی برای پلی...

بیشترین کلمات جستجو شده گوگل در سال ۱۴۰۱ توسط کاربران ایرانی

با پایان سال ۱۴۰۱ باید بیشترین کلمات جستجو شده در گوگل را مرور کنیم. در ادامه...

عربستان سعودی قصد دارد در شرکت فضایی اسپیس‌ایکس سرمایه‌گذاری کند

عربستان سعودی قصد دارد در یک همکاری با اسپیس‌ایکس، به‌عنوان سرمایه‌گذار در...

هوش مصنوعی ChatGPT حالا می‌تواند با کمک افزونه‌ها به اینترنت دسترسی داشته باشد

OpenAI در خبری اعلام کرد که ChatGPT حالا از افزونه‌ها پشتیبانی می‌کند و می‌تواند...

تیک‌های آبی سیستم قدیمی توییتر در روز دروغ اول آوریل حذف می‌شود

 توییتر در خبری اعلام کرده است که از 1 آوریل (12 فروردین) تیک‌هایی آبی قدیمی...

تلسکوپ هابل برای اولین‌بار یک سیاه‌چاله ابَرپرجرم فراری را ثبت کرد

تلسکوپ هابل موفق به ثبت اولین تصویر از یک سیاه‌چاله ابَرپرجرم فراری شد.

به‌روزرسانی واتس‌اپ با دو قابلیت جدید؛ مدیریت گروه‌ها آسان‌تر می‌شود

واتس‌اپ آپدیتی شد و حالا افزون بر امکان مشاهده گروه‌های مشترک خود با دیگر...

گوشی جدید نوکیا معرفی شد

 بر اساس خبرهای جدید، امروز شرکت نوکیا به صورت رسمی از گوشی هوشمند Nokia C12 Pro...