۲۸ شهریور ۱۳۹۵ ۱۱:۱۶

مایکروسافت از IBM سبقت گرفت

فهم زبان انسان و به خصوص فهم گفتار صوتی انسان توسط کامپیوتر یکی از بزرگترین اهدافی است که توسط شرکت های بزرگ کامپیوتری دنبال می شود. اخیرا مایکروسافت اعلام کرده است که پیشرفت قابل توجهی در این زمینه داشته است.

به گزارش کلیک، گروهی از محققان مایکروسافت، سیستم تشخیص گفتار صوتی طراحی کرده اند که کمترین میزان خطا را دارد. خطای این سیستم برای تشخیص گفتار صوتی ضبط شده در حدود ۳/۶ درصد است. قبل از این سیستم تشخیص گفتار صوتی، آی بی ام سیستمی با نام واتسون تولید کرده بود که خطای برای تشخیص گفتار صوتی در حدود ۹/۶ درصد بوده است.

خبرها حاکی از این است که مایکروسافت یک قدم دیگر به تولید کامپیوترهایی که توانایی تشخیص گفتار صوتی مانند انسان را دارندف نزدیک تر شده است. سیستم طراحی شده توسط محققان این شرکت می تواند در نرم افزارهای مانند اسکایپ که شامل اپلیکیشنی برای ترجمه همزمان گفتار هستند، کاربردی و مفید باشد. علاوه بر این در نرم افزارهایی که بر اساس تشخیص گفتار صوتی عمل می کنند نیز می توان از این سیستم استفاده کرد. اخیرا تلاش های زیادی جهت استفاده از صوت به عنوان یک واسط میان کاربر و کامپیوتر صورت گرفته است. زمان زیادی از استفاده از اپلیکیشن Siri ساخت شرکت اپل به عنوان بخشی از سیستم عامل iOS میگذرد و هم اکنون این اپلیکیشن به عنوان بخشی حیاتی برای این سیستم عامل تبدیل شده است اما متاسفانه هنوز سرعت عملکرد و نتیجه خروجی این اپلیکیشن برای تولید کنندگان ان رضایت بخش نیست. اما اخیرا به کمک تکنولوژی‌های جدید بکار گرفته شده در تشخیص و درک زبان از جمله تکنولوژی هوش مصنوعیف دقت و درک نرم‌افزارهای تشخیص گفتار بالا رفته است. شرکت های زیادی از جمله آمازون، اپل، گوگل و آی بی ام در حال حاضر در تلاش برای پیشی گرفتن از رقبای خود در زمینه استفاده از سیستم تشخیص گفتار صوتی برای خدمات رسانی به کاربران خود هستند.

اخیرا شرکت اپل با کمک شرکت های شخص ثالث توانسته است قابلیت تعامل با سایر اپلیکیشن ها را به اپلیکیشن تولید این شرکت یعنی siri اضافه کند. در واقع کاربران قدر خواهند بود تا با استفاده از siri سفارشات خود را انجام دهند. با این وجود دستیاران صوتی قبل از اینکه به یک واسط اولیه برای تعامل کاربران و کامپیوترها تبدیل شود، نیاز به بهینه سازی و بهبود بیشتری دارند. در واقع هدف دانشمندان در این زمینه رسیدن به دقتی بالای ۹۹ درصد در تشخیص گفتار صوتی است. در واقع به نظر کلینر پارکینزف یکی از محققان و تحلیلگران زبانشناسی رایانشی، رسیدن به این میزان دقت برای تعامل صحیح و بدون خطا میان کاربر و کامپیوتر بسیار ضروری و مهم است. از طرفی شرکت هایی که هنوز وارد حوزه تشخیص ماشینی گفتار صوتی نشده اند می بایست هرچه سریع تر تصمیم خود را در خصوص ورد به حوزه بگیرند زیرا طبق پیش بین ها در آبنده ای نه چندان دور، واسط های صوتی به عنوان بخش اصلی و بی رقیب در تعامل کاربر و کامپیوتر تبدیل خواهد شد.

ارسال به دیگران

۲۸ شهریور ۱۳۹۵ ۱۱:۱۶