روشی جدید برای جستجوی اشیا در اینترنت

تشخیص تصاویر و دید کامپیوتر یا computer vision، قابلیتی است که شما می‌توانید از هر چیزی یک تصویر به کامپیوتر نشان ‌دهید و کامپیوتر به شما بگوید که چه می‌بیند.به گزارش کلیک، در دهه گذشته، به لطف شبکه‌های یادگیری عمیق جهش عظیمی در فناوری‌های مختلف صورت گرفته است. شبکه‌های یادگیری عمیق، در واقع تقریب محاسباتی از این است که مغز انسان چگونه کار می‌کند و می‌تواند اشیا و مردم را براساس نمونه‌های آموزشی از قبل مشاهده شده شناسایی کند. در واقع ابتدا سیستم یاد می‌گیرد و بعد می‌تواند به سوالات پاسخ بدهد.

روشی جدید برای جستجوی اشیا در اینترنت

به گزارش کلیک، در دهه گذشته، به لطف شبکه‌های یادگیری عمیق جهش عظیمی در فناوری‌های مختلف صورت گرفته است. شبکه‌های یادگیری عمیق، در واقع تقریب محاسباتی از این است که مغز انسان چگونه کار می‌کند و می‌تواند اشیا و مردم را براساس نمونه‌های آموزشی از قبل مشاهده شده شناسایی کند. در واقع ابتدا سیستم یاد می‌گیرد و بعد می‌تواند به سوالات پاسخ بدهد.

تعدادی از شرکت‌ها در تلاش هستند که از این تکنولوژی در طراحی اشیا استفاده کنند، ولی تاکنون هیچ‌کدام واقعا موفق نبوده‌اند. با استفاده از اسکن کد QR در یک مغازه، یا نام یک کتاب در سایت آمازون می‌توانیم به اینگونه درخواست‌ها برسیم، ولی فناوری هنوز به ما این امکان را نداده است که یک عکس از یک صندلی بگیریم و بتوانیم به راحتی آن یا مشابه با آن صندلی را به صورت آنلاین جستجو کنیم.

deep learning2

این قابلیت جذاب کامپیوترها، اخیرا مورد توجه محققان قرار گرفته است. برای حل این مساله، یک تیم از محققان دانشگاه کرنل در تلاش هستند. یک استارتاپ جدید به نام GrokStyle راه‌اندازی شده است و دانشمندان کامپیوتر گرد هم آمده‌اند تا بتوانند الگوریتمی طراحی کنند که قابلیت شناخت اشیا در یک تصویر را داشته باشد و سپس آن را به کالای دنیای واقعی لینک بدهند و کالا را بفروش برسانند.

آنچه به دنبال آن هستند مشابه تجربه جستجوی پست‌های متنی بر روی اینترنت است. همچنین، محققان قصد دارند که علاوه بر اینکه اشیا را تشخیص بدهند، بتوانند بفهمند چه شخص دیگری آن شی را خریداری کرده است و همچنین آیا اشیا مشابه دیگری وجود دارد؟ یا مثلا از چه جنس چوبی در آن استفاده شده است. اما در گام اول، هدف این است که الگوریتمی طراحی شود که بگوید آن شی چیست؟! و بعد تجربه مردم در خرید آن شی را کشف کنند. همانطور که تصور می‌شود، این کار راحتی نیست و چیزی فراتر از تشخیص گفتار، جلد کتاب و فیلم‌ها است.

deep learning

ممکن است در رستوران نشسته باشید و یک لوستر را ببینید که از آن خوشتان آمده است. بخواهید یکی مشابه آن را خریداری کنید. همچنین می‌خواهید بدانید در چه رنگ‌ها و چه قیمت‌هایی در دسترس است. این ایده که از آن عکس بگیرید و براساس تصویر به جستجوی آن بپردازید جالب است. سپس براساس تصویر لیستی از قیمت‌ها از اقلام مشابه نیز دریافت کنید. بعد می‌توانید براساس مکان، مواد یا معیارهای خاصی آن را فیلتر کنید. البته صحبت بر سر این که چیزی که می‌خواهیم کجاست نیست، صحبت بر سر انتخاب‌های بیشتر است.

در ایده‌پردازی کمی جلوتر برویم، حتی کاربر بتواند کیفیت شی چقدر است؟ مثلا اینکه از چه چوب یا پارچه‌ای با چه میزان مرغوبیت در آن استفاده شده است، جستجوی خود را انجام دهد.

سیستمی که تیم در حال طراحی آن است، با عنوان یادگیری شباهت‌های بصری برای طراحی محصول با استفاده از شبکه‌های عصبی کانولوشن در مجله ACM Transactions به چاپ رسیده است. محققان امیدوار هستند که بتوانند تا ماه‌های آینده کار خود را به اتمام برسانند و سیستم به زودی در دسترس کاربران قرار بگیرد.

ارسال نظر