حرکت عظیم یاهو در حوزه یادگیری ماشین

|
۰ دیدگاه
960-yahoo-release-largest-cache-to-improve-machine-learning

ارائه بزرگ ترین مجموعه داده هابرای یادگیری ماشین، به عنوان مزیت رقابتی در بازار برای یاهو تلقی می شود.

به گزارش کلیک، مسئولین یاهو اعلام کرده اند، هدف از این کار پیشبرد حوزه سامانه های پیشنهادگر و یادگیری ماشین در مقیاس بزرگ است. همچنین این شرکت به دنبال این است تا به ایجاد برابری و عدالت بین جوامع تحقیقاتی دانشگاهی و صنعتی کمک کند.
بنا بر اظهارات سوجو راجان مدیر تحقیقات آزمایشگاه های یاهو، بسیاری از محققین دانشگاهی و دانشمندان علوم داده به مجموعه داده های واقعا بزرگ دسترسی ندارند چرا که این حق دسترسی، از گذشته تا به حال مزیتی بوده که در انحصار شرکت های بزرگ قرار داشته است. ما این مجموعه داده ها را برای محققین مستقل عرضه می کنیم چرا که روابط مشترک و صادقانه با همکاران دانشگاهی خود را ارج می نهیم و همیشه به دنبال پیشبرد نوآوری در یادگیری ماشین و سامانه های پیشنهادگر هستیم.

machine_learning

20 میلیون کاربر در این زمینه مشارکت داشتند

یاهو دقیقا چه چیزی را عرضه می کند؟ این مجموعه داده، مجموعه ای مبتنی بر نحوه تعاملات کاربران ناشناس با سرویس های تحت مالکیت یاهو است که از جمله این سرویس ها می توان مجموعه داده های خوراک اخبار یاهو، صفحه اصلی یاهو، یاهو فاینانس، بخش ورزشی یاهو، املاک و مستغلات یاهو و بخش فیلم یاهو را نام برد.
این مجموعه داده حاوی 13.5 ترابایت اطلاعات فشرده نشده در رابطه با نحوه تعامل و ارتباط کاربران با این سرویس های یاهو است. این مجموعه داده 110 میلیارد رویداد را پوشش می دهد و شامل تعامل حدود 20 میلیون کاربر از فوریه سال 2015 تا ماه می 2015 است.
اطلاعات طبقه بندی شده شامل بازه سنی، داده های کلی جغرافیایی و جنسیت زیر مجموعه ای از کاربران ناشناس در این مجموعه داده وجود دارد. عناوین، عبارات کلیدی مقالات خبری و خلاصه اخبار و غیره نیز در این مجموعه وجود دارند. داده های مربوط به تعامل کاربران دارای مُهر زمانی است و حتی نشان می دهد برای مرورگری سایت ها، کاربر از چه دستگاهی استفاده کرده است.
به گفته تام میشل، رئیس دانشکده یادگیری ماشین دانشگاه کارنگی ملون بالاخره برای بررسی این که چگونه به صورت خودکار می توان پی برد که کدام مقاله خبری مورد نظر کدام کاربر است، کلیه محققین دانشگاهی به داده های در مقیاس واقعی دسترسی دارند و قادر خواهند بود تا با استفاده از این مجموعه داده به شکل یک مورد آزمایشی مشترک، روش های تحقیقاتی خود را با یکدیگر مقایسه کنند. قطعا در دانشگاه کارنگی ملون از این مجموعه داده استفاده خواهیم کرد.

حرکت عظیم یاهو
از چارلز کینگ تحلیل گر اصلی شرکت Pund-IT، نظرش را در مورد این حرکت عظیم یاهو در زمینه یادگیری ماشین جویا شدیم. به نظر او این کار به نوعی یک رویداد خود ترویجی از جانب یاهو است که این شرکت را به بازیگری در حوزه رو به رشد یادگیری تبدیل می کند. گاهی اوقات مشکلات تجاری دائمی یاهو باعث می شود تا تاریخچه نوآوری در حال توسعه این شرکت، خصوصا در مورد فناوری های پیشتاز بازار به ورطه فراموشی سپرده شود و این تلاش می تواند و باید چنین تصور نادرستی را از بین ببرد.

به گفته کینگ در اصل با ایجاد چنین مجموعه عظیمی از داده ها که نحوه تعامل کاربران ناشناس با سرویس های تحت مالکیت یاهو را به محققین دانشگاهی نشان می دهد، این شرکت به پیشرفت پروژه های یادگیری ماشین بین محققینی که به ندرت به چنین منبع سرشاری از داده ها دسترسی دارند کمک می کند.
همچنین کینگ خاطر نشان می کند که در بسیاری از موارد، شرکت ها مجموعه داده هایی از این دست را اغلب برای استفاده خصوصی خودشان نگه می دارند. در نتیجه دانشمندان علوم داده در دانشگاه ها و آزمایشگاه های تحقیقاتی مربوطه مجبور می شوند تا با مجموعه داده های با حجم بسیار کمتر تحقیقات خود را انجام دهند.
به گفته کینگ این تلاش یاهو باید به پیشرفت یادگیری ماشین، خصوصا در سطح دانشگاهی کمک کند. البته تجزیه و تحلیل تاثیرات این کار بر سازمان های تجاری کار دشواری است. با گذشت زمان بسیاری از نوآوری هایی که دانشگاه ها انجام می دهند راه خود را به بازارهای تجاری پیدا خواهند کرد. با توجه به اندازه و غنای مجموعه داده ای که یاهو عرضه می کند، به خوبی از تحقیقات علمی پشتیبانی خواهد کرد و الهام بخش این تحقیقات خواهد بود که در نهایت این مسئله به نفع کسب و کارها است.

منبع:MSN

0 پسندیده شده
محمدرضا مرتضایی
از این نویسنده

بدون دیدگاه

جهت ارسال پیام و دیدگاه خود از طریق فرم زیر اقدام و موارد زیر را رعایت نمایید:
  • پر کردن موارد الزامی که با ستاره قرمز مشخص شده است اجباری است.
  • در صورتی که سوالی را در بخش دیدگاه مطرح کرده باشید در اولین فرصت به آن پاسخ داده خواهد شد.