داده کاوی چیست؟ ۷ نکته خواندنی درباره داده کاوی
10 دی 1399کامسول چیست؟ راهنمای کامل نرم افزار کامسول و کاربردهای آن
1 خرداد 1400یادگیری ماشین یا ماشین لرنینگ (Machine Learning) کامپیوترها را قادر به انجام کارهایی میکند که تا پیش از این تنها توسط انسانها انجام میشد. از رانندگی با خودروها تا ترجمه متون، یادگیری ماشین منجر به انقلابی در هوش مصنوعی شده است. یادگیری ماشین به نرمافزارها کمک میکند تا درک بهتری از محیطهای پیچیده و غیرقابل پیش بینی در دنیای واقعی داشته باشند. اما یادگیری ماشین دقیقا چیست و چه چیزی منجر به فراگیر شدن این موضوع شده است؟
فهرست مطالب
یادگیری ماشین چیست؟
یادگیری ماشین عبارتست از آموزش دادن ماشینها با دادههای اولیه برای پیشبینی دقیق وقایع. این پیش بینی ها میتواند تشخیص اینکه میوه نمایش داده شده در یک تصویر، موز است یا سیب؟ یا تشخیص افراد در حال رانندگی پشت فرمان در یک چهار راه شلوغ، یا اینکه واژه شیر در جمله اشاره به شیر جنگل دارد یا لبنیات.
تفاوت اصلی مدل یادگیری ماشین با نرمافزارهای کلاسیک کامپیوتر در این است که برنامه نویس اصولا برای تشخیص موز از سیب برنامه نویسی نکرده است. در واقع یک مدل یادگیری ماشین بر اساس دادههایی که مدل بر اساس آن آموزش دیده است می تواند بصورت مستقل میوههای موجود در تصویر را تفکیک کند. در اصل کیفیت داده و فراوانی داده، کلید موفقیت یک مدل یادگیری ماشین است.
با استفاده از الگوریتم یادگیری ماشین میتوانید الگو ها را در داده ها پیدا کنید و در کار خود اعمال کنید. در یادگیری ماشینی، الگوریتم ها برای یافتن الگوها و ویژگی ها در حجم عظیمی از داده ها “آموزش داده می شوند” تا بتوانند براساس داده های جدید تصمیم گیری و پیش بینی کنند. هرچه الگوریتم بهتر باشد، میتوان با پردازش داده های بیشتر، تصمیمات و پیش بینی ها دقیق تر می شود. یادگیری ماشین شاخه ای از هوش مصنوعی (AI) است. امروزه، نمونه های زیادی از یادگیری ماشین در زندگی روزمره ما وجود دارد. دستیارهای دیجیتال در پاسخ به دستورات صوتی ما در وب جستجو می کنند و موسیقی پخش می کنند. وب سایت ها محصولات و فیلم ها و آهنگ ها را براساس آنچه قبلاً خریدهایم، تماشا کردهایم یا گوش داده ایم، توصیه میکنند.
تاریخچه یادگیری ماشین
یادگیری ماشین (ML) یکی از جنبه های مهم تجارت و تحقیقات مدرن است. یادگیری ماشین از الگوریتم ها و مدل های شبکه عصبی برای کمک به سیستمهای رایانهای در بهبود عملکرد آنها استفاده میکند. الگوریتم های یادگیری ماشینی به طور خودکار، یک مدل ریاضی را با استفاده از داده های نمونه که به آن «داده های آموزشی» نیز می گویند میسازند. میتوان گفت یادگیری ماشینی تا حدی مبتنی بر مدلی از تعامل سلولهای مغزی است. این مدل در سال ۱۹۴۹ توسط دونالد هب در كتابی با عنوان سازمان رفتار رونمایان شد. این کتاب نظریه های Hebb در مورد هیجان نورون و ارتباط بین نورون ها را ارائه می دهد.
تفاوت یادگیری ماشین با هوش مصنوعی در چیست؟
یادگیری ماشین اگرچه دستاوردهای بسیاری در حوزههای مختلف داشته است اما خود آن نیز یک روش برای دستیابی به هوش مصنوعی است. با تولد هوش مصنوعی در سال ۱۹۵۰ محققان مفهموم هوش مصنوعی را بدین صورت تعریف کردهاند: «ماشینی با توانایی انجام دادن وظیفهای که عموما توسط انسان انجام میشود.»
سیستمهای هوش مصنوعی عموما یک یا تمامی خصوصیتهای زیر را دارند: برنامه ریزی، یادگیری، استنتاج، حل مساله، نمایش دانش، بینش، حرکت
در کنار یادگیری ماشین راهکارهای دیگری برای ساخت سیستمهای هوش مصنوعی نیز وجود دارد. محاسبات تحولی یکی از این روشها می باشد که در آن الگوریتمها جهشهای رندومی را بین نسلها برای رسیدن به پاسخ بهینه امتحان میکنند.
شاخههای اصلی یادگیری ماشین چیست؟
یادگیری ماشین عموما به ۲ شاخه تقسیم میشود، یادگیری تحت نظارت و یادگیری بدون نظارت.
یادگیری ماشین تحت نظارت
این راهکار ماشین را بوسیله مثال آموزش میدهد. در طول یادگیری در روش یادگیری تحت نظارت، سیستم در معرض دادههای زیادی قرار میگیرد. بعنوان مثال تعداد زیادی عکس از اعداد دستنویس در اختیار سیستم قرار داده میشود. این عکسها هریک دارای یادداشت نوشته شده توسط ناظر برای مشخص کردن عدد موجود در عکس هستند. با ارائه تعداد کافی مثال، در نهایت سیستم یادگیری تحت نظارت ما یاد خواهد گرفت که رشتهی پیکسلها و اشکال مربوط به هر عدد را تشخیص دهد. نتیجه آن تشخیص مطمئن اعداد توسط سیستم ما خواهد بود.
با این وجود، سیستمهای آموزش عموما نیاز به تعداد کثیری داده برچسب گذاری شده خواهند داشت. دیتاستهای زیادی برای آموزش سیستمها وجود دارد. Google Open Images دارای بیش از ۹ میلیون تصویر می باشد. همچنین Youtube-8m دارای بیش از ۸ میلیون تصویر برچسب گذاری شده است. ابعاد دیتاستهای موجود روزبروز در حال بیشتر شدن هستند. فیسبوک نیز اخیرا اعلام کرد که بیش از سه و نیم میلیارد تصویر برچسب گذاری شده توسط هشتگها در اینستاگرام را در اختیار دارد. محققان برای آموزش یک سیستم پردازش تصویر با استفاده از یک میلیارد از دادههای این دیتاست توانستند به رکورد صحت تشخیص ۸۵.۴ درصد برسند.
کار سخت و طاقت فرسای برچسبگذاری دیتاستها عموما توسط سرویسهای عمومی انجام میشود. یکی از این روشها میتواند استفاده از انتخابهای افراد در کپچای گوگل باشد.
این روش یعنی یادگیری تحت نظارت به دادههای آموزشی کمتری نسبت به سایر روشهای یادگیری ماشین نیاز دارد و آموزش مدل را آسانتر میکند زیرا نتایج مدل را می توان با نتایج برچسبدار واقعی مقایسه کرد.
یادگیری ماشین بدون نظارت
در روش یادگیری بدون نظارت الگوریتمها برای تشخیص الگوهای مشابه وظیفهبندی میشوند تا بتوانند تشابهات بین دادهها را تشخیص دهند. یادگیری ماشین بدون نظارت، دادههای بدون برچسب را کنار میگذارد و از الگوریتمها برای استخراج ویژگیهای معنیدار مورد نیاز برای برچسبگذاری، مرتبسازی و طبقهبندی دادهها بدون دخالت انسان استفاده می کند.
یک مثال از یادگیری بدون نظارت میتواند تلاش الگوریتم گوگل برای نمایش نتایج جستجوی مناسب به شما باشد. یا نمایش سوالات مشابهی که سایر کاربران در موتور جستجوی گوگل سرچ کرده اند.
یک الگوریتم یادگیری بدون نظارت میتواند حجم عظیمی از ایمیلها را تجزیه و تحلیل کرده و ویژگیها و الگوهایی را که نشانگر spam بودن هستند کشف کند.
این الگوریتم برای تشخیص یک داده مشخص طراحی نشده است و به عبارت دیگر برای دسته بندی داده ها بر اساس تشابهات در به کار می رود.
یادگیری ماشین نیمه نظارت شده
این روش نسبت به روش های دیگر مخاطب بیشتری دارد. یادگیری نیمه نظارت شده می تواند مشکل نداشتن داده های دارای برچسب کافی (یا توانایی تهیه برچسب داده های کافی) برای آموزش الگوریتم یادگیری تحت نظارت را حل کند.
کاربرد های یادگیری ماشین
- تشخیص تصویر
تشخیص تصویر یکی از رایج ترین کاربردهای یادگیری ماشین است. این مورد برای شناسایی اشیا، اشخاص ، مکانها، تصاویر دیجیتال و غیره استفاده میشود.
- تشخیص گفتار
تشخیص گفتار فرآیندی است برای تبدیل دستورالعملهای صوتی به متن و همچنین با عنوان “تدبیل گفتار به متن” یا “تشخیص گفتار رایانهای” نیز شناخته میشود. در حال حاضر، الگوریتمهای یادگیری ماشین به طور گستردهای توسط برنامههای مختلف تشخیص گفتار استفاده می شود. دستیار گوگل، سیری، کورتانا و الکسا از فناوری تشخیص گفتار برای دنبال کردن دستورالعمل های صوتی استفاده میکنند.
- پیشبینی ترافیک
اگر می خواهیم از یک مکان جدید بازدید کنیم از Google Maps کمک میگیریم که مسیر صحیح را با کوتاهترین مسیر به ما نشان میدهد و شرایط ترافیک را پیشبینی میکند. این برنامه شرایط ترافیکی مانند خلوت بودن مسیر، کند شدن حرکت خودروها و یا ازدحام زیاد ترافیک را با کمک موقعیت مکانی واقعی وسایل نقلیه پیش بینی میکند. همه کسانی که از Google Map استفاده می کنند به این برنامه کمک می کنند تا پیش بینیها را بهتر شوند. این برنامه اطلاعات را از کاربران می گیرد و برای بهبود عملکرد به پایگاه داده خود می فرستد. اطلاعات جمع آوری شده توسط الگوریتمهای یادگیری ماشین پردازش شده و بهترین مسیر به کاربر پیشنهاد داده میشود.
- پیشنهاد محصول
یادگیری ماشین به طور گسترده ای توسط شرکتهای مختلف تجارت الکترونیکی و سرگرمی مانند آمازون، نتفلیکس و … برای توصیه محصول به کاربران استفاده میشود. هر زمان که ما در آمازون به دنبال کالایی بودیم، در هنگام گشت و گذار در اینترنت با همان مرورگر، تبلیغات مربوط به همان محصول را مشاهده کردیم و این به دلیل یادگیری ماشین است.
گوگل با استفاده از الگوریتمهای مختلف یادگیری ماشین، علاقه کاربر را درک می کند و محصول را براساس علاقه مشتری پیشنهاد میکند. پیشنهاد محصولات مرتبط با علاقه کاربران منجر به افزایش بازدید و افزایش فروش محصولات خواهد شد.
به همین ترتیب، وقتی از Netflix استفاده می کنیم پیشنهادهای متناسب با علاقه برای سریال، فیلم و غیره دریافت میکنیم. ارايه این پیشنهادات نیز با کمک یادگیری ماشین صورت میپذیرد.
- اتومبیل های خودران
یکی از جالب ترین کاربردهای یادگیری ماشین اتومبیلهای خودران هستند. یادگیری ماشین نقش بسزایی در اتومبیلهای خودران دارد و منجر به تحول در این صنعت شده است. تسلا مشهورترین شرکت تولید کننده اتومبیلهای خودران است. در صنعت اتومبیلهای خودران با استفاده از روش یادگیری بدون نظارت، آموزش خودرو برای تشخیص افراد و اشیا در هنگام رانندگی صورت میپذیرد.
- دستیار شخصی مجازی
ما دستیارهای شخصی مجازی مختلفی مانند دستیار گوگل-الکسا-کورتانا-سیری داریم. همانطور که از نامش پیداست، آنها به ما در یافتن اطلاعات با استفاده از دستورالعمل صوتی کمک میکنند. این دستیارها با دریافت دستورالعملهای صوتی، وظایفی نظیر پخش موسیقی، تماس تلفنی، باز کردن ایمیل، تعیین وقت ملاقات و… انجام داده و در امور روزمره به ما کمک کنند. این دستیارهای مجازی از الگوریتم های یادگیری ماشین به عنوان یک قسمت مهم استفاده میکنند.
- معاملات بازار سهام
یادگیری ماشین به طور گستردهای در معاملات بازار سهام استفاده میشود. در بازار سهام همیشه خطر بالا و پایین آمدن سهام وجود دارد، بنابراین برای یادگیری از حافظه کوتاه مدت شبکه عصبی برای پیش بینی روند بازار سهام استفاده می شود.
- پزشکی
در علم پزشکی از یادگیری ماشینی برای تشخیص انواع بیماریها استفاده میشود. استفاده از فناوری یادگیری ماشین منجر به تحول در علم پزشکی شده است و پزشکان قادر به ساخت مدلهای سه بعدی هستند و به کمک این مدلها میتوانند موقعیت دقیق ضایعات را در مغز پیشبینی کنند.بعنوان یک پزشک شما با استفاده از یادگیری ماشین به راحتی می توانید تومورهای مغزی و سایر بیماری های مرتبط با مغز را پیدا کنید.
- ترجمه خودکار زبان
امروزه اگر از کشوری جدید بازدید کنیم و آشنایی به زبان ان کشور نداشته باشیم، مشکل زیادی نخواهیم داشت، زیرا یادگیری ماشین نیز با تبدیل متن به زبانهای شناخته شده میتواند به ما کمک کند. (Google Neural Machine Translation) یک سرویس ارائه شده توسط گوگل است که این کار را برای ما انجام میدهد. فناوری ترجمه خودکار توالی الگوریتمهای یادگیری است، که ابتدا تشخیص تصویر انجام شده و با استفاده از تصویر استخراج شده متن از یک زبان به زبان دیگر ترجمه میشود.
اپلیکیشن های معروفی که از یادگیری ماشین استفاده کردند
- یلپ (Yelp)
یلپ یک وبسایت کاربرمحور می باشد که نظرات کاربران را در مورد کسب وکارهای مختلف به نمایش میگذارد. Yelp چند سال پیش هنگامی که برای اولین بار فناوری طبقه بندی تصاویر خود را پیاده سازی کرد، به یادگیری ماشین روی آورد. الگوریتم های یادگیری ماشینی Yelp به پرسنل انسانی این شرکت کمک می کند تا تصاویر را به طور موثرتری جمع آوری طبقه بندی و برچسب گذاری کنند.
- پینترست (Pinterest)
Pinterset برای بهبود تصاویر و محتوای خود چندین سال است که از یادگیری ماشین استفاده میکند. از آنجا که وظیفه اصلی Pinterest ارایه محتوای اصیل است. منطقی است که سرمایه گذاری در فناوریهایی که میتوانند این روند را موثرتر کنند، در اولویت پینترست باشد.
- توییتر
توییتر در سالهای اخیر در کانون اختلافات متعددی قرار داشت. از تغییرات بحث برانگیز در توییتر حرکت به سمت الگوریتم های یادگیری ماشین برای نمایش بهترین توعیت ها در ابتدا بوده است. هوش مصنوعی توییتر هر توییت را در زمان واقعی ارزیابی می کند و آنها را با توجه به معیارهای مختلف «امتیاز» میدهد و توعیتهای افراد دنبال شده را بر اساس امتیاز تولید شده با کاربر نشان میدهد. همچنین نمایش تبلیغات مناسب در بین توعیتها مورد دیگر استفاده از الگوریتمهای یادگیری ماشین توسط توییتر بوده است.
- گوگل
مشهودترین تحولات در تحقیقات شبکه عصبی گوگل، شبکه DeepMind و آنچه از آن با جمله “دستگاهی است که رویا میکند” بوده است. این همان شبکه ای است که تصاویرهای روانگردانی را تولید میکند که همه در مورد آن صحبت میکنند.
به گفته گوگل این شرکت در حال تحقیق در مورد تقریباً همه جنبه های یادگیری ماشین است که منجر به تحولات هیجانانگیزی در آنچه گوگل «الگوریتمهای کلاسیک» مینامند و همچنین سایر برنامه ها از جمله پردازش زبان طبیعی، ترجمه گفتار و سیستم های رتبهبندی و پیشبینی موتور جستجوی گوگل خواهد شد.
نرم افزارهای یادگیری ماشین
در این قسمت به بررسی مهمترین نرم افزاهایی که مهندسین داده و یادگیری ماشین برای طراحی و توسعه الگوریتمهای یادگیری ماشین استفاده میکنند خواهیم پرداخت:
- TensorFlow
- Google Cloud
- Amazon Machine Learning
- Accord.net
- Apache Mahout
- Shogun
- Oryx 2
- Apache Singa
- Apache Spark Mlib
- PyTorch
- Weka
- Colab
- Rapid Miner
- Karas.io
- Accors.net
- Knime
- Scikit Learn
در انجام پروژه های یادگیری ماشین خود از چند ضلعی کمک بگیرید.
چند ضلعی ارائه دهنده خدمات انجام پروژه های صنعتی، انجام پروژه های تخصصی در تمامی رشتهها