ماشین لرنینگ یا همان یادگیری ماشینی (ML) ترجمه عبارت انگلیسی Machine learning می باشد.
این علم مطالعه علمی الگوریتمها و مدلهای آماری مورد استفادهی سیستمهای کامپیوتری می باشد که بهجای استفاده از دستورالعملهای واضح، از الگوها و استنباط برای انجام وظایف سود میبرند.
یادگیری ماشینی علمی است که باعث میشود رایانهها بدون نیاز به یک برنامه صریح در مورد یک موضوع خاص یاد بگیرند. به عنوان زیر مجموعهای از هوش مصنوعی، الگوریتمهای یادگیری ماشینی یک مدل ریاضی بر اساس دادههای نمونه یا “دادههای آموزش” به منظور پیشبینی یا تصمیمگیری بدون برنامهریزی آشکار، ایجاد میکنند.
در واقع با آموزش های ریاضی، به برنامه یا ربات می فهمانیم که چگونه برنامه استنباط کند و تشخیص دهد و با استفاده از آن آموزش ها و مدل های ریاضی آموزش داده شده، مسائل جدید را برای ما حل خواهد کرد.
معرفی دوره: آموزش دوره حضوری پایتون در چهارباغ اصفهان با مدرک فنی و حرفه ای
گواهینامه فنی حرفه ای دوره ماشین لرنینگ (پایتون) در مهارت خانه
قطعا بعد از گذراندن دوره آموزشی پایتون یکی از سوالات هنرجویان، نحوه صدور گواهینامه یا مدرک برای هنرجویان دوره می باشد. طبق سرفصل فنی و حرفه ای، حداقل ميزان تحصيلات هنرجویان فوق ديپلم فني می باشد و باید آشنایی نسبی با رایانه داشته باشند.
دقت شود هر موسسه و آموزشگاهی می تواند مدرک پایان دوره صادر کند اما معتبرترین مدرک دوره پایتون از طرف سازمان فنی و حرفه ای صادر می شود.
مراحل صدور مدرک فنی و حرفه ای دوره ماشین لرنینگ (پایتون)
پس از اتمام دوره آموزشی، هنرجو می بایست آزمون تئوری و سپس آزمون عملی را در سازمان مرکز استان امتحان دهد و پس از کسب حداقل نمره قبولی، مدرک برنامه نویسی پایتون برای ایشان صادر خواهد شد. مدارک صادر شده از این سازمان دارای کد استاندرد ISCO می باشد که در بیش از 186 کشور دنیا مورد اعتبار می باشد.
حتما سوال پیش می آید که محتوای آموزشی دوره ماشین لرنینگ مهارت خانه چیست و چه مواردی در آن آموزش داده می شود.
باید به این نکته اشاره شود که بدلیل جدید بودن بحث ماشین لرنینگ، این دوره هنوز در سرفصل فنی و حرفه ای تعریف نشده و احتمالا طی سالهای آینده سرفصل این دوره رسما اعلام می گردد و پیشنیاز آموزش آن نرم افزار پایتون است.
کشورهای صنعتی اروپا مثل آلمان، خواستگاه آموزش دیدگان این علم هستند و سالیانه تعداد زیادی برای کار و تحصیل با مهارت به این علم به این کشورها مهاجرت می کنند.
در این دوره حضوری سعی شده است که تمامی سرفصل دوره پایتون سازمان فنی و حرفه ای پوشش داده شود تا هنرجویان خیالشان از بابت آزمون و مدرک راحت باشد و همچنین موارد ماشین لرنینگ و مثال های فراوان و کاربردی که هنوز وارد سرفصل نشده و مطابق نیاز روز بازار است در دوره گنجانده شود که اهم آن به اختصار توضیح داده می شود.
مروری کلی بر ماشین لرنینگ
به صورت خیلی خلاصه، ماشین لرنینگ یا یادگیری ماشین یک نوع از هوش مصنوعی است که به یک سیستم امکان میدهد از روی دادهها یاد بگیرد و دیگر نیازی به برنامه نویسی دقیق برای اجرای آن نیست.
این رشته روی توسعه برنامههای کامپیوتری متمرکز میشود تا آنها را قادر سازد به دادهها دسترسی پیدا کنند و از آنها برای یادگیری خودشان استفاده شود.
در یک سطح دیگر میتوان ماشین لرنینگ را فرایند آموزش دادن به یک سیستم کامپیوتری دانست تا بتواند هنگامی که اطلاعات مناسبی به آن داده میشود، پیشبینیهای دقیقی انجام بدهد.
این پیشبینیها ممکن است تشخیص دادن اینکه یک تکه میوه در عکس، سیب یا پرتقال یا موز است، باشد، یا تشخیص یک دسته از افراد که در حال رد شدن از خیابان هستند باشد، یا اینکه در فلان جمله «دفتر» به معنای یک محل کار است یا به معنای محل یادداشت، و یا شناسایی محتوای یک ویدئو و تولید کپشن برای آن باشد.
تفاوت کلیدی یادگیری ماشین با نرمافزارهای سنتی در این است که در اینجا، یک برنامهنویس با کدهای دقیق کامپیوتری تفاوت سیبها با پرتقالها را برنامهنویسی نکرده، بلکه خود هوش مصنوعی این تفاوت را شناسایی میکند.
به جای این کار، یک مدل یادگیری ماشینی تفاوت میوهها را بر اساس مجموعهای از دادهها، برای مثال حجم انبوهی از تصاویر تگشده میوههای مختلف مثل سیب، پرتقال، و موز یاد میگیرد.
برای همین دادهها یا اطلاعات، و نه مقدار محدود بلکه حجم انبوهی از آنها، کلید اصلی امکانپذیری ماشین لرنینگ محسوب میشود.
انواع روش های ماشین لرنینگ:
نحوه ارتباط برقرار کردن هوش مصنوعی یا عامل یادگیری ماشین با دادهها بر اساس مدلها و الگوریتمهای مختلفی مشخص میشود.
به صورت کلی، اغلب الگوریتمهای یادگیری ماشین به دو دسته اصلی تقسیم میشود:
- الگوریتمهای یادگیری با نظارت
- الگوریتمهای یادگیری بدون نظارت
از دیگر آلگوریتم ها میتوان به انواع یادگیری ماشین زیر اشاره کرد:
- الگوریتمهای یادگیری با شبه-نظارت
- الگوریتمهای یادگیری ماشین تقویت شده
در ادامه هریک از این روش های ماشین لرنینگ را معرفی کرده و تفاوت آنها با یکدیگر که کاربردهای یادگیری ماشین بر اساس آنها مشخص میشوند را نشان خواهیم داد.
یادگیری ماشین با نظارت چیست؟
این رویکرد معمولا به ماشینها از طریق مثال آموزش میدهد. در حین آموزش و تمریندادن در روش با نظارت، حجم بسیار زیادی دادههای برچسب خورده به سیستم ارائه میشود.
این دادهها ممکن است برای مثال شکلهای دستنویسی باشند که مشخص میکنند کدام عدد را نمایش میدهند.
با دریافت مثالهای کافی، یک سیستم یادگیری ماشین با نظارت یاد میگیرد که خوشههای پیکسل و شکلهای مرتبط با هر عدد را شناسایی کرده و در ادامه قادر میشود اعداد دستنویس را تشخیص داده و شناسایی کند. به این ترتیب یاد میگیرد به خوبی فرق بین ۷ و ۸ یا ۴ و ۹ را تشخیص بدهد.
اما به هر حال لازم به ذکر است که تمریندادن و آموزش این سیستمها نیاز به حجم انبوهی از اطلاعات برچسب خورده دارد. و بعضی از این سیستمها برای تسلط یافتن روی یک وظیفه نیاز به میلیونها مثال دارند.
در نتیجه، مجموعههای داده (Datasets) که برای آموزش این سیستمها به کار میروند بسیار بزرگ هستند. برای مثال مجموعه دادههای تصاویر باز گوگل شامل چیزی حدود ۹ میلیون تصویر میشود.
فرآیند پر زحمت برچسب زدن دادهها کاری است که اغلب با استفاده از سیستمهای برونسپاری جمعی انجام میشود.
مثالی از ماشی لرنینگ با “یادگیری ماشین با نظارت “
برای مثال مجموعه داده ایمیجنت (ImageNet) که شامل بیش از ۱۴ میلیون تصویر طبقهبندی شده است، در طول ۲ سال و با کمک حدود ۵۰.۰۰۰ نفر از سراسر جهان انجام شده است.
این در حالی است که به تازگی فیسبوک اعلام کرده مجموعه دادهای از تصاویر عمومی اینستاگرام به دست آورده است. این مجموعه شامل بیش از ۵/۳ میلیارد تصویر میشود. این رویکرد، یعنی استفاده از تصاویر در دسترس عمومی برای یادگیری ماشین میتواند راهی برای برونرفت از دردسر برچسب زدن و ایجاد مجموعه دادههای دستی باشد.
یادگیری ماشین بدون نظارت چیست؟
در مقابل روش با نظارت، در یادگیری بدون نظارت از الگوریتمهایی استفاده میشود که وظیفه تشخیص پترن یا الگوهای داخل دادهها را انجام میدهند.
این الگوریتمها سعی میکنند شباهتها را پیدا کنند تا با استفاده از آنها دادهها را به مقولههای مختلف طبقهبندی کنند. برای مثال هنگامی که از یک فروشگاه اینترنتی خرید میکنید از این الگوریتمها برای کنار هم قرار دادن آیتمهای مرتبط با جستجوی شما استفاده میشود.
یا اگر از گوگل نیوز استفاده کنید متوجه میشوید که از این الگوریتمها برای کنار هم گذاشتن موضوعات مشابه و تاپیکهای مرتبط استفاده میشود.
این نوع الگوریتم برای شناسایی انواع مشخصی از داده طراحی نشده است، بلکه به سادگی به دنبال دادههایی میگردد که بر اساس مشابهت میتوانند کنار هم قرار بگیرند. همچنین میتواند موارد متفاوتی که بیرون از این دستهها قرار میگیرند را تشخیص بدهد.
یادگیری ماشین با شبه-نظارت چیست؟
ممکن است به واسطه اوج گرفتن استفاده از یادگیری ماشین با شبه-نظارت، اهمیت مجموعههای عظیم داده برای آموزش سیستمهای یادگیری ماشین در طول زمان کاهش پیدا کند.
همان طور که از عنوان این روش معلوم است، در آن ترکیبی از یادگیری با نظارت و یادگیری بدون نظارت به کار برده میشود.
این تکنیک از مجموعه کوچکی از دادههای برچسب خورده و در کنار مجموعه بزرگی از دادههای برچسب نخورده برای آموزش سیستم استفاده میکند.
از دادههای برچسب خورده برای آموزش یک مدل ماشین لرنینگ استفاده میشود، سپس این مدل برای برچسب زدن دادههای بدون برچسب به کار برده میشود. به این فرایند برچسب زدن کاذب یا شبه-برچسب-زدن (pseudo-labelling) گفته میشود.
سپس مدل بر اساس مجموعهای از دادههای برچسب خورده و برچسب نخورده آموزش میبیند.
استفاده از این روش اخیرا با ایجاد فریمورکهای جیایان (Generative Adversarial Networks)، که سیستمهای یادگیری ماشینی هستند که میتوانند از دادههای برچسب خورده برای تولید دادههای کاملا نو استفاده کنند، افزایش پیدا کرده است.
هنگامی که یادگیری ماشین با شبه-نظارت به همان تاثیرگذاری یادگیری با نظارت شود، دسترسی به حجم بسیار بالای قدرت محاسبه ممکن است اهمیت بیشتری در یادگیری ماشین موفقیتآمیز پیدا کند.
یادگیری ماشین تقویت شده چیست؟
برای فهمیدن یادگیری ماشین تقویت شده میتوانید به نحوهای که یک نفر یاد میگیرد یک بازی قدیمی کامپیوتری را بازی کند توجه کرد. فرد در ابتدا نه قواعد بازی را میداند و نه میداند چطور باید آن را کنترل کند. در حالی که آنها ممکن است کاملا تازه وارد باشند، با نگاه کردن به ارتباط بین دکمههایی که فشار میدهند. و اتفاقهایی که در تصویر میافتد، و امتیازی که در بازی به دست آورده یا از دست میدهند، کم کم یاد می گیرند و بازی آنها بهتر و بهتر میشود.
یکی از کاربردهای یادگیری ماشین تقویت شده در شبکه-Q عمیق در مجموعه گوگل دیپ مایند است. این سیستم توانسته در مجموعه گستردهای از بازیهای ویدئویی قدیمی با استفاده از دوره یادگیری ماشین انسانها را شکست دهد.
این سیستم با پیکسلهایی از هر بازی تغذیه می شود. و اطلاعات مختلف در مورد حالت بازی، مثل فاصله بین چیزهای مختلف در تصویر را تخمین میزند. سپس این موضوع که چطور حالت بازی و کنشهایی که در آن انجام میشوند با امتیاز نهایی ارتباط برقرار میکنند را بررسی میکند.
در نهایت با بررسی چندین باره روند بازی، سیستم به مدلی دست پیدا میکند که با دست آوردن بالاترین امتیاز در بازی به وجود میآید.
آنچه در دوره حضوری ماشین لرنینگ آموزش داده می شود
سازمان فنی و حرفه ای دوره ای تحت عنوان “برنامه نویس پایتون” در گروه شغلی کامپیوتر ارائه داده است. کد ایسکو برای این دوره 351230530000111 است که در سال 1399 تدوین شده است. این در حالی است که اهم موارد آموزش ماشین لرنیگ بصورت زیر می باشد.
لازم به ذکر است در این دوره ضمن پوشش تمام سرفصل فنی و حرفه ای دوره پایتون، سعی بر آن شده است که علاوه بر سرفصل فنی و حرفه تمام موارد کاربردی ماشین لرنینگ بصورت پروژه محور بیان شود.
- مقدمه ای بر یادگیری ماشین و فرمول نویسی پایتون
- پردازش های خطی و مباحث ریاضی مرتبط با آن
- ابزارهای یادگیری ماشین و پیش پردازش های متداول
- آلگوریتم جنگل و درخت و مباحث ریاضی مربوط به آن
- حل مسائل با استفاده از شعاع همسایگی
- فراخوانی داده نمونه و متفاوت و فراخوانی
- مباحث ریاضی در SVM و Support vector machine
- naive bayes
- کلاسترینگ و استفاده از روش k
- و در انتها شبکه عصبی