Understanding Machine Learning: From Theory to Algorithms
به تشخیص خودکار الگوهای معنی دار در داده ها، اصطلاحا یادگیری ماشین گویند. در دو دهه گذشته تقریباً در هر کاری که نیاز به استخراج اطلاعات از مجموعه دادههای بزرگ داشته باشند، یادگیری ماشین به ابزاری رایج تبدیل شده است. ما توسط فناوریهای مبتنی بر یادگیری ماشین احاطه شده ایم: موتورهای جستجو یاد میگیرند که چگونه بهترین نتایج را برای ما به دست آورند (در حالی که تبلیغات سود آوری نیز در بین نتایج قرار دهند)، نرم افزارهای آنتی اسپم یاد میگیرند که پیامهای اسپم ایمیل شما را فیلتر کنند و تراکنشهای کارتهای اعتباری توسط نرم افزاری که نحوه تشخیص کلاه برداران را یاد میگیرد، ایمن میشوند. دوربینهای دیجیتال تشخیص چهرهها در تصاویر را یاد میگیرند و برنامههای دستیار شخصی بر روی گوشیهای هوشمند یاد میگیرند تا دستورات صوتی را شناسایی کنند. اتومبیلها مجهز به سیستمهای جلوگیری از تصادف شده اند که با استفاده از الگوریتمهای یادگیری ماشین ساخته شده اند. یادگیری ماشین همچنین در علوم دیگر مانند بیوانفورماتیک، پزشکی و نجوم بسیار مورد استفاده قرار میگیرد.
هدف اول کتاب درک یادگیری ماشین، ارائه مقدمه ای خیلی دقیق و در عین حال آسان برای یادگیری مفاهیم اصلی یادگیری ماشین است: یادگیری چیست؟ چگونه یک ماشین یاد میگیرد؟ چگونه ما منابع لازم برای یادگیری مفهوم داده شده را معلوم میکنیم؟ آیا یادگیری، همیشه ممکن است؟ آیا میتوانیم بدانیم فرایند یادگیری، موفق یا ناکام بوده است؟
هدف دوم این کتاب، ارائه چندین الگوریتم کلیدی یادگیری ماشین است. ما الگوریتم هایی را انتخاب کردیم که از یک سو با در عمل با موفقیت مورد استفاده قرار گرفته اند و از سویی دیگر طیف گسترده ای از تکنیکهای مختلف یادگیری را ارائه میدهند. علاوه بر این، ما توجه خاصی به الگوریتمهای مناسب برای یادگیری در مقیاس بزرگ کرده ایم (مثل کلان داده)؛ در سالهای اخیر، جهان ما به طور فزاینده ای «دیجیتالی» شده و میزان دادههای موجود برای یادگیری به طرز چشمگیری در حال افزایش است. در نتیجه، در بسیاری از برنامه ها، دادهها فراوان است و زمان محاسبه، تنگنای اصلی است. بنابراین ما به صراحت هم مقدار داده و هم مقدار زمان محاسبه لازم برای یادگیری یک مفهوم داده شده را تعیین میکنیم.
Table of Contents
Chapter 1 Introduction
Part 1 Foundations
Chapter 2 A Gentle Start
Chapter 3 A Formal Learning Model
Chapter 4 Learning Via Uniform Convergence
Chapter 5 The Bias-Complexity Tradeoff
Chapter 6 The Vc-Dimension
Chapter 7 Nonuniform Learnability
Chapter 8 The Runtime Of Learning
Part 2 From Theory to Algorithms
Chapter 9 Linear Predictors
Chapter 10 Boosting
Chapter 11 Model Selection And Validation
Chapter 12 Convex Learning Problems
Chapter 13 Regularization And Stability
Chapter 14 Stochastic Gradient Descent
Chapter 15 Support Vector Machines
Chapter 16 Kernel Methods
Chapter 17 Multiclass, Ranking, And Complex Prediction Problems
Chapter 18 Decision Trees
Chapter 19 Nearest Neighbor
Chapter 20 Neural Networks
Part 3 Additional Learning Models
Chapter 21 Online Learning
Chapter 22 Clustering
Chapter 23 Dimensionality Reduction
Chapter 24 Generative Models
Chapter 25 Feature Selection And Generation
Part 4 Advanced Theory
Chapter 26 Rademacher Complexities
Chapter 27 Covering Numbers
Chapter 28 Proof Of The Fundamental Theorem Of Learning Theory
Chapter 29 Multiclass Learnability
Chapter 30 Compression Bounds
Chapter 31 Pac-Bayes
Appendix A Technical Lemmas
Appendix B Measure Concentration
Appendix C Linear Algebra