از مقاله یادگیری ماشین چیست فهمیدیم یادگیری ماشین از کجا آمده و به کجا میرود، سوالی که پیش میآید این است که جایگاه آن در مفاهیم کامپیوتری کجاست. کلمات داده کاوی (Data mining)، هوش مصنوعی و یادگیری ماشین را زیاد میبینیم، ولی آیا این کلمات با هم فرق دارند یا همه آنها یک مفهوم را بیان میکنند؟ اگر با هم فرق دارند، تفاوتشان در چیست و هر کدام کجا استفاده میشوند؟
با هدف پاسخ به این سوالات، در ادامه مرز بین این مفاهیم و تفاوت هوش مصنوعی و یادگیری ماشین را مشخص میکنیم.
. . . .
علم داده چیست؟
ورود به بحث علم داده، هوش مصنوعی و یادگیری ماشین را با یک معرفی سطح بالا شروع میکنیم. یادگیری ماشین، دادهکاوی، برنامهنویسی کامپیوتر و بیشتر شاخههای مرتبط (به جز آمار) در ابتدا از علوم کامپیوتر نشات میگیرند که هر چیز مرتبط با طراحی و استفاده از کامپیوترها را در برمیگیرد. در این فضای فراگیر علوم کامپیوتر، شاخه وسیع بعدی، علم داده (Data science) است. در فضایی محدودتر از علوم کامپیوتر، علم داده شامل روشها و سیستمهایی برای استخراج دانش و بینش از داده با استفاده از کامپیوترها است.
نکته مهمی که باید بهخاطر بسپارید این است که در مقیاس بزرگتر،چگونه یادگیری ماشین بین دو مفهوم علم داده و علوم کامپیوتر جای میگیرد. البته شاخههای مرتبط مثل «یادگیری ماشین» و «دادهکاوی» ممکن است در نگاه اول بهراحتی قابل تفکیک نباشند.
دوره آموزشی: هنوز انجام پروژه یادگیری ماشین شروع نکردید، چون برنامهنویسی بلد نیستید؟ اصلا نگران نباشید. دوره آموزش پایتون ویژه هوش مصنوعی را در کانال یوتیوب دیتاهاب ببینید.
تفاوت هوش مصنوعی و یادگیری ماشین
در شکل بالا سلسهمراتب یادگیری ماشین به کمک یک نوع از عروسکهای روسی (Russian matryoshka dolls) نمایش داده شده است. سومین عروسک خارج شده هوش مصنوعی است. هوش مصنوعی یا AI، توانایی ماشینها در انجام وظایف هوشمند (Intelligent) و شناختی (تشخیصی، Cognitive) است.
مشابه با تأثیری که انقلاب صنعتی در تولید نسلی از ماشینها با توانایی شبیهسازی عملیات فیزیکی داشت، هوش مصنوعی محرک پیشرفت ماشینهایی با توانایی شبیهسازی قابلیتهای شناختی شد.
هوش مصنوعی، یک شاخه بزرگ (ولی در مقایسه با علوم کامپیوتر و علم داده بسیار کوچک) که شامل تعداد زیادی زیرمجموعه است که امروزه اکثر این زیرمجموعهها معروف هستند؛ مثل جستجو و برنامهریزی (Search and planning)، استدلال و بازنمایی دانش (Reasoning and knowledge representation)، ادراک (Perception)، پردازش زبان طبیعی (NLP: Natural language processing) و یادگیری ماشین.
دوره آموزشی: برای آشنایی با مفاهیم پردازش زبان طبیعی دوره آموزش پردازش زبان طبیعی مقدماتی را ببینید.
یادگیری ماشین در دیگر شاخههای هوش مصنوعی از جمله پردازش زبان طبیعی و ادراک نیز ورود پیدا میکند، زیرا هر دو از الگوریتمهای خودآموزی استفاده میکنند. رابطه بین حوزههای مرتبط با داده در شکل زیر مشخص شده است که در آن جای هوش مصنوعی و یادگیری ماشین مشخص شده است.
دوره آموزشی: برای ورود به دنیای پروژههای یادگیری ماشین، دوره آموزش یادگیری ماشین به زبان ساده با پایتون را در کانال یوتیوب دیتاهاب ببینید.
تفاوت یادگیری ماشین و دادهکاوی
حال که تفاوت هوش مصنوعی و یادگیری ماشین را مشخص کردیم، جایگاه داده کاوی را بررسی می کنیم.
برای دانشجویان علاقهمند به هوش مصنوعی، یادگیری ماشین یک نقطه بسیار عالی برای شروع است چون یک مسیر دقیقتر و محدودتر مطالعاتی را در مقایسه با حوزه هوش مصنوعی ارائه میکند. همچنین الگوریتمهای یادگیری ماشین در دیگر حوزهها از جمله ادراک و پردازش زبان طبیعی نیز قابل استفاده است.
همانطور که قبلاً اشاره شد، یادگیری ماشین با دادهکاوی نیز (که بر روی کشف الگوها در مجموعهدادهها تمرکز دارد) همپوشانی دارد. الگوریتمهای معروف مثل خوشهبندی k-means، تحلیل وابستگی (Association analysis) و تحلیل رگرسیون (مقاله رگرسیون چیست را ببینید) برای تحلیل داده در یادگیری ماشین و دادهکاوی مورداستفاده قرار میگیرند.
تفاوت یادگیری ماشین و دادهکاوی این است که یادگیری ماشین بر روند افزایشی خودآموزی و ساخت مدل دادهای برای انجام پیشبینیهای آینده تمرکز دارد، ولی دادهکاوی به طور دقیقتری بر روی پاکسازی مجموعهدادهها برای یافتن بینش کلی از گذشته، تمرکز دارد.
مثال برای تفاوت یادگیری ماشین و دادهکاوی
تفاوت یادگیری ماشین و دادهکاوی را میتوان از طریق قیاس دو تیم باستانشناسان توضیح داد.
- تیم اول:
از باستانشناسانی تشکیل شده است که تمرکز آنها بر روی ازبینبردن ذرات مخربی است که در مسیر آثار باارزش وجود دارند و آنها را از دید پنهان کردهاند. هدف اصلی آنها کاوش محل، یافتن اکتشافات جدید و ارزشمند و پس از آن جمعآوری وسایل و رفتن از محل است. یک روز بعد به مقصدی دیگر میروند تا یک پروژه جدید را شروع کنند (بدون هیچ رابطهای با محلی که دیروز آن را کاوش کردهاند).
- تیم دوم:
مثل تیم اول کار کاوش در محلهای تاریخی را دارند، ولی این باستانشناسان یک شیوه (Methodology) دیگر دارند. آنها از عمد برای چندین هفته از کاوش چاله اصلی خودداری میکنند. در این زمان، از مکانهای باستانشناسی مرتبط در آن حوالی بازدید میکنند و بررسی میکنند که هر محل چطور کاوش شده است. پس از بازگشت به محل اکتشاف خود، این دانش بهدستآمده را برای کاوش چالههای کوچکی حوالی چاله اصلی به کار میبرند. سپس باستانشناسان نتایج را تجزیه و تحلیل میکنند. پس از تحلیل تجربه خود از کاوش یک چاله، از این تحلیل برای بهبود فرایند کاوش چاله بعدی استفاده میکنند که شامل تخمین زمان کاوش یک چاله، درک تفاوتها و الگوهای یافته شده در زمین آن محل و یافتن یک استراتژی جدید برای کاهش خطا و بهبود دقت کارشان میشود. به کمک این تجربه، قادر خواهند بود تا روش خود را بهینه کنند و یک مدل استراتژیک برای کاوش چاله اصلی ایجاد کنند.
بررسی تفاوت یادگیری ماشین و داده کاوی
برای روشنتر شدن تفاوت بین دو تیم کمی وارد جزئیات میشویم. تیم اول از شیوه دادهکاوی و تیم دوم از یادگیری ماشین استفاده میکند. در سطح خرد، تفاوت یادگیری ماشین و دادهکاوی زیاد مشخص نیست و بسیار شبیه به نظر میرسند، چرا که از ابزارهای مشترک زیادی استفاده میکنند. هر دو تیم از راه کاوش محلهای تاریخی برای کشف اشیا ارزشمند کسب درآمد میکنند. ولی در عمل، روش آنها متفاوت است.
تیم یادگیری ماشین تمرکز خود را بر روی تقسیم داده به دادههای آموزشی و آزمایشی برای ساختن مدل و بهبود پیشبینیهای آینده بر اساس تجربیات گذشته میگذارد. درحالیکه تیم دادهکاوی روی کاوش هرچه مؤثرتر محل هدف، بدون استفاده از مدل خودآموز تمرکز دارد.
. . . .
و در انتها…
همان طور که دیدیم دادهکاوی، هوش مصنوعی و یادگیری ماشین ارتباط بسیار نزدیکی دارند. اما یادگیری ماشین نقطه مناسبی برای شروع یادگیری بود، چون یک مسیر دقیقتر و محدودتری داشت و الگوریتمهای یادگیری ماشین را میتوان در حوزه های دیگر استفاده کرد.
حال که تفاوت هوش مصنوعی و یادگیری ماشین را فهمیدیم، در مقاله یادگیری ماشین به زبان ساده درباره مدل داده و همچنین دادههای آموزشی و آزمایشی حرف میزنیم. قبل از هرکاری، لازم است مجموعه داده را به دو بخش دادههای آموزشی و آزمایشی تقسیم کرده و سپس از آنها برای آموزش مدل استفاده کرد.
دوره آموزشی: از بقیه شنیدید برای یادگیری هوش مصنوعی باید ریاضیات بلد باشید و نگرانید که ریاضی را فراموش کردید؟ آموزش سریع جبر خطی را در کانال یوتیوب دیتاهاب ببینید تا خیالتان راحت شود.