مرجع چیت شیتهای آموزشی
17
تعداد
مقدماتی
سطح
انگلیسی
زبان
برای همه ما پیش آمده که به آگهی های استخدامی نگاه می کنیم و به نظرمون مهارت هایی که خواستن با عنوان شغلی هم خوانی نداره (خیلی از شرکت ها آچار فرانسه میخوان). اینکه در حوزه داده و هوش مصنوعی بدونیم برای هر شغل، چه توانایی هایی لازم داریم، خیلی بهمون کمک میکنه که همون چیزی یاد بگیریم که لازمه و حوزه کاریمون دقیق مشخص کنیم.در این چیت شیت، مسیر Data Analyst براتون مشخص کردیم.
سه عنوان شغلی اصلی در حوزه داده و هوش مصنوعی زیاد می بینیم.
تعریف های زیادی از Data Analyst، Data Engineer و Data Scientist می شنویم (بعضی وقتا اصلا معلوم نمیشه تفاوت کجاست). ولی ما ترجیح میدیم بهتون راه خیلی واضح نشون بدیم. پس میگیم چی لازمه بدونید که برای انجام پروژه و کار بدردتون میخوره.
در این چیت شیت، مشخص کردیم یک Data Engineer باید چه چیزهایی بلد باشه.
تا حالا به این فکر کردید که اگر بخواهید تخصص خودتون در حوزه داده را دقیق مشخص کنید، باید چی بنویسید؟ چون خیلی وقتا مسیر نمیدونیم و مهارت های مختلفی یاد می گیریم که در یک دسته مشخص قرار نمی گیرند.
در دو قسمت قبلی، با Data Analyst و Data Engineer آشنا شدیم. ولی Data Scientist چه کسی هست و چه چیزایی باید بدونه؟
در این چیت شیت، مسیر Data Scientist بهتون نشون دادیم.
حتما براتون پیش اومده که خواستین وارد حوزه علوم داده بشید و یک عالمه اسم کتابخونه شنیدید. با هر کی مشورت می کنید
میگه این کتابخونه رو بلدی🤨؟ باید این یاد بگیری
چطور نمیدونی این کتابخونه چیه؟😞
قبول داریم که انتخاب ها زیاده و مسیرها زیادن و هر کسی یک چیزی میگه
کاملا گیج کننده میشه
پس توی این چیت شیت نقشه راهی می بینیم که طبق این مسیر اگه حرکت کنیم و مطالب یاد بگیریم دیگه گیج نمیشیم.
حتما اطلاع دارین که یادگیری پایتون برای کارهای هوش مصنوعی و علوم داده از واجباته. اینجا براتون دستورات پایه پایتون گفتیم که توی کار خیلی بدردتون میخورن. کارای مهمی که با ساده ترین دستورات میتونید انجام بدید که قدرت پایتون نشون میده.
داده ها داخل فایل ذخیره می شوند و تا زمانی که داده نداشته باشیم، هیچ کاری نمی توانیم انجام بدهیم و این اهمیت کار با فایل را نشان می دهد.
یک چیت شیت براتون آماده کردیم که بتونید هر نوع فایل، با هر پسوندی را بخونید.
با ذخیره این چیت شیت، همیشه میدونید فایلاتون چطور در پایتون باز کنید و نگران فراموش کردن کدها نباشید.
یکی از کتابخانههای اصلی پایتون برای کار داده، Numpy هست. مزیت اصلی Numpy سرعت بالای اون هست. هرجا دیدید کار داره کند پیش میره به Numpy متوسل بشید.
خیلی از منابع، یادگیری Numpy برای هر دانشمند داده ضروری میدونند. پس خیلی مهمه که با این کتابخانه آشنا بشید.
برای تحلیل داده لازم هست یک دیتاست تمیز شده داشته باشیم، ولی دادههای دنیای واقعی کثیف هستند و اصلا برای تحلیل مناسب نیستند. به عنوان مهندس یا دانشمند داده باید بتوانیم با دادههای نامرتب، مقادیر از دست رفته، ناسازگار، نویز یا داده های بی معنی کار کنیم. پس همیشه بخش قابل توجهی از زمان پروژه صرف پاکسازی دیتاست میشود.
کتابخانه Pandas فرایند پاکسازی، تبدیل، دستکاری و تحلیل داده را آسانتر از همیشه کرد.
شما به لحاظ فنی بهترین کار ممکن را انجام دهید، اما اگر نمودارهای مناسبی نداشته باشید، نمی توانید پیام مورد نظرتان را به مخاطب منتقل کنید.
با استفاده از کتابخانه Matplotlib، نتایج کارتان را با نمودارهای باکیفیت نمایش دهید.
از قدیم گفتن اگر یک کتاب جلد زیبا و شکیل نداشته باشه، کمتر خونده میشه (حتی اگه محتواش عالی باشه). واسه پروژههای علم داده هم دقیقاً این ماجرا برقراره.
پس واسه اینکه ارزش کارهای خوبی که انجام دادین، به چشم بیاد حتماً از کتابخانههای خوبی مثل seaborn استفاده کنید.
اسمش کوتاهه ولی کار زیادی ازش میاد. نمودارهای زیبا و همهمنظوره، برای تمامی سلایق.
رشتهها رایجترین نوع دادهها هستند. رشتهها شامل دنبالهای از حروف، اعداد، علائم نگارشی و سایر هستند.
برای کار با رشتهها، توابع زیادی هست که توی این آموزش، مهمترین آنها معرفی خواهد شد.
اگر عبارت منظم یا regular-expression نبودن برنامهنویسی کار سختتری میشد. مثلاً تصور کنین یک متن صدصفحهای باشه و مجبور باشین کلشو بخونین تا تمومی کدهای ملی استخراج کنین ولی عبارات منظم در کمتر از یک دقیقه شما را به هدفتون می رسونه.
البته شاید یکم کار با عبارات منظم بدقلق به نظر برسه ولی تقلب از روی این فایل آموزشی، مشکلات هموار می کنه.
یکی از مهمترین تفاوتهای برنامهنویسی کمتجربه و باتجربه نحوه کدزنی هست. اگر قصد دارید به باشگاه باتجربهها وارد بشوید، بلیت ورود، کدنویسی شی گرا هست.
کراس یک کتابخونه زرد پایتونی، ساده و روون هست که همه دوستش دارن. چون مفاهیم پیچیده شبکه عصبی به سادهترین شکل ممکن پیاده کرده و هر آدمی با هر میزان تجربه می تونه ازش بهره ببره. (برخلاف جناب پایتورچ)
توی دنیا همیشه آدمای دقیق و وسواسی هستند که انتخابهای ساده و معمولی قانعشون نمی کنه. دلشون میخواد وارد جزئیات ریاضیات روشها بشن و گاهی از صفر، چرخ را از نو بسازند. خب تبریک میگم که کتابخانه scipy مناسب برای سلیقه شماست.
(یادگیری ماشین در 5 دقیقه: فستفود دیتاهاب)
من میترسم یک روزی برسه، مدل خودش دیتا جمع کنه، خودش پیشپردازش انجام بده و آموزش کافی و واف که دید، خروجیهای نهایی در قالب یک فایل ورد راستچین شده و پر از شکلهای خوشگل ارائه بده. Pycaret چنین قصدی داره و میخواد طی 5 دقیقه یک مدل یادگیری ماشین آموزش بدید.
sklearn مثل آچار واسه مکانیکه، sklearn بلد نباشی نمی تونی پروژه یادگیری ماشین انجام بدی
اکسل یک راه حل ساده واسه وقتایی هست که باید روی داده ها چند تا نمودار استخراج کنید ولی زمانتون کم هست، چون همیشه فرصت و حوصله کدنویسی نیست.
آیا با واژه sql چیست آشنا هستید؟ چقدر درباره آن میدانید؟ دستورات مهم این زبان را میشناسید؟ اگر به دنبال جواب تمامی این سوالات هستید، کافیست این چیت شیت را مطالعه کنید.
زبان برنامه نویسی R یک جورایی مظلوم واقع شده و خیلی نتونست خودشو از زیر سایه پایتون جدا کنه ولی واسه بعضی از کارها مثل گراف کاوی (البته گراف های کوچک و متوسط) انصافا در نایابی هستش. البته توی بحث های آماری هم انصافا یک سر و گردن از رقبا بالاتره.
نکته: برای دانلود چیت شیت ها و کدهای آموزشی بیشتر، حتما به کانال تلگرامی دیتاهاب مراجعه کنید.