مقدمه
احتمالا برای شما این سوال پیش آمده که برای اینکه یک دانشمند داده باشیم چه چیزی باید در جعبه ابزار خود داشته باشیم و اینکه مهارت های لازم برای علم داده چیست و اساسی ترین مهارت ها برای علم داده کدام مهارت ها هستند.
بیایید به دقت نگاه کنیم که دانشمندان داده چه کسانی هستند، چه کار میکنند و چه نوع مهارتهایی ممکن است نیاز داشته باشد تا بتواند در این زمینه راه یابد. جمله ای که می توان در خصوص یک دانشمند داده بیان نمود این است که
«دانشمند داده فردی است که در آمار بهتر از هر مهندس نرمافزار و در مهندسی نرمافزار از هر آماردانی بهتر است»
جین هریس در مقاله خود در هاروارد بیزینس ریویو مهارتهایی را فهرست کرده است که کارفرمایان از دانشمندان داده انتظار دارند. در ادامه این پست این مهارت ها را با هم مرور می کنیم.
مهارت های لازم برای علم داده
تمایل داشتن به آزمایش
یک دانشمند داده باید انگیزه، شهود و کنجکاوی داشته باشد نه تنها برای حل مشکلات، بلکه برای شناسایی و بیان آنها.
کنجکاوی فکری و توانایی آزمایش مستلزم ادغام تفکر تحلیلی و خلاق است.
برای توضیح این موضوع از منظر فنی تر، کارفرمایان همواره به دنبال متقاضیانی هستند که بتوانند برای تعریف فرضیه های هوشمند و کشف داده ها با استفاده از روش ها و مدل های آماری اولیه، سؤال بپرسند.
هریس همچنین خاطرنشان می کند که کارفرمایان برای تعیین میزان کنجکاوی و تفکر خلاق متقاضی، سوالاتی را در فرآیند درخواست خود وارد می کنند که هدف از این سؤالات استخراج یک پاسخ صحیح خاص نیست، بلکه مشاهده رویکرد و تکنیک های مورد استفاده برای کشف یک احتمال ممکن است.
از این رو، از متقاضیان کار در زمینه علم داده اغلب سؤالاتی مانند «چند توپ گلف در اتوبوس مدرسه جا میشود؟» یا «چند پوشش فاضلاب در منهتن وجود دارد؟» پرسیده میشود.
تسلط بر استدلال ریاضی
دانش ریاضی و آماری دومین مهارت حیاتی برای متقاضی بالقوه ای است که به دنبال شغل در علم داده است.
البته اصلا منظورمان این نیست که به مدرک دکترا نیاز داشته باشید.
اما در ریاضیات یا آمار شما نیاز به درک قوی از روش های آماری اساسی و نحوه به کارگیری آنها دارید. کارفرمایان به دنبال متقاضیانی هستند که بتوانند توانایی خود را در استدلال، منطق، تفسیر داده ها و توسعه استراتژی هایی برای انجام تجزیه و تحلیل نشان دهند. هریس همچنین خاطرنشان می کند که،
“تفسیر و استفاده از داده های عددی به طور فزاینده ای در شیوه های تجاری حیاتی خواهند بود. در نتیجه، روند استخدام برای اکثر شرکتها این است که بررسی شود که آیا متقاضیان در استدلال ریاضی مهارت دارند یا خیر.
سواد داده
سواد داده توانایی استخراج اطلاعات معنی دار از مجموعه ای از داده است.
هر کسب و کار مدرن مجموعه ای از داده ها را دارد که باید تفسیر شوند. یک دانشمند داده ماهر از طریق توانایی ارزیابی یک مجموعه داده برای ارتباط و مناسب بودن به منظور تفسیر، انجام تجزیه و تحلیل و ایجاد تجسم های معنادار برای گفتن ارتباط داده های ارزشمند، نقش ذاتی را برای مشاغل ایفا می کند.
هریس مشاهده می کند که «آموزش سواد داده برای کاربران تجاری اکنون در اولویت است. مدیران در حال آموزش هستند تا بفهمند کدام داده مناسب است و چگونه از تجسم و شبیه سازی برای پردازش و تفسیر آن استفاده کنند. تصمیم گیری مبتنی بر داده، نیروی محرکه ای برای نوآوری در کسب و کار است، و دانشمندان داده جزء جدایی ناپذیر این فرآیند هستند.
سواد داده یک مهارت مهم است، نه فقط برای دانشمندان داده، بلکه برای همه. محققان و مربیان این بحث را آغاز کردهاند که مانند تواناییهای خواندن و نوشتن که در هر برنامه آموزشی ضروری است، سواد داده یک مهارت اساسی است و باید به همه آموزش داده شود.
مهارت برنامه نویسی
یک دانشمنده داده باید بر چند زبان برنامه نویسی تسلط داشته باشد.
دانشمند داده باید با زبان های برنامه نویسی همچون Python , R ,Perl, C/C++, SQL, Java آشنایی داشته باشد و البته باید به زبان هایی همچون Python و یا R تسلط مورد نیاز را داشته باشد.
یاد گیری ماشین و یادگیری عمیق
شاید بتوان گفت که برای انجام پردازش داده امروزه بدون شک نیاز است که از هوش مصنوعی استفاده نماییم. یادگیری ماشین و یادگیری عمیق دو ابزاری هستند که می توانند برای یک دانشمند داده بسیار ارزشمند باشند.
دانشمند داده با این دو ابزار به راحتی می تواند انواع داده را تحلیل و بررسی نمایند.
واکاوی داده و مدیریت داده
واکاوی داده ها فرآیند تمیز کردن و سازماندهی مجموعه داده های پیچیده است تا دسترسی و تجزیه و تحلیل آنها را آسان تر کند.
دستکاری دادهها برای دستهبندی آنها بر اساس الگوها و روندها، و تصحیح و وارد کردن مقادیر دادهها میتواند زمانبر اما برای تصمیمگیری مبتنی بر دادهها ضروری باشد.
این همچنین به درک مدیریت پایگاه داده مربوط می شود. از شما انتظار می رود داده ها را از منابع مختلف استخراج کنید و آنها را به قالبی مناسب برای پرس و جو و تجزیه و تحلیل تبدیل کنید و سپس آن را در یک سیستم انبار داده بارگذاری کنید.
ابزارهای مفید برای این کار عبارتند از: Altair, Talend, Alteryx , Trifacta, Tamr
ابزارهای مدیریت پایگاه داده عبارتند از: MySQL, MongoDB, Oracle
تجسم داده ها
یک دانشمند داده نه تنها باید بداند که چگونه داده ها را تجزیه و تحلیل، سازماندهی و دسته بندی کند، بلکه می خواهد مهارت های خود را در تجسم داده ها نیز تقویت کنید.
توانایی ایجاد نمودارها و نحوه رسم نمودارها برای دانشمند داده بودن مهم است.
با مهارت های تجسم قوی، می توانید کار خود را به ذینفعان ارائه دهید تا داده ها داستان قانع کننده ای از بینش های تجاری را بیان کنند. آشنایی با ابزارهای زیر می توانند شما را به خوبی آماده کنند:
- Tableau, Microsoft Excel, PowerBI
محاسبات ابری
به عنوان یک دانشمند داده، به احتمال زیاد باید از ابزارهای رایانش ابری استفاده کنید که به شما در تجزیه و تحلیل و تجسم داده های ذخیره شده در پلتفرم های ابری کمک می کند.
برخی از گواهینامه ها به طور خاص بر روی سرویس های ابری تمرکز می کنند مانند: سرویس وب آمازون (AWS) Microsoft Azure, Google Cloud این ابزارها دسترسی حرفه ای های داده به پایگاه های داده و چارچوب های مبتنی بر ابر را فراهم می کنند که برای پیشرفت فناوری کلیدی هستند.
آنها در حال حاضر در بسیاری از صنایع استفاده می شوند، بنابراین در علم داده مهم است که با مفاهیم رایانش ابری نیز آشنا شوید.
- مطالب پیشنهادی
- علم داده چیست؟
- کاربرد علم داده
- ارتباط علم داده با سایر علوم