ارتباط علم داده با سایر علوم

ارتباط علم داده با سایر علوم
ارتباط علم داده با سایر علوم

مقدمه

در حالی که علم داده به‌عنوان یک رشته به خودی خود ظهور کرده است، اما در مورد ارتباط آن با سایر علوم بعضی مواقع این اشتباه بوجود می آید که اغلب به عنوان زیرشاخه‌ای از رشته‌های دیگر در نظر گرفته می‌شود.

از آنجا که امروزه در هر رشته و زمینه تخصصی حجم داده ها بطور چشمگیری رشد داشته است از این رو مطمئناً می توان از علم داده جهت بررسی و تحلیل داده ها در هر رشته ای بهره برد.

در ادامه می خواهیم بررسی کنیم که چگونه علم داده با سایر زمینه ها مشابه یا متفاوت است؟

ارتباط علم داده با سایر علوم

علم داده و آمار

تفاوت بین این دو زمینه نزدیک به هم در اختراع و پیشرفت کامپیوترهای مدرن نهفته است.

آمار اساساً برای کمک به مردم برای مقابله با «مشکلات داده‌ها» پیش از رایانه، مانند آزمایش تأثیر کود در کشاورزی، یا کشف صحت تخمین از یک نمونه کوچک، ایجاد شده است.

اما علم داده بر مشکلات داده قرن بیست و یکم مانند دسترسی به اطلاعات از پایگاه های داده بزرگ، نوشتن کد کامپیوتری برای دستکاری داده ها و تجسم داده ها تاکید دارد.

اندرو گلمن، آماردان دانشگاه کلمبیا، می گوید:

«منصفانه است که آمار را به عنوان زیرمجموعه ای از علم داده در نظر بگیریم» و احتمالاً کم اهمیت ترین جنبه آن را دارد.
او پیشنهاد می‌کند که جنبه‌های مانند جمع آوری و برداشت، پردازش، ذخیره‌سازی و تمیز کردن، بیش از بحث های آماری، برای علم داده مهم و محوری هستند.

اما چگونه دانش این دو زمینه با هم ترکیب می شود؟

ناتان یاو، آمارشناس و تجسم‌کننده داده‌ها از Flowing Data پیشنهاد می‌کند که دانشمندان داده باید حداقل سه مهارت اساسی داشته باشند:

1.دانش قوی از آمار پایه و یادگیری ماشین یا حداقل به اندازه کافی برای جلوگیری از تفسیر نادرست همبستگی برای علیت یا برون یابی

2. مهارت های علوم کامپیوتر برای گرفتن یک مجموعه داده و استفاده از یک زبان برنامه نویسی (مانند R یا Python )

3. توانایی تجسم و بیان داده‌ها و تجزیه و تحلیل آنها به گونه‌ای که برای کسی که در داده‌ها آشنایی کمتری دارد معنادار باشد.

ارتباط علم داده با سایر علوم

علم داده و علوم کامپیوتر

در حقیقت، علم داده و علوم کامپیوتر با یکدیگر همپوشانی دارند و از یکدیگر حمایت می کنند. برخی از الگوریتم‌ها و تکنیک‌های توسعه‌یافته در زمینه علوم کامپیوتر – مانند الگوریتم‌های یادگیری ماشین، الگوریتم‌های تشخیص الگو، و تکنیک‌های تجسم داده‌ها – به رشته علم داده کمک کرده‌اند. امروزه یادگیری ماشین قطعاً بخش بسیار مهمی از علم داده است و انجام علم داده معنادار در بیشتر حوزه‌ها بدون حداقل دانش اولیه یادگیری ماشین دشوار است.

دانشمندان علوم کامپیوتر تکنیک‌ها و روش‌های متعددی را توسعه داده‌اند، مانند:

(1) سیستم‌های پایگاه داده (DB) که می‌توانند حجم فزاینده داده‌ها را در قالب‌های ساختاریافته و بدون ساختار مدیریت کنند و تجزیه و تحلیل داده‌ها را تسریع کنند.

(2) تکنیک های تجسم که به مردم کمک می کند تا داده ها را درک کنند.

(3) الگوریتم هایی که محاسبه داده های پیچیده و ناهمگن را در زمان کمتری ممکن می سازند.

علوم کامپیوتر شامل ابتکارات بسیار و رو به رشد است که دانشمندان داده را درگیر می کند.

علم داده و مهندسی

به طور کلی، مهندسی در زمینه های مختلف (شیمی، عمران، کامپیوتر، مکانیک و غیره) تقاضا برای دانشمندان داده و روش های علم داده را ایجاد کرده است.

مهندسان برای حل مشکلات دائماً به داده نیاز دارند. از دانشمندان داده خواسته شده است تا روش ها و تکنیک هایی را برای رفع این نیازها توسعه دهند. به همین ترتیب، مهندسان به دانشمندان داده کمک کرده اند.

علم داده از نرم‌افزار و سخت‌افزار جدیدی که از طریق مهندسی توسعه یافته‌اند، مانند CPU (واحد پردازش مرکزی) و GPU (واحد پردازش گرافیکی) بهره‌مند شده است که به طور قابل‌توجهی زمان محاسبات را کاهش می‌دهند.

به عنوان مثال مشاغل در مهندسی عمران را در نظر بگیرید. این روند در صنعت ساخت و ساز به دلیل استفاده از تکنولوژی در چند دهه اخیر به شدت تغییر کرده است. اکنون می توان از تکنیک های ساختمانی «هوشمند» استفاده کرد که ریشه در جمع آوری و تجزیه و تحلیل مقادیر زیادی از داده های ناهمگن دارند.

به لطف الگوریتم های پیش بینی، برآورد هزینه احتمالی ساخت و ساز از قیمت واحد برای یک آیتم خاص، مانند نرده محافظ، امکان پذیر شده است، که پیمانکاران با توجه به مکان پیمانکار، زمان سال، ارزش کل، شاخص های هزینه مربوطه را پیشنهاد می دهند.

علاوه بر این، تکنیک‌های ساختمان هوشمند با استفاده از فناوری‌های مختلف معرفی شده‌اند. از چاپ سه‌بعدی مدل‌هایی که می‌تواند به پیش‌بینی نقاط ضعف در ساخت‌وساز کمک کند، تا استفاده از پهپادها در نظارت بر سایت ساختمان در مرحله ساخت‌وساز واقعی، همه این فناوری‌ها حجمی از داده‌ها را تولید می‌کنند که برای مهندسی طراحی و فعالیت ساخت‌وساز نیاز به تجزیه و تحلیل دارند.

بنابراین، با افزایش استفاده از فناوری برای هر گونه طراحی و برنامه های مهندسی، گسترش نقش علم داده در آینده اجتناب ناپذیر است.

ارتباط علم داده با سایر علوم

علم داده و پردازش صوت و تصویر

همانطور که در پست علم داده چیست؟‌ شرح داده شد مدل 3V در حوزه صوت و تصویر بسیار صادق است. یعنی در این حوزه سرعتی که داده ها با آن انباشته می شوند،‌ اندازه و دامنه داده ها و گستردگی داده ها بطور چشمگیری بطور روزانه در حال رشد هستند.

صوت و تصویر نقش بسیار مهمی در تمام زمینه های زندگی روزمره انسان ها ایفا می نمایند به همین ترتیب هم داده های فراوانی از جنس تولید و انبار می شود. از این رو علم داده نقش بسیار مهمی در پردازش داده های مربوط به صوت و تصویر را می تواند ایفا نماید.

علم داده و تجزیه و تحلیل کسب و کار

به طور کلی می‌توان گفت که هدف اصلی «انجام کسب‌وکار» کسب سود – حتی با منابع محدود – از طریق روش‌های تولید کارآمد و پایدار و مدل‌های خدمات مؤثر و غیره است.

این امر مستلزم تصمیم‌گیری مبتنی بر ارزیابی عینی است. که تجزیه و تحلیل داده ها ضروری است. چه به شرکت‌ها و چه مشتریان مربوط باشد، داده‌های مربوط به کسب‌وکار به طور فزاینده‌ای ارزان (به‌دست آوردن، ذخیره‌سازی و پردازش آسان) و در همه جا موجود است.

علاوه بر انواع سنتی داده‌ها، که اکنون از طریق روش‌های خودکار دیجیتالی می‌شوند، انواع جدیدی از داده‌های دستگاه‌های تلفن همراه، حسگرهای پوشیدنی و سیستم‌های تعبیه‌شده اطلاعات غنی را در اختیار کسب‌وکارها قرار می‌دهند.

فن آوری های جدیدی ظهور کرده اند که به دنبال کمک به ما در سازماندهی و درک این حجم فزاینده داده ها هستند. این فناوری ها در تجزیه و تحلیل کسب و کار استفاده می شوند.

ارتباط علم داده با سایر علوم

تجزیه و تحلیل کسب و کار Business analytics (BA) به مهارت‌ها، فناوری‌ها و شیوه‌هایی برای کاوش و بررسی مداوم و تکراری عملکرد کسب‌وکار گذشته و فعلی برای کسب بینش و استراتژیک بودن اشاره دارد.

BA بر توسعه دیدگاه های جدید و ایجاد حس عملکرد بر اساس داده ها و آمار متمرکز است. و اینجاست که علم داده وارد می‌شود.

برای برآورده کردن الزامات BA، دانشمندان داده برای تجزیه و تحلیل آماری، از جمله مدل‌سازی توضیحی و پیش‌بینی‌کننده و مدیریت مبتنی بر واقعیت، برای کمک به تصمیم‌گیری موفق مورد نیاز هستند.

چهار نوع تجزیه و تحلیل وجود دارد که هر کدام فرصت هایی را برای دانشمندان داده در تجزیه و تحلیل کسب و کار فراهم می کند:

1. تجزیه و تحلیل تصمیم: از تصمیم گیری با تجزیه و تحلیل بصری پشتیبانی می کند که منعکس کننده استدلال است.

2. تجزیه و تحلیل توصیفی: بینشی از داده های تاریخی با گزارش، کارت امتیاز، خوشه بندی، و غیره ارائه می دهد.

3. تجزیه و تحلیل پیش بینی کننده: از مدل سازی پیش بینی با استفاده از تکنیک های آماری و یادگیری ماشین استفاده می کند.

4. تجزیه و تحلیل تجویزی: تصمیم گیری با استفاده از بهینه سازی، شبیه سازی و غیره را توصیه می کند.

علوم داده، علوم اجتماعی و علوم اجتماعی محاسباتی

در این قرن علم داده نه تنها به علوم اجتماعی کمک می کند، بلکه در حال شکل دادن به آن است، حتی شاخه جدیدی به نام علوم اجتماعی محاسباتی ایجاد کرده است.

از بدو پیدایش، علوم اجتماعی در شاخه‌های بسیاری از جمله انسان‌شناسی، باستان‌شناسی، اقتصاد، زبان‌شناسی، علوم سیاسی، روان‌شناسی، بهداشت عمومی و جامعه‌شناسی گسترش یافته است.

هر یک از این شاخه ها استانداردها، رویه ها و شیوه های جمع آوری داده های خود را در طول سال ها ایجاد کرده اند. اما اتصال نظریه ها یا نتایج از یک رشته به رشته دیگر به طور فزاینده ای دشوار شده است. اینجاست که علوم اجتماعی محاسباتی در چند دهه اخیر انقلابی در تحقیقات علوم اجتماعی ایجاد کرده است.

با کمک این علم، علوم اجتماعی محاسباتی نتایج چندین رشته را به هم متصل کرده است تا این سوال ضروری کلیدی را بررسی کند: انقلاب اطلاعاتی در این عصر دیجیتال چگونه جامعه را متحول خواهد کرد؟

علوم اجتماعی محاسباتی از زمان پیدایش خود، گام‌های شگرفی در تولید مجموعه‌ای از پروژه‌های میان رشته‌ای برداشته است، که اغلب با مشارکت دانشمندان رایانه، آماردانان، ریاضیدانان و اخیراً با دانشمندان داده انجام می‌شود.

برخی از این پروژه‌ها شامل ابزارها و الگوریتم‌های پیش‌بینی و یادگیری ماشینی برای کمک به مقابله با مشکلات خط‌مشی هستند.

برخی دیگر مستلزم به کارگیری پیشرفت های اخیر در تشخیص تصویر، متن و گفتار برای مسائل کلاسیک در علوم اجتماعی است.

این پروژه‌ها اغلب به پیشرفت‌های روش‌شناختی، مقیاس‌بندی روش‌های اثبات‌شده در سطوح جدید، و همچنین طراحی معیارها و رابط‌های جدید برای قابل فهم کردن یافته‌های پژوهش برای محققان، مدیران و سیاست‌گذارانی که ممکن است فاقد مهارت محاسباتی هستند، اما دارای تخصص در حوزه مربوطه هستند، نیاز دارند.

علوم اجتماعی محاسباتی سؤالات اجتناب ناپذیری را در مورد سیاست و اخلاقی که اغلب در تحقیقات علم داده گنجانده شده است، مطرح می کند، به ویژه زمانی که مبتنی بر مشکلات اجتماعی-سیاسی با کاربردهای واقعی است که پیامدهای گسترده ای دارد.

اشتراک گذاری

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *