در این مقاله قصد داریم به یکی از رایج ترین سوالات در مورد داشمندان علم داده پاسخ دهیم. سوال این است: متخصصان علم داده چه تفاوت هایی با متخصصین آمار و ریاضی و متخصصان و برنامه نویسان کامپیوتر دارند؟

با توجه به جدید و نو پا بودن علم داده، ارائه یک شرح وظایف دقیق برای دانشمندان علم داده کمی دشوار است. اکثر متخصصان علم داده محققانی هستند که بین رشته های مرتبط آمار و کامپیوتر فعالیت می کنند. آنها در زمینه علم کامپیوتر دارای مهارت هستند و در زمینه آمار و مهندسی داده نیز صاحب نظرند. بنابراین از نظر مهارت های حرفه ای؛ یک دانشمند علم داده، نقطه اتصال سایر مهارت هایی است که به آنها اشاره شد.

دانشمندان علم داده و متخصصین آمار

 در مقایسه با متخصصین آمار، دانشمندان علم داده، زمان بیشتری را صرف تحلیل و بررسی داده ها می کنند. به طور یقین، داده ها برای متخصصین آمار هم بسیار مهم هستند اما در علم آمار همیشه تلاش بر این است که داده ها با استفاده از یک مدل ذهنی به یک گروه آماری خاص ارتباط داده شود. متخصصین آمار معمولا با پیش فرض ها و مدل های ذهنی سر و کار دارند و مدل سازی برای آنها اهمیت بالایی دارد. این در حالی است که دانشمندان علم داده کار با ابزارهای داده محور مانند bootstrapping، permutation testing و یادگیری ماشین (machine learning) را ترجیح می دهند و با بهره گیری از مهارت هایی مانند اعتبار سنجی متقابل (cross-validation) و تقسیم داده ها (data splitting)، داده ها را ارزیابی می کنند. به این ترتیب دانشمندان علم داده بدون توسل به راهکارهایی مانند ایجاد پیش فرض های آماری و اتکا به هویت جامعه آماری، از بیش برازش (overfitting) و تعمیم داده ها جلوگیری می کنند.

دانشمندان علم داده به طور کامل به علم آمار اشراف دارند و از پیش فرض های مورد استفاده در مدل سازی آماری آگاهند. اما موارد استفاده و رجوع متخصصان آمار به اینگونه مدل سازی به مراتب بیشتر از دانشمندان علم داده است. ناگفته نماند که شرح وظایف یک دانشمند علم داده می تواند در موقعیت های مختلف، متفاوت باشد. بعضی از کسب و کارها به دنبال افرادی هستند که گرایش بیشتری به سمت مهندسی داده دارند و از یک داشمند علم داده انتظار دارند مجموعه داده های پیچیده را تلفیق کرده و یک پایگاه داده منظم ایجاد کند. از طرف دیگر برخی بیشتر به دنبال یک تحلیل گر داده هستند و البته مهارت های لازم برای تحلیل داده با مهارت های مورد نیاز برای مهندسی داده متفاوت است. برای تحلیل گران داده نحوه جمع آوری و شکل دهی به داده ها چندان اهمیت ندارند و آنچه مهم است استخراج اطلاعات مفید و کاربردی با استفاده و تحلیل و آنالیز داده هاست.

دانشمندان علم داده و متخصصین کامپیوتر 

 یکی از نکات قابل ذکر در مورد علم داده این است که با کسانی که در این رشته تحصیل کرده و صاحب تخصص هستند معمولا به شکلی خاص و ویژه برخورد می شود و به اصطلاح کسب تخصص در این رشته، شان و منزلت ویژه ای دارد. دلیل این برخورد ویژه این است که کسانی که از تخصص یک دانشمند علم داده استفاده می کنند، نیازی نیست در زمینه مهارت های برنامه نویسی، درک تحلیلی نتایج آماری و مصور سازی داده ها (data storytelling) نگران باشند. داشتن تلفیقی از تمام این مهارت ها یک مزیت قابل توجه است. بسیاری از متخصصین آمار، با کد نویسی کامپیوتر کاملا بیگانه اند و از طرف دیگر بسیاری از متخصصین کامپیوتر در زمینه استخراج مفاهیم کاربردی از داده ها ناتوانند. این در حالی است که می توان یقین داشت که یک متخصص داده در هر دو این زمینه ها دارای اطلاعات و مهارت های کافی است.

از آنجایی که تخصص در علم داده، شامل کسب مهارت در زمینه برتامه نویسی کامپیوتر، مصورسازی داده ها و علوم اجتماعی مانند اقتصاد است؛ یک متخصص داده نه تنها قادر است در هر یک از این زمینه ها فعال باشد، بلکه می تواند به عنوان شخصی که تمامی ابن مهارت ها را به هم ارتباط می دهد هم ایفای نقش کند. با حذف ریاضیات محض از علم ریاضی، بخش های مربوط به توسعه دهی در زمینه علم کامپیوتر و جنیه های مرتبط با سیاست گذاری در علم اقتصاد و به کار گیری مهارت های کاربردی تر این تخصص های مختلف، شما می توانید یک دانشمند علم داده کاملا موفق باشید.

بسیاری از متخصصین کامپیوتر در برخورد با الگوریتم های مختلف دارای یک طرز فکر صفر و یکی هستند و انتظارشان این است که یک فرایند خاص همیشه یک نتیجه مشخص در پی داشته باشد. اما در زمینه علم داده همیشه اینطور نیست و گاهی اوقات به این شکل است که در صورت پیروی از یک فرایند خاص، به عنوان مثال 60 درصد احتمال وقوع اتفاق A متصور است و 40 درصد احتمال وقوع اتفاق B. این در حالی است که متخصصان کامپیوتر و برنامه ویسی در صورت اجرای یک فرایند خاص، همیشه انتظار وقوع 100 درصدی یک نتیجه خاص را دارند و در زمینه تحلیل احتمالات چندان فعال نیستند.

از طرف دیگر، استخدام یک برنامه نویس یا متخصص کامپیوتر برای یک کارفرما فرایند ساده تری است زیرا دقیقا مشخص است که از فردی که در زمینه علم کامپیوتر تخصص دارد چه انتظاراتی می توان داشت. البته باید توجه داشت که در دنیای رقابتی امروز موقعیت های شغلی در این زمینه تقریبا اشباع شده اند و داشتن تخصص در علم کامپیوتر دیگر آن معنا و مفهوم گذشته را ندارد. در زمینه برنامه نویسی، علم کامپیوتر تنوع زیادی دارد و می توان ادعا کرد که پایه و اصول زبان های مختلف برنامه نویسی تقریبا یکسان است. پس اگر شما یک برنامه نویس Java یا C++ باشید، می توانید به راحتی Python را هم یاد بگیرید. بعلاوه متخصصین کامپیوتر دارای مهارت ریاضیاتی قابل قبولی هستند و با در نظر گرفتن این موارد می توان نتیجه گرفت که یک برنامه نویس یا متخصص کامپیوتر با بخشی از مهارت های یک دانشمند علم داده آشنایی دارد. از طرف دیگر یک دانشمند علم داده هم لازم است با برنامه نویسی آشنایی داشته باشد.

 کلام آخر 

یک داشمند علم داده تلاش می کند تا جنبه های کاربردی تر علم آمار و کامپیوتر را استخراج و مورد استفاده قرار دهد. یک متخصص علم داده با متودولوژی های آماری آشنایی دارد اما درگیر مباحث تئوریک آمار نمی شود و در عوض جنبه هایی از علم آمار را مورد توجه قرار می دهد که در زندگی روزمره و در کسب و کارهای مختلف کاربرد دارند. همچنین یک دانشمند علم داده با بخش هایی از علم کامپیوتر هم که در مهندسی داده و طراحی الگوریتم های مختلف نقش دارند، آشنا است. شرکت راهبر بازار با پیروری از این الگو و بطور کاملا کاربردی با تلفیق علم داده، آمار و کامپیوتر و همچنین تکنیک های تحقیقات بازاریابی می تواند تحلیل های لازم برای دستیابی به اهداف بازاریابی کسب و کارها را ارائه نماید.