
علم داده (Data Science)، دانشی میانرشتهای پیرامون استخراج دانش و آگاهی از مجموعهای داده و اطلاعات است علم داده از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روشهای موجود در حوزههای مختلف علمی بنا شدهاست. تعدادی از این حوزهها عبارتند از: ریاضیات، آمار، مهندسی داده، بازشناخت الگو و… هدف این علم، استخراج مفهوم از داده و تولید محصولات دادهمحور است.
آقایان توماس دونپورت و دی جی پاتیل در سال ۲۰۱۲ در مقاله «علم داده: جذابترین شغل قرن بیست و یکم» متخصصین علم داده را این طور تعریف میکنند:
کسانی که میدانند چگونه میتوان از انبوه اطلاعات بدون ساختار پاسخ سوالهای کسبوکار را پیدا کرد. ا
ستنتون در سال ۲۰۱۳ علم داده را این طور تعریف میکند: علم داده رشته در حال ظهوری است که به جمعآوری، آمادهسازی، تحلیل، بصریسازی، مدیریت و نگهداشت اطلاعات در حجم بالا میپردازد. دریسکول در سال ۲۰۱۴ علم داده را این طور تعریف میکند: علم داده مهندسی عمران دادههاست. متخصص علم داده دانشی کاربردی از دادهها و ابزارها دارد به علاوه درک تئوریکی دارد که مشخص میکند چه چیزی از نظر علمی ممکن است.
امروزه در کشور آمریکا یکی از پر طرفدارترین شاخه های آموزشی علم داده هاست. در حالی که این شاخه علمی متقاضایان زیادی دارد اما نیاز به تخصص در این رشته به قدری است که فرصت های شغلی زیادی در این زمینه وجود دارد.
به شاغلین در حوزهٔ علم داده، متخصص علم داده (data scientist) میگویند. این اصطلاح توسط دی جی پاتیل و جف همربارکرابداع شده است در صورتی که سالها قبل از آن که آنها استفاده از اصطلاح فوق را به طور عمومی مطرح کنند، از آن استفاده شده است. چن فو جف وو در سال ۱۹۹۸ برای اولین بار در یک سخنرانی از واژهٔ متخصص علم داده استفاده کرد. متخصصین علم داده با عمیق شدن در چندین رشتهٔ علمی، مسائل پیچیدهٔ مطرح شده در حوزهٔ داده را حل میکنند. به طور کلی انتظار میرود که متخصصین علم داده قادر باشند در بخشهایی از علوم ریاضیات و آمار و علوم کامپیوتر کار کنند .یک متخصص علم داده میبایست در یک یا دو رشته تخصص داشته باشد و در دیگر حوزهها دارای مهارت کافی باشد. نتایج نظرسنجیها حاکی از این موضوع است که برای متخصص علم داده شدن ۵ تا ۸ سال زمان لازم است.
متخصصین علم داده می توانند مهارت هایشان را برای دست یابی به طیف وسیعی از نتایج نهایی به کار گیرند. تعدادی از این مهارتها به شرح زیرند:
- توانایی استخراج و تفسیر منابع داده
- مدیریت حجم زیاد اطلاعات با سختافزار
- محدودیتهای نرمافزاری و بهنای باند
- ادغام منابع داده با یک دیگر
- تضمین پایداری مجموعههای داده
- مصورسازی داده برای فهم آن
- ساخت مدلهای ریاضی با استفاده از داده
- به اشتراک گذاری یافتهها و دیدگاهها در حوزه داده با متخصصان دیگر یا مخاطب عام
سلام لطفا اطلاعات بیشتری درباره علم داده منتشر کنید. آیا جایی را می شناسید .که خدمات علوم داده ارائه نماید.