آخرین مطالب

داده­‌کاوی (Data Mining) چیست؟

با توجه به این‌که حوزه‌های مختلف فناوری اطلاعات و کسب‌وکارها در تمام بخش‌ها حجم کثیری از داده‌های خام را مدیریت می‌نمایند، فرآیندهایی برای تبدیل این داده‌ها به اطلاعات مفید و کاربردی ایجاد شده‌ است.

داده‌کاوی (Data Mining) اَبَر‌واژه و اصطلاح جامع این فرآیند است. داده‌کاوی تاریخچه‌ای غنی دارد و به‌طور کلی با پیشرفت تکنولوژی در طول سالیان متمادی تعاریف مختلفی داشته است. در اینجا اطلاعاتی در مورد تاریخچه داده‌کاوی، کاربردهای اساسی و همچنین آینده آن جمع‌آوری نموده‌ایم. بی‌تردید داده‌کاوی مفهومی است که بنیاد و اساس تلاش‌های تحول دیجیتال امروزی است.

داده‌کاوی فرآیند تبدیل داده‌های خام و پردازش نشده به اطلاعات قابل استفاده برای کسب‌و‌کار‌ها است. رایج‌ترین روش انجام این کار از طریق راه‌حل‌های نرم‌افزاری متنوع داده‌کاوی است که الگوهای موجود در داده‌ها را بررسی می‌نمایند.

داده‌کاوی زیر‌مجموعه‌ای از تجزیه و تحلیل داده‌ها می‌باشد.  علاوه‌براین، داده‌کاوی یک عنصر اساسی در زمینه هوش مصنوعی و یادگیری ماشین است.

تکنیک‌های متعددی وجود دارد که برای استفاده عملی و کاربردی داده‌کاوی در طول سال‌های متمادی توسعه یافته‌اند. هر تکنیک بر اساس ایده اساسی ردیابی الگوها در مجموعه‌ای از داده‌ها ساخته شده است. از این لحظه به بعد، بسته به تمرکز پروژه و عمق تحقیق خود، می‌توانید روش داده‌کاوی خود را ارتقاء دهید.

برای مثال، با یک سازماندهی منسجم بسادگی می‌توانید چندین متغیر وابسته را به‌هم مرتبط نمایید. یا برعکس می‌توانید تحقیقات خود را کامل‌تر نموده و با تشخیص داده‌های پرت و مغایر با داده‌های اصلی و با بررسی دقیق مجموعه داده‌های بزرگ هرگونه داده نامتعارف را شناسایی نمایید. اگرچه امروزه این تکنیک‌ها به‌طور گسترده مورد استفاده قرار می‌گیرند، درک تاریخچه داده‌کاوی و روند چگونگی تغییر این تکنیک‌ها بسیار مهم است.

تاریخچه داده‌کاوی

به‌طرز شگفت‌انگیزی مفهوم داده‌کاوی به دهه ۱۷۰۰ بازمی‌گردد. نظریه بیز (Bayes) و تحلیل رگرسیون هر دو نمونه‌های اولیه‌ شناسایی الگوها در مجموعه داده‌های خام هستند. اگرچه این روش‌ها قرن‌ها مورد استفاده قرار می‌گرفتند، اما اصطلاح “داده‌کاوی” برای اولین بار در سال ۱۹۸۳ در مقاله‌ منتشر شده توسط مایکل سی لاول (Michael C. Lovell) اقتصاددان آمریکایی ظهور پیدا کرد.

درابتدا لاول و تعداد زیادی از اقتصاددانان دیگر دید مثبتی نسبت به کاربرد داده‌کاوی نداشتند. آنها معتقد بودند که داده‌کاوی مدرن می‌تواند اقتصاددانان و صاحبان کسب‌و‌کار را به سمت همبستگی نادرست داده‌هایی سوق دهد که الزاماً مرتبط نیستند.

علیرغم این اتفاقات پدیده داده‌کاوی محبوبیت قابل توجهی پیدا کرد و در دهه ۱۹۹۰ فروشندگان انبار داده داده به‌طورگسترده از این اصطلاح برای اهداف بازاریابی خود استفاده می‌کردند.

یکی از مهمترین رویدادها در تاریخ داده‌کاوی فرآیند استاندارد صنعت متقابل برای داده‌کاوی (CRISP-DM) است. این استاندارد توسط تعدادی از شرکت‌ها در سال ۱۹۹۶ در راستای کمک به استانداردسازی فرآیند و جلوگیری از مسائل مطرح شده توسط لاول و همتایانش ایجاد گردید. این فرآیند شامل شش گام اساسی به شرح زیر است:

  • درک کسب‌وکار
  • درک داده‌ها
  • آماده‌سازی داده‌ها‌
  • مدل‌سازی
  • ارزیابی
  • استقرار و توسعه

این مدل همواره تکرار شده و حتی نسخه به‌روز شده خود را از طریق IBM دریافت کرده است. داده‌کاوی با پیشرفت‌های تکنولوژیکی که داشته است به فرآیندی پیچیده‌تر و انعطاف‌پذیرتر و درعین‌حال بسیار قدرتمندتر تبدیل شده است. امروزه در بازار تکنولوژی و دنیای کسب‌وکارها داده‌کاوی موثر به‌عنوان یک مزیت رقابتی بسیار مهم و حیاتی محسوب می‌گردد.

مشکل عمده و اساسی که داده‌کاوی در حال حاضر به دنبال ارائه یک راهکار برای حل آن است، تجزیه و تحلیل فراوانی قابل توجه داده‌های تولید شده است. داده‌کاوی با گسترش یادگیری ماشین و هوش مصنوعی پیشرفت‌ چشمگیری داشته است و در‌واقع خود را به ظرفیت موجود در حوزه‌های فناوری اطلاعات تحمیل کرده است.

کاربردهای داده‌کاوی

داده‌کاوی بسته به صنعت عمودی که در آن اعمال می‌شود کاربردهای مختلفی دارد. در ادامه به چند مورد کلیدی پرداخته می‌شود.

 

مراقبت های بهداشتی

داده‌کاوی را می‌توان برای کشف ارتباط بین بیماری‌ها و اثربخشی درمان مورد استفاده قرار داد. در مشاهدات سطح بالا، داده‌کاوی می‌تواند در راستای شناسایی داروهای جدید و ارائه مراقبت به‌موقع برای بیماران استفاده شود. یکی از موثرترین کاربردهای داده‌کاوی تشخیص درمان‌های مناسب از طریق مقایسه علائم می‌باشد.

همچنین به‌منظور کشف و شناسایی جعل و کلاهبرداری در شرکت‌های فعال در حوزه صنعت پزشکی و مراقبت و درمان می‌توان از داده‌کاوی استفاده نمود. کاربران می‌توانند به‌واسطه تشخیص ناهنجاری‌ها و مغایرت‌های موجود نسبت به شناسایی داده‌های پرت که در ادعاهای پزشکی توسط پزشکان، آزمایشگاه‌ها، کلینیک‌ها و یا سایر افراد مطرح شده است اقدام نمایند. همچنین می‌توان از طریق شناسایی داده‌های پرت ارجاعات و نسخه‌های غیرمتعارف را پیگیری نمود.

داده‌کاوی به‌طور متداول برای کشف و شناسایی جعل و تقلب در صنعت پزشکی مورد استفاده قرار می‌گیرد. برای مثال، سیستم احراز کلاهبرداری و سوء‌استفاده بیمه سلامت مستمندان تگزاس از داده‌کاوی برای بازیابی بیش از ۲ میلیون دلار وجه سرقت شده و شناسایی بیش از ۱۰۰۰ مظنون استفاده کرد.

آژانس‌های اطلاعاتی

داده‌کاوی می‌تواند برای سازمان‌های اطلاعاتی به‌منظور تعیین جرایم در تمام سطوح بسیار مهم و حیاتی باشد. این جرایم پولشویی و انواع مختلف قاچاق را شامل می‌شود. این دستاورد دیگری است که برای اهداف داده‌کاوی خود، به‌شدت متکی به تشخیص ناهنجاری و شرایط نامتعارف است. این امر به آژانس‌های اطلاعاتی مانند FBI کمک می‌نماید تا جنایات مختلف را پیش‌بینی نموده و با توجه به نوع جرم اقدامات لازم را در راستای پیشگیری و پاسخ به آن انجام دهند. در همین راستا، داده‌کاوی را می‌توان برای اهداف امنیت سایبری مورد بهره‌برداری قرار داد. برنامه‌ها می‌توانند ناهنجاری‌ها را شناسایی کرده و با آگاهی از مجموعه اطلاعات و داده‌های موجود مانع از حملات بیشتری شوند و از آنها جلوگیری نمایند. در حال حاضر بسیاری از موسسات امنیت سایبری هوش مصنوعی بر روی توسعه این نوع ابزارها کار می‌کنند.

بازاریابی

داده‌کاوی با کارایی و تأثیرگذاری بسیار زیادی می‌تواند در زمینه فروش و بازاریابی مورد استفاده واقع شود. کاربرد اصلی آن شناسایی رویداد‌ها و روندهای پنهان در داده‌های خرید است. این کار می‌تواند به شرکت‌ها و بنگاه‌های بازاریابی کمک کند تا کمپین‌ها و تشکیلات مناسبی را طراحی و راه اندازی نمایند.

تیم‌های فروش با استفاده از داده‌های مشتریان می‌توانند از طریق روش‌های دلخواه خود به آنها دسترسی داشته باشند. به بیان ساده داده‌کاوی در بازاریابی به‌طور همه‌جانبه و به‌منظور تعیین مسیر سفر مشتری (Customer Journey) در وب‌سایت موردنظر به بهترین وجه ممکن مورد استفاده قرار می‌گیرد. این پروسه می‌تواند در رابطه با مسیر و تجربه خرید یا روند پشتیبانی مشتری باشد. مثال بعدی می‌تواند تجزیه و تحلیلی باشد که مشخص نماید کدام محصولات اغلب به‌صورت هم‌زمان و متوالی خریداری می‌شوند. این موضوع به کسب‌وکارها کمک می‌کند تا اطلاعات بهتر و بیشتری از بسته‌ها و شکل کلی سبدهای خرید مشتریان کسب نمایند.

سرمایه‌گذاری

همانند نمونه‌های بازاریابی و فروش، داده‌کاوی می‌تواند توسط بانک‌ها و موسسات مالی بمنظور یادگیری و پیش-بینی رفتار مشتری بکار گرفته شود. معمولاً موسسات مالی را خواهید دید که از داده‌کاوی برای افزایش وفاداری کلی مشتریان خود استفاده می کنند.

این موضوع می‌تواند امکان ارائه خدمات مرتبط به مشتریان را برای شرکت‌ها فراهم نماید. مشابه روشی که آژانس‌های اطلاعاتی از داده‌کاوی استفاده می‌کنند، موسسات مالی نیز می‌توانند از داده‌کاوی برای شناسایی اقدامات متقلبانه یا غیرمتقلبانه استفاده کنند. در اینجا دوباره تشخیص ناهنجاری و داده‌های پرت عامل اصلی دستیابی به یک بررسی دقیق می‌باشد.

تحلیلگران مالی همچنین برای آگاهی از روند خرید و فروش می‌توانند از داده‌کاوی استفاده کنند. آنها با استفاده از بازیابی داده‌های فروش می‌توانند اقدام به پیگیری نقاط اوج و افت فروش نمایند. تکنیک‌های پیشرفته داده‌کاوی عوامل خارجی مانند تعطیلات یا تخفیف‌های ویژه فصلی را مدنظر قرار داده. و بطور ویژه به بررسی عواملی که منجر به این خریدها شده است می‌پردازند.

آینده داده‌کاوی

با ادامه روند روبه‌رشد داده‌های مشتریان، آینده داده‌کاوی بطور پیوسته توسط صاحبان کسب‌وکار مورد توجه بوده و برای آن برنامه‌ریزی صورت می‌گیرد. در ادامه به چند دستورالعمل کلیدی و مسیرهایی که داده‌کاوی می‌تواند در سال‌های آتی طی نماید، پرداخته می‌شود.

داده‌کاوی در صنعت پزشکی

صنعت پزشکی از لحاظ تاریخی در خط مقدم داده‌کاوی بوده و از آن برای تشخیص بهتر بیماری‌ها و راه‌های درمان استفاده می‌شود. یکی از موثرترین کاربردهای داده‌کاوی در تشخیص علایم حاصل شده است، که فرآیند تشخیص و تمایز نمونه‌های ارزشمند در اطلاعات تصادفی است.

با ظهور همه‌گیری، پیشرفت‌هایی در تکنیک‌های داده‌کاوی بویژه برای آزمایش‌های دارویی و فرآیندهای کارآزمایی بالینی حاصل شد. انتظار می‌رود داده‌کاوی به برخی از جاه‌طلبانه‌ترین کاربردهای خود در این زمینه دست یابد و برخی از دانشمندان داده‌ها از آن برای تجزیه و تحلیل توالی‌های DNA استفاده نمایند.

داده‌کاوی جامع و یکپارچه

فرایند داده‌کاوی در گذشته یا بوسیله نرم‌افزار اختصاصی یا از طریق سایر ابزارهای خارجی انجام میشد. اکنون امکانات داده‌کاوی در حال ورود به بسترهای CRM SaaS ( نرم‌افزارهای مدیریت ارتباط با مشتری به عنوان یک پلتفرم خدماتی) برای انجام اهداف و مقاصد مختلف است که اصلی‌ترین آنها امنیت سایبری است.

این موضوع در عصر تحول دیجیتال اهمیت بیشتری پیدا کرده است. همانطور که ذینفعان عمده و صاحبان کسب-وکارها ارزش نوسازی و مدرن نمودن عملیات تجاری خود را درک می کنند، فروشندگان نرم‌افزار درحال تطبیق و ایجاد راه‌حل‌های توسعه نرم‌افزاری low-code (کم کُد) هستند تا از توسعه روزافزون نرم افزار جلوگیری نمایند. این راه‌حل‌ها، در کنار جریان دموکراسی‌سازی داده‌ها، پتانسیل‌ها و فرصت‌های داده‌کاوی را برای کاربران روزمره ایجاد می‌نماید.

داده‌کاوی یکپارچه دارای چندین مزیت است. اولین مزیت این است که داده‌کاوی و داده‌ها را بعنوان یک کلیت واحد به روشی کاربرپسندتر برای کارمندان معرفی می نماید. کسب‌وکارها به دلیل مواجه شدن با این قضیه می‌توانند انتظار ارتقای مهارت عمومی کارکنان را داشته باشند. مزیت دوم این است که درواقع کسب‌وکارها اکنون می‌توانند از حجم بیشتری از تجزیه و تحلیل داده‌ها بهره‌مند شوند. دلیل این کار این است که داده‌کاوی یکپارچه تجزیه و تحلیل داده‌ها را برای بخش‌های خارج از تیم فناوری اطلاعات شما ایجاد  می‌نماید.

هایپراتوماسیون

مفهوم هایپراتوماسیون مطمئناً شامل فرآیندهای داده‌کاوی به موازات آن خواهد بود. هایپراتوماسیون به توصیف رویکردی می‌پردازد که بعضی از کسب‌وکارها در شناسایی و خودکارسازی هر چه بیشتر فعالیت‌های تجاری و فناوری اطلاعات در پیش گرفته‌اند. این بدان معناست که کسب‌وکارها به‌سرعت درحال استفاده از هوش مصنوعی، یادگیری ماشینی و نرم‌افزار اتوماسیون فرآیند روباتیک هستند.

در حال حاضر بسیاری از راه‌حل‌های داده‌کاوی برای مدیریت و تجزیه و تحلیل حجم بالای داده‌ها از یادگیری ماشین و هوش مصنوعی استفاده می‌کنند. در واقع، این یکی از دلایلی است که علاقه به حوزه AIOps (کاربرد هوش مصنوعی در عملیات فناوری اطلاعات) به‌سرعت در حال افزایش است. هایپراتوماسیون و AIOps می‌توانند برای یکی از مشکلات اصلی داده‌کاوی یعنی داده‌های بیش از حدی که انسان نمی‌تواند بدون کمک آن را مدیریت نماید، یک راه‌حل اساسی باشند. یقیناً داده‌کاوی با کمک AIOps نقشی اساسی در این چالش ایفا خواهد کرد.

منبع: ای-ویک

مطالب مشابه