امروز میخواهیم به این مطلب که داده کاوی یا data mining چیست؟ بپردازیم . توصیه میکنم اگر میخواهید در آینده یک میلیاردر فوق العاده موفق بشید ، حتما این مطلب رو مطالعه کنید.
برای توضیح داده کاوی ابتدا باید با یک سری از مفاهیم آشنا شویم.
Big data(کلان داده)
کلان داده به طور کاملا خلاصه به معنی اطلاعات بسیار بزرگ میباشد.
برای مثال
اطلاعات موجود در شماره تماس های تلفن همراه شما نوعی داده میباشد که شامل اسم و شماره تلفن افراد است. که گاها همراه با عکس است ولی برای درک بهتر کلان داده میتوان ثبت احوال را مثال زد. که شامل اطلاعات کاملی از افراد میباشد .
Summarization(خلاصه سازی)
خلاصهسازی کمک میکند تا یک تعریف مشخص و در عین حال ساده از کلان دادهها ایجادکنیم . و توانایی و سرعت تحلیل آنها را بالاتر خواهد برد. این تکنیک یکی از مراحل فرایند دادهکاوی است.
در نهایت باید گفت که دادهکاوی با استفاده از ترکیب تکنیکهای مختلف، بررسی و تحلیلهای ریاضیاتی، روانشناختی و … در تلاش است حداکثر بازدهی را در استخراج اطلاعات از داده های خام فراهم کند.داده کاوی یا data mining چیست؟
Pre-Processing (پیش پردازش)
پیشپردازش دادهها اولین و اساسیترین مرحله در data mining است. در این مرحله، دادههای موجود در دیتاسنتر های متمرکز و یا نامتمرکز مورد بررسی و ارزیابی قرار میگیرد . و مشکلات موجود در آنها تا حد زیادی رفع میشود. در واقع این بررسی برای شناسایی داده های کامل و مشخص نمودن کاستی های آن هاست.
Classification(طبقه بندی)
طبقهبندی نیز یکی دیگر از مراحل فرایند دادهکاوی است. که در این مرحله، دادههایی که امکان طبقهبندی شدن را دارند شناسایی کرده و آنها را به گروه های مشخصی تقسیمبندی میکنیم .
برای مثال
در یک دانشگاه میتوانیم سه دسته دانشجویان کاردانی، ارشد و دکتری داشته باشیم.داده کاوی یا data mining چیست؟
Clustering(خوشه بندی)
خوشهبندی مرحله ای دیگر از فرایند دادهکاوی است. که در این مرحله تلاش داریم حجم عظیمی از دادهها را به خوشههای تقریبا مرتبط تقسیمبندی کنیم. بدین ترتیب، دسته هایی داریم که دادههای موجود در آنها از نظر ساختار و مقادیر بسیار شبیه به هم هستند.
برای مثال
دانشجویانی که در یک رشته تحصیل میکنند، در یک خوشه همسان قرار میگیرند.داده کاوی یا data mining چیست؟
Outlier Analysis(تجزیه و تحلیل مقادیر دور افتاده)
تجزیهوتحلیل مقادیر دورافتاده از یکطرف و همچنین پاک کردن آنها از طرفی دیگر میتواند در پروسه ی کار کردن با big data به ما کمکهای زیادی کند.
برای مثال
فرض کنید در مورد حقوق کارمندان یک سازمان 100 نفره در حال داده کاوی هستیم؛ اگر به صورت میانگین نود درصد افراد بین ۱ تا ۳ میلیون تومان حقوق دریافت کنند و تعداد اخیلی کمی حقوق بالای 10 میلیون تومان دریافت کنند، وجود این دادهها (حقوق بالای 10 میلیون تومان) در محاسباتما بسیار تاثیر گذار خواهد بود ؛ درنتیجه بهترین پیشنهاد حذف این مقادیر دور افتاده از محاسبات است.داده کاوی یا data mining چیست؟
Associative Analysis(تجزیه و تحلیل وابسته)
تجزیهوتحلیل قواعد وابسته یکی دیگر از مراحل فرایند دادهکاوی است. به طور خلاصه، قوانین وابسته به بررسی همسویی اتفاقات میپردازد.
برای مثال
تمام کسانی که به کشور هلند سفر کردهاند علاقه زیادی به طبیعت داشتهاند و یا 60٪ افرادی که به ایران سفر کردهاند، به یک کشور تاریخی دیگر که دارای بناهای تاریخی زیادی است نیز سفر کردهاند.
Knowledge(دانش)
دانش در واقغ آخرین مورد در علم داده کاوی است. شما طی datamining داده های خام را به اطلاعات تیدیل میکنید. و سپس با علم انسانی خود اون اطلاعات را به دانش تبدیل کرده و از آن استفاده میکنید.
Data mining(داده کاوی)
پس در واقع دادهکاوی علمی است که در تلاش است تا با شناسایی روابط، الگوها و بررسی مشخصات دادههای خام، اطلاعات معناداری را در اختیارکار و کاسبی شما قرار دهد.
نمونه های داده کاوی یا data mining
برای درک بهتر این مطلب چند نمونه موفق از داده کاوی رو باهم بررسی میکنیم.داده کاوی یا data mining چیست؟
در فروشگاه های زنجیره ای تلاش بسیار زیادی صورت میگیرد تا مدیران آن ها ارتباط فروش بین کالا ها را پیدا کنند و آن ها را به نحو احسن مدیریت کنند. مثلا در یکی از فروشگاه های زنجیره ای بزرگ آمریکای شمالی طی بررسی های بسیار زیاد مشخص شد . بیشتر افرادی که پوشک بچه خریداری میکنند ، ابجو نیز میخرند. یا بیشتر افرادی که تلوزیون میخرند ، گلدون های کریستالی نیز میخرند. تا اینجای کار مرحله اطلاعات بود که در اختیار مدیران قرار گرفت.
حال مدیران با دانش بشری خود میتوانند دو تصمیم مختلف بگبرند. یک اینکه بخش مربوط به پوشک و ابجو را در نزدیکی هم قرار دهند که مشتری راحت تر خرید کند . و دو اینکه اجناسی که کم تر فروش رفته اند را بر سر راه مشتریان که از بخش پوشک به بخش ابجو میروند قرار دهند که مشتریان آن اجناس هم ببیند. در واقع این موضوع به سیاست کاری مجموعه و مدیر ان جا بستگی دارد.
مثال بعدی یک فروشگاه پوشاک آقایان است که طی داده کاوی مشخص شد . بیشتر افرادی که کراوات مشکی میخرند ، در همان روز یا روزهای بعد گیره کروات یشمی رنگ نیز خریداری میکنند. خب واضح است که این اطلاعات به صاحبان کسبو کار ها در زمینه پوشاک برای برگزاری جشنواره های فروش و تخفیف گزاشتن خیلی کمک شایانی خواهد کرد. داده کاوی یا data mining چیست؟
اینجی سودیش کوجیست؟
شاید این سوال در ذهن شما نقش ببنده که خب سود این کار کجاست. یا چه پولی توی این کار نهفته است؟
مارک زاکربرگ ، جوان آمریکایی که با 100 میلیارد دلار سرمایه سومین پولدار جهان است. این جوان نه تو کار دلالی ماشین ، دارو ، اسلحه ، جواهرات و یا هرچیز دیگری نیست. ایشون صاحب فیسبوک ، توییتر، اینستاگرام و واتس آپ هستند. شاید سوال پیش بیاد که خب استفاده از این نرم افزار ها که در کل جهان کاملا رایگان است ، پس این چیجوری پول دار شده؟ مارک زاکربرگ و امثال این آقا از ما دزدی نمیکنند ، درواقع با جمع آوری داده ها از شبکه های مجازی خود و انجام دادن داده کاوی روی ان ها ، اطلاعات به دست آمده را به صاحبان کسب و کار میفروشند.داده کاوی یا data mining چیست؟
به طور مثال شرکت اپل یک هزینه هنگ گفتی را به فیس بوک میدهد تا ببیند باز خورد مردم راحب ایفون 11 بهتر بوده یا ایفون 12 ؟ و خیلی مثال های مشابه این موضوع…
با سپاس از همراهی شما عزیزان. تیم ای تی هسته فناوری سام در خدمت شماست.داده کاوی یا data mining چیست؟