قالب وردپرس پوسته وردپرس قالب فروشگاهی وردپرس وردپرس قالب وردپرس
خانه / کتاب / کتاب داده کاوی در پایگاه داده های بزرگ

کتاب داده کاوی در پایگاه داده های بزرگ

داده کاوی در پایگاه داده های بزرگ

داده کاوی
داده کاوی

داده کاوی چیست؟

داده کاوی (Data Mining) علم و فنی است که در سال‌های اخیر و با گسترش استفاده از فناوری اطلاعات و سیستم‌های اطلاعاتی مورد توجه سازمان‌ها قرار گرفت. داده کاوی کاربردهای مختلفی برای سازمان‌ها دارد و می‌تواند برای شرکت‌ها در زمینه‌های مهمی مثل بازاریابی و فروش بسیار راه گشا و مفید باشد. در ادامه با مفهوم داده و اطلاعات آشنا می‌شویم و سپس با معنای داده کاوی و کاربردهای آن بیشتر آشنا خواهیم شد:

داده با اطلاعات چه فرقی دارد؟
بسیاری از مردم به اشتباه می‌پندارند که داده با اطلاعات تفاوت ندارد و عموما این دو واژه را به جای هم استفاده می‌کنند. داده (Data)  می‌تواند هر نوع از کاراکتر شامل متن، عدد، کلمه، صدا و تصویر باشد و در صورتی که توسط انسان مشاهده شود لزوما معنای خاصی هم در بر نخواهد داشت. داده‌ها عموما خام، دسته بندی و طبقه بندی نشده هستند و در صورتی که بخواهیم از آنها به صورت مستقیم استفاده کنیم عموما بی فایده خواهد بود.

حال آنکه پس از طبقه بندی، دسته بندی و ساختاردهی به داده‌ها اطلاعات (Information) به وجود می‌آید. می‌توان از داده‌ها برای تصمیم گیری و یا ایجاد دانش در مورد یک مقوله استفاده کرد. اطلاعات عموما برای کاربر مفهوم دارد و قابل استفاده است.

مثال: نمرات دانشجویان یک کلاس داده است، اما ترتیب نمرات، میانگین، و ارتباط نمره این درس با معدل دانشجو یا یک درس دیگر یک نمونه از اطلاعات است.

ویژگی‌های اصلی داده کاوی:

  1. کشف اتوماتیک الگوها
  2. پیش بینی احتمالی نتایج و خروجی‌ها
  3. ایجاد اطلاعات اجرایی و مفید
  4. تمرکز بر روی داده‌های بزرگ و مجموعه پایگاه های داده

داده کاوی چه کاری می تواند انجام دهد؟
داده کاوی عموما توسط سازمان های مشتری محور استفاده می‌شود، این سازمان‌ها (فروشگاه‌ها، تولید کنندگان، خرده فروشان و فروشگاه های اینترنتی) می‌توانند با استفاده از داده کاوی ارتباط میان اقدامات خود و عوامل درونی سازمان مثل قیمت کالاها، تخفیفات، هزینه تبلیغات و دیگر عوامل داخلی را با عوامل بیرونی مثل مشخصات مشتریان (سن، جنسیت، درآمد و محل سکونت)، رقبا و عوامل عمومی بازار (سطح درآمد جامعه، وضعیت رونق و رکود اقتصادی) را پیدا کنند. علاوه بر این می‌توان شاخص‌هایی مثل رضایت مشتری، درآمد و سود سازمان، مجموع سرمایه درگردش و هزینه های جاری و میزان افزایش و کاهش آنها در طول زمان را استخراج کند.

به طور مثال شرکت ویدئوی خانگی Blockbuster از داده‌های سابق مشتریان استفاده می‌کند و به انها ویدئوهایی پیشنهاد می‌دهد تا آنها را تماشا کنند. والمارت (بزرگترین خرده فروش زنجیره ای جهان) برای بهبود عمکلرد عرضه کنندگان خود از داده کاوی در مقیاسی وسیع استفاده کرده است. داده‌های ۲۹۰۰ فروشگاه در ۶ کشور برای این کار استفاده شده‌اند و در مجموع ۷٫۵ ترابایت داده مورد بررسی قرار گرفت. ۳۵۰۰ تامین کننده به داده‌های دسترسی پیدا کردند تا بتوانند الگوهای خرید مشتریان، عمکلرد یک کالا و محصول خاص را بررسی کنند و برنامه‌های خود را بر این پایه و اساس بهبود دهند.

داده کاوی
داده کاوی

فرایند داده ‌کاوی شامل سه مرحله می‌باشد:

  1. کاوش اولیه
  2. ساخت مدل یا شناسایی الگو با کمک احراز اعتبار/ تایید
  3. بهره برداری

مرحله ۱ : کاوش
معمولا‌ این‌ مرحله با آماده سازی داده‌ها صورت می‌گیرد که ممکن است شامل: پاک سازی داده‌ها ،‌تبدیل داده‌ها‌ و‌ انتخاب زیرمجموعه‌هایی‌‌ از رکوردها‌ با‌ حجم‌ عظیمی‌ از ‌متغییرها ( فیلدها ) باشد. سپس با توجه‌ به‌ ماهیت‌ مساله تحلیلی‌، این‌ مرحله‌ به‌ مدل‌های‌‌ ‌پیش بینی ساده یا مدل‌های‌ آماری‌ و‌ گرافیکی برای شناسایی متغیرهای مورد نظر و تعیین پیچیدگی مدل‌ها برای استفاده در مرحله بعدی نیاز دارد.

مرحله ۲ : ساخت و احراز اعتبار مدل
این‌مرحله‌ به بررسی‌ مدل‌های مختلف و گزینش بهترین مدل با توجه به کارآیی پیش‌بینی آن می‌پردازد. شاید این مرحله ساده به نظر برسد، اما اینطورنیست. تکنیک‌های‌متعددی‌برای‌ر سیدن‌ به‌ این‌ هدف توسعه یافتند. و ” ارزیابی رقابتی مدل‌ها”‌ نام گرفتند. بدین منظور مدل‌های مختلف برای مجموعه داده‌های یکسان‌‌ به‌ کار‌ می‌روند‌ تا‌ کارآیی‌شان‌ با‌هم مقایسه‌ شود،‌ سپس مدلی که‌ بهترین کارآیی راداشته باشد‌، انتخاب می‌شود.‌ این‌ تکنیک‌ها عبارتند از : Bagging,Boosting ,Stacking و Meta-learning .

مرحله ۳ : بهره برداری
آخرین‌ مرحله‌ مدلی‌ را که‌ در مرحله قبل‌ انتخاب‌ شده است، در داده‌های‌ جدید به کار‌ می‌گیرد تا پیش‌بینی‌های‌ خروجی‌های مورد انتظار را تولید نماید. داده کاوی‌ به‌ عنوان‌ ابزار‌ مدیریت‌ اطلاعات‌ برای‌ تصمیم گیری‌،‌ عمومیت‌ یافته‌ است. اخیرا‌،‌ توسعه تکنیک‌های تحلیلی جدید در این زمینه مورد توجه قرار گرفته است (مثلا Classification Trees)، اما هنوز داده کاوی مبتنی بر اصول آماری نظیر (EDA) می‌باشد.

اطلاعات فایل
عنوان کتاب : داده کاوی در پایگاه داده های بزرگ

تعداد صفحات : ۱۰۳ صفحه

وضعیت محصول : رایگان

فرمت فایل : پی دی اف

زبان : فارسی

حجم : ۲.۰۸ Mb

  دانلود

مطلب مفیدی برای شما بود ؟؟ پس به اشتراک بگذارید برای دوستانتان

نظر دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

})