توضیحات محصول

کتاب داده کاوی وب

با توسعه سیستم‌ های اطلاعاتی، داده به یکی از منابع پر اهمیت سازمان‌ ها مبدل گشته است. بنابراین روش‌ ها و تکنیک‌ هایی برای دستیابی کارا به داده، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد نیاز می‌ باشد.با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روش‌ ها و تکنیک‌ ها بیش از پیش احساس می‌ شود.وب، محیطی وسیع، متنوع و پویا است که کاربران متعدد اسناد خود را در آن منتشر می‌ کنند. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ ۷.۳ میلیون صفحه در روز افزایش می‌ یابد. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزار های سنتی تقریبا غیر ممکن است و ابزار ها و روش‌ هایی نو برای مدیریت آن مورد نیاز است.

به طور کلی کاربران وب در استفاده از آن با مشکلات زیر روبرو هستند:

۱) یافتن اطلاعات مرتبط.

۲) ایجاد دانش جدید با استفاده از اطلاعات موجود در وب.

۳) خصوصی سازی اطلاعات.

نکته : وب کاوی در واقع کاربرد تکنیک‌ های داده کاوی به منظور کشف الگو هایی از وب می‌ باشد.

وب کاوی شامل چهار مرحله اصلی می‌باشد:

۱) پیدا کردن منبع: این مرحله شامل بازیابی اسناد وب مورد نظر می‌ باشد.

۲) انتخاب اطلاعات و پیش پردازش: در این مرحله به صورت خودکار اطلاعات خاصی از اسناد بازیابی شده، انتخاب و پیش پردازش می‌ شوند.

۳) تعمیم: در این مرحله به صورت خودکار الگو های عام در یک یا چندین سایت وب کشف می‌ شود.

۴) تحلیل: در این مرحله الگو های به دست آمده در مرحله قبل اعتبار سنجی و تفسیر می‌ شوند.

توضیح مراحل داده کاوی وب

در مرحله اول داده‌ ها از منابع موجود در وب مانند خبرنامه‌ های الکترونیکی، گروه‌ های خبری، اسناد HTML، پایگاه داده‌ های متنی و … بازیابی می‌ شوند.

مرحله انتخاب و پیش پردازش شامل هر گونه فرآیند تبدیل داده‌ های بازیابی شده در مرحله قبل می‌ باشد. این پیش پردازش می‌ تواند کاهش کلمات به ریشه آنها، حذف کلمات زائد، پیدا کردن عبارات موجود در متن و تبدیل بازنمایی داده‌ ها به قالب رابطه‌ ای یا منطق مرتبه اول باشد. در مرحله سوم از تکنیک‌ های داده کاوی و یادگیری ماشین برای تعمیم استفاده می‌ شود.

همچنین باید توجه داشت که کاربران نقش مهمی در فرآیند استخراج اطلاعات و دانش از وب ایفا می‌ کنند. این نکته به ویژه در مرحله چهارم از اهمیت بسزایی برخوردار است. به این ترتیب وب کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده‌ های وب می‌ باشد. این فرآیند به طور ضمنی شامل فرآیند کشف دانش در پایگاه داده‌ ها نیز می‌شود. در واقع وب کاوی گونه توسعه یافته KDD است که بر روی داده‌ های وب عمل می‌ کند.


برچسب ها:

, , , , , , , ,
قابل ویرایشنمی باشد
قابل پرینتمی باشد
حجم فایل8 مگابایت
محتوای فایل دانلودیZip
زبانانگلیسی
فرمت فایلپی دی اف
تعداد صفحات643 صفحه
جزئیات محصولاین محصول شامل یک فایل پی دی اف (PDF) می باشد.

    شما باید وارد شوید و یک خریدار محصول باشید تا بتوانید نظر خود را ثبت کنید.

    For security, use of Google's reCAPTCHA service is required which is subject to the Google Privacy Policy and Terms of Use.

    If you agree to these terms, please click here.

    نظری بدهید

    For security, use of Google's reCAPTCHA service is required which is subject to the Google Privacy Policy and Terms of Use.

    If you agree to these terms, please click here.