قالب وردپرس پوسته وردپرس قالب فروشگاهی وردپرس وردپرس قالب وردپرس
خانه / مهندسی فناوری اطلاعات / کتاب : داده‌کاوی وب

کتاب : داده‌کاوی وب

داده‌کاوی وب

 

داده‌کاوی وب
داده‌کاوی وب

با توسعه سیستم‌های اطلاعاتی، داده به یکی از منابع پراهمیت سازمان‌ها مبدل گشته است. بنابراین روش‌ها و تکنیک‌هایی برای دستیابی کارا به داده، اشتراک داده، استخراج اطلاعات از داده و استفاده از این اطلاعات، مورد نیاز می‌باشد. با ایجاد و گسترش وب و افزایش چشمگیر حجم اطلاعات، نیاز به این روش‌ها و تکنیک‌ها بیش از پیش احساس می‌شود. وب، محیطی وسیع، متنوع و پویا است که کاربران متعدد اسناد خود را در آن منتشر می‌کنند. در حال حاضر بیش از دو بیلیون صفحه در وب موجود است و این تعداد با نرخ ۷.۳ میلیون صفحه در روز افزایش می‌یابد. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیر ممکن است و ابزارها و روش‌هایی نو برای مدیریت آن مورد نیاز است. به طور کلی کاربران وب در استفاده از آن با مشکلات زیر روبرو هستند:

۱) یافتن اطلاعات مرتبط.

۲) ایجاد دانش جدید با استفاده از اطلاعات موجود در وب.

۳) خصوصی سازی اطلاعات.

نکته : وب کاوی در واقع کاربرد تکنیک‌های داده کاوی به منظور کشف الگوهایی از وب می‌باشد.

وب کاوی شامل چهار مرحله اصلی می‌باشد:

۱) پیدا کردن منبع: این مرحله شامل بازیابی اسناد وب مورد نظر می‌باشد.
۲) انتخاب اطلاعات و پیش پردازش: در این مرحله به صورت خودکار اطلاعات خاصی از اسناد بازیابی شده، انتخاب و پیش پردازش می‌شوند.
۳) تعمیم: در این مرحله به صورت خودکار الگوهای عام در یک یا چندین سایت وب کشف می‌شود.
۴) تحلیل: در این مرحله الگوهای به دست آمده در مرحله قبل اعتبار سنجی و تفسیر می‌شوند.
در مرحله اول داده‌ها از منابع موجود در وب مانند خبرنامه‌های الکترونیکی، گروه‌های خبری، اسناد HTML، پایگاه داده‌های متنی و … بازیابی می‌شوند. مرحله انتخاب و پیش پردازش شامل هر گونه فرآیند تبدیل داده‌های بازیابی شده در مرحله قبل می‌باشد. این پیش پردازش می‌تواند کاهش کلمات به ریشه آنها، حذف کلمات زائد، پیدا کردن عبارات موجود در متن و تبدیل بازنمایی داده‌ها به قالب رابطه‌ای یا منطق مرتبه اول باشد. در مرحله سوم از تکنیک‌های داده کاوی و یادگیری ماشین برای تعمیم استفاده می‌شود. همچنین باید توجه داشت که کاربران نقش مهمی در فرآیند استخراج اطلاعات و دانش از وب ایفا می‌کنند. این نکته به ویژه در مرحله چهارم از اهمیت بسزایی برخوردار است.
به این ترتیب وب کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده‌های وب می‌باشد. این فرآیند به طور ضمنی شامل فرآیند کشف دانش در پایگاه داده‌ها نیز می‌شود. در واقع وب کاوی گونه توسعه یافته KDD است که بر روی داده‌های وب عمل می‌کند.

اطلاعات فایل
عنوان کتاب : داده‌کاوی وب

تعداد صفحات : ۶۴۳ صفحه

وضعیت محصول : رایگان

فرمت فایل : پی دی اف

زبان : انگلیسی

حجم : ۸ Mb

 

مطلب مفیدی برای شما بود ؟؟ پس به اشتراک بگذارید برای دوستانتان

نظر دهید

نشانی ایمیل شما منتشر نخواهد شد.

})