نسل جوان ایران

فنی مهندسی کامپیوترخدمات طراحیطراحی وبلاگ دهی

تقسيم‌بندي صفحات وب

ارسال کننده : جناب آقای سجاد رجبی
سطح فعالیت : نویسنده
ایمیل : sajadrajabi.sajad[@]gmail.com
تاریخ ارسال : ۲۳ تیر ۱۳۹۷
دفعات بازدید : 74
زبان نوشتاری : فارسی
تعداد صفحه : 71
فرمت فایل : word
حجم فایل : 431kb

قیمت فایل : 5,000 تومان
خرید فایل

امتیاز مثبت : 0
امتیاز منفی : 0

پایگاه مقاله نسل جوان ایران

همانطور که می دانیم مجموع اطلاعات در دسترس روی وب بسیار زیاد می باشد و هر ساله شاهد روندرو به رشد تصاعدی در مقدار اطلاعات روی صفحات وب می باشیم. در حقیقت ،وب یک انبار بزرگ اطلاعات است و با یک بررسی اجمالی در میابیم که شمارش صفحات قابل دسترس در وب در حدود یک میلیارد صفحه می باشد وچیزی در حدود یک و نیم میلیون صفحه نیز به طور روزانه اضافه می شوند. به عنوان مثال در حال حاضر سایت گوگل بیشتر از 2/4 میلیارد صفحه را جستجو می کند. این مقدار هنگفت اطلاعات به اضافه طبیعت فعل و انفعالی و پر محتوای وب آنرا بسیار پر طرفدار کرده است . به علاوه سازماندهی این صفحات امکان جستجوی آسان را نمی دهد.

- معرفی فصل دوم پایان نامه................................................................................................. 2

1-2- معرفی فصل سوم پایان نامه............................................................................................ 7

 

فصل دوم:روش های متفاوت تقسیم بندی صفحات وب

2-1- تقسيم بندي صفحات وب بطور مختصر............................................................................ 9

2-1-1-1- روش خلاصه سازي تعديل شده Luhn............................................................... 10

2-1-1-2 – روش تحليل معنايي نهفته (LSA)....................................................................... 12

2-1-1-3- شناسايي مضمون بدنه اصلي توسط تجزيه و تحليل لايه‌اي.................................. 13

2-1-1-4- خلاصه سازي نظارت شده................................................................................... 15

2-1-1-5- يك دسته بندي كلي از خلاصه سازي................................................................... 17

2-1-2- آزمايشات.............................................................................................................. 18

2-1-2-1- مجموعه ی داده.................................................................................................. 18

2-1-2-2- دسته كننده ها.................................................................................................... 19

2-1-2-3- مقياس ارزيابي.................................................................................................... 21

2-1-2-4- نتايج و تحليل هاي تجربي................................................................................... 22

2-1-2-5 مورد پژوهش....................................................................................................... 29

2-1-3- نتیجه گیری و عملکرد آینده................................................................................... 31

2-2- تقسیم بندی صفحات وب با استفاده از الگوریتم اجتماع مورچه ها................................... 32

2-2-1- پیش پردازش متنی وابسته به زبان شناسی و استخراج وب......................................... 32

2-2-2- الگوريتم Ant- Miner......................................................................................... 36

2-2-3- نتايج محاسباتي...................................................................................................... 39

2-2-3-1- تنظيم بصورت عملي........................................................................................... 39

2-2-3-2- نتايج تأثير تكنيك های پيش پردازش متنی وابسته به زبان شناسی.............................. 40

2-2-4- بحث و تحقيقات آينده............................................................................................ 43

2-3- تقسيم بندي صفحات وب براساس ساختار پوشه‌اي......................................................... 44

2-3-1 الگوريتم هاي تقسيم بندي صفحات وب...................................................................... 45

2-3-2- روش مبتني بر ساختار............................................................................................. 47

2-3-3- يك كاربرد خاص.................................................................................................. 47

2-3-3-1- استخراج مهمترين خصوصيات............................................................................. 48

2-3-3-2- عمل دسته بندي.................................................................................................. 50

2-3-4 نتايج....................................................................................................................... 51

2-3-5- نتيجه گيري و عملكرد آينده.................................................................................... 53

 

فصل سوم : جستجوي وب با استفاده از طبقه بندي خودكار

3-1- معماري .................................................................................................................... 57

3-1-1- دسته كننده‌ي خودكار ............................................................................................ 57

3-1-2-واسط جستجو......................................................................................................... 58

3-2- آزمایش معتبر سازي................................................................................................... 59

3-2-2- برپایی آزمایش ..................................................................................................... 60

3-2-2- نتایج تجربي.......................................................................................................... 61

3-3- فهرست لغات هر دسته................................................................................................ 64

3-3-1- تشخیص هرزنامۀ¹ وب............................................................................................ 66

3-3-2- تأثیرات تبعیضات................................................................................................... 67

3-4- عملکردهای بعدی ..................................................................................................... 68

شواهد نشان می دهد که طبقه بندی نقش مهمی را در آینده سیستم های جستجو بازی می کند. تحقیقات انجام شده نشان می دهد که کاربران ترجیح می دهند برای جستجو ، از کاتولوگ های از پیش دسته بندی شده استفاده کنند . از طرفی رسیدن به این قبیل نیاز های اساسی بدون تکنیک های خودکار دسته بندی صفحات وب و تحت ویرایش دستی و طبیعی توسط انسان بسیار مشکل است . زیرا با افزایش حجم اطلاعات طبقه بندی دستی بسیار وقتگیر و دشوار است.

در نگاه اول ، دسته بندی صفحات وب را می توان از برنامه های اداری دسته بندی متون مقتبس نمود.اگر بخواهیم در یک آزمایش ملموس تر به نتایج دقیق برسیم، راه حل مساله بسیار دشوار خواهد شد.صفحات وب ساختار اصلی و اساسی خود را در قالب زبان HTML قرار می دهند که آنها شامل محتویات پر سروصدا مانند تیترهای تبلیغاتی و یا هدایت گرهای راهنما و غیر متنی هستند.اگز روش های خاص طبقه بندی ویژه متون برای این صفحات بکار گرفته شود چون متمایل به یک الگوریتم خاص دسته بندی متون است ، گمراه شده و باعث از دست رفتن تمرکز بر موضوعات اصلی و محتویات مهم می شود.زیرا این محتویات فقط شامل متن نیست.ش

برای این فایل تا کنون نظری ارسال نشده است

برای ارسال نظر باید عضو سایت باشید

تعداد کاراکتر مجاز:

مقاله و کتاب های مرتبط

برچسب های مرتبط


فهرست کتابخانه نسل جوان ایران

تاییدیه های سایت


درگاه بانک ملت

شبکه های اجتماعی نسل جوان ایران


فن آوری های روز دنیا


آرشیو فن آوری های روز دنیا

جدیدترین اخبار سایت


پایگاه خبری نسل جوان ایران

مقالات برتر و منتخب کاربران