نسل جوان ایران

فنی مهندسی کامپیوترنرم افزار نرم افزار

دانلود پایان نامه تسریع یادگیری مشارکتی در سیستم های چندعاملی بهره گیری از کوتاههترین مسیر تجربه شده

ارسال کننده : سرکار خانم زهرا رحیمی
سطح فعالیت : نویسنده
ایمیل : NJIRAN33[@]GMAIL.COM
تاریخ ارسال : ۲۰ بهمن ۱۳۹۹
دفعات بازدید : 59
زبان نوشتاری : فارسی
تعداد صفحه : 73
فرمت فایل : pdf
حجم فایل : 1/830kb

قیمت فایل : 5,000 تومان
خرید فایل

امتیاز مثبت : 3
امتیاز منفی : 0

دانلود پایان نامه و مقاله
محل سفارش تبلیغات شما

چکیده

می توان گفت بشر از ساخت اولین سیستم کامپیوتری، به دنبال سیستم های هوشمند بود. این رو با با فعالیت در شاخه هوش مصنوعی روز به روز به واقعیت نزدیک تر شده است. اصلی ترین معیار هوشمندی قابلیت یادگیری است که بر همین اساس در هوش مصنوعی زیر شاخه یادگیری ماشین پدید آمد و روز به روز بیشتر مورد توجه قرار گرفت. بعدها با ترکیب یادگیری ماشین با سیستم های توزیع شده، باد گیری در سیستم های چند عاملی با هدف افزایش سرعت و کیفیت مورد بررسی قرار گرفت. باد گیری در سیستم های چند عاملی می تواند به صورت رقابتی و با مشارکتی باشد. در سیستم های چند عاملی مشارکتی عامل ها سعی دارند با همکاری پاداش گروهی خود را افزایش دهند. بر خلاف آن، در سیستم های رقایتی عامل های خود خواه در تلاش برای افزایش سود فردی خود بوده که این افزایش ممکن است به قیمت کاهش مود دیگران باشد.

ترکیب اطلاعات را می تران بزرگ ترین چالش در روش های یادگیری مشارکتی دانست که از باد گیری تفرینی استفاده می نمایند. در پژوهش پیش رو با هدف بهبود یادگیری مشارکتی در سیستم های چند عاملی روش های ارائه شده مورد بررسی قرار گرفت که نتیجه این بررسی شناسایی سه نقطه بحرانی بود. اولین نقطه بحرانی که بررسی شد انتخاب عمل در یادگیری مستقل بود که با ارائه معماری به نام کوتاه ترین فاصله تجربه شده و بهره گیری از این معیار به عنوان یک مکاشفه در انتخاب عمل، منجر به بهبود یاد گیری تقویتی شد. نقطه بحرانی دوم، بخش ترکیب داده های عامل ها است؛ در جهت بهبود این ترکیب داده ها ابتدا معبار جدیدی به نام شرکت ارائه شده، سپس با ترکیب این معیار با معیار حداقل فاصله تجربه شده، ترکیب مؤثری ایجاد شده است. در آخر موضوعی که کمتر مورد بررسی قرار گرفته تقسیم کار بین عامل ها با هدف کاهش اعمال تکراری و افزایش سرعت است. انجام آزمایش ها نشان داد این سه عمل در کنار هم می تواند بهبود چشم گیری در یادگیری مشارکتی ایجاد نماید.

عنوان

فهرست مطالب

فهرست تصاویر

فهرست جداول

چکیده

فصل

مقدمه

یادگیری ماشین

سیستم های چند عاملی

یادگیری مشارکتی در سیستم های چند عاملی

اهداف و نو آوری های پژوهش

ساختار پایان نامه

فصل مروری بر کارهای گذشته

مشارکت به وسیله اشتراک گذاری

تقليد

حافظه جمعی

یادگیری مشارکتی مبتنی بر خبرگی

تخته سیاه

یادگیری مشارکتی مبتنی بر پتنگی سیاست

یادگیری مشارکتی بر مبنای خیرگی چند معیاره

نتیجه گیری

فصل سوم: پیش نیاز

یادگیری تقویتی

فرآیند تصمیم گیری مارکف

یادگیری

برقراری تعادل در اکتشاف و بهره برداری

حریصانه

بهره گیری از توزیع بولتزمن (Softmax

مکاشفه در یادگیری

محیطهای یادگیری

محیط های آزمایشی

صید و صیاد

پلکان مارپیچ

پلکان مارپیچ تعمیم یافته

نتیجه گیری

فصل 4: ارائه روش پیشنهادی

معیارهای ارائه شده جهت ارزیابی عامل

شوک دو

کوتاهترین مسیر تجربه شدت

افزایش کارایی در انتخاب عمل یادگیری تقویی

آزمایش اول: بررسی و مقایسه روش پیشنهادی با روش یادگیری تقویتی

آزمایش دوم: بررسی حساسیت روش پیشنهادی در برابر پارامتر

آزمایش سوم: بررسی حساسیت روش پیشنهادی در برابر پارامترات.

آزمایش چهارم: بررسی حساسیت روش پیشنهادی در برابر پارامتر

بررسی و ارائه راهکار در فاز ترکیب اطلاعات و تنب کار

تشریح کامل روش پیشنهادی

آزمایش اول: بررسی عملکرد روش پیشنهادی در مقایسه با کارهای گذشته

آزمایش دوم: بررسی عملکرد روش پیشنهادی با تعداد تلاش های متفاوت

آزمایش دوم: بررسی اثر افزایش پارامتر در عملکرد روش پیشنهادی

آزمایش سوم: بررسی اثر افزایش دمای تابع بولتزمن در عملکرد روش پیشنهادی

نتیجه گیری

فصل3

نوآوری های پروژه

نتایج نهایی

تجربه های ناموفق

استفاده از معبار شرکت در یادگیری مشارکتی مبتنی بر خبرگی

استفاده از معیار شوکت جهت میانگین گیری محلی

استفاده از معیار کوتاه ترین فاصله تجربه شده در W5S

طرح پیشنهادهایی جهت کارهای آنتی

پیشنهاد اول: تعادل در بهره گیری از حداقل فاصله تجربه شده

پیشنهاد دوم: تقسیم کار مناسب

پیشنهاد موم: تولید معیاری جهت سنجش میزان شک و يقين در عامل

پیشنهاد چهار: تهیه معیارهایی مشابه معبار SEP

مقدمة

یادگیری ماشین یکی از شاخه های بسیار مهم و پرکاربرد در هوش مصنوعی است که سعی در ایجاد سیستم هایی با هوشمندی و قابلیت یادگیری دارد. معمولا تحقیقاتی که امروزه در این زمینه صورت می گیرد با هدف بهبود کیفیت و افزایش سرعت یادگیری است. یکی از ایده های مطرح شده در این زمینه ترکیب یادگیری با سیستم های چند عاملی است. سیستم های چند عاملی به تنهایی توانایی حل بسیاری از مسائل را دارند؛ ترکیب سیم های چند عاملی با یادگیری ماشین می تواند به صورت مؤثری کارایی این سیم ها را افزایش دهد. با توجه به روابطی که می توان بين عامل ها در سیستم های چند عاملی تعریف کرد، دو مفهوم یادگیری رقابتی و یادگیری مشارکتی ایجاد می شود.

در یادگیری رقابتی عامل های خود خواه" سعی دارند تا از یادگیری برای افزایش کارایی خود بهره ببرند. گاهی این بالا بردن سود شخصی عامل ها به معنی کاهش سود دیگر عامل ها است، این بزرگ ترین دلیل رقابتی نامیدن این مبحث است. در این سیستم ها توجه زیادی به پویایی محیط و تعادل پایدار می شود. ساده ترین حالت از یادگیری رقابتی را می توان بازی های دو نفره در نظر گرفت که عامل های آن قابلیت یادگیری داشته باشند.

عامل های یادگیری مشارکتی برای رسیدن به کارایی بالا با هم مشارکت نموده و از تجربه ی یکدیگر برای رسیدن به سرعت و کیفیت بالا بهره می برند. در ادامه این فصل پس از تشریح دقيق مفاهیم پادگیری ماشین و سیستم های چند عاملی به تشریح دقیق تری از یادگیری مشارکتی در سیستم های چند عاملی خواهیم پرداخت.

یادگیری ماشین

تقریبا از ایجاد اولین رایانه ها انسان سعی داشته، بتواند با آموزش دادن، از رایانه بهره برد. از این رو به امید رسیدن به سیستم هایی که با آزمایش و کسب تجربه به هوشمندی می رسند تلاش های زیادی انجام داده است. میشل در مقدمه کتاب خود [۳] تعریف را برای یادگیری ماشین ارائه نموده است.

تعریف: زمانی گفته می شود که یک برنامه کامپیوتری از تجربه E در مورد کار T"يرحسب معیار کارایی 2 یادگیری دارد که کارایی اش بعد از تجربه ی E برای کار بهبود بیابد.

امروزه می توان نمود این تفکر را به آسانی دید. میشل هم چنین به کارهایی که با موفقیت در زمینه یادگیری ماشین انجام شده اشاراتی داشته است. سیستم هایی مثل تشخیص صوت، تشخیص دست خط، سیستم هایی که می توانند مثل بازیکنان حرفه ای بازی کنند و سیستم های داده کاوی که از طریق یادگیری کار می کنند نمونه هایی از کارهای موفق در زمینه یادگیری ماشین است که به خوبی نیز عمل می نمایند[۳]

اما هنوز نمی توان گفت که به هدف خود رسیده ایم زیرا سیستم های تهیه شده همه برای انجام کارهای خاص بوده و هنوز نتوانسته ایم به س شمی برسیم که در تمام اهداف کارایی بالا داشته باشد. چالش های زیادی در این شاخه وجود دارد که محققان برای رفع آنها تلاش می نمایند.

تقسیم بندی های فراوانی برای یادگیری ماشین وجود دارد که یکی از متداولترین آنها تقسیم بندی به سه دسته یادگیری با نظارت و یادگیری بدون نظارت و یادگیری نیمه نظارتی است. در یادگیری با نظارت یک مجموعه داده های برچسب دار وجود دارد و یادگیری بر اساس همین داده ها صورت می گیرد؛ اما در یادگیری بدون نظارت داده ها برچسب ندارند، در نتیجه خروجی این روش ها تا حدودی با هم متفاوت است. با توجه به یادگیری با نظارت و بدون نظارت می توان به ماهیت داده ای محیط های نیمه نظارت نیز می برد. در این محیط ها بخشی از داد ها دارای برچسب و بخش دیگر داده ها بدون برچسب هستند[۳]. با این حال رده ای از مسائل وجود دارند که خروجی مناسب که یک سیستم یادگیری تحت نظارت نیازمند آن است، برای آنها موجود نیست. این نوع از مسائل چندان قابل جوابگویی با استفاده از یادگیری تحت نظارت نیستند. یادگیری تقویتی مدلی برای مسائلی از این قبیل فراهم می آورد. در یادگیری تقویتی، سیستم تلاش می کند تا تقابلات خود با یک محیط پویا را از طریق آزمون و خطا بهینه نماید. یادگیری تقویتی مسئله ای است که یک عامل که می بایست رفتار خود را از طریق تعاملات آزمون و خطا با یک محیط پویا فراگیرد، با آن مواجه است. دریادگیری تقویتی هیچ نوع زوج ورودی- خروجی ارائه نمی شود. به جای آن، پس از اتخاذ یک عمل، حالت بعدی و پاداش بلافصل به عامل ارائه می شود. هدف اولیه برنامه ریزی عامل ها با استفاده از تنبیه و تشویق است بدون آنکه ذکری از چگونگی انجام وظیفه آن ها شود.

برای این فایل تا کنون نظری ارسال نشده است

برای ارسال نظر باید عضو سایت باشید

تعداد کاراکتر مجاز:

برچسب های مرتبط


فهرست کتابخانه نسل جوان ایران

نویسندگان برتر و فعال نسل جوان ایران

تاییدیه های سایت


درگاه بانک ملت

شبکه های اجتماعی نسل جوان ایران


فن آوری های روز دنیا


آرشیو فن آوری های روز دنیا

جدیدترین اخبار سایت


پایگاه خبری نسل جوان ایران