📁 کامپیوتر و IT (آموزش_و_پژوهش)کد:32065امتیاز:4.8📅 بروزرسانی: هفته پیش

دانلود فایل ورد Word فایل پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

دانلود فایل اصلی

برای دریافت فایل کامل روی دکمه زیر کلیک کنید

دانلود و مشاهده جزئیات
ℹ️
برای مشاهده محصول و توضیحات به ادامه مطلب بروید

توضیحات

دانلود فایل ورد Word فایل پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبانعنوان:پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان تعداد صفحات :115 چکیده: برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.پیش پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش است.روش های بسیاری برای پیش پردازش داده وجود دارد که می­توان از آنها استفاده کرد.اما این روش ها برای داده های نامتوازن مناسب نیستند. اصطلاح “مجموعه داده نامتوازن” عموما به مجموعه داده‌ای گفته می‌شود که در آن تعداد نمونه‌هایی که نمایانگر یک کلاس هستند از نمونه‌های دیگر در کلاس‌های متفاوت کمتر است مشکل عدم توازن کلاس در بسیاری از برنامه های کاربردی جهان واقعی به رسمیت شناخته شده است و موضوع تحقیقات یادگیری مبتنی بر ماشین قرار گرفته است از این رو اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینه ی داده کاوی قرار گرفته است.آنها به دنبال کشف روش هایی بودند که با اعمال بر روی داده های نامتوازن به نتایج مطلوبی دست یابند. در این پروژه روش های گوناگون پیش پردازش داده های نامتوازن مورد بحث قرار گرفته و الگوریتم جدیدی برای بهبود نتایج طبقه بندی ارائه می­شود، به گونه ای که کارایی و دقت آن مورد توجه باشد. فصل اول: مقدمه و کلیات تحقیق 1-1- مقدمه کشف دانش و داده کاوی یک حوزه جدید میان رشته ای و در حال رشد است که حوزه های مختلفی همچون پایگاه داده، آمار، یادگیری ماشین و سایر زمینه های مرتبط را با هم تلفیق کرده تا اطلاعات و دانش ارزشمند نهفته در حجم بزرگی از داده ها را استخراج کند.هدف کشف دانش و داده کاوی یافتن الگوها در پایگاه داده است که در میان حجم عظیمی از داده ها مخفی هستند]1[ .کشف دانش شامل مراحل متعددی است که در این تحقیق به مرحله پیش پردازش توجه می­کنیم. مرحله آماده سازی داده ها مهم ترین و زمانبرترین مرحله در پروژه های داده کاوی است.از آنجا که داده ها در این پروژه ها ورودی پروژه هستند هر قدر این ورودی دقیق تر باشد، خروجی کار دقیق تر خواهد بود.یعنی ما از پدیده “ورودی نامناسب، خروجی نامناسب ” دور می­شویم]1[.داده های خام معمولا دچار مشکلاتی مانند نویز، داده پرت، تغییرات در نمونه برداری هستند و استفاده از آنها به همین صورت موجب تضعیف نتایج مورد انتظار میشود.بنابراین باید از روشی برای بهبود نتایج استفاده کرد.پیش پردازش داده ها جهت بهبود کیفیت داده های واقعی برای داده کاوی لازم است.بنابراین پردازش اولیه ای مورد نیاز است تا مقادیر مفقوده، انحرافات و مسائلی از این دست را در داده های اولیه بیابد. پیش پردازش داده ها شامل همه تبدیلاتی است که بر روی داده های خام صورت می­گیرد وآنها را به صورتی در می­آورد که برای پردازشهای بعدی نظیر استفاده در دسته بندی و خوشه بندی، ساده تر و موثرتر می­سازد. در حال حاضر سازمانها نیاز دارند تا بتوانند داده ها را به صورت کاراتر دسته بندی کنند و از تحلیل نتایج آن برای بهبود روند پیشرفت کسب و کار استفاده نمایند.ممکن است که داده های در دسترس ، داده هایی مبهم و مغشوش باشند و یا کلاس های داده نامتوازن باشند. بنابراین نیاز به پیش پردازش دقیق داده ها رو به افزایش است. برای پاسخ به این نیاز رو به افزایش ، افراد همواره سعی در ارائه روش های نوین و موثرتری دارند. 1-2بیان مساله هرچند که روشهای مختلفی برای پیش پردازش داده ها موجود است ولی عملکرد و دقت این روش ها متفاوت است و تلاش در جهت ارائه روشی کارامد امری ضروری است.با توجه به اهمیت داده ها در جهان کنونی و افزایش حجم داده ها مساله پیش پردازش مناسب داده ها، بخصوص داده های نامتوازن یک چالش به نظر می­رسد.اغلب روش های موجود در پیش پردازش داده های ناتوازن به سمت کلاس اکثریت تمایل دارند و این امر باعث می شود که داده های کلاس اقلیت به صورت نویز در نظر گرفته شود. همانطور که پیش از این نیز گفته شد برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.میتوان ادعا کرد که اگر مرحله آماده سازی داده ها به خوبی صورت نپذیرد، نتایجی بدست می­آید که نمی­تواند مورد استفاده قرار گیرد و ممکن است که هزینه و زمان به کار رفته برای دست یابی به نتیجه موثر هدر رود و نتایج حاصل به دلیل عدم پیش پردازش مناسب داده غیر قابل استفاده و نادرست باشد. اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینه ی داده کاوی قرار گرفته است. در موارد متعددی کلاسی که از نقطه نظر دامنه ی کاربردی اهمیت زیادی دارد(کلاس اصلی) شامل تعداد حالات کمتری نسبت به کلاسی است که کلاس اکثریت می­باشد. این مجموعه ی داده ها نامتوازن نامیده می­شود. رویکرد سنتی داده کاوی توانایی خوبی برای پیش بینی نمونه های اقلیت که مورد توجه است ندارند. متأسفانه در اکثر موارد داده های واقعی دارای این خصوصیت هستند. به عنوان مثال در تشخیص بیماری­های نادر، حملات شبکه، متنکاوی و … معمولاً توزیع داده­ها نامتوازن می باشد. در واقع مساله این است که چگونه میتوان داده های نامتوازن را به گونه ای پیش پردازش کرد که در خوشه های مناسب و درست طبقه بندی شوند.بنابراین مساله این تحقیق ارائه روشی جهت پیش پردازش داده های نا متوازن است به گونه ای که کارایی و دقت آن در مقایسه با روش های دیگر بیشتر باشد. در روش ارائه شده در این تحقیق برای ارتقای روش ماشین بردار پشتیبان از تکنیک حداقل مربعات با متر اقلیدسی استفاده نمودیم.این روش بهبود یافته را M-SVM می­نامیم.بنابراین مساله را بدین شکل طرح می نماییم، چگونه می­توان در روش پیش پردازش داده های نامتوازن به دقت بالاتری دست یافت و از پیش پردازش صحیح داده برای دست یابی به نتایج صحیح در حوزه کاربردی استفاده نمود.از انجا که داده های متفاوتی وجود دارد ما پیش پردازش بر روی مجموعه داده های نامتوازن را انتحاب کردیم. 3-1- اهداف تحقیق هدف از این تحقیق ارائه راهکاری به منظور افزایش دقت متعادل سازی داده و غلبه بر مشکل عدم توازن کلاس است.سعی کرده ایم تا متعادل سازی داده که در مرحله پیش پردازش داده صورت می­گیرد باعث بهبود نتایج طبقه بندی نمونه ها شود.بدین منظور اثربخشی و کارایی روش ارائه شده با سایر روش های موجود مورد مقایسه و ارزیابی قرار می­گیرد.امید است که نتایج الگوریتم نهایی امیدوار کننده باشد و نشان دهنده پیشرفت الگوریتم باشد.این تحقیق بر اساس نیاز به دسته بندی دقیق داده ها و استفاده از تحلیل نتایج داده ها در بهبود شرایط مرجع مورد استفاده کننده داده ها شکل گرفته است. فهرست مطالب: فصل اول مقدمه و کلیات تحقیق 1-1مقدمه 1-2بیان مساله 1-3 اهداف تحقیق 1-4 پرسش های اصلی تحقیق 1-5فرضیه های تحقیق 1-6 نوآوری تحقیق 1-7 تعریف واژگان کلیدی 1-8 ساختار پروژه فصل دوم ادبیات و پیشینه تحقیق 2-1 مقدمه 2-2 مفاهیم داده کاوی 2-2-1 تعاریف داده کاوی 2-2-2 فرایند کشف دانش 2-2-3 حوزه ها و عملکردهای داده کاوی 2-3 کاربردهای داده کاوی و کشف دانش 2-4 چالش هایی برای KDD 2-5 پیش پردازش و آماده سازی داده ها 2-5-1اجزای اصلی پیش پردازش داده ها 2-5-1-1 پاکسازی داده ها 2-5-1-2یکپارچه سازی داده ها 2-5-1-3 تبدیل داده ها 2-5-1-3-1هموار سازی 2-5-1-3-2 تجمیع 2-5-1-3-3 تعمیم 2-5-1-3-4 ساخت ویژگی 2-5-1-3-5 نرمال سازی 2-5-1-4 کاهش داده ها 2-5-1-4-1 تجمیع مکعبی داده 2-5-1-4-2 انتخاب زیر مجموعه مشخصه ها 2-5-1-4-3 کاهش تعدد نقاط 2-5-1-5 تصویر کردن برای کاهش بعد 2-6 روش های ارزیابی دسته بندی 2-6-1 ارزیابی صحت روشهای دسته بندی 2-7 تکنیک حداقل مربعات 2-7-1 تقریب کمترین مربعات گسسته چند جمله ای 2-8 ماشین بردار پشتیبان 2-8-1مقدمه 2-8-2دلایل استفاده از SVM 2-8-3 کاربردهای SVM 2-8-4 مزایا و معایب SVM 2-8-5 تعاریف کلی 2-8-5-1تابع تصمیم مسائل دو کلاسی 2-8-5-2 تعیین تابع تصمیم(ابر صفحه جداکننده) 2-8-5-3 بعد VC 2-8-5-4حداقل سازی ریسک تجربی 2-8-5-5حداقل سازی ریسک ساختاری 2-8-6 ماشین بردار پشتیبان طبقه بندی کننده خطی با داده های جدا شدنی به طور خطی 2-8-7ماشین بردار پشتیبان طبقه بندی کننده خطی با داده های جدا نشدنی به طور خطی 2-8-8 ماشین بردار پشتیبان غیر خطی 2-8-9 انواع کرنل ها 2-8-9-1 کرنل چند جمله ای 2-8-9-2 کرنل های شبکه عصبی 2-8-9-3 کرنل های گوسی 2-9 تکنیک های پیش پردازش نامتوازن 2-9-1 ماشین بردار پشتیبان و مشکل عدم توازن کلاس 2-9-1-1 عیب مشکل بهینه سازی با ناحیه مرزی نرم 2-9-1-2 نسبت بردار پشتیبان نامتوازن 2-9-2 روشهای یادگیری عدم توازن خارجی برای SVM (روشهای پیش پردازش داده) 2-9-2-1 روشهای نمونه برداری دوباره 2-9-2-1-1زیر نمونه برداری 2-9-2-1-2بیش نمونه برداری 2-9-2-1-3 SCM 2-9-2-1-4 نمونه برداری پیشرفته 2-9-2-1-5 تکنیک بیش نمونه برداری اقلیت مصنوعی 2-9-2-1-6 نزدیک ترین همسایه فشرده(CNN) 2-9-2-1-7 نزدیک ترین همسایه تغییر یافته(ENN) 2-9-2-1-8 Tomek-Link 2-9-2-2 روشهای یادگیری جمعی 2-9-2-2-1الگوریتم آموزشی Bagging 2-9-2-2-2 الگوریتم آموزشی Boosting 2-9-3 روشهای یادگیری عدم تعادل داخلی برای ماشین بردار پشتیبان 2-9-3-1 هزینه خطای متفاوت 2-9-3-2 یادگیری یک کلاس 2-9-3-3zSVM 2-9-3-4 روشهای اصلاح کرنل 2-9-3-5 یادگیری فعال 2-9-3-6 روش های ترکیبی فصل سوم:روش تحقیق 3-1مقدمه 3-2 ماشین بردار پشتیبان فازی برای یادگیری عدم توازن کلاس 3-2-1 روش SVMFuzzy 3-2-2متد FSVM-CIL 3-3 ماشین بردار پشتیبان حداقل مربعات (LS-SVM) 3-4 الگوریتم پیشنهادی فصل چهارم: محاسبات و یافته های تحقیق 4-1 مقدمه 4-2 مجموعه داده ها 4-3 نتایج کارایی روش های مختلف بر روی مجموعه داده ها فصل پنجم:نتیجه گیری و پیشنهادات 5-1 جمع بندی و نتیجه گیری 5-2 کارهای آتی منابع و مآخذ چکیده انگلیسی

دسته‌بندی‌های سایت

📂 ... pdf (رمان،شعر،داستان)16402 فایل📂 معارف اسلامی (آموزش_و_پژوهش)4771 فایل📂 ... PowerPoint پاورپوینت4628 فایل📂 معماری (آموزش_و_پژوهش)3827 فایل📂 روانشناسی و مشاوره (آموزش_و_پژوهش)3098 فایل📂 ... پروژه های تحصیلی و آموزشی2600 فایل📂 مدیریت (آموزش_و_پژوهش)2469 فایل📂 🔺... پژوهش ها و محتوای مجازی2458 فایل📂 حقوق (آموزش_و_پژوهش)1961 فایل📂 حسابداری (آموزش_و_پژوهش)1834 فایل📂 امتحانات نهایی1689 فایل📂 تاریخ (آموزش_و_پژوهش)1278 فایل📂 اقتصاد (آموزش_و_پژوهش)1169 فایل📂 برق و مخابرات (آموزش_و_پژوهش)1163 فایل📂 کامپیوتر و IT (آموزش_و_پژوهش)1095 فایل📂 ادبیات (آموزش_و_پژوهش)1021 فایل📂 علوم تربیتی (آموزش_و_پژوهش)986 فایل📂 پزشکی (آموزش_و_پژوهش)902 فایل📂 مکانیک (آموزش_و_پژوهش)884 فایل📂 ... psdو (نمونه قرارداد،طرح،الگو)883 فایل📂 گوناگون873 فایل📂 جغرافیا (آموزش_و_پژوهش)795 فایل📂 هنر و گرافیک (آموزش_و_پژوهش)577 فایل📂 عمران و نقشه برداری (آموزش_و_پژوهش)537 فایل📂 بهداشت (آموزش_و_پژوهش)494 فایل📂 تربیت بدنی (آموزش_و_پژوهش)488 فایل📂 مواد و متالورژی (آموزش_و_پژوهش)481 فایل📂 کشاورزی و محیط زیست (آموزش_و_پژوهش)458 فایل📂 علوم اجتماعی (آموزش_و_پژوهش)437 فایل📂 علوم سیاسی (آموزش_و_پژوهش)357 فایل📂 شهرسازی (آموزش_و_پژوهش)281 فایل📂 شیمی (آموزش_و_پژوهش)261 فایل📂 کامپیوتر261 فایل📂 صنایع (آموزش_و_پژوهش)247 فایل📂 استخدامی239 فایل📂 ... پروژه های صنعتی و احداث201 فایل📂 هنر و گرافیک (کارآموزی_و_گزارشات)199 فایل📂 فیزیک (آموزش_و_پژوهش)190 فایل📂 پیام نور179 فایل📂 ریاضی (آموزش_و_پژوهش)170 فایل📂 معماری (کارآموزی_و_گزارشات)168 فایل📂 برق و مخابرات (کارآموزی_و_گزارشات)160 فایل📂 موبایل و اندروید160 فایل📂 مدیریت (مقالات_و_تحقیقات)157 فایل📂 امار و احتمال (آموزش_و_پژوهش)153 فایل📂 عمران و نقشه برداری (کارآموزی_و_گزارشات)150 فایل📂 زبانهای خارجه (آموزش_و_پژوهش)141 فایل📂 صنایع غذایی (آموزش_و_پژوهش)136 فایل📂 زیست شناسی (آموزش_و_پژوهش)134 فایل📂 ... پروژه های تولیدی و اشتغال133 فایل📂 عمران و نقشه برداری (مقالات_و_تحقیقات)133 فایل📂 مکانیک (کارآموزی_و_گزارشات)130 فایل📂 فلسفه و منطق (آموزش_و_پژوهش)126 فایل📂 کامپیوتر و IT (کارآموزی_و_گزارشات)125 فایل📂 صنایع (کارآموزی_و_گزارشات)123 فایل📂 ... پروژه های غذایی و کشاورزی117 فایل📂 پرستاری (آموزش_و_پژوهش)117 فایل📂 حسابداری (کارآموزی_و_گزارشات)110 فایل📂 روانشناسی و مشاوره (مقالات_و_تحقیقات)96 فایل📂 زمین شناسی (آموزش_و_پژوهش)96 فایل📂 ... پروژه های تحقیق و ترجمه مقاله95 فایل📂 مدیریت (کارآموزی_و_گزارشات)90 فایل📂 کشاورزی و محیط زیست (کارآموزی_و_گزارشات)88 فایل📂 علوم تربیتی (کارآموزی_و_گزارشات)86 فایل📂 کنکور سراسری86 فایل📂 بیمه و بانکداری (آموزش_و_پژوهش)83 فایل📂 عمران و نقشه برداری (نظام_مهندسی)76 فایل📂 نفت (آموزش_و_پژوهش)76 فایل📂 برق و مخابرات (مقالات_و_تحقیقات)75 فایل📂 کامپیوتر و IT (مقالات_و_تحقیقات)75 فایل📂 کنکور ارشد و دکتری74 فایل📂 دیگر73 فایل📂 مهندسی پزشکی (آموزش_و_پژوهش)73 فایل📂 شیمی (کارآموزی_و_گزارشات)72 فایل📂 ... پروژه های پرورش و دامپروری69 فایل📂 علوم دامی (آموزش_و_پژوهش)63 فایل📂 ... پروژه های تاسیس و خدمات56 فایل📂 پزشکی (مقالات_و_تحقیقات)52 فایل📂 حقوق (کارآموزی_و_گزارشات)45 فایل📂 تغذیه (آموزش_و_پژوهش)40 فایل📂 حسابداری (مقالات_و_تحقیقات)40 فایل📂 بانک ها40 فایل📂 🔺قالب و پلاگین40 فایل📂 علوم اجتماعی (مقالات_و_تحقیقات)37 فایل📂 مهندسی معدن (آموزش_و_پژوهش)37 فایل📂 C و C++33 فایل📂 پزشکی و پرستاری (کارآموزی_و_گزارشات)29 فایل📂 دندانپزشکی (آموزش_و_پژوهش)28 فایل📂 سی شارپ28 فایل📂 ... پروژه های پزشکی و دارو27 فایل📂 معماری (نظام_مهندسی)27 فایل📂 مامایی (آموزش_و_پژوهش)26 فایل📂 ویژوال بیسیک26 فایل📂 نظام مهندسی25 فایل📂 نفت (کارآموزی_و_گزارشات)25 فایل📂 نساجی (آموزش_و_پژوهش)24 فایل📂 کشاورزی و محیط زیست (مقالات_و_تحقیقات)23 فایل📂 طراحی وب21 فایل📂 انیمیشین و وکتور (آموزش_و_پژوهش)18 فایل📂 داروسازی (آموزش_و_پژوهش)17 فایل📂 مهندسی شیلات (آموزش_و_پژوهش)16 فایل📂 Android14 فایل📂 مهندسی آب (کتب_و_جزوات)13 فایل📂 ICDL13 فایل📂 کشاورزی و محیط زیست (کتب_و_جزوات)13 فایل📂 Matlab13 فایل📂 مکانیک (نظام_مهندسی)12 فایل📂 مهندسی بهداشت (کتب_و_جزوات)12 فایل📂 کتابداری (آموزش_و_پژوهش)12 فایل📂 مواد و متالوژی و معدن (کارآموزی_و_گزارشات)11 فایل📂 آیین نامه رانندگی11 فایل📂 PHP11 فایل📂 داروسازی (کارآموزی_و_گزارشات)11 فایل📂 ... پروژه های کارآموزی و کارورزی10 فایل📂 مهندسی آب و هواشناسي (کارآموزی_و_گزارشات)10 فایل📂 دستگاه های اجرایی9 فایل📂 برق و مخابرات (نظام_مهندسی)8 فایل📂 ... پروژه های کارآفرینی و توجیهی7 فایل📂 وردپرس7 فایل📂 شرکت گاز6 فایل📂 اسمبلی5 فایل📂 Visual Basic.net5 فایل📂 وزارت نیرو4 فایل📂 شرکت نفت4 فایل📂 HTML4 فایل📂 ASP.net4 فایل📂 دلفی4 فایل📂 علوم نجوم (آموزش_و_پژوهش)3 فایل📂 طراحی (کتب_و_جزوات)3 فایل📂 مصاحبه حضوری3 فایل📂 شهرداری3 فایل📂 پایتون1 فایل📂 🔺زبان برنامه نویسی و اسکریپت1 فایل📂 SQL Server1 فایل📂 جاوا1 فایل📂 اسکریپت1 فایل

برخی محصولات مشابه

جستجو در بین فایل‌ها