پایان نامه: تدوین شاخصها و داشبورد ارزیابی و پیشبینی پیشرفت تحصیلی دانشجویان با شبکهعصبی و درختتصمیمC5 |
واژههای کلیدی:داده کاوی آموزشی، شبکه عصبی، خوشه بندی، درخت تصمیمC5، داشبورد.
فهرست مطالب
فصل اول: 1
1-1-مقدمه. 2
1-2-تعریف مساله و بیان سوال های اصلی تحقیق. 3
1-3-ضرورت انجام تحقیق. 6
1-4-هدفها و کاربردهای مورد انتظار از انجام تحقیق. 7
1-5-جنبه جدید بودن و نوآوری طرح. 7
1-6-قلمرو مکانی و زمانی تحقیق. 8
1-7-روش تجزیه و تحلیل دادهها 8
1-8-ساختار تحقیق. 8
1-9-تعاریف و اصطلاحات.. 9
1-10-نتیجه گیری.. 12
فصل دوم: 122
2-1- مقدمه. 133
2-2-انگیزههای کاوش داده 13
2-3-نیاز به دادهکاوی.. 15
2-4- چالشهای دادهکاوی.. 16
2-4-1- چالشهای اولیه. 17
2-4-2- چالشهای ثانویه. 18
2-5-معرفی دادهکاوی.. 19
2-5-1-منشاُ علمی.. 21
2-5-2- معماری سیستم دادهکاوی.. 21
2-5-3- مراحل عملیات دادهکاوی.. 23
2-5-3-1-آمادهسازی داده 23
2-5-3-2-یادگیری مدل. 24
2-5-3-3-ارزیابی و تفسیر مدل. 25
2-6- محدودیتهای دادهکاوی.. 25
2-7- قابلیتهای دادهکاوی.. 26
2-8- روشهای یادگیری مدل در دادهکاوی.. 26
2-8-1- روشهای پیشبینی.. 26
2-8-1-1- دستهبندی.. 27
2-8-1-2- رگرسیون. 27
2-8-1-3-تشخیص انحراف.. 28
2-8-2- روشهای توصیفی.. 29
2-8-2-1- خوشهبندی.. 30
2-8-2-2- کشف قوانین انجمنی.. 32
2-8-2-3- کشف الگوهای ترتیبی.. 32
2-9- فنون دادهکاوی.. 32
2-9-1- یافتن خودکارخوشهها 34
2-9-1-1-نقاط قدرت این روش… 34
2-9-1-2-نقاط ضعف… 34
2-9-1-3- کاربرد. 34
2-9-2- درختهای تصمیمگیری و استقرا قاعدهای.. 35
2-9-2-1-نقاط قوت.. 35
2-9-2-2-نقاط ضعف روش درختتصمیمگیری.. 35
2-9-2-3-کاربرد. 36
2-9-3- شبکههای عصبی.. 36
2-9-3-1- نقاط قوت شبکههای عصبی مصنوعی.. 36
2-9-3-2- نقاط ضعف شبکهعصبی.. 37
2-9-3-3-کاربرد. 37
2-10- درجهبندی فنون مختلف دادهکاوی از جهت سختی و آسانی.. 37
2-11-تعریف داشبورد. 38
2-12- سابقه تحقیق. 43
2-12-1- سابقه دادهکاوی.. 43
2-12-2- سابقه داشبورد. 47
2-13 بررسی مراحل داشبورد در چند نمونه. 49
2-14-نتیجه گیری.. 50
فصل سوم: 51
3-1- مقدمه. 52
3-2- چارچوب تحقیق. 53
3-3- روش تحقیق. 54
3-3-1- طبقهبندی تحقیق برمبنای هدف.. 54
3-3-2- طبقه بندی تحقیق بر مبنای روش… 54
3-3-3- طبقهبندی تحقیق بر مبنای نوع دادهها 55
3-4- جامعه آماری.. 55
3-5- نمونهگیری.. 56
3-5-1- روش نمونهگیری.. 56
گردآوری و تحلیل دادهها 56
3-7- ساختار اجرایی تحقیق. 57
3-7-1- ساختار اجرایی بخش اول تحقیق. 58
3-7-1-1- درک مساله. 59
3-7-1-2- شناخت دادهها 60
3-7-1-3- آماده سازی دادهها 61
3-7-1-4- مدلسازی.. 61
3-7-1-5- ارزیابی نتایج. 62
3-7-1-6- بکارگیری مدل. 62
3-8- تحلیل خوشهای.. 63
3-9- الگوریتم k-means. 64
3-10-شبکهعصبی.. 65
3-10-1- معماری شبکه. 66
3-11-درختتصمیم. 67
3-12- شاخص مقایسه نتایج خوشهبندی با رویکردهای مختلف… 69
3-12-1- شاخص مجموع خطای مربعی.. 69
3-13- ابزارهای دادهکاوی.. 69
3-14- بخش دوم ساختار اجرایی تحقیق. 70
3-14-1- شناسایی شاخص… 70
3-14-2- پیادهسازی داشبورد. 70
3-15- ابزار پیادهسازی داشبورد. 71
3-16- نتیجهگیری.. 71
فصل چهارم: 73
4-1-مقدمه. 74
4-2-فرایند دادهکاوی.. 74
4-2-1-درک مساله. 74
4-2-2-شناخت دادهها 75
4-2-2-1- دادهها 75
4-2-2-2- انتخاب دادهها 75
4-2-3- آماده سازی و پیش پردازش دادهها 76
4-2-3-1- آماده سازی دادهها 76
-2-3-2-پیش پردازش دادهها 77
4-2-4-مدلسازی.. 82
4-2-4-1-خوشهبندی.. 83
4-2-4-2- خوشهبندی k-means. 83
4-2-4-3- پیشبینی خوشهها 84
4-2-4-4- پیشبینی با شبکهعصبی.. 85
4-2-4-5- پیشبینی با درختتصمیم C5. 85
4-2-5- ارزیابی.. 88
4-2-6- بهکارگیری مدل. 89
4-3- فرایند طراحی و پیادهسازی داشبورد. 89
4-3-1- شناسایی شاخص… 89
4-4- نتیجهگیری.. 93
فصل پنجم: 94
5-1- مقدمه. 95
برفصلهای گذشته. 95
5-3- دستاوردها و نوآوریهای تحقیق. 96
5-4- پیشنهادات برای تحقیقهای آتی.. 97
5-5- محدودیتهای تحقیق. 98
فهرست منابع. 99
فهرست جداول
جدول2-1 درجهبندی فنون مختلف دادهکاوی.. 38
جدول 2-2 تعاریف داشبورد در مرور ادبیات.. 38
جدول 2-3 مراحل طراحی داشبورد. 49
جدول3-1 الگوریتم خوشهبندی.. 65
جدول 4-1 اقلام اطلاعات فردی دانشجویان. 78
جدول 4-2 اقلام اطلاعاتی معدل دانشجویان. 79
جدول 4-3 اقلام اطلاعاتی دانشگاهی دانشجویان. 79
جدول 4-4 نرخ پارامتر SSE به ازای تعداد خوشهها در k-means. 84
جدول 4-5 پیش بینی با بهره گرفتن از روش شبکهعصبی.. 85
جدول 4-6 دستهبندی معدلها 86
جدول 4-7 پیش بینی با بهره گرفتن از روش درخت تصمیمC5. 87
جدول 5-1 دقت پیشبینیهای انجام شده 97
فهرست شکلها و نمودارها
.. 9
شکل2-1: قیاس رشد حجم داده با رشد تعداد تحلیلگران داده 15
شکل 2-2 سلسله مراتب داده تا خرد. 20
شکل 2-3 معماری یک سیستم دادهکاوی.. 22
شکل 2-4 ساختار دادهکاوی آموزشی.. 44
شکل 3-1 مراحل اصلی پیشنهادی برای اجرای تحقیق. 53
شکل 3-2 استاندارد جهانی CRISP. 59
شکل 4-1 بخشی از ارتباط دادهای جداول. 77
نمودار 4-1 میزان استفاده تکنیکهای پیشپردازش داده 81
شکل 4-2بخشی از دادهها در نرمافزار Excel 82
شکل 4-3 تعداد رکوردها در هر خوشه. 84
شکل 4-5 اهمیت فیلدها در پیشبینی معدل ترم شش دانشجویان. 88
شکل4-6 پیشرفت تحصیلی دانشجویان ورودی سال 1371. 91
شکل4-7 پیشرفت تحصیلی دانشجویان ورودی سال 1381. 91
شکل 4-8 پیش بینی پیشرفت تحصیلی دانشجویان فاقد شغل ورودی سال 1381. 92
شکل 4-9 پیشبینی پیشرفت تحصیلی دانشجویان شاغل در سازمانهای دولتی ورودی سال 1381 93
فصل اول:مقدمه و كلیات تحقیق |
1-1-مقدمه
پیشبینی آینده در زمینههای مختلف همواره برای انسان جالب و جذاب بوده است. با اطمینان میتوان گفت که پیشبینی آینده و روند تغییرات در همهی حوزهها از دغدغههای اصلی و همیشگی مدیران سطح بالا و میانی میباشد. اما همواره مشکلات فراوانی در برابر آن وجود داشته است که انجام پیشبینیهای دقیق و قابل اعتماد را تقریباً غیرممکن نموده است (توحیدی- مقدم و فرهادی، 1391). در سالهای اخیر با توجه به جذابیتهایی که در زمینه دادهکاوی و همچنین پیشبینی که یکی از اهداف دادهکاوی میباشد وجود دارد،تحقیقات زیادی در این حوزه انجام شده است.
در حال حاضر در اکثر دانشگاهها بانکهای اطلاعاتی وسیعی از ویژگیهای دانشجویان موجود است که حجم بالایی از اطلاعات مربوط به سوابق آموزشی و تحصیلی را شامل میشود و از آنجایی که امروزه فضای رقابتی شدیدی در دانشگاههای مختلف حاکم شده است. مدیران باید سریعتر و درستتر از قبل تصمیم بگیرند. لازمه چنین امری، دستیابی سریع و دقیق به دانش است و برای دستیابی به دانش، وجود ابزارهای کارا و موثری نظیر داشبوردهای مدیریتی ضرورت دارد. ارزش داشبورد در اتصال ویژگیها و کاربرد مناسب آن در سازمان است. گرچه تا به امروز توافق خاصی در اینکه داشبورد باید دقیقا چگونه باشد و چه کارهایی را انجام دهد، وجود ندارد اما به طور کلی انتظار میرود داشبورد، امکان جمع آوری، خلاصهسازی و ارائه اطلاعات مناسب از منابع مختلفی را داشته باشد تا بدین وسیله کاربر بتواند وضعیت شاخصها را به طور یکجا ملاحظه نماید
هدف از انجام این تحقیق، دادهکاویآموزشی جهت مقاصد پیشبینی پیشرفت تحصیلی دانشجویان به همراه داشبورد آن میباشد، دادهکاویآموزشی یک حوزه علمی نوظهور است که به توسعه روش هایی برای کاوش و اکتشاف دانش در محیطهای آموزشی میپردازد. پیشرفت تحصیلی دانشجویان یکی از اموری است که در امر آموزش مطرح است و از مسائل مورد توجه مدیران آموزشی دانشگاههاست. در این تحقیق سعی شده از دادهکاوی و فنون آن استفاده شود و با بهره گرفتن از دادههایی که در دانشگاهها موجود است پیشرفت تحصیلی را پیشبینی نمود. پس از آشنایی با ادبیات مسئله و مرورکلی بر ویژگیهای اصلی یک داشبورد مدیریتی کارا، روش های دادهکاوی و پیشبینی به عنوان مطالعه موردی کار پیشبینی در امور آموزش را انجام دادهایم. معدل دانشجویان بهصورت تصادفی تغییر نمیکند، بلکه تغییرات بر اساس یک روند تکرار پذیر و قابل تشخیص صورت میگیرد، پس قابل پیشبینی است. برای این منظور پس از گردآوری دادهها جهت دادهکاوی، با بهره گرفتن از روش های شبکهعصبی و درختتصمیم C5، کار پیشبینی را انجام داده ایم و بعد از پیشبینی، طراحی و پیادهسازی داشبورد آن صورت گرفت.
فرم در حال بارگذاری ...
[دوشنبه 1399-10-01] [ 08:49:00 ب.ظ ]
|