واژه‌های کلیدی:داده کاوی آموزشی، شبکه عصبی، خوشه بندی، درخت تصمیمC5، داشبورد.

 

فهرست مطالب

فصل اول: 1

1-1-مقدمه. 2

1-2-تعریف مساله و بیان سوال های اصلی تحقیق. 3

1-3-ضرورت انجام تحقیق. 6

1-4-هدف‌ها و کاربردهای مورد انتظار از انجام تحقیق. 7

1-5-جنبه جدید بودن و نوآوری طرح. 7

1-6-قلمرو مکانی و زمانی تحقیق. 8

1-7-روش تجزیه و تحلیل داده‌ها 8

1-8-ساختار تحقیق. 8

1-9-تعاریف و اصطلاحات.. 9

1-10-نتیجه گیری.. 12

فصل دوم: 122

2-1- مقدمه. 133

2-2-انگیزه‌های کاوش داده 13

2-3-نیاز به داده‌کاوی.. 15

2-4- چالش‌های داده‌کاوی.. 16

2-4-1- چالش‌های اولیه. 17

2-4-2- چالش‌های ثانویه. 18

2-5-معرفی داده‌کاوی.. 19

2-5-1-منشاُ علمی.. 21

2-5-2- معماری سیستم داده‌کاوی.. 21

2-5-3- مراحل عملیات داده‌کاوی.. 23

2-5-3-1-آماده‌سازی داده 23

2-5-3-2-یادگیری مدل. 24

2-5-3-3-ارزیابی و تفسیر مدل. 25

2-6- محدودیت‌های داده‌کاوی.. 25

2-7- قابلیت‌های داده‌کاوی.. 26

2-8- روش‌های یادگیری مدل در داده‌کاوی.. 26

2-8-1- روش‌های پیش‌بینی.. 26

2-8-1-1- دسته‌بندی.. 27

2-8-1-2- رگرسیون. 27

2-8-1-3-تشخیص انحراف.. 28

2-8-2- روش‌های توصیفی.. 29

2-8-2-1- خوشه‌بندی.. 30

2-8-2-2- کشف قوانین انجمنی.. 32

2-8-2-3- کشف الگوهای ترتیبی.. 32

2-9- فنون داده‌کاوی.. 32

2-9-1- یافتن خودکارخوشه‌ها 34

2-9-1-1-نقاط قدرت این روش… 34

2-9-1-2-نقاط ضعف… 34

2-9-1-3- کاربرد. 34

2-9-2- درخت‌های تصمیم‌گیری و استقرا قاعده‌ای.. 35

2-9-2-1-نقاط قوت.. 35

2-9-2-2-نقاط ضعف روش درخت‌تصمیم‌گیری.. 35

2-9-2-3-کاربرد. 36

2-9-3- شبکه‌های عصبی.. 36

2-9-3-1- نقاط قوت شبکه‌های عصبی مصنوعی.. 36

2-9-3-2- نقاط ضعف شبکه‌عصبی.. 37

2-9-3-3-کاربرد. 37

2-10- درجه‌بندی فنون مختلف داده‌کاوی از جهت سختی و آسانی.. 37

2-11-تعریف داشبورد. 38

2-12- سابقه تحقیق. 43

2-12-1- سابقه داده‌کاوی.. 43

2-12-2- سابقه داشبورد. 47

2-13 بررسی مراحل داشبورد در چند نمونه. 49

2-14-نتیجه گیری.. 50

فصل سوم: 51

3-1- مقدمه. 52

3-2- چارچوب تحقیق. 53

3-3- روش تحقیق. 54

3-3-1- طبقه‌بندی تحقیق برمبنای هدف.. 54

3-3-2- طبقه بندی تحقیق بر مبنای روش… 54

3-3-3- طبقه‌بندی تحقیق بر مبنای نوع داده‌ها 55

3-4- جامعه آماری.. 55

3-5- نمونه‌گیری.. 56

مقالات و پایان نامه ارشد

 

3-5-1- روش نمونه‌گیری.. 56

گردآوری و تحلیل داده‌ها 56

3-7- ساختار اجرایی تحقیق. 57

3-7-1- ساختار اجرایی بخش اول تحقیق. 58

3-7-1-1- درک مساله. 59

3-7-1-2- شناخت داده‌ها 60

3-7-1-3- آماده سازی داده‌ها 61

3-7-1-4- مدل‌سازی.. 61

3-7-1-5- ارزیابی نتایج. 62

3-7-1-6- بکارگیری مدل. 62

3-8- تحلیل خوشه‌ای.. 63

3-9- الگوریتم  k-means. 64

3-10-شبکه‌عصبی.. 65

3-10-1- معماری شبکه. 66

3-11-درخت‌تصمیم. 67

3-12- شاخص مقایسه نتایج خوشه‌بندی با رویکردهای مختلف… 69

3-12-1- شاخص مجموع خطای مربعی.. 69

3-13- ابزار‌های داده‌کاوی.. 69

3-14- بخش دوم ساختار اجرایی تحقیق. 70

3-14-1- شناسایی شاخص… 70

3-14-2- پیاده‌سازی داشبورد. 70

3-15- ابزار پیاده‌سازی داشبورد. 71

3-16- نتیجه‌گیری.. 71

فصل چهارم: 73

4-1-مقدمه. 74

4-2-فرایند داده‌کاوی.. 74

4-2-1-درک مساله. 74

4-2-2-شناخت داده‌ها 75

4-2-2-1- داده‌ها 75

4-2-2-2- انتخاب داده‌ها 75

4-2-3- آماده سازی و پیش پردازش داده‌ها 76

4-2-3-1- آماده سازی داده‌ها 76

-2-3-2-پیش پردازش داده‌ها 77

4-2-4-مدل‌سازی.. 82

4-2-4-1-خوشه‌بندی.. 83

4-2-4-2- خوشه‌بندی k-means. 83

4-2-4-3- پیش‌بینی خوشه‌ها 84

4-2-4-4- پیش‌بینی با شبکه‌عصبی.. 85

4-2-4-5- پیش‌بینی با درخت‌تصمیم C5. 85

4-2-5- ارزیابی.. 88

4-2-6- به‌کارگیری مدل. 89

4-3- فرایند طراحی و پیاده‌سازی داشبورد. 89

4-3-1- شناسایی شاخص… 89

4-4- نتیجه‌گیری.. 93

فصل پنجم: 94

5-1- مقدمه. 95

برفصل‌های گذشته. 95

5-3- دستاوردها و نوآوری‌های تحقیق. 96

5-4- پیشنهادات برای تحقیق‌های آتی.. 97

5-5- محدودیت‌های تحقیق. 98

فهرست منابع. 99

 

 

فهرست جداول

جدول2-1 درجه‌بندی فنون مختلف داده‌کاوی.. 38

جدول 2-2 تعاریف داشبورد در مرور ادبیات.. 38

جدول 2-3 مراحل طراحی داشبورد. 49

جدول3-1 الگوریتم خوشه‌بندی.. 65

جدول 4-1 اقلام اطلاعات فردی دانشجویان. 78

جدول 4-2 اقلام اطلاعاتی معدل دانشجویان. 79

جدول 4-3 اقلام اطلاعاتی دانشگاهی دانشجویان. 79

جدول 4-4 نرخ پارامتر SSE به ازای تعداد خوشه‌ها در k-means. 84

جدول 4-5 پیش بینی با بهره گرفتن از روش شبکه‌عصبی.. 85

جدول 4-6 دسته‌بندی معدل‌‌ها 86

جدول 4-7 پیش بینی با بهره گرفتن از روش درخت تصمیمC5. 87

جدول 5-1 دقت پیش‌بینی‌های انجام شده 97

 

 

فهرست شکل‌ها و نمودارها

.. 9

شکل2-1: قیاس رشد حجم داده با رشد تعداد تحلیل‌گران داده 15

شکل 2-2 سلسله مراتب داده تا خرد. 20

شکل 2-3 معماری یک سیستم داده‌کاوی.. 22

شکل 2-4 ساختار داده‌کاوی آموزشی.. 44

شکل 3-1 مراحل اصلی پیشنهادی برای اجرای تحقیق. 53

شکل 3-2  استاندارد جهانی CRISP. 59

شکل 4-1 بخشی از ارتباط داده‌ای جداول. 77

نمودار 4-1 میزان استفاده تکنیک‌های پیش‌پردازش داده 81

شکل 4-2بخشی از داده‌ها در نرم‌افزار Excel 82

شکل 4-3 تعداد رکوردها در هر خوشه. 84

شکل 4-5 اهمیت فیلدها در پیش‌بینی معدل ترم شش دانشجویان. 88

شکل4-6 پیشرفت تحصیلی دانشجویان ورودی سال 1371. 91

شکل4-7 پیشرفت تحصیلی دانشجویان ورودی سال 1381. 91

شکل 4-8 پیش بینی پیشرفت تحصیلی دانشجویان فاقد شغل ورودی سال 1381. 92

شکل 4-9 پیش‌بینی پیشرفت تحصیلی دانشجویان شاغل در سازمان‌های دولتی ورودی سال 1381  93

 

 

فصل اول:

مقدمه و كلیات تحقیق

 

 

1-1-مقدمه

پیش‌‌‌‌بینی آینده در زمینه‌های مختلف همواره برای انسان جالب و جذاب بوده است. با اطمینان می‌توان گفت که پیش‌‌‌‌بینی آینده و روند تغییرات در همه‌ی حوزه‌ها از دغدغه‌های اصلی و همیشگی مدیران سطح بالا و میانی می‌باشد. اما همواره مشکلات فراوانی در برابر آن وجود داشته است که انجام پیش‌‌‌‌بینی‌های دقیق و قابل اعتماد را تقریباً غیرممکن نموده است (توحیدی- مقدم و فرهادی، 1391). در سالهای اخیر با توجه به جذابیت‌هایی که در زمینه داده‌کاوی و همچنین پیش‌‌‌‌بینی که یکی از اهداف داده‌کاوی می‌باشد وجود دارد،تحقیقات زیادی در این حوزه انجام شده است.

در حال حاضر در اکثر دانشگاه‌ها بانک‌های اطلاعاتی وسیعی از ویژگی‌های دانشجویان موجود است که حجم بالایی از اطلاعات مربوط به سوابق آموزشی و تحصیلی را شامل می‌شود و از آن‌جایی که امروزه فضای رقابتی شدیدی در دانشگاه‌های مختلف حاکم شده است. مدیران باید سریع‌تر و درست‌تر از قبل تصمیم بگیرند. لازمه چنین امری، دستیابی سریع و دقیق به دانش است و برای دستیابی به دانش، وجود ابزارهای کارا و موثری نظیر داشبوردهای مدیریتی ضرورت دارد. ارزش داشبورد در اتصال ویژگی‌ها و کاربرد مناسب آن در سازمان است. گرچه تا به امروز توافق خاصی در اینکه داشبورد باید دقیقا چگونه باشد و چه کارهایی را انجام دهد، وجود ندارد اما به طور کلی انتظار می‌رود داشبورد، امکان جمع‌ آوری، خلاصه‌سازی و ارائه اطلاعات مناسب از منابع مختلفی را داشته باشد تا بدین وسیله کاربر بتواند وضعیت شاخص‌ها را به طور یک‌جا ملاحظه نماید

هدف از انجام این تحقیق، داده‌کاوی‌آموزشی جهت مقاصد پیش‌‌‌‌بینی پیشرفت تحصیلی دانشجویان به همراه داشبورد آن می‌باشد، داده‌کاوی‌آموزشی یک حوزه علمی نوظهور است که به توسعه روش هایی برای کاوش و اکتشاف دانش در محیط‌های آموزشی می‌پردازد. پیشرفت‌ تحصیلی دانشجویان یکی از اموری است که در امر آموزش مطرح است و از مسائل مورد توجه مدیران آموزشی دانشگاه‌هاست. در این تحقیق سعی شده از داده‌کاوی و فنون آن استفاده شود و با بهره گرفتن از داده‌هایی که در دانشگاه‌ها موجود است پیشرفت تحصیلی را پیش‌‌‌‌بینی نمود. پس از آشنایی با ادبیات مسئله و مرورکلی بر ویژگی‌های اصلی یک داشبورد مدیریتی کارا، روش های داده‌کاوی و پیش‌‌‌‌بینی به عنوان مطالعه موردی کار پیش‌‌‌‌بینی در امور آموزش را انجام داده‌ایم. معدل دانشجویان به‌صورت تصادفی تغییر نمی‌کند، بلکه تغییرات بر اساس یک روند تکرار پذیر و قابل تشخیص صورت می‌گیرد، پس قابل پیش‌‌‌‌بینی است. برای این منظور پس از گردآوری داده‌ها جهت داده‌کاوی، با بهره گرفتن از روش های شبکه‌عصبی و درخت‌تصمیم C5، کار پیش‌‌‌‌بینی را انجام داده ایم و بعد از پیش‌‌‌‌بینی، طراحی و پیاده‌سازی داشبورد آن صورت گرفت.

 

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...