1-1) اجزای اصلی QSAR   3
1-2) انواع روش‌های QSAR   4
1-3) اهداف QSAR   5
1-4) نگاهی گذرا برمایعات یونی   5
فصل دوم: تئوری.. 8
2-1) جمع‌ آوری سری داده‌ها………………………………………………………………………………………………………………..10
2-1-1) روش‌های تقسیم بندی سری داده‌ها……………………………………………………………………………………………….10
2-1-1-1) تحلیل خوشه‌ای (CA)……………………………………………………………………………………………………….11
2-1-1-2) انواع خوشه‌بندی……………………………………………………………………………………………… …………….12
2-1-1-3) اندازه‌گیری فاصله ……………………………………………………………………………………………………………13
2-1-1-4) دسته‌بندی تفکیکی……………………………………………………………………………………………………………14
2-1-1-4-1) دسته بندی مبهم C- میانگین………………………………………………………………………………………….14
2-1-1-4-2) الگوریتم دسته‌بندی QT………………………………………………………………………………………………15
2-1-1-4-3) خوشه بندی K- میانگین………………………………………………………………………………………………15
2-2) بهینه‌سازی ساختارهای مولکولی…………………………………………………………………………………………………………………………….17
2-3) محاسبه توصیف‌کننده‌های مولکولی   17
2-3-1) توصیف‌کننده‌های ساختاری………………………………………………………………………………………………………………………..19
2-3-2) توصیف کننده‌های توپولوژیکی……………………………………………………………………………………………………………………19
2-3-2-1) توصیف‌كننده‌های جزء……………………………………………………………………………………………………………………..19
2-3-2-2) اندیس‌های توپولوژی   19
2-3-2-3) توصیف‌كننده‌های زیرساختاری   20
2-3-2-4) توصیف‌كننده‌های محیطی………………………………………………………………………………………………………………….20
2-3-3) توصیف‌كننده‌های هندسی.. 20
2-3-4) توصیف‌کننده‌های الکترونی.. 21
2-3-5) توصیف‌کننده‌های فیزیکو شیمیایی………………………………………………………………………………………………………………..21
2-3-6) توصیف‌کننده‌های توسعه یافته………………………………………………………………………………………………………………………21
2-3-7) توصیف‌کننده‌های LFER……………………………………………………………………………………………………………………………22
2-4) تجزیه و تحلیل آماری توصیف‌کننده‌ها و انتخاب مؤثرترین آنها…………………………………………………………………………………..22
2-4-1) الگوریتم ژنتیک (GA)……………………………………………………………………………………………………………………………….23
2-4-1-1) اصول الگوریتم‌های ژنتیكی…………………………………………………………………………………………………24        2-4-1-2) روش‌های انتخاب…………………………………………………………………………………………………………………….25
2-5) ایجاد مدل­های آماری 26
2-5-1) رگرسیون خطی چندگانه…………………………………………………………………………………………………………..26
2-5-2) شبکه‌های عصبی پرسپترون چندلایه(MLP)…………………………………………………………………………………….27
2-5-2-1) تک نرون و ساختار (MLP)………………………………………………………………………………………………..28
2-5-2-2) پرسپترون چند لایه……………………………………………………………………………………………………………30
2-5-2-3) آموزش شبکه‌های عصبی MLP……………………………………………………………………………………………30
2-6) انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخاب شده 33
2-6-1) قلمرو كاربرد مدل………………………………………………………………………………………………………………….37
2-7) نرم افزارهای مورد استفاده………………………………………………………………………………………………………………………………………………………………38
2-7-1) بسته نرم افزاری Hyperchem………………………………………………………………………………………………………………………38
2-7-2) بسته نرم افزاری MOPAC…………………………………………………………………………………………………………………………..38
2-7-3) بسته نرم افزاریSTATISTICA  39
2-7-4) نرم افزار دراگون. 39
2-7-5) نرم افزار CODESSA………………………………………………………………………………………………………………………………..39
فصل سوم: مدلسازی QSAR سمیت مایعات یونی.. 41
3-1) روش كار  43
3-1-1) سری داده‌ها………………………………………………………………………………………………………………………………………………43
3-1-2) محاسبه و پیش‌پردازش توصیف‌کننده‌ها…………………………………………………………………………………………………………53
3-1-3) انتخاب اعضای سری‌های آموزشی و ارزیابی به روش خوشه‌بندی k-میانگین……………………………………………………….54
3-1-4) انتخاب بهترین توصیف كننده و مدل‌سازی خطی…………………………………………………………………………………………….55
3-1-5) مدلسازی غیر خطی با شبكه‌ی عصبی مصنوعی پرسپترون چند لایه. 56
3-2) بحث و نتیجه‌گیری   57
3-2-1) تفسیر توصیف‌كننده‌ها………………………………………………………………………………………………………………………………..75
3-2-2) بررسی نتایج……………………………………………………………………………………………………………………………………………..61
3-2-3) ارزیابی نتایج مدل………………………………………………………………………………………………………………………………………63
3-3) جمع‌بندی نهایی   65
فصل چهارم: پیش‌بینی دمای ذوب مایعات یونی و نمك‌های مربوطه با بهره‌گیری از رویكرد QSPR.. 67
4-1) روش كار  70
4-1-1) سری داده‌ها………………………………………………………………………………………………………………………………………………70
4-1-2) محاسبه و پیش‌پردازش توصیف‌كننده‌ها…………………………………………………………………………………………………………72
4-1-3) تقسیم‌بندی سری داده‌ها توسط روش تحلیل خوشه‌ای……………………………………………………………………………………….73
4-1-4) انتخاب متغیر و مدل‌سازی خطی……………………………………………………………………………………………………………………74
4-1-5) مدل‌سازی به روش شبكه‌ی عصبی پرسپترون چند لایه (MLP) 77
4-2) بحث و نتیجه‌گیری   79
4-2-1) تفسیر توصیف‌كننده‌ها………………………………………………………………………………………………………………………………..79
4-2-2) ارزیابی نتایج مدل‌ها…………………………………………………………………………………………………………………………………..81
4-3) جمع‌بندی

مقالات و پایان نامه ارشد

 نهایی…………………………………………………………………………………………………………………………………………………82

منابع. 83
 
 
 
فهرست شکل­ها
عنوان                                                                                                                                            صفحه
شکل 2-1: طرحی ساده از خوشه بندی سلسله‌ای…………………………………………………………………………………………………………….. 13
شکل 2-2: شمایی كلی از الگوریتم ژنتیك……………………………………………………………………………………………………………………. 25
شکل 2-3: شمایی كلی از یک نرون……………………………………………………………………………………………………………………………… 29
شکل 2-4: ساختار کلی پرسپترون تک لایه…………………………………………………………………………………………………………………….. 29
شکل 2-5: ساختار شبکه پیشرو دولایه با توابع سیگموید در لایه پنهان و لایه خروجی………………………………………………………….. 30
شکل 2-6: کمینه کلی و کمینه محلی……………………………………………………………………………………………………………………………. 31
شکل 2-7: ساختار کلی آموزش با ناظر…………………………………………………………………………………………………………………………. 32
شکل 3-1: شمایی از شبكه‌ی بهینه شده‌ی پرسپترون………………………………………………………………………………………………………….. 57
شکل 3-2: نمودار مقادیر تجربی سمیت در برابر مقادیر محاسبه شده با مدل پرسپترون چند لایه……………………………………………….. 62
شکل 3-3: نتایج تحلیل حساسیت………………………………………………………………………………………………………………………………….. 63
شکل 3-4: قلمرو كاربرد مدل ارائه شده به صورت نمودار ویلیامز……………………………………………………………………………………… 64
شکل 1-4: نمودار حاصل از آنالیز خوشه‌ای……………………………………………………………………………………………………………………. 76
شکل 4-2: نمودار تغییر ضریب همبستگی و لگاریتم خطای استاندارد مدل در برابر تعداد توصیف‌كننده‌ها…………………………………. 75
شکل 4-3: شبكه‌ی عصبی پرسپترون طراحی شده جهت پیش‌بینی دمای ذوب مایعات یونی…………………………………………………….. 78
  شکل 4-4: نمودار حاصل از تحلیل حساسیت…………………………………………………………………………………………………………………… 79
شکل 4-5: قلمرو كاربرد مدل……………………………………………………………………………………………………………………………………….. 81
  
فهرست جدول­ها
عنوان                                                                                                                                            صفحه
جدول 3-1: سری داده‌های سمیت تجربی و پیش بینی شده به صورت (log EC50)……………………………………………………………… 44
جدول 3-2: ماتریس ضرایب همبستگی بین توصیف­کننده­ های انتخاب شده………………………………………………………………………….. 55
جدول 3-3: آنیون‌های متنوع به كار رفته در ساختار مایعات یونی موجود در سری داده………………………………………………………….. 60
جدول 3-4: پایه‌های كاتیونی به كار رفته در سری داده……………………………………………………………………………………………………… 61
جدول 3-5: نتایج حاصل از مدل‌های خطی و غیر خطی…………………………………………………………………………………………………….. 62
جدول 4-1: مقادیر پیش‌بینی شده و تجربی دمای ذوب مایعات یونی……………………………………………………………………………………. 70
جدول 4-2: ماتریس ضرایب همبستگی بین توصیف‌كننده‌های انتخاب شده………………………………………………………………………….. 76
جدول 4-3: ضرایب و آماره‌های مدل MLR………………………………………………………………………………………………………………… 77
جدول 4-4: نتایج حاصل از مدل‌های خطی و غیرخطی……………………………………………………………………………………………………… 78
 
 
مقدمه
کمومتریکس یا شیمی سنجی در حقیقت کاربرد علوم آمار، کامپیوتر و ریاضی در شیمی می‌باشد [1]. از روش‌های ذکر شده برای درک بهتر اطلاعات شیمیایی که در آزمایشگاه بدست می‌آید استفاده می‌شود، به این صورت که با بهره گرفتن از تحلیل داده‌های شیمیایی بدست آمده اطلاعات مفید استخراج می شود تا با توجه به این اطلاعات بتوان آزمایش‌های مورد نظر را با بازدهی بهتر طراحی کرد.کاربرد روش‌های ریاضی در شیمی سابقه دیرین دارد ولی با توجه به پیشرفت علوم کامپیوتر و کاربرد آن در علوم روش‌های کمومتریکس در دهه اخیر پیشرفت بسیار داشته است. در این دو دهه روش‌های کمومتریکس مختلفی توسط شیمیدان‌ها با کمک متخصصین علوم کامپیوتر، ریاضی و آمار ارائه شده است. بسیاری از شیمیدان‌ها و کسانی که از روش‌های کمومتریکس استفاده می‌کنند دانشمند سوئدی به نام ولدرا به عنوان اولین کسی که این روش‌ها را معرفی کرده است نام می‌برند و به او لقب پدر علم کمومتریکس را داده‌اند [2]. کمومتریکس درشاخه­های مختلف شیمی مورد استفاده قرار می‌گیـرد. بـرخی از کاربرد­های آن شامل کنترل فرایندها، تجزیه و تحلیل و شناخت الگوها، پردازش علائم و بهینه کردن شرایط می­باشد.  یکی از زمینه ­های مهم کاربرد کمومتریکس در مطالعاتی است که خواص مولکولها را به ویژگی­های ساختاری آنها نسبت می­دهد. موارد خاصی از این تحقیقات و مطالعات شامل موارد رابطه‌ی كمی ساختار-فعالیت(QSAR)، رابطه‌ی كمی ساختار-سمیت(QSTR)، رابطه‌ی كمی ساختار-خصوصیت(QSPR) است که به منظور سهولت و کلی نگری تمامی این موارد تحت عنوان QSAR قرار می گیرند.
1-1) اجزای اصلی QSAR
یک رابطه ی كمی‌ساختار – فعالیت از سه بخش مجزای زیر تشكیل می‌گردد  ;[3]

  • داده‌های معتبر مربوط به فعالیت یا ویژگی مورد مطالعه كه باید مدل سازی و در نهایت پیش بینی شوند. تعدادی از خصوصیاتی كه می‌توانند برای مدل سازی QSAR مورد استفاده قرار گیرند به شرح زیر می‌باشند: فعالیت دارویی، فعالیت سمی، خصوصیات فیزیكوشیمیایی و تاثیرات سموم شیمیایی در محیط زیست.
  • توصیف‌كننده‌ها یا همان متغیرهایی كه مدل براساس آنها ساخته می‌شود. ویژگی‌های هر ملكول كه معمولا با در نظر گرفتن ساختار ملكولی به صورت كمی‌محاسبه می‌شوند، در واقع همان متغیر‌های مورد استفاده در مدل سازی می‌باشند.
  • روشی (اعم از ریاضی یا آماری) كه برای فرمول بندی مدل از آن استفاده می‌گردد.

روش‌های بسیاری جهت مدل سازی QSAR به كار می‌روند كه تعدادی از آن‌ ها به قرار زیر می‌باشند:
رگرسیون خطی چند تایی (MLR)، روشی ریاضی است که معمولا برای برقراری ارتباط بین ویژگی­های ساختاری مولکول و خواص آن در مطالعات QSPR/QSAR به کار می­رود. این روش هنگامی که بین توصیف­کننده­ها بر­هم­کنشی وجود نداشته و ارتباط آن­ها با فعالیت مورد نظر خطی باشد مفید است.[4]
شبکه عصبی مصنوعی (ANN)، كه با تقلید از شبكه ­های عصبی بیولو‍ژیكی مثل مغز انسان ساخته شده ­اند الگویی برای پردازش اطلاعات می­باشند كه بر پایه اتصال به هم پیوسته چندین واحد پردازشی عمل می­كنند [5].
ماشین بردار پشتیبان (SVM)، یكی دیگر از روش­های یادگیری راهنمایی شده است كه از آن برای طبقه بندی و آنالیز رگرسیون استفاده می­كنند[6] .
كمترین مربعات جزیی (PLS)، این روش با روش MLR، تفاوت چندانی ندارد. تنها فرضیاتی كه براساس آن ضرایب متغیرهای مدل محاسبه می‌گردند در دو روش با هم متفاوت است[7] .
1-2) انواع روش های QSAR
روش‌هایQSAR  را می‌توان به سه گروه تقسیم‌بندی کرد[8]. اولین روش، QSAR دو بعدی است که در آن ساختار سه ‌بعدی مولکول در نظر گرفته نمی‌شود. در این روش مولکول با بهره گرفتن از یک سری توصیف‌کننده‌های مولکولی نمایش داده می‌شود که مقادیر عددی آن مشخصه مفاهیم متنوعی از ساختار مولکولی است و در مجموع با در نظر گرفتن فعالیت مشاهده شده مدل پیشگو ساخته می‌شود.
روش دوم QSAR سه بعدی است که بطور مثال با رهیافت CoMFA نشان داده می‌شود [8]. در این روش ساختار سه بعدی مولکول مورد بررسی قرار می‌گیرد. به این منظور ابتدا مولکول در یک شبکه منظم سه‌ بعدی قرار گرفته و سپس برهمکنش‌های الکتروستاتیک و فضایی بین مولکول مورد نظر و یک اتم فرضی قرار گرفته در محل نقاط تقاطع این شبکه توری مانند (مثل کربن)، محاسبه شده و به عنوان توصیف‌کننده استفاده می‌شود تا با ایجاد مدل، برهمکنشهای الکتروستاتیک و فضایی مطلوب بدست آید. به وضوح این روش مزایای بسیار زیادی نسبت به روش ساده‌تر دو بعدی دارد اما پیچیدگی‌های آن نیز بیشتر است.
روش سوم که QSAR چهار بعدی است، یک روش توسعه یافته از QSAR سه بعدی می‌باشد و توسط هاپفینگر و همکارانش ارائه شد [9] که اطلاعات مربوط به صورتبندی را در بعد چهارم در نظر می‌گیرد. مشابه با روش CoMFA،  QSARچهار بعدی با مشخص کردن یک مجموعه از نقاط شبکه که خصوصیات مولکول را ارزیابی کند شروع می‌شود. این روش علاوه بر نقاط شبکه از کل صورتبندی، نمونه برداری کرده و از اطلاعات بدست آمده از آن استفاده می‌کند تا سلولهای اشغال شده در شبکه را ارزیابی کند و از این خصوصیات مولکولی برای ساختن مدل استفاده می‌کند.
 
1-3) اهداف QSAR
روابط كمی‌ساختار – فعالیت باید به عنوان ابزاری علمی‌تلقی گردند كه اجازه ی كشف و همچنین تجزیه و تحلیل روابط نهفته در میان داده‌های موجود را به ما می‌دهند. اهداف زیادی را از ایجاد یک QSAR می‌توان برشمرد كه تعدادی از آنها به صورت زیر است[8]:
1- پیش بینی فعالیت زیستی وخصوصیات فیزیكو- شیمیایی
2- درك بهتر مكانیسم عمل دریک سری از تركیبات شیمیایی
3- صرفه جویی درهزینه‌های تولید محصول ( داروها ، آفت كش‌ها ، و تركیبات شیمیایی جدید)
4- كاهش دادن ودربرخی موارد حتی جایگزینی استفاده از حیوانات آزمایشگاهی
با توجه به این اهداف، مدل سازی خصوصیات مایعات یونی که از پرکاربردترین ترکیبات در علم شیمی بشمار می­روند، می ­تواند بسیار مفید واقع گردد. در ادامه مایعات یونی به صورت مختصر معرفی گردیده­اند.
 
1-4) نگاهی گذرا برمایعات یونی
مایعات یونی اولین بار در سال ١٩١٤ با سنتز اتیل آمونیوم نیترات (نقطه ذوب C˚12) شناخته شدند اما تا سال ١٩۵١ كاربرد گسترده ای نداشتند [10] . در پی یافتن روش جدیدی برای تهیه آلومینیم به طریق آبكاری با مخلوط كردن دو پودر سفید رنگ آلكیل پیریدینیوم كلرید با 3AlCl مشاهده شد که این دو با یكدیگر واكنش می‌دهند و مایع بی رنگ آلكیل پیریدینیوم تتراكلروآلومینات تولید می‌شود[11] . با این توصیف همچنان به این دسته از تركیبات فقط با كنجكاوی نگاه می‌شد تا اینكه در چند دهه اخیر به عنوان جایگزین، برای حلال‌های آلی متداول واكنش‌های شیمیایی مطرح شدند. به طور كلی تعریف‌های گوناگونی برای یک مایع یونی وجود دارند كه شاید پذیرفته شده‌ترین آنها «یک ماده متشكل از یون‌ها با نقطه ذوب پایین‌تر از 100 درجه‌ی سانتی‌گراد» باشد [12] . مایعات یونی را با نام های نمك های مذاب، مایعات یونی غیرآبی یا مایعات یونی دمای اتاق نیز می‌شناسند[13اگر دمای ذوب نمک زیر دمای اتاق (25درجه‌ی سانتی‌گراد) باشد به آن مایع یونی دمای اتاق می‌گویند. این تركیبات متشكل از یک کاتیون آلی غیر متقارن سنگین شامل فسفر یا نیتروژن مانند آلكیل ایمیدازولیوم، پیرولیدینیوم، آمونیم، فسفونیوم و انواع مختلفی از آنیون‌های آلی مانند تری فلئورو استات و یا آنیون‌های معدنی کلرید، برمید، تترافلئوروبورات و هگزافلئوروفسفات و … می‌باشند [13]. ترکیب آنیون‌ها و کاتیون‌های مختلف به طور گسترده تعداد مایعات یونی را گسترش داده‌است و تاکنون بیش از 2000 مایع یونی شناخته شده‌اند. از آنجا که معمولا می‌توان با اتصال یک کاتیون و آنیون خاص مایع یونی مورد نیاز برای یک کاربرد به خصوص را تولید کرد به این حلال‌ها، حلال‌ طراح[17] نیز گفته می‌شود[12] .
مهمترین ویژگی‌های مایعات یونی عبارت‌اند از:[14]

  • خواص فیزیكی مایعات یونی با تغییر تركیب شیمیایی آنیون‌ها و كاتیون‌ها تغییر می‌كنند.
  • مایعات یونی غیر فرارند بنابراین در سیستم‌های با خلاء زیاد قابل استفاده‌اند كه این موضوع از بروز برخی مشكلات فرایندی جلوگیری می‌كند.
  • بسیاری از تركیبات آلی و معدنی در آنها قابل حل‌اند.
  • عدم حلالیت مایعات یونی در برخی از حلال‌ها (مانند آلكان‌ها) یک محیط قطبی غیر آبی ایجاد می‌كند كه این عامل، در سیستم‌های جداسازی دو فازی و چند فازی، بازیابی كاتالیست را (فرایند سبز) آسان می‌كند.
  • این تركیبات می‌توانند، نه تنها به عنوان یک حلال، بلكه به عنوان یک كاتالیست فعال نیز در واكنش شركت كنند.

همچنین مایعات یونی خواص بی نظیر دیگری از قبیل پنجره‌ی الکتروشیمیایی وسیع، هدایت الکتریکی زیاد، تحرک یونی، گستره‌ی دمایی مایع وسیع، به شدت سولواته کننده، عدم فراریت، اشتعال ناپذیری و گستره‌ی پایداری گرمایی وسیع نیز دارند.
[1]. Chemometrics
[2].  Wold
[3]. Quantitative structure activity relationship
[4]. Quantitative structure toxicity relationship
[5]. Quantitative structure property relationship
[6]. Descriptors
[7]. Multiple linear regression
[8]. Artificial neural network
[9]. Support vector machine
[10]. Partial least square

  1. 1. Comparative molecular field analysis
موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...