پایان نامه: مدلسازی QSAR سمیت مایعات یونی |
1-1) اجزای اصلی QSAR 3
1-2) انواع روشهای QSAR 4
1-3) اهداف QSAR 5
1-4) نگاهی گذرا برمایعات یونی 5
فصل دوم: تئوری.. 8
2-1) جمع آوری سری دادهها………………………………………………………………………………………………………………..10
2-1-1) روشهای تقسیم بندی سری دادهها……………………………………………………………………………………………….10
2-1-1-1) تحلیل خوشهای (CA)……………………………………………………………………………………………………….11
2-1-1-2) انواع خوشهبندی……………………………………………………………………………………………… …………….12
2-1-1-3) اندازهگیری فاصله ……………………………………………………………………………………………………………13
2-1-1-4) دستهبندی تفکیکی……………………………………………………………………………………………………………14
2-1-1-4-1) دسته بندی مبهم C- میانگین………………………………………………………………………………………….14
2-1-1-4-2) الگوریتم دستهبندی QT………………………………………………………………………………………………15
2-1-1-4-3) خوشه بندی K- میانگین………………………………………………………………………………………………15
2-2) بهینهسازی ساختارهای مولکولی…………………………………………………………………………………………………………………………….17
2-3) محاسبه توصیفکنندههای مولکولی 17
2-3-1) توصیفکنندههای ساختاری………………………………………………………………………………………………………………………..19
2-3-2) توصیف کنندههای توپولوژیکی……………………………………………………………………………………………………………………19
2-3-2-1) توصیفكنندههای جزء……………………………………………………………………………………………………………………..19
2-3-2-2) اندیسهای توپولوژی 19
2-3-2-3) توصیفكنندههای زیرساختاری 20
2-3-2-4) توصیفكنندههای محیطی………………………………………………………………………………………………………………….20
2-3-3) توصیفكنندههای هندسی.. 20
2-3-4) توصیفکنندههای الکترونی.. 21
2-3-5) توصیفکنندههای فیزیکو شیمیایی………………………………………………………………………………………………………………..21
2-3-6) توصیفکنندههای توسعه یافته………………………………………………………………………………………………………………………21
2-3-7) توصیفکنندههای LFER……………………………………………………………………………………………………………………………22
2-4) تجزیه و تحلیل آماری توصیفکنندهها و انتخاب مؤثرترین آنها…………………………………………………………………………………..22
2-4-1) الگوریتم ژنتیک (GA)……………………………………………………………………………………………………………………………….23
2-4-1-1) اصول الگوریتمهای ژنتیكی…………………………………………………………………………………………………24 2-4-1-2) روشهای انتخاب…………………………………………………………………………………………………………………….25
2-5) ایجاد مدلهای آماری 26
2-5-1) رگرسیون خطی چندگانه…………………………………………………………………………………………………………..26
2-5-2) شبکههای عصبی پرسپترون چندلایه(MLP)…………………………………………………………………………………….27
2-5-2-1) تک نرون و ساختار (MLP)………………………………………………………………………………………………..28
2-5-2-2) پرسپترون چند لایه……………………………………………………………………………………………………………30
2-5-2-3) آموزش شبکههای عصبی MLP……………………………………………………………………………………………30
2-6) انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخاب شده 33
2-6-1) قلمرو كاربرد مدل………………………………………………………………………………………………………………….37
2-7) نرم افزارهای مورد استفاده………………………………………………………………………………………………………………………………………………………………38
2-7-1) بسته نرم افزاری Hyperchem………………………………………………………………………………………………………………………38
2-7-2) بسته نرم افزاری MOPAC…………………………………………………………………………………………………………………………..38
2-7-3) بسته نرم افزاریSTATISTICA 39
2-7-4) نرم افزار دراگون. 39
2-7-5) نرم افزار CODESSA………………………………………………………………………………………………………………………………..39
فصل سوم: مدلسازی QSAR سمیت مایعات یونی.. 41
3-1) روش كار 43
3-1-1) سری دادهها………………………………………………………………………………………………………………………………………………43
3-1-2) محاسبه و پیشپردازش توصیفکنندهها…………………………………………………………………………………………………………53
3-1-3) انتخاب اعضای سریهای آموزشی و ارزیابی به روش خوشهبندی k-میانگین……………………………………………………….54
3-1-4) انتخاب بهترین توصیف كننده و مدلسازی خطی…………………………………………………………………………………………….55
3-1-5) مدلسازی غیر خطی با شبكهی عصبی مصنوعی پرسپترون چند لایه. 56
3-2) بحث و نتیجهگیری 57
3-2-1) تفسیر توصیفكنندهها………………………………………………………………………………………………………………………………..75
3-2-2) بررسی نتایج……………………………………………………………………………………………………………………………………………..61
3-2-3) ارزیابی نتایج مدل………………………………………………………………………………………………………………………………………63
3-3) جمعبندی نهایی 65
فصل چهارم: پیشبینی دمای ذوب مایعات یونی و نمكهای مربوطه با بهرهگیری از رویكرد QSPR.. 67
4-1) روش كار 70
4-1-1) سری دادهها………………………………………………………………………………………………………………………………………………70
4-1-2) محاسبه و پیشپردازش توصیفكنندهها…………………………………………………………………………………………………………72
4-1-3) تقسیمبندی سری دادهها توسط روش تحلیل خوشهای……………………………………………………………………………………….73
4-1-4) انتخاب متغیر و مدلسازی خطی……………………………………………………………………………………………………………………74
4-1-5) مدلسازی به روش شبكهی عصبی پرسپترون چند لایه (MLP) 77
4-2) بحث و نتیجهگیری 79
4-2-1) تفسیر توصیفكنندهها………………………………………………………………………………………………………………………………..79
4-2-2) ارزیابی نتایج مدلها…………………………………………………………………………………………………………………………………..81
4-3) جمعبندی
نهایی…………………………………………………………………………………………………………………………………………………82
منابع. 83
فهرست شکلها
عنوان صفحه
شکل 2-1: طرحی ساده از خوشه بندی سلسلهای…………………………………………………………………………………………………………….. 13
شکل 2-2: شمایی كلی از الگوریتم ژنتیك……………………………………………………………………………………………………………………. 25
شکل 2-3: شمایی كلی از یک نرون……………………………………………………………………………………………………………………………… 29
شکل 2-4: ساختار کلی پرسپترون تک لایه…………………………………………………………………………………………………………………….. 29
شکل 2-5: ساختار شبکه پیشرو دولایه با توابع سیگموید در لایه پنهان و لایه خروجی………………………………………………………….. 30
شکل 2-6: کمینه کلی و کمینه محلی……………………………………………………………………………………………………………………………. 31
شکل 2-7: ساختار کلی آموزش با ناظر…………………………………………………………………………………………………………………………. 32
شکل 3-1: شمایی از شبكهی بهینه شدهی پرسپترون………………………………………………………………………………………………………….. 57
شکل 3-2: نمودار مقادیر تجربی سمیت در برابر مقادیر محاسبه شده با مدل پرسپترون چند لایه……………………………………………….. 62
شکل 3-3: نتایج تحلیل حساسیت………………………………………………………………………………………………………………………………….. 63
شکل 3-4: قلمرو كاربرد مدل ارائه شده به صورت نمودار ویلیامز……………………………………………………………………………………… 64
شکل 1-4: نمودار حاصل از آنالیز خوشهای……………………………………………………………………………………………………………………. 76
شکل 4-2: نمودار تغییر ضریب همبستگی و لگاریتم خطای استاندارد مدل در برابر تعداد توصیفكنندهها…………………………………. 75
شکل 4-3: شبكهی عصبی پرسپترون طراحی شده جهت پیشبینی دمای ذوب مایعات یونی…………………………………………………….. 78
شکل 4-4: نمودار حاصل از تحلیل حساسیت…………………………………………………………………………………………………………………… 79
شکل 4-5: قلمرو كاربرد مدل……………………………………………………………………………………………………………………………………….. 81
فهرست جدولها
عنوان صفحه
جدول 3-1: سری دادههای سمیت تجربی و پیش بینی شده به صورت (log EC50)……………………………………………………………… 44
جدول 3-2: ماتریس ضرایب همبستگی بین توصیفکننده های انتخاب شده………………………………………………………………………….. 55
جدول 3-3: آنیونهای متنوع به كار رفته در ساختار مایعات یونی موجود در سری داده………………………………………………………….. 60
جدول 3-4: پایههای كاتیونی به كار رفته در سری داده……………………………………………………………………………………………………… 61
جدول 3-5: نتایج حاصل از مدلهای خطی و غیر خطی…………………………………………………………………………………………………….. 62
جدول 4-1: مقادیر پیشبینی شده و تجربی دمای ذوب مایعات یونی……………………………………………………………………………………. 70
جدول 4-2: ماتریس ضرایب همبستگی بین توصیفكنندههای انتخاب شده………………………………………………………………………….. 76
جدول 4-3: ضرایب و آمارههای مدل MLR………………………………………………………………………………………………………………… 77
جدول 4-4: نتایج حاصل از مدلهای خطی و غیرخطی……………………………………………………………………………………………………… 78
مقدمه
کمومتریکس یا شیمی سنجی در حقیقت کاربرد علوم آمار، کامپیوتر و ریاضی در شیمی میباشد [1]. از روشهای ذکر شده برای درک بهتر اطلاعات شیمیایی که در آزمایشگاه بدست میآید استفاده میشود، به این صورت که با بهره گرفتن از تحلیل دادههای شیمیایی بدست آمده اطلاعات مفید استخراج می شود تا با توجه به این اطلاعات بتوان آزمایشهای مورد نظر را با بازدهی بهتر طراحی کرد.کاربرد روشهای ریاضی در شیمی سابقه دیرین دارد ولی با توجه به پیشرفت علوم کامپیوتر و کاربرد آن در علوم روشهای کمومتریکس در دهه اخیر پیشرفت بسیار داشته است. در این دو دهه روشهای کمومتریکس مختلفی توسط شیمیدانها با کمک متخصصین علوم کامپیوتر، ریاضی و آمار ارائه شده است. بسیاری از شیمیدانها و کسانی که از روشهای کمومتریکس استفاده میکنند دانشمند سوئدی به نام ولدرا به عنوان اولین کسی که این روشها را معرفی کرده است نام میبرند و به او لقب پدر علم کمومتریکس را دادهاند [2]. کمومتریکس درشاخههای مختلف شیمی مورد استفاده قرار میگیـرد. بـرخی از کاربردهای آن شامل کنترل فرایندها، تجزیه و تحلیل و شناخت الگوها، پردازش علائم و بهینه کردن شرایط میباشد. یکی از زمینه های مهم کاربرد کمومتریکس در مطالعاتی است که خواص مولکولها را به ویژگیهای ساختاری آنها نسبت میدهد. موارد خاصی از این تحقیقات و مطالعات شامل موارد رابطهی كمی ساختار-فعالیت(QSAR)، رابطهی كمی ساختار-سمیت(QSTR)، رابطهی كمی ساختار-خصوصیت(QSPR) است که به منظور سهولت و کلی نگری تمامی این موارد تحت عنوان QSAR قرار می گیرند.
1-1) اجزای اصلی QSAR
یک رابطه ی كمیساختار – فعالیت از سه بخش مجزای زیر تشكیل میگردد ;[3]
- دادههای معتبر مربوط به فعالیت یا ویژگی مورد مطالعه كه باید مدل سازی و در نهایت پیش بینی شوند. تعدادی از خصوصیاتی كه میتوانند برای مدل سازی QSAR مورد استفاده قرار گیرند به شرح زیر میباشند: فعالیت دارویی، فعالیت سمی، خصوصیات فیزیكوشیمیایی و تاثیرات سموم شیمیایی در محیط زیست.
- توصیفكنندهها یا همان متغیرهایی كه مدل براساس آنها ساخته میشود. ویژگیهای هر ملكول كه معمولا با در نظر گرفتن ساختار ملكولی به صورت كمیمحاسبه میشوند، در واقع همان متغیرهای مورد استفاده در مدل سازی میباشند.
- روشی (اعم از ریاضی یا آماری) كه برای فرمول بندی مدل از آن استفاده میگردد.
روشهای بسیاری جهت مدل سازی QSAR به كار میروند كه تعدادی از آن ها به قرار زیر میباشند:
رگرسیون خطی چند تایی (MLR)، روشی ریاضی است که معمولا برای برقراری ارتباط بین ویژگیهای ساختاری مولکول و خواص آن در مطالعات QSPR/QSAR به کار میرود. این روش هنگامی که بین توصیفکنندهها برهمکنشی وجود نداشته و ارتباط آنها با فعالیت مورد نظر خطی باشد مفید است.[4]
شبکه عصبی مصنوعی (ANN)، كه با تقلید از شبكه های عصبی بیولوژیكی مثل مغز انسان ساخته شده اند الگویی برای پردازش اطلاعات میباشند كه بر پایه اتصال به هم پیوسته چندین واحد پردازشی عمل میكنند [5].
ماشین بردار پشتیبان (SVM)، یكی دیگر از روشهای یادگیری راهنمایی شده است كه از آن برای طبقه بندی و آنالیز رگرسیون استفاده میكنند[6] .
كمترین مربعات جزیی (PLS)، این روش با روش MLR، تفاوت چندانی ندارد. تنها فرضیاتی كه براساس آن ضرایب متغیرهای مدل محاسبه میگردند در دو روش با هم متفاوت است[7] .
1-2) انواع روش های QSAR
روشهایQSAR را میتوان به سه گروه تقسیمبندی کرد[8]. اولین روش، QSAR دو بعدی است که در آن ساختار سه بعدی مولکول در نظر گرفته نمیشود. در این روش مولکول با بهره گرفتن از یک سری توصیفکنندههای مولکولی نمایش داده میشود که مقادیر عددی آن مشخصه مفاهیم متنوعی از ساختار مولکولی است و در مجموع با در نظر گرفتن فعالیت مشاهده شده مدل پیشگو ساخته میشود.
روش دوم QSAR سه بعدی است که بطور مثال با رهیافت CoMFA نشان داده میشود [8]. در این روش ساختار سه بعدی مولکول مورد بررسی قرار میگیرد. به این منظور ابتدا مولکول در یک شبکه منظم سه بعدی قرار گرفته و سپس برهمکنشهای الکتروستاتیک و فضایی بین مولکول مورد نظر و یک اتم فرضی قرار گرفته در محل نقاط تقاطع این شبکه توری مانند (مثل کربن)، محاسبه شده و به عنوان توصیفکننده استفاده میشود تا با ایجاد مدل، برهمکنشهای الکتروستاتیک و فضایی مطلوب بدست آید. به وضوح این روش مزایای بسیار زیادی نسبت به روش سادهتر دو بعدی دارد اما پیچیدگیهای آن نیز بیشتر است.
روش سوم که QSAR چهار بعدی است، یک روش توسعه یافته از QSAR سه بعدی میباشد و توسط هاپفینگر و همکارانش ارائه شد [9] که اطلاعات مربوط به صورتبندی را در بعد چهارم در نظر میگیرد. مشابه با روش CoMFA، QSARچهار بعدی با مشخص کردن یک مجموعه از نقاط شبکه که خصوصیات مولکول را ارزیابی کند شروع میشود. این روش علاوه بر نقاط شبکه از کل صورتبندی، نمونه برداری کرده و از اطلاعات بدست آمده از آن استفاده میکند تا سلولهای اشغال شده در شبکه را ارزیابی کند و از این خصوصیات مولکولی برای ساختن مدل استفاده میکند.
1-3) اهداف QSAR
روابط كمیساختار – فعالیت باید به عنوان ابزاری علمیتلقی گردند كه اجازه ی كشف و همچنین تجزیه و تحلیل روابط نهفته در میان دادههای موجود را به ما میدهند. اهداف زیادی را از ایجاد یک QSAR میتوان برشمرد كه تعدادی از آنها به صورت زیر است[8]:
1- پیش بینی فعالیت زیستی وخصوصیات فیزیكو- شیمیایی
2- درك بهتر مكانیسم عمل دریک سری از تركیبات شیمیایی
3- صرفه جویی درهزینههای تولید محصول ( داروها ، آفت كشها ، و تركیبات شیمیایی جدید)
4- كاهش دادن ودربرخی موارد حتی جایگزینی استفاده از حیوانات آزمایشگاهی
با توجه به این اهداف، مدل سازی خصوصیات مایعات یونی که از پرکاربردترین ترکیبات در علم شیمی بشمار میروند، می تواند بسیار مفید واقع گردد. در ادامه مایعات یونی به صورت مختصر معرفی گردیدهاند.
1-4) نگاهی گذرا برمایعات یونی
مایعات یونی اولین بار در سال ١٩١٤ با سنتز اتیل آمونیوم نیترات (نقطه ذوب C˚12) شناخته شدند اما تا سال ١٩۵١ كاربرد گسترده ای نداشتند [10] . در پی یافتن روش جدیدی برای تهیه آلومینیم به طریق آبكاری با مخلوط كردن دو پودر سفید رنگ آلكیل پیریدینیوم كلرید با 3AlCl مشاهده شد که این دو با یكدیگر واكنش میدهند و مایع بی رنگ آلكیل پیریدینیوم تتراكلروآلومینات تولید میشود[11] . با این توصیف همچنان به این دسته از تركیبات فقط با كنجكاوی نگاه میشد تا اینكه در چند دهه اخیر به عنوان جایگزین، برای حلالهای آلی متداول واكنشهای شیمیایی مطرح شدند. به طور كلی تعریفهای گوناگونی برای یک مایع یونی وجود دارند كه شاید پذیرفته شدهترین آنها «یک ماده متشكل از یونها با نقطه ذوب پایینتر از 100 درجهی سانتیگراد» باشد [12] . مایعات یونی را با نام های نمك های مذاب، مایعات یونی غیرآبی یا مایعات یونی دمای اتاق نیز میشناسند[13] . اگر دمای ذوب نمک زیر دمای اتاق (25درجهی سانتیگراد) باشد به آن مایع یونی دمای اتاق میگویند. این تركیبات متشكل از یک کاتیون آلی غیر متقارن سنگین شامل فسفر یا نیتروژن مانند آلكیل ایمیدازولیوم، پیرولیدینیوم، آمونیم، فسفونیوم و انواع مختلفی از آنیونهای آلی مانند تری فلئورو استات و یا آنیونهای معدنی کلرید، برمید، تترافلئوروبورات و هگزافلئوروفسفات و … میباشند [13]. ترکیب آنیونها و کاتیونهای مختلف به طور گسترده تعداد مایعات یونی را گسترش دادهاست و تاکنون بیش از 2000 مایع یونی شناخته شدهاند. از آنجا که معمولا میتوان با اتصال یک کاتیون و آنیون خاص مایع یونی مورد نیاز برای یک کاربرد به خصوص را تولید کرد به این حلالها، حلال طراح[17] نیز گفته میشود[12] .
مهمترین ویژگیهای مایعات یونی عبارتاند از:[14]
- خواص فیزیكی مایعات یونی با تغییر تركیب شیمیایی آنیونها و كاتیونها تغییر میكنند.
- مایعات یونی غیر فرارند بنابراین در سیستمهای با خلاء زیاد قابل استفادهاند كه این موضوع از بروز برخی مشكلات فرایندی جلوگیری میكند.
- بسیاری از تركیبات آلی و معدنی در آنها قابل حلاند.
- عدم حلالیت مایعات یونی در برخی از حلالها (مانند آلكانها) یک محیط قطبی غیر آبی ایجاد میكند كه این عامل، در سیستمهای جداسازی دو فازی و چند فازی، بازیابی كاتالیست را (فرایند سبز) آسان میكند.
- این تركیبات میتوانند، نه تنها به عنوان یک حلال، بلكه به عنوان یک كاتالیست فعال نیز در واكنش شركت كنند.
همچنین مایعات یونی خواص بی نظیر دیگری از قبیل پنجرهی الکتروشیمیایی وسیع، هدایت الکتریکی زیاد، تحرک یونی، گسترهی دمایی مایع وسیع، به شدت سولواته کننده، عدم فراریت، اشتعال ناپذیری و گسترهی پایداری گرمایی وسیع نیز دارند.
[1]. Chemometrics
[2]. Wold
[3]. Quantitative structure activity relationship
[4]. Quantitative structure toxicity relationship
[5]. Quantitative structure property relationship
[6]. Descriptors
[7]. Multiple linear regression
[8]. Artificial neural network
[9]. Support vector machine
[10]. Partial least square
- 1. Comparative molecular field analysis
فرم در حال بارگذاری ...
[دوشنبه 1399-10-01] [ 06:34:00 ب.ظ ]
|