پایان نامه : مدلسازی طول موج ماکزیمم جذب رنگهای آزو توسط الگوریتم مورچه و فعالیت داروئی مشتقات کاپساسین با بهره گرفتن از ماشین بردار پشتیبان |
چکیده
مشتقات رنگ های آزو سنتزی تهیه می شوند که دارای گروه عاملی N=N می باشند و کاربرد اصلی آنها در صنایع غذائی و نساجی است. قسمت آروماتیکی تعیین کننده رنگ است.
در این کار از الگوریتم کلونی مورچه و مدل رگرسیون خطی جهت پیشگویی λmax یک سری30- تایی از مشتقات رنگ های آزو استفاده شده است. در ابتدا پس از بهینه سازی ساختار مولکولی توسط نرم افزار Hyper Chem، در مجموع 1521 توصیف کننده به وسیله نرمافزارهای Hyper Chem و Dragon محاسبه گردید. توصیف کننده ها به عنوان ورودی به برنامه الگوریتم مورچه داده شدند. به منظور به دست آوردن بهترین نتیجه با درصد خطای پایین و توصیف کننده های مناسب، برنامه الگوریتم مورچه را چند بار اجرا کرده و در اجراهای مختلف پارامترهای آن از جمله تعداد مورچه های اولیه، پارامتر تبخیر و تعداد دورها بهینه شدند. 5 توصیف کننده که بالاترین همبستگی را با λmax رنگ های آزو داشتند، توسط الگوریتم مورچه انتخاب شدند. از این توصیف کننده های انتخاب شده، برای ساختن مدل خطی مناسب جهت پیشگویی λmax ترکیبات مورد نظر استفاده شد. این روش نتایج خوبی را در هر دو سری آموزش (9346/0=2R) و پیشگویی (8419/0=2R) فراهم آورد. با توجه به موارد ذکر شده، معلوم گردید الگوریتم مورچه طراحی شده روشی مناسب جهت انتخاب توصیف کننده ها برای مدل سازی و پیشگوییλmax مشتقات رنگ های آزو میباشد.
کاپساسین ماده داروئی است که از فلفل قرمز استخراج می شود و مصارف داروئی ازجمله درمان انواع سرطان، آرتروز، رماتیسم مفصلی، زخم معده دارد.
با بهره گرفتن ازروش های آموزش آماری ماشین یک رابطه کمی ساختار- فعالیت برای کاپساسین برقرار شده است .99 مولکول کاپساسین مطابق روش قسمت اول رسم شد و 1206 توصیف کننده محاسبه گردید.
برای کاهش تعداد توصیف کننده ها ابتدا از روش های PCA، ICA و Fuzzy Clustering استفاده کردیم که صحت از حدود 62-61% بالاتر نرفت. در رهیافت دیگری از تئوری اطلاعات و معیار” بیشترین ارتباط، کمترین تقلیل پذیری” استفاده شد و پس از بهینه سازی توصیف کننده ها 100 توصیف کننده انتخاب شد. در مرحله بعد مجموع توصیف کننده ها با بهره گرفتن از الگوریتم Wrapper بهینه سازی شد که مجموعا 13 توصیف کننده انتخاب شد و صحت برای طبقه بندی به پنج دسته فعالیت بسیار ضعیف ، ضعیف، متوسط ، خوب و فعالیت عالی84% بدست آمد.در کارهای قبلی ]72[ تنها با تقسیم مولکول به سه قسمت و طبقه بندی به فعال و غیر فعال، صحت نزدیک به 80% آمده بود. اما در کار حاضر بدون تقسیم بندی مولکولی و با تکیه به روش های محاسباتی صحتی بالاتر از کارهای سابق به دست آمد که نشانگر مناسب بودن و برتری روش های تئوری اطلاعات و SVM بر روش های قدیمی تر می باشد.
1 مقدمه
بشر هوشمند و صاحب تفكر همیشه برای یافتن راهی كه زندگی اش را متحول و كامل گرداند، از طبیعت الهام گرفته است.
با گذشت قرن ها، احساس نیاز به الهام گرفتن از طبیعت اسرارآمیز و دوست داشتنی و صد البته منظم، قانونمند و دارای شعور فطری، شدت پیدا كرده است. به گونه ای كه از ریزترین موجودات همچون ویروس تا غول آساترین كهكشان ها، برای انسان كه همیشه در تكاپوی حقیقت و دانش است، همه، معلمان و راهنمایان خوبی محسوب گردیدهاند، چرا كه طبیعت همیشه رو به سوی كمال دارد.
آنچه كاملاً مشهود است، به نظر می آید جهان هستی از جزء تا كل با یک حركت آرام ولی پیوسته كه به ظاهر تصادفی است رو به یک نقطه بهینه درحال حركت است. در حقیقت طبق نظریه داروینی، طبیعت در حال بهینه كردن مسائل است.
به طور مثال اگر بخواهیم حجم معینی آب را از كوهستان به دریا منتقل كنیم و تمام ویژگیها و معادلات مربوط به سختی، نوع، دما، جنس و سایر مشخصات آب و محیط اطراف را تعیین كرده و با این معادلات مسیر را بیابیم دقیقاً به همان مسیر جویبارها و رودخانهها میرسیم كه در طبیعت جریان دارند.
بدیهی است كه خداوند معلمی است كه دانش آموزش، انسان را از طریق نشانه هایش در طبیعت به طور كامل هدایت میكند.
هم اكنون كار روی توسعه سیستمهای هوشمند با الهام از طبیعت، از زمینه های پرطرفدار هوش مصنوعی است. الگوریتم ژنتیك[1] كه با بهره گرفتن از ایده تكامل داروینی و انتخاب طبیعی مطرح شده روش بسیار خوبی برای یافتن مسائل بهینهسازی است. ایده تكاملی داروینی بیانگر این مطلب است كه هر نسل نسبت به نسل قبل دارای تكامل است و آنچه در طبیعت رخ میدهد، حاصل میلیونها سال تكامل نسل به نسل موجوداتی مانند مورچه است.
حشراتی مانند مورچه، موریانه، زنبور كه به صورت كلونی زندگی میكنند، بر رفتار به ظاهر بینظمشان نظم و قانونمندی خاصی حكمفرماست كه دانشمندان و محققان را به خاطر این پیچیدگی منظم و راهگشا در حل مسائل بهینهسازی، شیفته خود ساخته است.
1-2 كمومتریكس
بدست آوردن داده تجزیهای یكی از مراحل اصلی تجزیه میباشد، تا اواخر دهه پنجاه قرن بیستم این مرحله به عنوان مشكلترین بخش یک تجزیه به حساب میآمد، همچنین زمان عمده یک تجزیه شیمیائی مربوط به جمعآوری داده های تجزیهای میشد.
اما ازآغاز دهه شصت قرن بیستم، زمانی كه دستگاههای مدرن وارد آزمایشگاهها و مراكز تحقیقاتی گردید، این مشكل برطرف شد و در نتیجه استفاده از چنین دستگاههای پیشرفته تعداد زیادی داده از یک نمونه بدست میآید. جهت ثبت و ذخیرهسازی چنین داده های وسیعی نیاز به وسیلهای بود كه بتواند از عهده چنین كاری برآید، به طور همزمان با ظهور دستگاههای پیشرفته تعداد زیادی داده از یک نمونه بدست آمد و استفاده از كامپیوتر نیز به عنوان ابزاری جهت ثبت و ذخیره داده های حاصل از یک تجزیه شیمیائی رشد چشمگیری یافت، در نتیجه اتصال كامپیوتر به دستگاههای آزمایشگاهی ثبت و ذخیره نمودن داده ها كه قبلاً به عنوان مشكلترین بخش یک تجزیه بوده تبدیل به سادهترین مرحله گردید. ولی مشكل دیگری كه به دنبال چنین پیشرفتی، ظاهر گردید، نحوه برخورد با چنین حجم وسیعی از داده بود كه باید به اطلاعات تبدیل میشدند.
برای مدتهای طولانی، ریاضی و آمار برای تفسیر نتایج آزمایشها به كار گرفته میشدند. ولی با ظهور نرمافزارهای پیشرفته رایانه ای تحول شگرفی در نحوه استفاده ریاضی و آمار در حل مسائل شیمیایی به وجود آمد. به طوری كه استفاده از ریاضی ، آمار و كامپیوتر در شیمی منجر به ظهور شاخهای جدید به نام كمومتریكس[2] گردید. اگرچه شیمیدانهای تجزیه بیش از سایر همکارانشان با این شاخه آشنا هستند و از آن بهره میبرند، ولی در رشتههای مرتبط با شیمی از جمله علوم داروئی، بیوشیمی و غیره نیز كاربردهای فراوانی دارد ]5-1[.
برای اولین بار در سال 1971 سوانت ولد[3] اصطلاح “كمومتریكس” را به كار برد و آن را هنر استخراج اطلاعات شیمیائی از داده های تجزیهای دانست . در سال 1974 با همكاری كوالسكی[4] انجمن بین المللی كمومتریكس تأسیس شد ]6[.
در سال 1982 كوالسكی و فرانك[5] كمومتریكس را شاخهای از علم شیمی كه در طراحی آزمایشهای بهینهسازی، برقراری ارتباط بین نتایج تجربی با متغیرهای آزمایش و همچنین استخراج اطلاعات از سیستمهای شیمیایی با بهره گرفتن از ریاضی، آمار و كامپیوتر تعریف كردند ]7[.
ماسارت[6]، كمومتریكس را یک روش شیمیائی میداند كه از منطق ریاضیات و آمار برای رسیدن به اهداف زیر بهره میجوید ]8[:
- طراحی با انتخاب فرایندهای تجربی بهینه شده
- دسترسی به حداكثر اطلاعات مناسب شیمیائی از طریق داده های تجربی
- بدست آوردن اطلاعات در زمینه سیستمهای شیمیائی
براون[7] سردبیر مجله كمومتریكس معتقد است كمومتریكس قسمتی از علم شیمی است كه كوشش در پاسخگوئی به سوالات مربوط به سنجشهای شیمیائی دارد ]9[. سوالاتی از قبیل:
- اندازه گیری كجا و چگونه باید انجام پذیرد؟
- سیگنال[8] و نویز[9] كدامند؟
- چگونه می توان از اندازه گیری، اطلاعات مناسب را بدست آورد؟
- منشأ خطاها در نتایج حاصل از اندازه گیریها چیست؟
انجمن بین المللی كمومتریكس (ICS) تعریف جامعی از كمومتریكس ارائه میدهد. براساس تعریف این انجمن كمومتریكس علم برقراری ارتباط بین سنجشهای انجام شده بر روی یک سیستم یا فرایند شیمیائی و حالتی از سیستم میباشد.
فرم در حال بارگذاری ...
[دوشنبه 1399-10-01] [ 04:33:00 ب.ظ ]
|