مهدي صارمي فر
[email protected]
دانش بيوانفورماتيك محل تقاطع علوم رياضيات، علوم محاسباتي و علوم زيستي است. بيوانفورماتيك، دانشي بين رشته اي است كه با توجه به گسترش روزافزون حيطه هاي علمي و درگير شدن آنها با هم و طرح مسائل مشترك بين شاخه هايي از دانش بشري كه پيش از اين چندان ربطي به هم نداشتند، امروزه بسيار مورد توجه قرار گرفته است. از طرف ديگر، گسترش توجه به زيست شناسي و به خصوص زيست شناسي مولكولي در دو دهه اخير، بيوانفورماتيك را در كانون توجه پژوهشگران رياضي و زيست شناسان قرار داده است. اگر بخواهيم موضوع پژوهش هاي بيوانفورماتيك را در يك جمله خلاصه كنيم، مي توان گفت كه بيوانفورماتيك از يك طرف به طراحي سيستم هاي كامپيوتري و مدل هاي رياضي مي پردازد كه در نگهداري و مديريت مجموعه عظيمي از داده هاي زيست شناسي كاربرد دارند و از سوي ديگر، به تحليل اين داده هاي زيست شناسي مي پردازد. محتواي اين «مجموعه عظيم داده اي» چيست؟ بيوانفورماتيك با چه مسائلي درگير است؟ چه جايگاهي در كنار علوم ديگر دارد؟
با توجه به گسترش روزافزون و توجه به اين شاخه در كشورمان در اين گزارش نگاهي داريم به كليات بيوانفورماتيك.
توالي ها
اطلاعات وراثتي هر سلول در مولكول هاي طويلي به نام «ديوكسي ريبونوكلئيك اسيد» يا دي ان آ نگهداري مي شود. دي ان آ پليمري است كه از چهار مونومر ساخته شده است. اين مونومرها كه باز هستند به اختصار A، T، C و G ناميده مي شوند. به اين ترتيب براي نمايش مولكول دي ان آ دانشمندان از يك رشته طولاني از اين چهار حرف استفاده مي كنند. به اين رشته طولاني، توالي مي گويند. در واقع دي ان آ زنجيره اي دوگانه و به هم تابيده است، كه هر دو مونومر از هر زنجيره با مونومري از زنجيره مقابل، در هم جفت مي شوند، به اين صورت كه A با T و G با C جفت مي شوند. پس با دانستن توالي يك زنجيره، توالي متقابل به دست مي آيد. در درون هسته هر سلول، مولكول دي ان آ چندين بار تاب مي خورد و براي استحكام بيشتر، به دور گلوله هايي از چربي حلقه مي زند. به اين مجموعه كروموزوم مي گويند. براي مثال در بدن انسان ۴۶ كروموزوم وجود دارد كه همه خصلت هاي انساني در آنها كد شده اند.
اما مولكول دي ان آ به تنهايي قادر به كنترل فعاليت هاي حياتي موجود زنده نيست. بلكه هر كدام از قسمت هاي اين دنباله بايد طي فرآيندي كه روخواني و ترجمه نام دارد، در درون اندامي از سلول به نام ريبوزوم به يك آنزيم يا پروتئين معادل آن تبديل شوند. اين آنزيم يا پروتئين است كه براي مثال وارد جريان خون مي شود و به وظايف محوله فرد مي پردازد. به هر قسمتي از مولكول دي ان آ كه يك پروتئين را كد مي كند، يك ژن مي گويند. يك مولكول دي ان آ حاوي هزاران ژن است كه هر كدام وظيفه اي خاص خود دارند، به اين ترتيب جريان اطلاعات كه توصيف كننده رفتار و عملكرد هر سلول زنده است، در دي ان آ كنترل مي شود.
پروتئين ها نيز زنجيره اي از آمينواسيدها هستند. بيش از بيست نوع آمينواسيد وجود دارد كه با نسبت دادن يك علامت به هر كدام، توالي پروتئيني نشان داده مي شود. هر سه تا باز، روي دي ان آ، يك آمينواسيد را كد مي كنند. به اين ترتيب از روي يك توالي ژني، مي توان توالي پروتئيني خاص آن را به دست آورد.
به اين ترتيب نخستين و مهمترين شباهت زيست شناسي مولكولي و علوم كامپيوتر نمايان شد: توالي ها، داده هايي ديجيتالي هستند. قسمت عمده اي از داده هايي كه در مدل ها، الگوريتم ها و پايگاه هاي داده اي (Data base) بيوانفورماتيك مورد تحليل قرار مي گيرند، به توالي ها اختصاص دارد.
پايگاه هاي داده
جريان اطلاعاتي را كه منجر به بروز يك واكنش خاص توسط يك سلول زنده يا يك موجود چند سلولي مي شود را در دياگرام زير مي توان خلاصه كرد:
توالي ژني، توالي RNA، توالي پروتئين، ساختار پروتئين، عملكرد پروتئين و بروز صفت در سلول زنده.براين اساس، هدف نهايي بيوانفورماتيك اين است كه با در دست داشتن توالي دي ان آهاي يك سلول يا يك موجود زنده، تمام خصوصيات و رفتارهاي آن را پيش بيني كند.
يكي از محرك هاي اصلي براي فعاليت روزافزون در زمينه بيوانفورماتيك پروژه هاي ژنوم و پروتيوم بوده اند. پروژه هاي ژنوم، با هدف تعيين كد توالي دي ان آهاي موجودات زنده تعريف شده اند كه مهمترين و بزرگ ترين آنها پروژه ژنوم انساني است. اين پروژه كه يك برنامه بزرگ جهاني بود و دانشمنداني از سراسر جهان در آن شركت داشتند، وظيفه اش شناخت كامل دي ان آ انسان است. اين پروژه يكي از چهار پروژه عظيم جهاني است كه البته به لطف ساخت دستگاهي به نام PCR كه به اين فرآيند سرعت بخشيد، در سال ۲۰۰۲ و سه سال پيش از موعد پانزده ساله پيش بيني شده اوليه، به پايان رسيد. پايگاه هاي داده اي اينترنتي مخصوص اين كار توالي هاي به دست آمده را در اختيار پژوهشگران قرار مي دهند. اين پايگاه ها كاملاً عمومي هستند و با وارد كردن هر توالي دلخواه مي توان تمام توالي هاي مشابه به همراه مجموعه كاملي از اطلاعات مربوط به آنها را استخراج كرد. اين پايگاه هاي بيوانفورماتيك حجم زيادي از اطلاعات ژنتيكي را در خود حفظ كرده اند و در طول مدت كوتاهي كه از راه اندازيشان مي گذرد، به مهمترين ابزار پژوهشي در زيست شناسي مولكولي مبدل گشته اند.
سرعت رشد اطلاعات موجود در پايگاه هاي داده اي به صورت نمايي رشد مي يابد. به طوري كه براي مثال در پايگاه Gen Bank هر ۱۴ ماه حجم اطلاعات دو برابر مي شود. به طور مشابه براي پروتئين هم پروژه پروتيوم تعريف شده است كه البته در اينجا حجم كار به طرز بسيار وحشتناكي بالاتر است. در عين حال روش هاي خوبي مثل روش هاي به كار رفته در پروژه ژنوم در دست نيست ضمن اينكه بسياري از پروتئين ها و آنزيم ها، ناشناخته مانده اند. هدف اين پروژه ها تعيين توالي پروتئين ها و شكل ساختاري سه بعدي آنها است. به خصوص اين آخري كه نقش اساسي در عملكردهاي پروتئين ها دارد. اگر پروژه ژنوم طي يك فرآيند ۱۲ ساله به پايان رسيد ما با توجه به حجم كار پروژه پروتيوم، به نظر مي رسد كه حدود يك قرن براي به پايان رساندن اين پروژه كه با همكاري اكثر مراكز پژوهشي جهان در حال انجام است، لازم باشد.
زمينه هاي مهم بيوانفورماتيك
يك- تحليل توالي هاي ژنوم
هدف اوليه بيوانفورماتيك طراحي روش هاي استخراج، نگهداري، پردازش و تحليل تعداد بسيار زيادي از توالي ها بود. رسيدن به اين هدف، براي محققان علوم زيستي دستاورد عظيمي به شمار مي رود. به طور كلي طي چند سال اخير، كاوش در اين پايگاه هاي داده اي براي پژوهشگران زيست شناسي مولكولي به يك فعاليت روزمره و نياز حياتي مبدل شده است. براي مثال فرض كنيد كه توالي قسمتي از يك دي ان آ در آزمايشگاه به دست آمده است.
نخستين سئوالي كه به ذهن مي رسد اين است كه آيا اين توالي در برگيرنده يك ژن هست يا نه؟ در صورت مثبت بودن جواب، اين ژن در كجاي زنجيره دي ان آ اصلي قرار دارد و نهايتاً آنزيمي را كه كد مي كند چه نقشي در سلول يا در فرآيندهاي حياتي ايفا مي كند؟ در غياب بيوانفورماتيك و ابزارهاي آن، ماه ها وقت لازم است تا يك تيم تحقيقاتي به حدس هاي اوليه اي درباره پاسخ سئوالات فوق برسد. در حالي كه تنها با يك كامپيوتر شخصي متصل به اين پايگاه هاي داده اي ظرف چند دقيقه مي توان به جواب قطعي يا حدس هايي محكم رسيد.
سرعت بالاي روش هاي تعيين توالي با روش هاي كامپيوتري و مدل هاي رياضي در طراحي تراشه هاي دي ان آ به دست آمده اند. دستگاه هاي فوق پيشرفته مجهز به تراشه هاي دي ان آ قادر هستند ضمن تعيين توالي همزمان هزاران قطعه نوكلئوتيدي آنها را به طور خودكار در پايگاه هاي داده اي به ثبت برساند.
دو- پيش بيني ساختار سه بعدي (ساختار سوم و چهارم) پروتئين
كاركرد مولكول هاي عظيم پروتئين به شدت به شكل فضايي و ساختار سه بعدي آنها بستگي دارد. از طرفي همان گونه كه ديديم ژن ها نيز از طريق عملكرد پروتئين هايي كه مي سازند، نقش خود را اعمال مي كنند. بنابراين شناخت كامل ماهيت و وظيفه ژن ها، منوط به دانستن اطلاعات كافي درباره پروتئين ها است. ولي پروژه هاي پروتيوم با وجود اين اهميت حياتي، به كندي پيش مي روند.
دلايل اين كندي پيشرفت، هزينه هاي زياد و كندي روند تعيين توالي پروتئين ها و مشكل بودن تعيين ساختار سه بعدي آنها در آزمايشگاه است. با توجه به سرعت بالاي روند كار در پروژه هاي ژنوم، حل مسائل پروتئيني مهم ترين چالش حال حاضر بيوانفورماتيك به حساب مي آيد.
دو اصل اساسي براي تعيين ساختار سه بعدي پروتئين از روي توالي آن وجود دارد كه هر كدام روش جداگانه اي را براي حل مسئله ساختار پيشنهاد مي كنند:
* پروتئين هايي كه توالي نسبتاً مشابهي دارند، شكل فضايي شبيه به هم پيدا مي كنند: جست وجو براي يافتن توالي هاي مشابه.
*شكل فضايي مولكول به نحوي است كه به حداقل انرژي برسد: استفاده از قوانين شيمي، فيزيك و ترموديناميك.
سه- تحليل كاركردي در سطح ژنوم
ابزارهاي تحليل كلان داده هاي زيستي، روش كار پژوهش هاي مهندسي ژنتيك، داروسازي و زيست شناسي را دگرگون كرده اند. فناوري جديد بيوانفورماتيكي امكانات جديد و بسيار قوي را فراهم ساخته است؛ مثل بررسي همزمان ميزان فعاليت هزاران ژن در سلول، تحليل نحوه تعامل تعداد زيادي پروتئين و تحليل خصوصيات هزاران سلول جهش يافته در آن واحد. اين مسائل با به كارگيري روش هاي آماري پيشرفته حل شده اند. دانش مربوط به اين بخش تحت عنوان «ژنوم شناسي كاركردي» به يكي از فعال ترين زمينه هاي تحقيقي در بيوانفورماتيك مبدل شده است.
از دستاوردهاي مهم در اين زمينه مي توان به پيش بيني نقش و كاركرد ژن ها در سلول بدون نياز به تحليل داده هاي پروتئيني اشاره كرد.
چهار- ايجاد و مديريت پايگاه هاي داده اي
صرف نظر از نوع داده هاي توليد شده در زيست شناسي مولكولي و نحوه تحليل و تفسير آنها، بايد اين داده ها را از طريق پايگاه هايي در اختيار پژوهشگران قرار داد. اما نحوه اين ارائه هم مشكلات خاص خود را پيش رو دارد؛ مثل نحوه حصول اطمينان از درستي داده هاي ثبت شده و چگونگي نمايش مفيد داده ها براي كاربران. از اين جهت اداره كنندگان پايگاه هاي بزرگ بيوانفورماتيكي، چالش هايي بيش از يك مهندس پيش رو دارند.
پنج- مدل سازي رياضي فرآيندهاي حيات
استفاده كنندگان ابزارها و داده هاي بيوانفورماتيكي محدود به متخصصان زيست شناسي مولكولي نمي شود. گروهي كه اخيراً به اهميت بيوانفورماتيك پي برده اند، فيزيولوژيست ها هستند. آنها با استفاده از حجم عظيم داده هاي ژنومي و پروتيومي در تلاشند تا راه شبيه سازي فرآيندهاي بيوشيميايي سلول هاي زنده را هموار سازند. تلاش محققان اين است كه فرآيندهاي خاص سلولي را شبيه سازي كرده و با يكپارچه سازي آنها به يك سلول كامل برسند كه در اين صورت يكي از هدف هاي مهم بيوانفورماتيك علوم زيستي محقق خواهد شد؛ يعني درك كامل ساز و كار ارگانيسم هاي زنده در سطح مولكولي.
در خاتمه بايد يادآور شد كه اهميت بيوانفورماتيك تنها در سرعت بخشيدن به كارهاي آزمايشگاهي نيست بلكه گسترش اين شاخه علمي و طرح و پاسخگويي به سئوالات جديد افق هاي نويني را پيش روي زيست شناسان گشوده است.