وظيفه اصلى بيوانفورماتيك طراحى
سيستم هاى كامپيوترى و مدل هاى رياضى براى نگهدارى، مديريت و
تحليل داده هاى بيولوژيكى است.
ابزارهاى بيوانفورماتيكى در
آينده قادر خواهند بود كه با دانستن يك توالى ژنى، نحوه بروز
صفت در سلول زنده را توصيف كنند.
بيوانفورماتيك دانشى بين رشته اى
است. نقطه اتصال رياضيات، علوم محاسباتى و علوم زيستى. اين
شاخه از علم با توجه به گسترش روزافزون حيطه هاى علمى و درگير
شدن آنها با هم و طرح مسائل مشترك بين شاخه هايى از علم كه پيش
از اين چندان ربطى به هم نداشتند از يك طرف و گسترش توجه به
زيست شناسى و به خصوص زيست شناسى مولكولى در دو دهه اخير،
بسيار مورد توجه پژوهشگران رياضى و زيست شناسان قرار گرفته
است. اگر بخواهيم موضوع علم بيوانفورماتيك را در يك جمله خلاصه
كنيم، مى توان گفت: «طراحى سيستم هاى كامپيوترى و مدل هاى
رياضى براى نگهدارى، مديريت و تحليل مجموعه عظيمى از داده هاى
بيولوژيكى و همچنين ارائه دانش زيستى» موضوع بيوانفورماتيك
است. محتواى اين «مجموعه عظيم داده اى» چيست؟ بيوانفورماتيك با
چه مسائلى درگير است؟ چه جايگاهى در كنار علوم ديگر دارد؟
با توجه به گسترش روزافزون و
توجه به اين شاخه در كشورمان در اين گزارش نگاهى داريم به
كليات بيوانفورماتيك.
• توالى ها
اطلاعات وراثتى هر سلول در مولكول هاى طويلى به نام
«ديوكسى ريبونوكلئيك اسيد» يا DNA نگهدارى
مى شود. DNA پليمرى
است كه از چهار مونومر ساخته شده است. اين مونومرها كه باز
هستند به اختصار A،
T، C و G ناميده
مى شوند. به اين ترتيب براى نمايش مولكول DNA دانشمندان
از يك رشته طولانى از اين چهار حرف استفاده مى كنند. به اين
رشته طولانى، توالى مى گويند. در واقع DNA زنجيره اى
دوگانه و به هم تابيده است، كه هر دو مونومر از هر زنجيره با
مونومرى از زنجيره مقابل، در هم جفت مى شوند، به اين صورت كه A
با T و G با C جفت
مى شوند. پس با دانستن توالى يك زنجيره، توالى متقابل به دست
مى آيد. در درون هسته هر سلول، مولكول DNA چندين بار
تاب مى خورد و براى استحكام بيشتر، به دور گلوله هايى از چربى
حلقه مى زند. به اين مجموعه كروموزوم مى گويند. براى مثال در
بدن انسان ۴۶ كروموزوم وجود دارد كه همه خصلت هاى انسانى در
آنها كد شده اند.
اما مولكول DNA به
تنهايى قادر به كنترل فعاليت هاى حياتى موجود زنده نيست. بلكه
هر كدام از قسمت هاى اين دنباله بايد طى فرآيندى كه روخوانى و
ترجمه نام دارد، در درون اندامى از سلول به نام ريبوزوم به يك
آنزيم يا پروتئين معادل آن تبديل شوند. اين آنزيم يا پروتئين
است كه براى مثال وارد جريان خون مى شود و به وظايف محوله فرد
مى پردازد. به هر قسمتى از يك مولكول DNA كه
يك پروتئين را كد مى كند، يك ژن مى گويند. يك مولكول DNA حاوى
هزاران ژن است كه هر كدام وظيفه اى خاص خود دارند، به اين
ترتيب جريان اطلاعات كه توصيف كننده رفتار و عملكرد هر سلول
زنده است، در DNA كنترل
مى شود.
پروتئين ها نيز زنجيره اى از
آمينواسيدها هستند. بيش از بيست نوع آمينواسيد وجود دارد كه با
نسبت دادن يك علامت به هر كدام، توالى پروتئينى نشان داده
مى شود. هر سه تا باز روى DNA يك
آمينواسيد را كد مى كنند. به اين ترتيب از روى يك توالى ژنى،
مى توان توالى پروتئينى خاص آن را به دست آورد.
به اين ترتيب نخستين و مهمترين
شباهت زيست شناسى مولكولى و علوم كامپيوتر نمايان شد:
توالى ها، داده هايى ديجيتالى هستند. قسمت عمده اى از
داده هايى كه در مدل ها، الگوريتم ها و پايگاه هاى داده اى (Data
base) بيوانفورماتيك
مورد تحليل قرار مى گيرند، به توالى ها اختصاص دارد.
• پايگاه هاى داده
جريان اطلاعاتى را كه منجر به
بروز يك واكنش خاص توسط يك سلول زنده يا يك موجود چند سلولى
مى شود را در دياگرام زير مى توان خلاصه كرد:
توالى ژنى، توالى RNA
توالى پروتئين، ساختار پروتئين،
عملكرد پروتئين، بروز صفت در سلول زنده. براين
اساس، هدف نهايى بيوانفورماتيك اين است كه با در دست داشتن
توالى DNA هاى
يك سلول يا يك موجود زنده، تمام خصوصيات و رفتارهاى آن را
پيش بينى كند.
يكى از محرك هاى اصلى براى فعاليت روزافزون در زمينه
بيوانفورماتيك پروژه هاى ژنوم و پروتيوم بوده اند. پروژه هاى
ژنوم، با هدف تعيين كد توالى DNA هاى
موجودات زنده تعريف شده اند كه مهمترين و بزرگ ترين آنها پروژه
ژنوم انسانى است. اين پروژه كه يك برنامه بزرگ جهانى بود و
دانشمندانى از سراسر جهان در آن شركت داشتند، وظيفه اش شناخت
كامل DNA انسان
است. اين پروژه يكى از چهار پروژه عظيم جهانى است كه البته به
لطف ساخت دستگاهى به نام PCR كه
به اين فرآيند سرعت بخشيد، در سال ۲۰۰۲ و سه سال پيش از موعد
پانزده ساله پيش بينى شده اوليه، به پايان رسيد. پايگاه هاى
داده اى اينترنتى مخصوص اين كار توالى هاى به دست آمده را در
اختيار پژوهشگران قرار مى دهند. اين پايگاه ها كاملاً عمومى
هستند و با وارد كردن هر توالى دلخواه مى توان تمام توالى هاى
مشابه به همراه مجموعه كاملى از اطلاعات مربوط به آنها را
استخراج كرد. اين پايگاه هاى بيوانفورماتيك حجم زيادى از
اطلاعات ژنتيكى را در خود حفظ كرده اند و در طول مدت كوتاهى كه
از راه اندازيشان مى گذرد، به مهمترين ابزار پژوهشى در
زيست شناسى مولكولى مبدل گشته اند.
سرعت رشد اطلاعات موجود در
پايگاه هاى داده اى به صورت نمايى رشد مى يابد. طورى كه براى
مثال در پايگاه Gen
Bank هر
۱۴ ماه حجم اطلاعات دو برابر مى شود. به طور مشابه براى
پروتئين هم پروژه پروتيوم تعريف شده است. كه البته در اينجا
حجم كار به طرز بسيار وحشتناكى بالاتر است. در عين حال روش هاى
خوبى مثل روش هاى به كار رفته در پروژه ژنوم در دست نيست ضمن
اينكه بسيارى از پروتئين ها و آنزيم ها، ناشناخته مانده اند.
هدف اين پروژه ها تعيين توالى پروتئين ها و شكل ساختارى
سه بعدى آنها است. به خصوص اين آخرى كه نقش اساسى در عملكردهاى
پروتئين ها دارد. اگر پروژه ژنوم در طى يك فرآيند ۱۲ ساله به
پايان رسيد ما با توجه به حجم كار پروژه پروتيوم، به نظر
مى رسد كه حدود يك قرن براى به پايان رساندن اين پروژه كه با
همكارى اكثر مراكز پژوهشى جهان در حال انجام است، لازم باشد.
• زمينه هاى مهم
بيوانفورماتيك
۱- تحليل توالى هاى ژنوم
هدف اوليه بيوانفورماتيك طراحى
روش هاى استخراج، نگهدارى، پردازش و تحليل تعداد بسيار زيادى
از توالى ها بود. رسيدن به اين هدف، براى محققان علوم زيستى
دستاورد عظيمى به شمار مى رود. به طور كلى در طى چند سال اخير،
كاوش در اين پايگاه هاى داده اى براى پژوهشگران زيست شناسى
مولكولى به يك فعاليت روزمره و نياز حياتى مبدل شده است. براى
مثال فرض كنيد كه توالى قسمتى از يك DNA در
آزمايشگاه به دست آمده است.
نخستين سئوالى كه به ذهن مى رسد
اين است كه آيا اين توالى در برگيرنده يك ژن هست يا نه؟ در
صورت مثبت بودن جواب، اين ژن در كجاى زنجيره DNA اصلى قرار
دارد و نهايتاً آنزيمى را كه كد مى كند چه نقشى در سلول يا در
فرآيندهاى حياتى ايفا مى كند؟ در غياب بيوانفورماتيك و
ابزارهاى آن، ماه ها وقت لازم است تا يك تيم تحقيقاتى به
حدس هاى اوليه اى درباره پاسخ سئوالات فوق برسد. در حالى كه
تنها با يك كامپيوتر شخصى متصل به اين پايگاه هاى داده اى ظرف
چند دقيقه مى توان به جواب قطعى يا حدس هايى محكم رسيد.
سرعت بالاى روش هاى تعيين توالى
با روش هاى كامپيوترى و مدل هاى رياضى در طراحى تراشه هاى DNA به
دست آمده اند. دستگاه هاى فوق پيشرفته مجهز به تراشه هاى DNA قادر
هستند ضمن تعيين توالى همزمان هزاران قطعه نوكلئوتيدى آنها را
به طور خودكار در پايگاه هاى داده اى به ثبت برساند.
۲- پيش بينى ساختار سه بعدى
(ساختار سوم و چهارم) پروتئين
كاركرد مولكول هاى عظيم پروتئين
به شدت به شكل فضايى و ساختار سه بعدى آنها بستگى دارد. از
طرفى همان گونه كه ديديم ژن ها نيز از طريق عملكرد
پروتئين هايى كه مى سازند، نقش خود را اعمال مى كنند. بنابراين
شناخت كامل ماهيت و وظيفه ژن ها، منوط به دانستن اطلاعات كافى
درباره پروتئين ها است. ولى پروژه هاى پروتيوم با وجود اين
اهميت حياتى، به كندى پيش مى روند.
دلايل اين كندى پيشرفت،
هزينه هاى زياد و كندى روند تعيين توالى پروتئين ها و مشكل
بودن تعيين ساختار سه بعدى آنها در آزمايشگاه است. با توجه به
سرعت بالاى روند كار در پروژه هاى ژنوم، حل مسائل پروتئينى
مهمترين چالش حال حاضر بيوانفورماتيك به حساب مى آيد.
دو اصل اساسى براى تعيين ساختار
سه بعدى پروتئين از روى توالى آن وجود دارد كه هر كدام روش
جداگانه اى را براى حل مسئله ساختار پيشنهاد مى كنند:
* پروتئين هايى كه توالى نسبتاً
مشابهى دارند، شكل فضايى شبيه به هم پيدا مى كنند: جست وجو
براى يافتن توالى هاى مشابه.
*شكل فضايى مولكول به نحوى است
كه به حداقل انرژى برسد: استفاده از قوانين شيمى، فيزيك و
ترموديناميك.
۳- تحليل كاركردى در سطح ژنوم
ابزارهاى تحليل
كلان داده هاى زيستى، روش كار پژوهش هاى مهندسى ژنتيك،
داروسازى و زيست شناسى را دگرگون كرده اند. فناورى جديد
بيوانفورماتيكى امكانات جديد و بسيار قوى را فراهم ساخته است؛
مثل بررسى همزمان ميزان فعاليت هزاران ژن در سلول، تحليل نحوه
تعامل تعداد زيادى پروتئين و تحليل خصوصيات هزاران سلول
جهش يافته در آن واحد. اين مسائل با به كارگيرى روش هاى آمارى
پيشرفته و كلاستربندى حل شده اند. دانش مربوط به اين بخش تحت
عنوان «ژنوم شناسى كاركردى» به يكى از فعال ترين زمينه هاى
تحقيقى در بيوانفورماتيك مبدل شده است.
از دستاوردهاى مهم در اين زمينه مى توان به پيش بينى نقش و
كاركرد ژن ها در سلول بدون نياز به تحليل داده هاى پروتئينى
اشاره كرد.
۴- ايجاد و مديريت پايگاه هاى
داده اى
صرف نظر از نوع داده هاى توليد
شده در زيست شناسى مولكولى و نحوه تحليل و تفسير آنها، بايد
اين داده ها را از طريق پايگاه هايى در اختيار پژوهشگران قرار
داد. اما نحوه اين ارائه هم مشكلات خاص خود را پيش رو دارد؛
مثل نحوه حصول اطمينان از درستى داده هاى ثبت شده و چگونگى
نمايش مفيد داده ها براى كاربران. از اين جهت اداره كنندگان
پايگاه هاى بزرگ بيوانفورماتيكى، چالش هايى بيش از يك مهندس
پيش رو دارند.