بر اساس دو مطالعه اخیر در Nature Genetics، برنامههای هوش مصنوعی (AI) جدید توسعهیافته نقش عناصر تنظیمکننده DNA و ساختار سهبعدی را تنها بر اساس توالی خام آن پیشبینی کردند.
تنها حدود ۱ درصد از DNA انسان دستورالعمل ساخت پروتئین ها را رمزگذاری می کند. تحقیقات در دهههای اخیر نشان داده است که بسیاری از مواد ژنتیکی غیرکدکننده باقیمانده دارای عناصر تنظیمکنندهای مانند پروموترها، تقویتکنندهها، خفهکنندهها و عایقها هستند که نحوه بیان DNA کدکننده را کنترل میکنند. دکتر ژو توضیح داد که چگونه توالی عملکرد بیشتر این عناصر تنظیمی را کنترل می کند به خوبی درک نشده است.
برای درک بهتر این مؤلفههای نظارتی، او و همکارانش یک مدل یادگیری عمیق به نام Sei توسعه دادند که بهطور دقیق این تکههای DNA غیرکدکننده را در ۴۰ «کلاس توالی» دستهبندی میکند. علاوه بر این، Sei میتواند هر دنبالهای را با فعالیت پیشبینیشدهاش در هر یک از ۴۰ کلاس توالی امتیاز دهد و پیشبینی کند که چگونه جهشها بر چنین فعالیتهایی تأثیر میگذارند.
با استفاده از Sei در دادههای ژنتیک انسانی، محققان توانستند ساختار تنظیمی ۴۷ صفت و بیماری ثبت شده در پایگاه داده Biobank انگلستان را مشخص کنند و توضیح دهند که چگونه جهش در عناصر نظارتی باعث آسیبشناسی خاص میشود. چنین قابلیت هایی می تواند به درک سیستماتیک تری از چگونگی ارتباط تغییرات توالی ژنومی با بیماری ها و سایر صفات کمک کند.
در ماه مه، دکتر ژو توسعه ابزار متفاوتی به نام Orca را گزارش داد که معماری سه بعدی DNA در کروموزوم ها را بر اساس توالی آن پیش بینی می کند. دکتر ژو با استفاده از مجموعه دادههای موجود از توالیهای DNA و دادههای ساختاری به دست آمده از مطالعات قبلی که چینخوردگیها، پیچشها و چرخشهای مولکول را نشان میدادند، مدل را برای ایجاد اتصالات آموزش داد و توانایی مدل را برای پیشبینی ساختار در مقیاسهای طولی مختلف ارزیابی کرد.
یافتهها نشان داد که اورکا ساختارهای DNA کوچک و بزرگ را بر اساس توالیهایشان با دقت بالا پیشبینی میکند. (از جمله برای توالیهای حامل جهشهای مرتبط با شرایط مختلف سلامت از جمله نوعی سرطان خون و ناهنجاریهای اندام.) اورکا همچنین به محققان این امکان را داد تا فرضیه های جدیدی در مورد اینکه چگونه توالی DNA ساختار سه بعدی و مقیاس بزرگ خود را کنترل می کند، ایجاد کنند.
دکتر ژو گفت که او و همکارانش قصد دارند از Sei و Orca استفاده کنند که هر دو به صورت عمومی در سرورهای وب به عنوان کد منبع باز در دسترس هستند تا نقش جهش های ژنتیکی در ایجاد تظاهرات مولکولی و فیزیکی بیماری ها را بررسی کنند، که در نهایت می تواند به راه های جدیدی برای درمان این بیماری ها منجر شود.
تنها حدود ۱ درصد از DNA انسان دستورالعمل ساخت پروتئین ها را رمزگذاری می کند. تحقیقات در دهههای اخیر نشان داده است که بسیاری از مواد ژنتیکی غیرکدکننده باقیمانده دارای عناصر تنظیمکنندهای مانند پروموترها، تقویتکنندهها، خفهکنندهها و عایقها هستند که نحوه بیان DNA کدکننده را کنترل میکنند. دکتر ژو توضیح داد که چگونه توالی عملکرد بیشتر این عناصر تنظیمی را کنترل می کند به خوبی درک نشده است.
برای درک بهتر این مؤلفههای نظارتی، او و همکارانش یک مدل یادگیری عمیق به نام Sei توسعه دادند که بهطور دقیق این تکههای DNA غیرکدکننده را در ۴۰ «کلاس توالی» دستهبندی میکند. علاوه بر این، Sei میتواند هر دنبالهای را با فعالیت پیشبینیشدهاش در هر یک از ۴۰ کلاس توالی امتیاز دهد و پیشبینی کند که چگونه جهشها بر چنین فعالیتهایی تأثیر میگذارند.
با استفاده از Sei در دادههای ژنتیک انسانی، محققان توانستند ساختار تنظیمی ۴۷ صفت و بیماری ثبت شده در پایگاه داده Biobank انگلستان را مشخص کنند و توضیح دهند که چگونه جهش در عناصر نظارتی باعث آسیبشناسی خاص میشود. چنین قابلیت هایی می تواند به درک سیستماتیک تری از چگونگی ارتباط تغییرات توالی ژنومی با بیماری ها و سایر صفات کمک کند.
در ماه مه، دکتر ژو توسعه ابزار متفاوتی به نام Orca را گزارش داد که معماری سه بعدی DNA در کروموزوم ها را بر اساس توالی آن پیش بینی می کند. دکتر ژو با استفاده از مجموعه دادههای موجود از توالیهای DNA و دادههای ساختاری به دست آمده از مطالعات قبلی که چینخوردگیها، پیچشها و چرخشهای مولکول را نشان میدادند، مدل را برای ایجاد اتصالات آموزش داد و توانایی مدل را برای پیشبینی ساختار در مقیاسهای طولی مختلف ارزیابی کرد.
یافتهها نشان داد که اورکا ساختارهای DNA کوچک و بزرگ را بر اساس توالیهایشان با دقت بالا پیشبینی میکند. (از جمله برای توالیهای حامل جهشهای مرتبط با شرایط مختلف سلامت از جمله نوعی سرطان خون و ناهنجاریهای اندام.) اورکا همچنین به محققان این امکان را داد تا فرضیه های جدیدی در مورد اینکه چگونه توالی DNA ساختار سه بعدی و مقیاس بزرگ خود را کنترل می کند، ایجاد کنند.
دکتر ژو گفت که او و همکارانش قصد دارند از Sei و Orca استفاده کنند که هر دو به صورت عمومی در سرورهای وب به عنوان کد منبع باز در دسترس هستند تا نقش جهش های ژنتیکی در ایجاد تظاهرات مولکولی و فیزیکی بیماری ها را بررسی کنند، که در نهایت می تواند به راه های جدیدی برای درمان این بیماری ها منجر شود.
کد خبر ۲۰۱۰۱۰۵۱۸.۰۲۹