از روزنامه نگاری غیرانتفاعی حمایت کنید.
AlphaFold، یک سیستم هوش مصنوعی با یادگیری عمیق، ساختار پروتئین گیرنده استروژن را پیش‌بینی کرد که در این تصویر به DNA متصل می‌شود (بنفش). پروتئین پیش‌بینی‌شده دارای بخش‌هایی است که به ساختارهای دقیق (صورتی) و مناطق دیگر شبیه اسپاگتی با جریان آزاد (زرد) تا شده است.
VERONICA FALCONIERI HAYS / منبع علم
نوشته

هنگامی که مردم سراسر جهان در ماه ژوئیه از جزئیات دقیق ترین تصاویر کیهان توسط تلسکوپ فضایی جیمز وب شگفت زده شدند، زیست شناسان اولین اجمالی خود را از مجموعه متفاوتی از تصاویر دریافت کردند – تصاویری که می توانند به انقلابی در تحقیقات علوم زیستی کمک کنند.
این تصاویر شکل های سه بعدی پیش بینی شده بیش از 200 میلیون پروتئین است که توسط یک سیستم هوش مصنوعی به نام AlphaFold ارائه شده است. دمیس حسابیس در یک نشست خبری در 26 ژوئیه گفت: "شما می توانید آن را به عنوان پوشش کل جهان پروتئین در نظر بگیرید." Hassabis یکی از بنیانگذاران و مدیر عامل DeepMind است، شرکت مستقر در لندن که این سیستم را ایجاد کرده است. با ترکیب چندین تکنیک یادگیری عمیق، برنامه کامپیوتری برای پیش‌بینی اشکال پروتئین با شناسایی الگوهایی در ساختارهایی که قبلاً طی دهه‌ها کار تجربی با استفاده از میکروسکوپ‌های الکترونی و روش‌های دیگر حل شده‌اند، آموزش داده می‌شود.
سرفصل‌ها و خلاصه‌ای از آخرین مقالات Science News ، به صندوق ورودی شما تحویل داده شده است
با تشکر از شما برای ثبت نام!
مشکلی در ثبت نام شما وجود داشت.
اولین بار هوش مصنوعی در سال 2021 با پیش بینی 350000 ساختار پروتئینی – از جمله تقریباً تمام پروتئین های شناخته شده انسانی – رخ داد. DeepMind با موسسه بیوانفورماتیک اروپایی آزمایشگاه بیولوژی مولکولی اروپا همکاری کرد تا ساختارها را در یک پایگاه داده عمومی در دسترس قرار دهد.
Hassabis گفت که نسخه عظیم جدید ژوئیه کتابخانه را به "تقریباً همه موجودات روی کره زمین که توالی ژنوم آنها تعیین شده است" گسترش داد. "شما می توانید ساختار سه بعدی یک پروتئین را تقریباً به آسانی جستجوی کلمه کلیدی در گوگل جستجو کنید."
اینها پیش بینی هستند، نه ساختارهای واقعی. با این حال، محققان از برخی از پیش‌بینی‌های سال 2021 برای تولید واکسن‌های بالقوه جدید مالاریا ، بهبود درک بیماری پارکینسون، بررسی نحوه محافظت از سلامت زنبور عسل، به دست آوردن بینش در مورد تکامل انسان و موارد دیگر استفاده کرده‌اند. DeepMind همچنین AlphaFold را بر روی بیماری‌های استوایی نادیده گرفته شده از جمله بیماری شاگاس و لیشمانیوز متمرکز کرده است که در صورت عدم درمان می‌تواند ناتوان کننده یا کشنده باشد.
دهه‌ها آزمایش‌های آهسته ساختار بیش از 194000 پروتئین را نشان داده‌اند که همگی در بانک داده‌های پروتئین قرار دارند. در سال 2021، پروژه AlphaFold ساختارهای پیش بینی شده ای را برای حدود 1 میلیون پروتئین، از جمله تقریباً تمام پروتئین های شناخته شده انسانی، منتشر کرد. امسال، پایگاه داده AlphaFold با ساختارهای پیش بینی شده برای بیش از 200 میلیون پروتئین منفجر شد.
انتشار مجموعه داده گسترده با هیجان بسیاری از دانشمندان مورد استقبال قرار گرفت. اما برخی دیگر نگرانند که محققان ساختارهای پیش‌بینی‌شده را به‌عنوان اشکال واقعی پروتئین‌ها در نظر بگیرند. هنوز هم چیزهایی وجود دارد که AlphaFold نمی تواند انجام دهد – و برای انجام آنها طراحی نشده است – که باید قبل از اینکه کیهان پروتئین کاملاً مورد توجه قرار گیرد، برطرف شود.
جولی فورمن کی، بیوفیزیکدان پروتئین در بیمارستان کودکان بیمار و دانشگاه تورنتو، می‌گوید که باز بودن کاتالوگ جدید برای همه «یک مزیت بزرگ» است. در بسیاری از موارد، AlphaFold و RoseTTAFold ، یکی دیگر از محققان هوش مصنوعی که در مورد آن هیجان‌زده هستند، اشکالی را پیش‌بینی می‌کنند که به خوبی با پروفایل‌های پروتئینی آزمایش‌ها مطابقت دارند. اما، او هشدار می دهد، "در کل اینطور نیست."
پیش‌بینی‌ها برای برخی پروتئین‌ها نسبت به برخی دیگر دقیق‌تر است. پیش‌بینی‌های اشتباه می‌تواند باعث شود برخی از دانشمندان فکر کنند که می‌دانند چگونه یک پروتئین کار می‌کند در حالی که واقعاً اینطور نیست. Forman-Kay می‌گوید، آزمایش‌های پرزحمت برای درک چگونگی تا شدن پروتئین‌ها بسیار مهم است. اکنون این احساس وجود دارد که مردم مجبور نیستند ساختار آزمایشی را تعیین کنند، که درست نیست.
شاهی تال ( Arabidopsis thaliana )
این پروتئین گیاهی یک کیناز است که فسفات ها را به مولکول های دیگر می چسباند و به طور بالقوه عملکرد آنها را تغییر می دهد.

پروتئین‌ها به‌عنوان زنجیره‌های بلندی از اسیدهای آمینه شروع می‌شوند و به‌صورت مجموعه‌ای از حلقه‌ها و دیگر اشکال سه‌بعدی جمع می‌شوند. برخی شبیه حلقه‌های چوب پنبه‌پنبه‌ای محکم یک پرم دهه 1980 یا چین‌های آکاردئون هستند. دیگران را می توان با خط خطی های مارپیچ کودک اشتباه گرفت.
معماری پروتئین چیزی بیش از زیبایی شناسی است. می تواند نحوه عملکرد پروتئین را تعیین کند. به عنوان مثال، پروتئین‌هایی به نام آنزیم‌ها به محفظه‌ای نیاز دارند که بتوانند مولکول‌های کوچک را جذب کرده و واکنش‌های شیمیایی را انجام دهند. و پروتئین‌هایی که در یک مجتمع پروتئینی کار می‌کنند، دو یا چند پروتئین که مانند قسمت‌هایی از یک ماشین در تعامل هستند، به شکل‌های مناسب نیاز دارند تا با شرکای خود شکل بگیرند.
دانستن چین‌ها، سیم‌پیچ‌ها و حلقه‌های شکل یک پروتئین ممکن است به دانشمندان کمک کند تا رمزگشایی کنند که مثلاً یک جهش چگونه آن شکل را تغییر می‌دهد و باعث ایجاد بیماری می‌شود. این دانش همچنین می تواند به محققان در ساخت واکسن ها و داروهای بهتر کمک کند.
برای سال‌ها، دانشمندان کریستال‌های پروتئین را با اشعه ایکس بمباران کردند، سلول‌های یخ‌زده را فلاش زدند و آن‌ها را زیر میکروسکوپ‌های الکترونی پرقدرت بررسی کردند و از روش‌های دیگری برای کشف اسرار اشکال پروتئین استفاده کردند. چنین روش‌های آزمایشی «زمان زیادی برای پرسنل، تلاش زیاد و پول زیادی می‌طلبد. تامیر گونن، بیوفیزیکدان غشایی و محقق موسسه پزشکی هاوارد هیوز در دانشکده پزشکی دیوید گفن در UCLA می‌گوید: «بنابراین سرعت آن کند بوده است.
باکتری سودوموناس ( Pseudomonas syringae )
با تحریک کریستال های یخ در دمای نسبتاً بالا منجر به آسیب سرمازدگی گیاهان می شود. ممکن است برای کاشت ابرها و نگهداری مواد غذایی استفاده شود.
چنین کار آزمایشی دقیق و پرهزینه‌ای، ساختارهای سه بعدی بیش از 194000 پروتئین را کشف کرده است، فایل‌های داده آن‌ها در بانک داده‌های پروتئین ذخیره می‌شود که توسط کنسرسیومی از سازمان‌های تحقیقاتی پشتیبانی می‌شود. ناظم بواتا، زیست‌شناس سیستمی از دانشکده پزشکی هاروارد، می‌گوید، سرعت فزاینده‌ای که ژنتیک‌دانان در حال رمزگشایی دستورالعمل‌های DNA برای ساخت پروتئین‌ها هستند، بسیار بیشتر از توانایی زیست‌شناسان ساختاری برای ادامه‌دادن است. سوال زیست شناسان ساختاری این بود که چگونه شکاف را کم کنیم؟ او می گوید.
برای بسیاری از محققان، آرزوی داشتن برنامه‌های رایانه‌ای بود که بتواند DNA یک ژن را بررسی کند و پیش‌بینی کند که پروتئینی که آن کدگذاری می‌کند چگونه به شکل سه بعدی تا می‌شود.
در طول چندین دهه، دانشمندان به سمت هدف هوش مصنوعی پیشرفت کردند. جان مولت، زیست‌شناس محاسباتی در دانشگاه مریلند در دانشگاه مریلند، می‌گوید: «تا دو سال پیش، ما واقعاً با راه‌حلی خوب فاصله داشتیم».
Moult یکی از سازمان دهندگان یک مسابقه است: ارزیابی انتقادی پیش بینی ساختار پروتئین یا CASP. سازمان‌دهندگان مجموعه‌ای از پروتئین‌ها را برای الگوریتم‌هایشان به رقبا می‌دهند تا پیش‌بینی‌های ماشین‌ها را با ساختارهای آزمایشی تعیین‌شده مقایسه کنند. بیشتر هوش مصنوعی ها نتوانستند به شکل واقعی پروتئین ها نزدیک شوند.
"ساختار همه چیز را در مورد نحوه عملکرد یک پروتئین به شما نمی گوید."
سپس در سال 2020، AlphaFold به شکل بزرگی ظاهر شد و ساختار 90 درصد پروتئین‌های آزمایشی را با دقت بالا، از جمله دو سوم با روش‌های آزمایشی رقیب دقت، پیش‌بینی کرد.
رمزگشایی ساختار تک پروتئین ها هسته اصلی رقابت CASP از زمان آغاز آن در سال 1994 بود. Moult می گوید با عملکرد AlphaFold، "به طور ناگهانی، اساساً این کار انجام شد."
Hassabis در نشست خبری گفت که از زمان انتشار AlphaFold در سال 2021، بیش از نیم میلیون دانشمند به پایگاه داده آن دسترسی پیدا کرده اند. به عنوان مثال، برخی از محققان از پیش‌بینی‌های AlphaFold استفاده کرده‌اند تا به آنها کمک کند تا به تکمیل یک پازل بیولوژیکی عظیم نزدیک‌تر شوند: مجموعه منافذ هسته‌ای. منافذ هسته‌ای پورتال‌های کلیدی هستند که به مولکول‌ها اجازه ورود و خروج از هسته‌های سلولی را می‌دهند. بدون منافذ، سلول ها به درستی کار نمی کنند. هر منفذی نسبتاً بزرگ است و از حدود 1000 قطعه 30 یا بیشتر پروتئین مختلف تشکیل شده است. محققان قبلاً موفق شده بودند حدود 30 درصد از قطعات را در این پازل قرار دهند.
محققان قبلاً حدود 30 درصد از پازل 1000 قطعه ای را حل کرده بودند که مجموعه منافذ هسته ای است. AlphaFold به درک داده های تجربی برای تکمیل 60 درصد ساختار کمک کرد.
محققان در ساینس 10 ژوئن گزارش دادند که این پازل اکنون تقریبا 60 درصد کامل شده است، پس از ترکیب پیش‌بینی‌های AlphaFold با تکنیک‌های تجربی برای درک اینکه چگونه قطعات با هم قرار می‌گیرند.
اکنون که AlphaFold تقریباً نحوه تا کردن پروتئین‌های منفرد را حل کرده است، امسال سازمان‌دهندگان CASP از تیم‌ها می‌خواهند تا روی چالش‌های بعدی کار کنند: پیش‌بینی ساختار مولکول‌های RNA و مدل‌سازی نحوه تعامل پروتئین‌ها با یکدیگر و با مولکول‌های دیگر.
Moult می‌گوید برای این نوع وظایف، روش‌های یادگیری عمیق هوش مصنوعی «امیدبخش به نظر می‌رسند اما هنوز کالا را تحویل نداده‌اند».
توانایی مدل‌سازی فعل و انفعالات پروتئینی یک مزیت بزرگ خواهد بود زیرا بیشتر پروتئین‌ها به صورت مجزا عمل نمی‌کنند. آنها با سایر پروتئین ها یا مولکول های دیگر در سلول ها کار می کنند. اما Forman-Kay، بیوفیزیکدان پروتئین دانشگاه تورنتو، می‌گوید دقت AlphaFold در پیش‌بینی اینکه چگونه شکل دو پروتئین ممکن است در هنگام برهمکنش پروتئین‌ها تغییر کند، «به هیچ وجه نزدیک» به پیش‌بینی‌های نقطه‌ای آن برای تعداد زیادی از پروتئین‌ها نیست. این چیزی است که سازندگان AlphaFold نیز به آن اذعان دارند.
هوش مصنوعی برای تا کردن پروتئین ها با بررسی خطوط ساختارهای شناخته شده آموزش دید. و کمپلکس های چند پروتئینی بسیار کمتری نسبت به تک پروتئین ها به صورت تجربی حل شده اند.
انگل مالاریا ( پلاسمودیوم فالسیپاروم )
به گامت های نر و ماده انگل اجازه می دهد تا با هم ترکیب شوند. به عنوان یک واکسن بالقوه در حال توسعه است.

Forman-Kay پروتئین هایی را مطالعه می کند که از محدود شدن به شکل خاصی خودداری می کنند. این پروتئین‌های ذاتاً بی‌نظم معمولاً مانند نودل‌های مرطوب فلاپی هستند ( SN: 2/9/13، ص 26 ). برخی از آنها زمانی که با پروتئین ها یا مولکول های دیگر برهمکنش می کنند به شکل های تعریف شده تا می شوند. و هنگامی که با پروتئین‌ها یا مولکول‌های مختلف جفت می‌شوند تا کارهای مختلفی را انجام دهند، می‌توانند به شکل‌های جدید تا شوند.
این تیم در یک مطالعه مقدماتی که در ماه فوریه در سایت bioRxiv.org منتشر شد، گزارش داد که اشکال پیش‌بینی‌شده AlphaFold برای حدود 60 درصد از پروتئین‌های ویگلی که Forman-Kay و همکارانش بررسی کردند، به سطح اطمینان بالایی می‌رسند. اغلب این برنامه تغییر دهنده های شکل را به صورت پیچ چوب پنبه بلند به نام مارپیچ آلفا به تصویر می کشد.
گروه Forman-Kay پیش‌بینی‌های AlphaFold برای سه پروتئین بی‌نظم را با داده‌های تجربی مقایسه کردند. این تیم دریافتند ساختاری که هوش مصنوعی به پروتئینی به نام آلفا سینوکلئین اختصاص داده است، شبیه شکلی است که پروتئین هنگام تعامل با لیپیدها به خود می گیرد. اما این شکلی نیست که پروتئین همیشه به نظر می رسد.
برای پروتئین دیگری که فاکتور شروع ترجمه یوکاریوتی 4E-binding protein 2 نام دارد، AlphaFold ترکیبی از دو شکل پروتئین را هنگام کار با دو شریک مختلف پیش‌بینی کرد. فورمن کی و همکارانش می گویند که ساختار فرانکشتاین، که در موجودات واقعی وجود ندارد، می تواند محققان را در مورد نحوه عملکرد پروتئین گمراه کند.
انسان
به کنترل تولید پروتئین های دیگر کمک می کند و ممکن است در یادگیری و حافظه نقش داشته باشد. علیرغم اطمینان بالای AlphaFold (آبی) در پیش‌بینی‌هایش از ناحیه سیم پیچ پایینی و ساختار روبان درست بالای آن، این دو هرگز در یک زمان ظاهر نمی‌شوند.
AlphaFold همچنین ممکن است در پیش بینی های خود کمی بیش از حد سفت و سخت باشد. جین دایسون، زیست‌شناس ساختاری در موسسه تحقیقاتی اسکریپس در لاجولا، کالیفرنیا، می‌گوید: «ساختار ایستا همه چیز را در مورد نحوه عملکرد پروتئین به شما نمی‌گوید.» حتی پروتئین‌های منفرد با ساختارهای کاملاً مشخص در فضا منجمد نمی‌شوند. . برای مثال، آنزیم‌ها در هنگام انجام واکنش‌های شیمیایی دچار تغییرات کوچکی در شکل می‌شوند.
دایسون می‌گوید اگر از AlphaFold بخواهید ساختار یک آنزیم را پیش‌بینی کند، تصویر ثابتی را نشان می‌دهد که ممکن است بسیار شبیه آنچه دانشمندان با کریستالوگرافی اشعه ایکس تعیین کرده‌اند، داشته باشد. "اما [این] هیچ یک از ظرافت هایی را که در حال تغییر هستند به شما نشان نمی دهد که شرکای مختلف با آنزیم تعامل دارند."
Dyson می گوید: «دینامیک چیزی است که آقای AlphaFold نمی تواند به شما بدهد.
رندرهای رایانه‌ای به زیست‌شناسان برای حل مسائلی مانند نحوه تعامل دارو با پروتئین، یک شروع عالی می‌دهد. اما دانشمندان باید یک چیز را به خاطر بسپارند: گونن از UCLA می‌گوید: «اینها مدل‌هایی هستند»، نه ساختارهای رمزگشایی شده تجربی.
او از پیش‌بینی‌های پروتئین AlphaFold برای کمک به درک داده‌های تجربی استفاده می‌کند، اما نگران است که محققان پیش‌بینی‌های هوش مصنوعی را به عنوان انجیل بپذیرند. اگر این اتفاق بیفتد، «خطر این است که توجیه اینکه چرا باید یک ساختار آزمایشی را حل کنید، سخت‌تر و سخت‌تر می‌شود.» او می‌گوید که این امر می‌تواند منجر به کاهش بودجه، استعداد و سایر منابع برای انواع آزمایش‌های مورد نیاز برای بررسی کار رایانه و ایجاد زمینه‌های جدید شود.
زنبور عسل ( Apis mellifera )
به محافظت در برابر عفونت های باکتریایی کمک می کند.

بوآتا دانشکده پزشکی هاروارد خوشبین تر است. او فکر می‌کند که احتمالاً محققان نیازی به سرمایه‌گذاری منابع تجربی روی انواع پروتئین‌هایی ندارند که AlphaFold کار خوبی در پیش‌بینی آنها انجام می‌دهد، که باید به زیست‌شناسان ساختاری کمک کند تا زمان و پول خود را در کجا بگذارند.
بواتا موافق است: «پروتئین‌هایی وجود دارند که آلفا فولد هنوز برای آنها تلاش می‌کند. او می گوید پژوهشگران باید سرمایه خود را در آنجا خرج کنند. «شاید اگر داده‌های [تجربی] بیشتری برای آن پروتئین‌های چالش‌برانگیز تولید کنیم، می‌توانیم از آن‌ها برای بازآموزی یک سیستم هوش مصنوعی دیگر استفاده کنیم» که می‌تواند حتی پیش‌بینی‌های بهتری انجام دهد.
او و همکارانش قبلاً AlphaFold را مهندسی معکوس کرده‌اند تا نسخه‌ای به نام OpenFold بسازند که محققان می‌توانند آن‌ها را برای حل مشکلات دیگر، مانند مجتمع‌های پروتئینی مهلک اما مهم آموزش دهند.
مقادیر انبوه DNA تولید شده توسط پروژه ژنوم انسانی طیف وسیعی از اکتشافات بیولوژیکی را ممکن ساخته و زمینه های جدیدی از تحقیقات را گشوده است ( SN: 2/12/22, p. 22 ). بواتا می‌گوید داشتن اطلاعات ساختاری در مورد 200 میلیون پروتئین می‌تواند به همین شکل انقلابی باشد.
او می‌گوید در آینده، به لطف AlphaFold و هوش مصنوعی آن، «ما حتی نمی‌دانیم چه نوع سؤالاتی ممکن است بپرسیم».
سوالات یا نظراتی در مورد این مقاله دارید؟ به ما در feedback@sciencenews.org ایمیل بزنید
نسخه ای از این مقاله در شماره 24 سپتامبر 2022 Science News ظاهر می شود.
DeepMind و EMBL-EBI. AlphaFold ساختار تقریباً هر پروتئین فهرست شده ای را که برای علم شناخته شده است پیش بینی می کند . منتشر شده در 28 ژوئیه 2022.
S. Mosalaganti و همکاران . پیش‌بینی ساختار مبتنی بر هوش مصنوعی، تجزیه و تحلیل ساختاری یکپارچه منافذ هسته‌ای انسان را تقویت می‌کند. علم . جلد 376، 10 ژوئن 2022، ص. 6598. doi:10.1126/science.abm9506.
K.-T. کو و همکاران ساختار واکسن کاندید مالاریا Pfs48/45 و شناسایی آن با آنتی بادی های مسدود کننده انتقال . bioRxiv.org. 25 مه 2022. doi:10.1101/2022.05.24.493318.
تی آر آلدرسون و همکاران شناسایی سیستماتیک نواحی آشفته ذاتی به طور مشروط چین خورده توسط AlphaFold2 . bioRxiv.org. 18 فوریه 2022.
doi:10.1101/2022.02.18.481080.
جی. جامپر و همکاران . پیش بینی ساختار پروتئین بسیار دقیق با AlphaFold . طبیعت . جلد 596، 15 جولای 2021، ص. 583. doi:10.1038/s41586-021-03819-2.
M. Baek و همکاران . پیش‌بینی دقیق ساختارها و برهمکنش‌های پروتئین با استفاده از یک شبکه عصبی سه مسیره . علم . منتشر شده به صورت آنلاین در 15 جولای 2021. doi: 10.1126/science.abj8754.
تینا حسمن سائی نویسنده ارشد کارکنان و گزارش هایی در مورد زیست شناسی مولکولی است. او دکتری دارد. در ژنتیک مولکولی از دانشگاه واشنگتن در سنت لوئیس و مدرک کارشناسی ارشد در روزنامه نگاری علمی از دانشگاه بوستون.
Science News در سال 1921 به عنوان یک منبع مستقل و غیرانتفاعی اطلاعات دقیق در مورد آخرین اخبار علم، پزشکی و فناوری تاسیس شد. امروز، ماموریت ما یکسان است: توانمندسازی مردم برای ارزیابی اخبار و دنیای اطرافشان. این توسط Society for Science منتشر شده است، یک سازمان غیرانتفاعی عضویت 501(c)(3) که به مشارکت عمومی در تحقیقات علمی و آموزش اختصاص دارد (EIN 53-0196483).
© Society for Science & the Public 2000–2022. تمامی حقوق محفوظ است.
مشترکین، آدرس ایمیل خود را برای دسترسی کامل به آرشیو اخبار علمی و نسخه های دیجیتال وارد کنید.
مشترک نیستید؟
الان یکی شو

source