Para saintis menggunakan AI untuk mengimpikan protein baharu yang revolusioner

Alat kecerdasan buatan membantu saintis menghasilkan protein yang berbentuk tidak seperti apa-apa dalam alam semula jadi.Kredit: Ian C Haydon/Institut UW untuk Reka Bentuk Protein

Pada bulan Jun, pengawal selia Korea Selatan membenarkan ubat pertama, vaksin COVID, dibuat daripada protein baru yang direka oleh manusia. Vaksin itu berdasarkan ‘nanopartikel’ protein sfera yang dicipta oleh penyelidik hampir sedekad lalu, melalui proses percubaan dan kesilapan yang intensif buruh1.

Kini, terima kasih kepada kemajuan besar dalam kecerdasan buatan (AI), sebuah pasukan yang diketuai oleh David Baker, ahli biokimia di Universiti Washington (UW) di Seattle, melaporkan dalam Sains2,3 bahawa ia boleh mereka bentuk molekul sedemikian dalam beberapa saat dan bukannya bulan.

Usaha sedemikian adalah sebahagian daripada perubahan laut saintifik, kerana alat AI seperti perisian ramalan struktur protein DeepMind AlphaFold diterima pakai oleh saintis hayat. Pada bulan Julai, DeepMind mendedahkan bahawa versi terkini AlphaFold telah struktur yang diramalkan untuk setiap protein yang diketahui sains. Dan beberapa bulan kebelakangan ini telah melihat pertumbuhan pesat dalam alatan AI — beberapa berdasarkan AlphaFold — yang boleh dengan cepat memimpikan protein baharu sepenuhnya. Sebelum ini, ini merupakan usaha yang bersungguh-sungguh dengan kadar kegagalan yang tinggi.

“Sejak AlphaFold, terdapat perubahan dalam cara kami bekerja dengan reka bentuk protein,” kata Noelia Ferruz, ahli biologi pengiraan di Universiti Girona, Sepanyol. “Kami menyaksikan masa yang sangat menggembirakan.”

Kebanyakan usaha tertumpu pada alat yang boleh membantu untuk membuat protein asli, berbentuk tidak seperti apa-apa dalam alam semula jadi, tanpa banyak fokus pada apa yang boleh dilakukan oleh molekul ini. Tetapi penyelidik – dan semakin banyak syarikat yang menggunakan AI untuk reka bentuk protein – ingin mereka bentuk protein yang boleh melakukan perkara yang berguna, daripada membersihkan sisa toksik kepada merawat penyakit. Antara syarikat yang berusaha ke arah matlamat ini ialah DeepMind di London dan Meta (dahulunya Facebook) di Menlo Park, California.

“Kaedahnya sudah benar-benar berkuasa. Mereka akan menjadi lebih berkuasa,” kata Baker. “Persoalannya ialah masalah apa yang akan anda selesaikan dengan mereka.”

Dari awal

Makmal Baker telah menghabiskan tiga dekad yang lalu untuk membuat protein baru. Perisian yang dipanggil Rosetta, yang makmalnya mula dibangunkan pada 1990-an, membahagikan proses itu kepada beberapa langkah. Pada mulanya, penyelidik mencipta bentuk untuk protein baru – selalunya dengan menggabungkan kepingan protein lain – dan perisian itu menyimpulkan urutan asid amino yang sepadan dengan bentuk ini.

Tetapi protein ‘draf pertama’ ini jarang dilipat ke dalam bentuk yang diingini apabila dibuat di makmal, dan sebaliknya tersekat dalam pengesahan yang berbeza. Oleh itu, langkah lain diperlukan untuk mengubah urutan protein supaya ia hanya dilipat menjadi satu struktur yang dikehendaki. Langkah ini, yang melibatkan simulasi semua cara urutan yang berbeza mungkin dilipat, adalah mahal dari segi pengiraan, kata Sergey Ovchinnikov, ahli biologi evolusi di Universiti Harvard di Cambridge, Massachusetts, yang pernah bekerja di makmal Baker. “Anda benar-benar akan mempunyai, seperti, 10,000 komputer berjalan selama berminggu-minggu melakukan ini.”

Dengan mengubah suai AlphaFold dan program AI yang lain, langkah yang memakan masa itu menjadi serta-merta, kata Ovchinnikov. Dalam satu pendekatan yang dibangunkan oleh pasukan Baker, dipanggil halusinasi, penyelidik menyuap urutan asid amino rawak ke dalam rangkaian ramalan struktur; ini mengubah struktur supaya ia menjadi lebih seperti protein, seperti yang dinilai oleh ramalan rangkaian. Dalam kertas kerja 2021, pasukan Baker mencipta lebih daripada 100 protein kecil ‘halusinasi’ dalam makmal dan menemui tanda bahawa kira-kira satu perlima menyerupai bentuk yang diramalkan.4

AlphaFold, dan alat serupa yang dibangunkan oleh makmal Baker yang dipanggil RoseTTAFold, telah dilatih untuk meramalkan struktur rantai protein individu. Tetapi penyelidik tidak lama lagi mendapati bahawa rangkaian sedemikian juga boleh memodelkan himpunan pelbagai protein yang berinteraksi. Atas dasar ini, Baker dan pasukannya yakin mereka boleh mengkhayalkan protein yang akan terhimpun sendiri menjadi nanozarah yang berbeza bentuk dan saiz; ini akan terdiri daripada banyak salinan protein tunggal dan akan serupa dengan yang berasaskan vaksin COVID-19.

Cara mereka bentuk protein: infografik yang menunjukkan empat teknik untuk mereka bentuk struktur atau jujukan protein baharu menggunakan AI.

Nik Spencer/alam semula jadi; Sumber: Diadaptasi daripada N. Ferruz et al. Pracetak di bioRxiv (2022); dan J. Wang et al. Sains 377, 387–394 (2022).

Tetapi apabila mereka mengarahkan mikroorganisma untuk membuat ciptaan mereka di makmal, tiada satu pun daripada 150 reka bentuk yang berfungsi. “Mereka tidak berlipat sama sekali: mereka hanya bersenjata di bahagian bawah tabung uji,” kata Baker.

Pada masa yang sama, seorang lagi penyelidik dalam makmal, saintis pembelajaran mesin Justas Dauparas, sedang membangunkan alat pembelajaran mendalam untuk menangani masalah yang dikenali sebagai masalah lipatan songsang — menentukan urutan protein yang sepadan dengan bentuk keseluruhan protein tertentu.3. Rangkaian yang dipanggil ProteinMPNN, boleh bertindak sebagai ‘semak ejaan’ untuk protein pereka yang dicipta menggunakan AlphaFold dan alat lain, kata Ovchinnikov, dengan mengubah urutan sambil mengekalkan bentuk keseluruhan molekul.

Apabila Baker dan pasukannya menggunakan rangkaian kedua ini pada nanopartikel protein halusinasi mereka, ia mempunyai kejayaan yang lebih besar dalam membuat molekul secara eksperimen. Para penyelidik menentukan struktur 30 protein baru mereka menggunakan mikroskop cryo-elektron dan teknik eksperimen lain, dan 27 daripadanya sepadan dengan reka bentuk yang diterajui AI2. Ciptaan pasukan termasuk cincin gergasi dengan simetri kompleks, tidak seperti apa-apa yang terdapat di alam semula jadi. Secara teori, pendekatan itu boleh digunakan untuk mereka bentuk nanopartikel yang sepadan dengan hampir semua bentuk simetri, kata Lukas Milles, ahli biofizik yang mengetuai usaha itu. “Sungguh menggembirakan untuk melihat apa yang boleh dilakukan oleh rangkaian ini.”

Revolusi pembelajaran mendalam

Alat pembelajaran mendalam seperti proteinMPNN telah menjadi pengubah permainan dalam reka bentuk protein, kata Arne Elofsson, ahli biologi pengiraan di Universiti Stockholm. “Anda menarik protein anda, tekan butang, dan anda mendapat sesuatu yang satu dalam sepuluh kali berfungsi.” Kadar kejayaan yang lebih tinggi boleh dicapai dengan menggabungkan pelbagai rangkaian saraf untuk menangani bahagian proses reka bentuk yang berbeza, seperti yang dilakukan oleh pasukan Baker dalam mereka bentuk nanozarah. “Kini kami mempunyai kawalan penuh ke atas bentuk protein,” kata Ovchinnikov.

Baker’s bukan satu-satunya makmal yang menggunakan AI pada reka bentuk protein. Dalam kertas ulasan yang disiarkan ke bioRxiv bulan ini, Ferruz dan rakan-rakannya mengira lebih daripada 40 alat reka bentuk protein AI yang telah dibangunkan dalam beberapa tahun kebelakangan ini, menggunakan pelbagai pendekatan5 (lihat ‘Cara mereka bentuk protein’).

Kebanyakan alat ini, termasuk proteinMPNN, menangani masalah lipatan songsang: mereka menentukan urutan yang sepadan dengan struktur tertentu, selalunya menggunakan pendekatan yang dipinjam daripada alat pengecaman imej. Beberapa yang lain adalah berdasarkan seni bina yang serupa dengan rangkaian neural bahasa seperti GPT-3, yang menghasilkan teks seperti manusia; tetapi, sebaliknya, alat itu mampu menghasilkan urutan protein baru. “Rangkaian ini dapat ‘bercakap’ protein,” kata Ferruz, yang telah membangunkan satu rangkaian sedemikian6.

Dengan begitu banyak alat reka bentuk protein yang tersedia, tidak selalu jelas cara terbaik untuk membandingkannya, kata Chloe Hsu, penyelidik pembelajaran mesin di University of California, Berkeley, yang membangunkan rangkaian lipatan songsang dengan penyelidik dari Meta7.

Animasi empat struktur protein yang diramalkan oleh sistem AI Alphafold

Empat contoh protein ‘halusinasi’. Dalam setiap kes, AlphaFold dipersembahkan dengan jujukan asid amino rawak, meramalkan struktur dan menukar jujukan sehingga perisian dengan yakin meramalkan bahawa ia akan dilipat menjadi protein dengan bentuk 3D yang jelas. Warna menunjukkan keyakinan ramalan (dari merah untuk keyakinan yang sangat rendah, melalui kuning dan biru muda kepada biru tua untuk keyakinan yang sangat tinggi). Bingkai awal telah diperlahankan untuk kejelasan. Kredit: Sergey Ovchinnikov

Banyak pasukan mengukur keupayaan rangkaian mereka untuk menentukan dengan tepat urutan protein sedia ada daripada strukturnya. Tetapi ini tidak terpakai untuk semua kaedah, dan tidak jelas bagaimana metrik ini, yang dikenali sebagai kadar pemulihan, digunakan untuk reka bentuk protein baru, kata saintis. Ferruz ingin melihat pertandingan reka bentuk protein, sama dengan percubaan Penilaian Kritikal Ramalan Struktur protein (CASP) dwitahunan, di mana AlphaFold pertama kali menunjukkan keunggulannya melalui rangkaian lain. “Ia mimpi. Sesuatu seperti CASP benar-benar akan menggerakkan bidang ke hadapan, “katanya.

Ke makmal basah

Baker dan rakan-rakannya bertegas bahawa membuat protein baru dalam makmal adalah ujian muktamad kaedah mereka. Kegagalan awal mereka membuat himpunan protein halusinasi menunjukkan ini. “AlphaFold menyangka ia adalah protein yang hebat, tetapi ia jelas tidak berfungsi di makmal basah,” kata Basile Wicky, ahli biofizik di makmal Baker yang mengetuai usaha itu, bersama-sama dengan Baker, Milles dan ahli biokimia UW Alexis Courbet.

Tetapi tidak semua saintis yang membangunkan alat AI untuk reka bentuk protein mempunyai akses mudah kepada persediaan eksperimen, kata Jinbo Xu, ahli biologi pengiraan di Toyota Technological Institute di Chicago di Illinois. Mencari makmal untuk bekerjasama boleh mengambil masa, jadi Xu sedang menubuhkan makmal basahnya sendiri untuk menguji ciptaan pasukannya.

Eksperimen juga akan menjadi penting apabila ia datang untuk mereka bentuk protein dengan tugas tertentu dalam fikiran, kata Baker. Pada bulan Julai, pasukannya menerangkan sepasang kaedah AI yang membolehkan penyelidik membenamkan urutan atau struktur tertentu dalam protein baru8. Mereka menggunakan pendekatan ini untuk mereka bentuk enzim yang memangkinkan tindak balas tertentu; protein yang mampu mengikat molekul lain; dan protein yang boleh digunakan dalam vaksin terhadap virus pernafasan yang merupakan punca utama kemasukan bayi ke hospital.

Tahun lepas, DeepMind melancarkan syarikat spin-off yang dipanggil Isomorphic Labs di London yang berhasrat untuk menggunakan alat AI seperti AlphaFold untuk penemuan dadah. Ketua eksekutif DeepMind, Demis Hassabis, berkata bahawa dia melihat reka bentuk protein sebagai aplikasi yang jelas dan menjanjikan untuk teknologi pembelajaran mendalam, dan untuk AlphaFold khususnya. “Kami bekerja agak banyak dalam ruang reka bentuk protein. Hari ini agak awal.”

We would love to say thanks to the writer of this article for this awesome content

Para saintis menggunakan AI untuk mengimpikan protein baharu yang revolusioner


Take a look at our social media accounts along with other pages related to themhttps://paw6.info/related-pages/