ГЕНЕТИЧЕСКИЕ ТЕХНОЛОГИИ И МЕТОДЫ КОМБИНАТОРНОЙ ХИМИИ И БИОЛОГИИ В ИССЛЕДОВАНИИ БИОЛОГИЧЕСКИХ ПРОЦЕССОВ

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Рассмотрены основные достижения в области прикладного использования алгоритмов больших языковых моделей (БЯМ) для решения современных прикладных задач структурной биоинформатики. В частности, рассмотрены конкретные успешные примеры применения БЯМ для предсказания потенциальных эпитопов на поверхности антигена, возможности конкретного CDRH3-фрагмента узнавать выбранный антиген и предсказания кросс-реактивности выбранных антител. Описаны частные случаи применения БЯМ для поиска и отбора связывающих антител против белка гемагглютинина вируса гриппа, предсказания эффекта точечных мутаций и повышения качества выравнивания белковых последовательностей. Также проанализированы основные недостатки современных алгоритмов БЯМ, связанные с интерпретацией весов модели, размером и структурой обучающей выборки и ресурсами, необходимыми для их обучения.

Об авторах

А. Г. Габибов

Государственный научный центр Российской Федерации Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук; Московский государственный университет им. М.В. Ломоносова

Москва, 117997 Россия; Москва, 119234 Россия

В. Д. Кнорре

Государственный научный центр Российской Федерации Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук

Email: vera.knorre@gmail.com
Москва, 117997 Россия

Я. В. Соловьев

Государственный научный центр Российской Федерации Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук

Москва, 117997 Россия

Список литературы

  1. Larionova T.D., Bastola S., Aksinina T.E. et al. Alternative RNA splicing modulates ribosomal composition and determines the spatial phenotype of glioblastoma cells // Nat. Cell Biol. 2022. V. 24. № 10. P. 1541–1557. https://doi.org/10.1038/s41556-022-00994-w
  2. Orlov E.E., Nesterenko A.M., Korotkova D.D. et al. Targeted search for scaling genes reveals matrixmetalloproteinase 3 as a scaler of the dorsal-ventral pattern in Xenopus laevis embryos // Dev. Cell. 2022. V. 57. № 1. P. 95–111. https://doi.org/10.1016/j.devecl.2021.11.021
  3. Wang Y., Ly H., Lei R. et al. An explainable language model for antibody specificity prediction using curated influenza hemagglutinin antibodies // Immunity. 2024. V. 57. № 10. P. 2453–2465. https://doi.org/10.1016/j.immuni.2024.07.022
  4. Mason D.M., Friedensohn S., Weber C.R. et al. Optimization of therapeutic antibodies by predicting antigen specificity from antibody sequence via deep learning // Nat. Biomed. Eng. 2021. V. 5. № 6. P. 600–612. https://doi.org/10.1038/s41551-021-00699-9
  5. Smirnov I.V., Golovin A.V., Chatziefthimiou S.D. Robotic OM/MM-driven maturation of antibody combining sites // Sci. Adv. 2016. V. 2. № 10. https://doi.org/10.1126/sciadv.1501695
  6. Robert P.A., Akbar R., Frank R. et al. Unconstrained generation of synthetic antibody-antigen structures to guide machine learning methodology for antibody specificity prediction // Nat. Comput. Sci. 2022. V. 2. № 12. P. 845–865. https://doi.org/10.1038/s43588-022-00372-4
  7. Greiff V., Menzel U., Milo E. et al. Systems analysis reveals high genetic and antigen-driven predetermination of antibody repertoires throughout B cell development // Cell Rep. 2017. V. 19. № 7. P. 1467–1478. https://doi.org/10.1016/j.celrep.2017.04.054
  8. Éliás S., Wrzodek C., Deane Ch.M. et al. Prediction of polyspecificity from antibody sequence data by machine learning // Front. Bioinform. 2024. V. 8. № 3. https://doi.org/10.3389/fbinf.2023.1286883
  9. Bravi B. Development and use of machine learning algorithms in vaccine target selection // NPJ Vaccines. 2024. V. 9. № 1. P. 15. https://doi.org/10.1038/s41541-023-00795-8
  10. Jumper J., Evans R., Pritzel A. et al. Highly accurate protein structure prediction with AlphaFold // Nature. 2021. V. 596. № 7873. P. 583–589. https://doi.org/10.1038/s41586-021-03819-2
  11. Kulikova A.V., Diaz D.J., Chen T. et al. Two sequence- and two structure-based ML models have learned different aspects of protein biochemistry // Sci. Rep. 2023. V. 13. № 1. P. 13280. https://doi.org/10.1038/s41598-023-40247-w
  12. Wang K., Zeng X., Zhou J. et al. BERT-TFBS: A novel BERT-based model for predicting transcription factor binding sites by transfer learning // Brief Bioinform. 2024. V. 25. № 3. https://doi.org/10.1093/bib/bbae195
  13. Abdullahi T., Singh R., Eickhoff C. Learning to make rare and complex diagnoses with generative AI assistance: Qualitative study of popular large language models // JMIR Med. Educ. 2024. V. 13. № 10. https://doi.org/10.2196/51391
  14. Lupo U., Sgarbossa D., Bitbol A.-F. Protein language models trained on multiple sequence alignments learn phylogenetic relationships // Nat. Commun. 2022. V. 13. № 1. P. 6298. https://doi.org/10.1038/s41467-022-34032-y
  15. Jumper J., Evans R., Pritzel A. et al. Highly accurate protein structure prediction with AlphaFold // Nature. 2021. V. 596. № 7873. P. 583–589. https://doi.org/10.1038/s41586-021-03819-2
  16. Kroll A., Ranjan S., Martin K.M. et al. A general model to predict small molecule substrates of enzymes based on machine and deep learning // Nat. Commun. 2023. V. 14. № 1. P. 2787. https://doi.org/10.1038/s41467-023-38347-2
  17. Clark T., Subramanian V., Jayaraman A. et al. Enhancing antibody affinity through experimental sampling of non-deleterious CDR mutations predicted by machine learning // Commun. Chem. 2023. V. 6. P. 244. https://doi.org/10.1038/s42004-023-01037-7
  18. Robert Ph.A., Akbar R., Frank R. et al. Unconstrained generation of synthetic antibody-antigen structures to guide machine learning methodology for antibody specificity prediction // Nat. Comput. Sci. 2022. V. 2. № 12. P. 845–865. https://doi.org/10.1038/s43588-022-00372-4
  19. Marinov T.M., Abu-Shmais A.A., Janke A.K., Georgiev I.S. Design of antigen-specific antibody CDRH3 sequences using AI and germline-based templates // bioRxiv [Preprint]. 2024. https://doi.org/10.1101/2024.032.586241
  20. Pisetsky D.S. Pathogenesis of autoimmune disease // Nat. Rev. Nephrol. 2023. V. 8. P. 509–524. https://doi.org/10.1038/s41581-023-00720-1
  21. Mason D.M., Friedensohn S., Weber C.R. et al. Optimization of therapeutic antibodies by predicting antigen specificity from antibody sequence via deep learning // Nat. Biomed. Eng. 2021. V. 5. № 6. P. 600–612. https://doi.org/10.1038/s41551-021-00699-9

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Российская академия наук, 2025

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».