Предсказание новых сайтов N -ацетилирования в протеоме человека на основе молекулярных дескрипторов множественных атомных окрестностей

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Nε-ацетилирование лизина относится к общераспространенным процессам посттрансляционной модификации белка. В результате реакции между ε-аминогруппой боковой цепи лизина и активированным ацетилом образуется амидная связь, что приводит к изменению заряда белка в области сайта модификации. Интерес к изучению таких сайтов объясняется влиянием Nε-ацетилирования остатков лизина на регуляцию клеточной активности, нарушение которой может приводить к возникновению патологических состояний. Кроме того, предсказание сайтов Nε-ацетилирования остатка лизина служит инструментом при планировании эксперимента в современной протеомике, поскольку наличие прогноза позволяет упростить выбор стратегии протеолиза, интерпретацию спорных масс-спектров и подбор протеотипических пептидов. В работе представлен новый подход к предсказанию сайтов Nε-ацетилирования остатков лизина в белках человека с помощью методов машинного обучения. Особенностью подхода является использование структурных формул пептидов, содержащих потенциальный сайт Nε-ацетилирования, и их описание в виде дескрипторов многоуровневых атомных окрестностей (Multilevel Neighborhoods of Atoms, MNA). Такие дескрипторы рекурсивно генерируются для каждого атома молекулы. Дескриптором нулевого уровня считается сам атом, первого уровня – сам атом, а также все атомы, расположенные через одну связь от него, и так далее. Классификационные модели для предсказания сайтов Nε-ацетилирования остатков лизина были созданы с помощью разработанной ранее программы MultiPASS на основе анализа более чем 23 000 сайтов из базы данных PhosphoSitePlus. Лучшая модель была получена при длине пептида 35 аминокислотных остатков и использовании 9 уровня MNA-дескрипторов. При пятикратной кросс-валидации показатели чувствительности, специфичности и ROC-AUC разработанной модели составили 0.71, 0.74 и 0.82. Модель позволила выявить 1 136 ранее неизвестных потенциальных сайтов в 418 белках референсного протеома человека при пороге разделения классов, выраженном в виде разности вероятностей принадлежности сайта к положительному (Pa) и отрицательному (Pi) классам, (Pa – Pi) ≥ 0.7. Полученные данные могут служить основой для дальнейших протеомных исследований, направленных на идентификацию и функциональную аннотацию новых сайтов Nε-ацетилирования лизина в белках человека.

Об авторах

Н. В. Лебедев

Российский национальный исследовательский медицинский университет им. Н.И. Пирогова

Email: lebedev_nv@rsmu.ru
Москва, 117997 Россия

Д. А. Филимонов

Научно-исследовательский институт биомедицинской химии им. В.Н. Ореховича

Москва, 119121 Россия

В. В. Поройков

Научно-исследовательский институт биомедицинской химии им. В.Н. Ореховича

Москва, 119121 Россия

А. А. Лагунин

Российский национальный исследовательский медицинский университет им. Н.И. Пирогова; Научно-исследовательский институт биомедицинской химии им. В.Н. Ореховича

Москва, 117997 Россия; Москва, 119121 Россия

Список литературы

  1. Jensen O.N. (2006) Interpreting the protein language using proteomics. Nat. Rev. Mol. Cell Biol. 7, 391–403.
  2. Li Z., Li S., Luo M., Jhong J.H., Li W., Yao L., Pang Y., Wang Z., Wang R., Ma R., Yu J., Huang Y., Zhu X., Cheng Q., Feng H., Zhang J., Wang C., Hsu J.B., Chang W.C., Wei F.X., Huang H.D., Lee T.Y. (2022) dbPTM in 2022: an updated database for exploring regulatory networks and functional associations of protein post-translational modifications. Nucleic Acids Res. 50, D471–D479.
  3. Ree R., Varland S., Arnesen T. (2018) Spotlight on protein N-terminal acetylation. Exp. Mol. Med. 50, 1–13.
  4. Narita T., Weinert B.T., Choudhary C. (2019) Functions and mechanisms of non-histone protein acetylation. Nat. Rev. Mol. Cell Biol. 20, 156–174.
  5. Shvedunova M., Akhtar A. (2022) Modulation of cellular processes by histone and non-histone protein acetylation. Nat. Rev. Mol. Cell Biol. 23, 329–349.
  6. Changjun Mu, Heng Liu, Guo-Chang Zheng (2007) Модификации и варианты гистонов: их роль в организации хроматина. Молекуляр. биология. 41, 395–407.
  7. Lei Z., Song X., Zheng X., Wang Y., Wang Y., Wu Z., Fan T., Dong S., Cao H., Zhao Y., Xia Z., Gao L., Shang Q., Mei S. (2024) Identification of two novel heterozygous variants of SMC3 with Cornelia de Lange syndrome. Mol. Genet. Genomic Med. 12, e2447.
  8. Pasqualucci L., Dominguez‒Sola D., Chiarenza A., Fabbri G., Grunn A., Trifonov V., Kasper L.H., Lerach S., Tang H., Ma J., Rossi D., Chadburn A., Murty V.V., Mullighan C.G., Gaidano G., Rabadan R., Brindle P.K., Dalla-Favera R. (2011) Inactivating mutations of acetyltransferase genes in B-cell lymphoma. Nature. 471, 189–195.
  9. You L., Nie J., Sun W.J., Zheng Z.Q., Yang X.J. (2012) Lysine acetylation: enzymes, bromodomains and links to different diseases. Essays Biochem. 52, 1–12.
  10. Park E., Kim Y., Ryu H., Kowall N.W., Lee J., Ryu H. (2014) Epigenetic mechanisms of Rubinstein‒Taybi syndrome. Neuromolecular Med. 16, 16–24.
  11. Xia Z., Kon N., Gu A.P., Tavana O., Gu W. (2022) Deciphering the acetylation code of p53 in transcription regulation and tumor suppression. Oncogene. 41, 3039–3050.
  12. Basith S., Chang H.J., Nithiyanandam S., Shin T.H., Manavalan B., Lee G. (2022) Recent trends on the development of machine learning approaches for the prediction of lysine acetylation sites. Curr. Med. Chem. 29, 235–250.
  13. Hornbeck P.V., Kornhauser J.M., Latham V., Murray B., Nandhikonda V., Nord A., Skrzypek E., Wheeler T., Zhang B., Gnad F. (2019) 15 years of PhosphoSitePlus(R): integrating post-translationally modified sites, disease variants and isoforms. Nucleic Acids Res. 47, D433–D441.
  14. Svinkina T., Gu H., Silva J.C., Mertins P., Qiao J., Fereshetian S., Jaffe J.D., Kuhn E., Udeshi N.D., Carr S.A. (2015) Deep, quantitative coverage of the lysine acetylome using novel anti-acetyl-lysine antibodies and an optimized proteomic workflow. Mol. Cell Proteomics. 14, 2429–2440.
  15. O’Shea J.P., Chou M.F., Quader S.A., Ryan J.K., Church G.M., Schwartz D. (2013) pLogo: a probabilistic approach to visualizing sequence motifs. Nat. Methods. 10, 1211–1212.
  16. Dalby A., Nourse J.G., Hounshell W.D., Gushurst A.K.I., Grier D.L., Leland B.A., Laufer J. (1992) Description of several chemical structure file formats used by computer programs developed at Molecular Design Limited. J. Chem. Inform. Comp. Sci. 32, 244–255.
  17. Филимонов Д.А., Дружиловский Д.С., Лагунин А.А., Глориозова Т.А., Рудик А.В., Дмитриев А.В., Погодин П.В., Поройков В.В. (2018) Компьютерное прогнозирование спектров биологической активности химических соединений: возможности и ограничения. Biomedical Chemistry: Research and Methods. 1(1), e00004. doi: 10.18097/BMCRM00004
  18. Smirnov A.S., Rudik A.V., Filimonov D.A., Lagunin A.A. (2023) TCR-Pred: a new web-application for prediction of epitope and MHC specificity for CDR3 TCR sequences using molecular fragment descriptors. Immunology. 169, 447–453.
  19. Zadorozhny A., Smirnov A., Filimonov D., Lagunin A. (2023) Prediction of pathogenic single amino acid substitutions using molecular fragment descriptors. Bioinformatics. 39(8), btad484.
  20. Zhuravleva S.I., Zadorozhny A.D., Shilov B.V., Lagunin A.A. (2023) Prediction of amino acid substitutions in ABL1 protein leading to tumor drug resistance based on “structure‒property” relationship classification models. Life (Basel). 13(9), 1807.
  21. Карасев Д.А., Савосина П.И., Соболев Б.Н., Филимонов Д.А., Лагунин А.А. (2017) Использование молекулярных дескрипторов для распознавания сайтов фосфорилирования в аминокислотных последовательностях. Биомед. химия. 63, 423–427.
  22. Chang A., Jeske L., Ulbrich S., Hofmann J., Koblitz J., Schomburg I., Neumann‒Schaal M., Jahn D., Schomburg D. (2021) BRENDA, the ELIXIR core data resource in 2021: new developments and updates. Nucleic Acids Res. 49, D498–D508.
  23. Mistry J., Chuguransky S., Williams L., Qureshi M., Salazar G.A., Sonnhammer E.L.L., Tosatto S.C.E., Paladin L., Raj S., Richardson L.J., Finn R.D., Bateman A. (2021) Pfam: the protein families database in 2021. Nucleic Acids Res. 49, D412–D419.
  24. Harris M.A., Clark J., Ireland A., Lomax J., Ashbu- rner M., Foulger R., Eilbeck K., Lewis S., Marshall B., Mungall C., Richter J., Rubin G.M., Blake J.A., Bult C., Dolan M., Drabkin H., Eppig J.T., Hill D.P., Ni L., Ringwald M., Balakrishnan R., Cherry J.M., Christie K.R., Costanzo M.C., Dwight S.S., Engel S., Fisk D.G., Hirschman J.E., Hong E.L., Nash R.S., Sethuraman A., Theesfeld C.L., Botstein D., Dolinski K., Feierbach B., Berardini T., Mundodi S., Rhee S.Y., Apweiler R., Barrell D., Camon E., Dimmer E., Lee V., Chisholm R., Gaudet P., Kibbe W., Kishore R., Schwarz E.M., Sternberg P., Gwinn M., Hannick L., Wortman J., Berriman M., Wood V., de la Cruz N., Tonellato P., Jaiswal P., Seigfried T., White R., Gene Ontology Consortium (2004) The Gene Ontology (GO) database and informatics resource. Nucleic Acids Res. 32, D258–261.
  25. UniProt Consortium (2023) UniProt: the Universal Protein Knowledgebase in 2023. Nucleic Acids Res. 51, D523–D531.
  26. Yu G. (2024) Thirteen years of clusterProfiler. Innovation (Camb.). 5, 100722.
  27. Lovci M.T., Bengtson M.H., Massirer K.B. (2016) Post-translational modifications and RNA-binding proteins. Adv. Exp. Med. Biol. 907, 297–317.
  28. Chen P.J., Huang Y.S. (2012) CPEB2–eEF2 interaction impedes HIF-1α RNA translation. EMBO J. 31, 959–971.
  29. Jacob A.L., Lund J., Martinez P., Hedin L. (2001) Acetylation of steroidogenic factor 1 protein regulates its transcriptional activity and recruits the coactivator GCN5. J. Biol. Chem. 276, 37659–37664.
  30. Shang S., Liu J., Hua F. (2022) Protein acylation: mechanisms, biological functions and therapeutic targets. Signal Transduct. Target. Ther. 7, 396.
  31. Chu C.W., Hou F., Zhang J., Phu L., Loktev A.V., Kirkpatrick D.S., Jackson P.K., Zhao Y., Zou H. (2011) A novel acetylation of β-tubulin by San modulates microtubule polymerization via down-regulating tubulin incorporation. Mol. Biol. Cell. 22, 448–456.
  32. Thygesen C., Boll I., Finsen B., Modzel M., Larsen M.R. (2018) Characterizing disease-associated changes in post-translational modifications by mass spectrometry. Expert Rev. Proteomics. 15, 245–258.
  33. Landrum M.J., Lee J.M., Benson M., Brown G., Chao C., Chitipiralla S., Gu B., Hart J., Hoffman D., Hoover J., Jang W., Katz K., Ovetsky M., Riley G., Sethi A., Tully R., Villamarin-Salomon R., Rubinstein W., Maglott D.R. (2016) ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44, D862–D868.
  34. Rüegsegger L., Schanz U., Seipel K., Pabst T., Schwegler J., Schmidt E., Schmidt A. (2022) Emberger syndrome – a family history over 3 generations. Healthbook TIMES Oncology. Hematology. 14, 34–41.
  35. Bresnick E.H., Jung M.M., Katsumura K.R. (2020) Human GATA2 mutations and hematologic disease: how many paths to pathogenesis? Blood Adv. 4, 4584–4592.
  36. Su M.G., Weng J.T., Hsu J.B., Huang K.Y., Chi Y.H., Lee T.Y. (2017) Investigation and identification of functional post-translational modification sites associated with drug binding and protein–protein interactions. BMC Syst. Biol. 11, 132.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Российская академия наук, 2025

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».