Анализ покрытия Alu-повторов выровненнымигеномными прочтениями

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Alu-повторы занимают значительную часть генома человека и оказывают большое влияние на процессы, связанные с поддержанием целостности генома. Одним из основных способов изучения вариабельности в геноме, включая Alu-повторы, является геномное секвенирование и последующее выравнивание полученных прочтений на последовательность референсного генома. Ключевой характеристикой выравнивания является глубина покрытия участков референсного генома размещенными на них прочтениями. В данной работе мы предлагаем новый метод анализа покрытия в регионах Alu-повторов и примыкающих к ним геномных регионов прочтениями из набора данных полногеномного секвенирования и исследуем распределение средних величин покрытия в двух указанных разновидностях геномных регионов.

Об авторах

Г. С Тамазян

Институт трансляционной биомедицины Санкт-Петербургского государственного университета

Санкт-Петербург, Россия

А. А Канапин

Институт трансляционной биомедицины Санкт-Петербургского государственного университета

Санкт-Петербург, Россия

А. А Самсонова

Институт трансляционной биомедицины Санкт-Петербургского государственного университета

Email: a.samsonova@spbu.ru
Санкт-Петербург, Россия

Список литературы

  1. M. A. Batzer and P. L. Deininger, Nat. Rev. Genet., 3 (5), 370 (2002).
  2. F. Hormozdiari, M. K. Konkel, J. Prado-Martinez. et al., Proc. Natl. Acad. Sci. USA, 110 (33), 13457 (2013).
  3. E. S. Lander, L. M. Linton, B. Birren, et al., Nature, 409 (6822), 860 (2001).
  4. J. C. Venter, M. D. Adams, E. W. Myers, et al., Science, 291 (5507), 1304 (2001).
  5. F. C. Chen, Y. Z. Chen, and T. J. Chuang, Bioinformatics, 25 (11), 1419 (2009).
  6. J. M. Chen, E. Masson, C. Le Marechal, et al., Cytogenet Genome Res, 123 (1-4), 102 (2008).
  7. P. Deininger, Genome Biol., 12 (12), 236 (2011).
  8. L. M. Payer, J. P. Steranka, W. R. Yang, et al., Proc. Natl. Acad. Sci. USA, 114 (20), E3984 (2017).
  9. S. Shen, L. Lin, J. J. Cai, et al., Proc. Natl. Acad. Sci. USA, 108 (7), 2837 (2011).
  10. I. Vorechovsky, Hum, Genet., 127 (2), 135 (2010).
  11. S. Pavlov, V. V. Gursky, M. Samsonova, et al., Life (Basel), 11 (11), 1209 (2021). doi: 10.3390/life11111209
  12. A. Smit, R. Hubley, and P. Green, RepeatMasker Open-4.0 (accessed 03/18/2022).
  13. H. Mao and H. Wang, Bioinformatics, 33 (5), 743 (2017).
  14. S. E. Staton and J. M. Burke, Bioinformatics, 31 (11), 1827 (2015).
  15. H. Li and R. Durbin, Bioinformatics, 25 (14), 1754 (2009).
  16. S. Fairley, E. Lowy-Gallego, E. Perry, et al., Nucl. Acids Res., 48 (D1), D941 (2020).
  17. H. Li, B. Handsaker, A. Wysoker, et al., Bioinformatics, 25 (16), 2078 (2009).
  18. J. K. Bonfield, J. Marshall, P. Danecek, et al., Gigascience, 10 (2), giab007 (2021). doi: 10.1093/giga-science/giab007
  19. G. Tamazian, N. Cherkasov, A. Kanapin, et al., in BGRS/SB-2022 (Novosibirsk, Russia, 2022), pp. 11211122.
  20. R Core Team, R: A Language and Environment for Statistical Computing (R Foundation for Statistical Computing, 2022).
  21. L. Scrucca, M. Fop, T. B. Murphy, et al., The R Journal, 8 (1), 289 (2016).
  22. Broad Institute, Picard: A set of command line tools for manipulating high-throughput sequencing data (2022).
  23. A. R. Quinlan and I. M. Hall, Bioinformatics, 26 (6), 841 (2010).
  24. P. Danecek, J. K. Bonfield, J. Liddle, et al., Gigascience, 10 (2), giab008 (2021). doi: 10.1093/giga-science/giab008

© Российская академия наук, 2023

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах