Изучение формирования стабильных вторичных структур ДНК применительно к ДНК технологиям

«Изучение формирования стабильных вторичных структур ДНК применительно к ДНК технологиям»

ИРН AP08855353

Научные исследования в области естественных наук. Фундаментальные исследования в области биологии животных, растений и микроорганизмов.

Дата начала и завершения проекта: 01.10.2020-31.12.2022, 27 месяцев

Ключевые слова: ДНК структура, технологии детекции и амплификации ДНК, ДНК и РНК гибридизация, алгоритм машинного обучения, биоинформатическое программное обеспечение

 

Аннотация

ДНК-олигонуклеотиды являются важными компонентами большого числа технологий в молекулярной биологии, которые основаны на ДНК и РНК гибридизации. Такие экспериментальные методы, основанные на ДНК гибридизации, как мультиплексная полимеразная цепная реакция, микрочиповый анализ, мультиплексный анализ NanoString, таргетированное секвенирование нового поколения и подобные им подходы, требуют использования сложных смесей олигонуклеотидов (праймеров и зондов) в одной пробирке. Молекулы одноцепочечной ДНК также имеют тенденцию связываться с собой. Вероятность такого неспецифического связывания увеличивается со степенью сложности анализа. Кроме того, необходим пересмотр существующих подходов к разработке конкретных гибридизационных зондов и праймеров для существующих технологий детекции нуклеиновых кислот. Прежде всего, для таких технологии, как стандартная или количественная ПЦР с различными методами амплификации ДНК для обнаружения специфического ампликона с использованием гибридизационных зондов, а также и для изотермических методов амплификации ДНК, которые сочетают в себе множество вложенных праймеров и флуоресцентных зондов. Пересмотр необходим для того, чтобы точно определить температуры плавления как для комплементарных ДНК-дуплексов, так и ДНК-дуплексов с наличием не комплементарных оснований, посредством использования методов машинного обучения.

Основная цель проекта заключается в исследование стабильных вторичных структур нуклеиновых кислот на основе экспериментальных данных по ДНК/ДНК гибридизации для сложных смесей одноцепочечных ДНК, с использованием подхода машинного обучения. Разработка биоинформатических инструментов, реализующих подходы машинного обучения для расчета базовой термодинамики вторичных структур ДНК применительно к технологиям детекции и амплификации ДНК.

Разработанные нами алгоритмы позволят объяснить наблюдаемые артефакты в мега-мультиплексной ДНК-амплификации и предсказать термодинамические прогнозы относительно плавления дуплексов ДНК. Разрабатываемое программное обеспечение будет выявлять взаимодействия нуклеиновых кислот для разработки отдельных олигонуклеотидов и их смеси, которые характеризуются наиболее слабыми возможными перекрестными взаимодействиями. Будут проведены модельные эксперименты по гибридизации ДНК и определению температур плавления с использованием синтетических структур ДНК. Будут проведены исследования стабильных вторичных структур нуклеиновых кислот на основе экспериментальных данных по ДНК/ДНК дуплексам для сложных смесей одноцепочечных ДНК. Будут проведена разработка биоинформатических инструментов, реализующих подходы машинного обучения для расчета базовой термодинамики вторичных структур ДНК применительно к технологиям детекции и амплификации ДНК. Будут разработаны алгоритмы для разработки ПЦР праймеров, зондов, микрочипов, реализующих подходы машинного обучения. Онлайн приложения будут инсталлированы на сервере. Будет опубликовано не менее 3 статей в рецензируемых научных изданиях (Springer Nature, Cell Press, PLOS, PeerJ, MDPI, Oxford Press, Frontiers и Elsevier), входящих в Q1-Q3 квартили в базе Web of Science и имеющих процентиль по CiteScore в базе Scopus не менее 50.

Исследовательская группа

Руководитель проекта, Календарь Руслан Николаевич, Профессор (Биология), Доцент генетики (университет Хельсинки), Ведущий научный сотрудник Частного учреждения "National Laboratory Astana", Назарбаев Университет, кандидат биологических науки.

ORCID:  http://orcid.org/0000-0003-3986-2460

Scopus:  http://www.scopus.com/authid/detail.url?authorId=6602789279

Publons: https://publons.com/researcher/254291/ruslan-kalendar/

Данияров Асет Жанатович, младший научный сотрудник «National Laboratory Astana», молодой специалист в области биоинформатики и программирования на Python.

ORCID:  https://orcid.org/0000-0003-3886-718X

Publons: https://publons.com/researcher/1629505/asset-daniyarov/

Scopus:  https://www.scopus.com/authid/detail.uri?authorId=57204420341

 

Достигнутые результаты

Проведены исследования по определению термодинамических параметров для вторичных структур ДНК, расчет базовой термодинамики и температур плавления для этих структур (в том числе с наличием комплементарных несоответствий) с использованием подходов машинного обучения. Нами были разработаны последовательности и синтезированы олигонуклеотиды для изучения кинетики гибридизации для расчета базовой термодинамики и температур плавления. Для анализа последовательностей коротких олигонуклеотидов использовалась одномерная рекуррентная нейронная сеть. Как результат этих исследований нами были подготовлен компьютерный код для разработки наборов олигонуклеотидов для специфической детекции конкретной последовательности, а также аллельных вариантов однонуклеотидного полиморфизма (SNP), методом AS-PCR (Allele-Specific PCR), на примере, технологии KASP (Kompetitive Allele Specific PCR), основанного для генотипирования биаллельного варианта SNP (LGC Biosearch), вставок или делеций (Indels) в конкретном локусе. Дополнительно, нами были подготовлен компьютерный код для разработки наборов технологии удлинения праймеров мультиплексной системы SNaPshot для мультиплексного генотипирование SNP (Thermo Fisher Scientific). Разработанный нами компьютерный код, реализованный в среде программы FastPCR для решения задач по разработке основанных на ПЦР анализов генотипирования для детекции SNP и InDels. Для увеличения специфичности реакции и усиления дискриминирующей способности детекции SNP аллелей, сайт SNP размещается на предпоследнем основании каждого аллель-специфичного праймера. В качестве альтернативного набора универсальной KASP-репортерной системы на основе FRET-кассет, мы разработали более продвинутое решение, отличное от производителя LGC Biosearch. Это решение, включает единственный и универсальный антипраймер с 3'-концом Dark Quencher, комплементарный 5'-концам хвостов аллель-специфичных праймеров. Уникальная хвостовая последовательность конца аллель-специфичных праймеров образует из комплементарной последовательности универсальный анти-праймер с 3'-концом Dark Quencher и короткой уникальной последовательностью в 6 нуклеотидов, расположенной между хвостовой и аллель-специфической последовательностями.

Результатом данной работы был разработано новый компьютерный код для разработки наборов для специфической детекции конкретной последовательности, а также аллельных вариантов SNP, методом количественного ПЦР с использованием TaqMan и MGB зондов, и гибридизации на микрочипах.

Компьютерный код реализован в программном обеспечении – FastPCR, реализованное на Java, которое свободно доступно по адресу http://primerdigital.com/tools/.

За текущий период реализации проекта было опубликовано 6 рецензируемых статей в международных журналах с импакт-фактором, с указанием номера проекта (AP08855353), в том числе в которых, руководитель проекта выступает автором для корреспонденции, входящих в 1 (первый), 2 (второй) квартили в базе Web of Science и имеющих высокий процентиль по CiteScore в базе Scopus.

Список опубликованных работ

  1. Belyayev A., Jandova M., Josefiova J., Kalendar R., Mahelka V., Mandak B., Krak K. The major satellite DNA families of the diploid Chenopodium album aggregate species: Arguments for and against the "library hypothesis" // PLoS One. ‒ 2020. ‒ T. 15, № 10. ‒ C. e0241206. doi:10.1371/journal.pone.0241206 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7591062/

(Scopus CiteScore2020=5.3 (92st percentile), SJR Q1; Web of Science IF2020=3.24, Q2)

  1. Erper I., Ozer G., Kalendar R., Avci S., Yildirim E., Alkan M., Turkkan M. Genetic diversity and pathogenicity of Rhizoctonia isolates associated with red cabbage in Samsun (Turkey) // J Fungi (Basel). 2021. Т. 7. № 3. doi:10.3390/jof7030234. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8004240/ (WoS IF2020=5.5 Q1; Scopus CiteScore2020=5.5, SJR2020=1.702, 88th percentile; SCR=Q1)
  2. Kalendar R., Shustov A., Schulman A. Palindromic sequence-targeted (PST) PCR, version 2: an advanced method for high-throughput targeted gene characterization and transposon display // Frontiers in Plant Science. 2021. Т. 12. — C. 691940. doi:10.3389/fpls.2021.691940. https://www.ncbi.nlm.nih.gov/labs/pmc/articles/PMC8258406/ WoS IF2020=5.753 Q1; Scopus CiteScore2020=8.2 SCR Q1 95th percentile
  3. Kalendar R., Sabot F., Rodriguez F., Alix K., Natali L., Karlov G.I. Editorial: Mobile Elements and Plant Genome Evolution, Comparative Analyzes and Computational Tools // Frontiers in Plant Science. 2021. Т. 12. — C. 735134. doi:10.3389/fpls.2021.735134. https://www.ncbi.nlm.nih.gov/labs/pmc/articles/PMC8500305/ (WoS IF2020=5.753 Q1; Scopus CiteScore2020=8.2 SCR Q1 95th percentile)
  4. Kalendar R, Baidyussen A, Serikbay D, Zotova L, Khassanova G, Kuzbakova M, Kurishbayev A, Jatayev S, Hu Y-G, Schramm C, Anderson PA, Jenkins CLD, Soole KL, Shavrukov Y. Modified ‘Allele-specific qPCR’ method for SNP genotyping based on FRET // Frontiers in Plant Science. 2021. doi:10.3389/fpls.2021.747886. https://www.frontiersin.org/articles/10.3389/fpls.2021.747886/abstract (WoS IF2020=5.753 Q1; Scopus CiteScore2020=8.2 SCR Q1 95th percentile)
  5. Khapilina O., Raiser O., Danilova A., Shevtsov V., Turzhanova A., Kalendar R. DNA profiling and assessment of genetic diversity of relict species Allium altaicum on the territory of Altai // PeerJ. 2021. Т. 9. — C. e10674. doi:10.7717/peerj.10674. https://peerj.com/articles/10674/ (WoS IF2020=2.379 Q2; Scopus CiteScore2020=3.8, SJR2020=0.927, 83th percentile; SCR=Q1)
  6. Kalendar R., Kospanova D., Schulman A. Transposon-based tagging in silico using FastPCR software // Methods in Molecular Biology. 2021. Т. 2250. — C. 245-256. doi:10.1007/978-1-0716-1134-0_23. https://pubmed.ncbi.nlm.nih.gov/33900610/ (Scopus CiteScore2020=2.2, SJR2020=0.711, 24th percentile; SCR=Q3)
  7. Kalendar R. A guide to using FASTPCR software for PCR, in silico PCR, and oligonucleotide analysis. Methods in molecular biology. Т. 2392. — C. 223-243. doi:10.1007/978-1-0716-1799-1_16 https://pubmed.ncbi.nlm.nih.gov/34773626/ (Scopus CiteScore2020=2.2, SJR2020=0.711, 24th percentile; SCR=Q3)