DOI: https://doi.org/10.20535/2617-8974.2019.2.184696

ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ ДЛЯ ПОШУКУ ТОЧОК ЗМІНИ ТРИПЛЕТНОЇ ПЕРІОДИЧНОСТІ

Сергій Володимирович Кисляк, Марина Петрівна Іллєнок

Анотація


З появою методів секвенування нового покоління спостерігається експоненційне збільшення молекулярно-біологічних даних. Банки даних біологічних послідовностей, такі як GenBank [1], UniProt [2], KEGG [3] та інші досягли великих розмірів. При цьому швидкість опису просеквенованих послідовностей значно відстає від швидкості їх накоплення. При такому збільшенні об’єму інформації, вирішити проблему «відставання» неможливо без застосування ефективних алгоритмів. Досить цікавим, складним та таким, що заслуговує уваги та детального дослідження є напрямок геноміки, що відповідає за пошук ефективних алгоритмів для вирішення задачі ідентифікації генів про – та еукаріот. Найбільш популярними є програмні продукти, що дозволяють знаходити гени відповідно до отриманого парного вирівнювання послідовностей методом динамічного програмування. Такий підхід не дозволяє дослідити всі ділянки нуклеотидної послідовності, оскільки більшість генів протягом еволюції змінювались за рахунок, наприклад, точкових мутацій або кодуюча ділянка гена була отримана за рахунок об`єднання декількох генів. В такій ситуації інформація про ділянки, що формують гібридні гени, буде відсутньою в базах даних. Заслуговує уваги нетривіальний алгоритм, що був описаний в роботах [4]. Пошук точок зміни триплетної періодичності для прямої та зворотно компліментарної послідовності дає можливість визначення координат, які можуть вказувати на місце об’єднання двох генів.

Ключові слова


нуклеотидна послідовність; триплетна періодичність; гібридні гени

Повний текст:

PDF

Посилання


Benson D.A. и др. GenBank: update. // Nucleic Acids Res. 2004. Т. 32. № Databaseissue. С. D23–D26.

Consortium T.U. The Universal Protein Resource (UniProt) 2009 // Nucleic Acids Res. 2009. Т. 37. № Data baseissue. С. 169–174.

Ogata H. и др. KEGG: Kyoto Encyclopedia of Genesand Genomes // Nucleic Acids Res. 1999. Т. 27. № 1. С. 29–34.

Коротков Е.В., Суворова Ю.М. // Изучение одиночных и парных точек разладки в кодирующих последовательностях ДНК // V съезд биофизиков Росии, Нижний Новгород. 2012. Том 1.

Vinga S., Almeida J. Alignment-free sequence comparison-a review. // Bioinformatics. 2003. Т. 19. № 4. С. 513–523.

Konopka A.K. и др. Distance analysis helps to establish characteristic motifsinintron sequences. // GeneAnal. Tech. 1987. Т. 4. № 4. С. 63–74.

Shepherd J.C. Periodic correlationsin DNA sequence sandevidence suggestingtheire volutionary originin a comma-less genetic code. // J. Mol. Evol. 1981a. Т. 17. № 2. С. 94–102.

Tsonis A.A., Elsner J.B., Tsonis P.A. Periodicityin DNA codings equences: implications ingenee volution. // J. Theor. Biol. 1991. Т. 151. № 3. С. 323–31.

Herzel H. и др. Interpreting correlations inbio sequences // Phys. A Stat. Mech. itsAppl. 1998. Т. 249. № 1-4. С. 449–459.

Durbin R. и др. Biological Sequence Analysis: Probabilistic Modelsof Proteinsand Nucleic Acids.: Cambridge University Press, 1998. 356 с.

Needleman S.B., Wunsch C.D. A general method applicable to the search for similarities in the aminoacid sequence of two proteins. // J. Mol. Biol. 1970. Т. 48. № 3. С. 443–453.

Smith T.F., Waterman M.S. Comparison of bios equences // Adv. Appl. Math. 1981b. Т. 2. № 1 981. С. 482–489.

Altschul S.F. и др. Basiclocalal ignment search tool. // J. Mol. Biol. 1990. Т. 215. № 3. С. 403–410.

Loewenstein Y. и др. Protein functionan notation by homology-based inference // GenomeBiol. 2009. Т. 10. № 2. С. 207.

Bonham-Carter O., Steele J., Bastola D. Alignment-free genetic sequence comparisons: a review of recent approach esby word analysis. // Brief. Bioinform. 2013. Т. 15. № 6. С. 890–905.

Kantorovitz M.R., Robinson G.E., Sinha S. A statistical method for alignment-free comparison of regulatory sequences. // Bioinformatics. 2007. Т. 23. № 13. С. 249–255.

Vinga S. Editorial: Alignment-free methods in computational biology. // Brief. Bioinform. 2014. Т. 15. № 3. С. 341–2.

Vinga S., Almeida J. Alignment-freesequencecomparison-a review. // Bioinformatics. 2003. Т. 19. № 4. С. 513–523.

Stuart G.W., Moffett K., Baker S. Integrated gene and species phylogenies from unaligned whole genomeprotein sequences. // Bioinformatics. 2002. Т. 18. № 1. С. 100–108.

Borozan I., Watt S., Ferretti V. Integrating alignment-based and alignment-free sequence similarity measures for biological sequence classification. // Bioinformatics. 2015. С. btv006.

Yin C., Chen Y., Yau S.S.-T. A measureof DNA sequence similarity by Fourier Transform with applications on hierarchical clustering. // J. Theor. Biol. 2014. Т. 359C. С. 18–28.

Korotkov E. V, Korotkova M.A., Kudryashov N.A. Informationd ecomposition of symbolic sequences // Phys. Lett. A. 2003. Т. 312. № 3. С. 198–210.

Fickett J.W., Tung C.S. Assessment of protein coding measures. // Nucleic Acids Res. 1992. Т. 20. № 24. С. 6441–6450.

Herzel H., Weiss O., Trifonov E.N. 10-11 bp period icities incompletegeno mesreflectprote in structure and DNA folding. // Bioinformatics. 1999. Т. 15. № 3. С. 187–193.

Bernardi G. и др. Themosaicgenome of warm-blooded vertebrates. // Science. 1985. Т. 228. № 4702. С. 953–958.

Trifonov E.N., Sussman J.L. The pitch of chromatin DNA isreflected inits nucleotide sequence. // Proc. Natl. Acad. Sci. 1980. Т. 77. № 7. С. 3816– 3820.

Zhang M. и др. Mining periodic patterns with gapr equirement from sequences // ACM Trans. Knowl. Discov. Data. 2007. Т. 1. № 2. С. 7–es.

Plotkin J.B., Kudla G. Synonymous but not the same: thecauses and consequences of codonbias. // Nat. Rev. Genet. 2011. Т. 12. № 1. С. 32–42.

Iriarte A. и др. General trend sinselective lydrivencodonusagebiases in the domain archaea. // J. Mol. Evol. 2014. Т. 79. № 3-4. С. 105–10.

Sharp P.M. и др. Codonusage patterns in Escherichiacoli, Bacillussubtilis, Saccharomy cescerevisiae, Schizosaccharomy cespombe, Drosophilamel anogaster and Homosapiens; a review of the considerable with in-species diversity. // Nucleic Acids Res. 1988. Т. 16. № 17. С. 8207–8211.

Suzuki H. и др. Comparison of Correspondence Analysis Methods for Synonymous Codon Usagein Bacteria // DNA Res. 2008. Т. 15. № 6. С. 357–365.

Eskesen S.T. и др. Periodicity of DNA inexons // BMC Mol. Biol. 2004. Т. 5. С. 12.

Sánchez J., López-Villaseñor I. A simple model to explain three-base 33 periodicity incoding DNA. // FEBS Lett. 2006. Т. 580. № 27. С. 6413–6422.

López-Villaseñor I., José M. V, Sánchez J. Three-base periodicity pattern sand self-similarity in wholebacterial chromosomes. // Biochem. Biophys. Res. Commun. 2004. Т. 325. № 2. С. 467–478.

Trotta E. The 3-Base Periodicity and Codon Usage of Coding Sequences Are Correlated with Gene Expressionat the Level of Transcription Elongation // PLoSOne. 2011. Т. 6. № 6. С. 11.

Електронний ресурс – режим доступу – URL: https://www.openthefile.net/ru/extension/fasta