Человеческий геном расшифрован на 100 процентов. Международная группа ученых сообщила об этом в журнале ZME Science. Если раньше у генетиков не было полного представления о последовательности всех нуклеотидов (оставалось 8 % непрочитанного текста), то теперь расшифрованы и они. Все — благодаря новой технологии расшифровки, при которой ДНК не разрезается на отдельные мелкие части, а исследуется целиком проходя через нанопору. О том, какие перспективы в исследовании генома открывает это достижение, рассказал руководитель лаборатории Института общей генетики им Н.И. Вавилова РАН, доктор биологических наук, профессор Сергея Киселев.
– Сергей Львович, объясните, пожалуйста, что именно помогло «прочитать» полный геном?
– Прежние технологии чтения генетического текста были основаны на обработке коротких «слов» (кусков генома). Брали отдельные такие слова, состоявшие, скажем, из 50-200 «букв» (нуклеотидов), и читали их сначала в хаотичном порядке, а потом, с помощью компьютера производили их биоинформационный анализ, искали на концах перекрывающиеся фрагменты и выстраивали в длинный полный текст.
Но процесс чтения усложняли повторяющиеся последовательности. Их имеет геном не только человека, но и всех других животных. Что это такое? Это, к примеру, когда генетическое «слово» (они пишутся с помощью четырех букв G, A, T и C), состоит только из буквы «А». Представьте себе тысячу букв «А» или комбинацию из тысяч «ТА».
– С чем связаны эти повторы?
– С функционированием генома. Есть предположение, что они являются неким его резервом. К примеру, известно, что такие повторяющиеся последовательности находятся на концах каждой хромосомы. А поскольку известно, что хромосома с каждым делением клетки укорачивается, получается, повторы на ее концах выполняют защитную функцию от быстрого укорочения с возрастом.
Вторая функция повторяющихся элементов может быть связана с делением клетки. На эту мысль ученых навел тот факт, что повторы были также обнаружены в центральных участках хромосом — центромерах, «узелках» которыми связаны парные хромосомы и к которым прикрепляются белковые нити, растягивающие хромосомы в две стороны при делении клетки.
Иногда повторы говорят генетикам о предрасположенности человека к тому или иному недугу. Это хорошо изучено на примере возрастных, нейродегенеративных заболеваний. По количеству повторов в том или ином гене специалисты судят о вероятности развития заболевания в будущем. К примеру, при имеющейся склонности к болезни Генсингтона нормальным считается до 34 повторов. Но если их становится, например, 40, то велика вероятность, что к 40-летнему возрасту заболевание проявит себя. А если у ребенка после рождения оказалось 100 повторов, то со 100-процентной вероятностью можно говорить о том, что болезнь Генсингтона разовьется у него уже в возрасте 10 лет или раньше.
Но вернемся к расшифровке генома. При прежнем способе (путем разрезания ДНК на мелкие фрагменты) генетики могли ошибаться с определением длины вышеописанных повторов. А года три назад была изобретена новая технология чтения генетического текста. Она позволила читать очень длинные последовательности из сотен тысяч, миллионов букв расположенных в цепочке ДНК. Эта технология как раз и позволила прочесть остававшиеся 8% генома, которые были представлены как раз повторяющимися элементами. Она позволила понять, какую на самом деле они имеют протяженность и где точно находятся в геноме.
– Исследователи заявили, что они изучили 3,055 миллиарда пар оснований генома человека. Как их можно себе представить?
– Это те самые буквы, нуклеотиды, из которых состоит текст нашего генома. По 3,055 миллиарда их находится в каждой нашей клетке. По емкости каждую можно сравнить с флэшкой на 3 мегабайта. И таких флэшек в нашем организме 10 в 14-ой степени.