Человеческий геном полностью расшифровали: в каждой клетке по 3 миллиарда «букв»

Человеческий геном расшифрован на 100 процентов. Международная группа ученых сообщила об этом в журнале ZME Science. Если раньше у генетиков не было полного представления о последовательности всех нуклеотидов (оставалось 8 % непрочитанного текста), то теперь расшифрованы и они. Все — благодаря новой технологии расшифровки, при которой ДНК не разрезается на отдельные мелкие части, а исследуется целиком проходя через нанопору. О том, какие перспективы в исследовании генома открывает это достижение, рассказал  руководитель лаборатории Института общей генетики им Н.И. Вавилова РАН, доктор биологических наук, профессор Сергея Киселев.

Сергей Львович, объясните, пожалуйста, что именно помогло «прочитать» полный геном?

 – Прежние технологии чтения генетического текста  были основаны на обработке коротких «слов» (кусков генома). Брали отдельные такие слова,  состоявшие, скажем,  из 50-200 «букв» (нуклеотидов), и читали их сначала в хаотичном порядке, а потом, с помощью компьютера производили их биоинформационный анализ,  искали на концах перекрывающиеся фрагменты и выстраивали в длинный полный текст.

 Но процесс чтения усложняли повторяющиеся последовательности. Их имеет геном не только человека, но и всех других животных. Что это такое? Это, к примеру, когда генетическое «слово» (они пишутся с помощью четырех букв  G, A, T и C), состоит только из буквы «А». Представьте себе тысячу букв «А» или комбинацию из тысяч «ТА».

С чем связаны эти повторы?

– С функционированием генома. Есть предположение, что они являются неким его резервом. К примеру, известно, что такие повторяющиеся последовательности находятся на концах каждой хромосомы. А поскольку известно, что  хромосома с каждым делением клетки укорачивается, получается, повторы на ее концах выполняют защитную функцию от быстрого укорочения с возрастом.

Вторая функция повторяющихся элементов может быть связана с делением клетки. На эту мысль ученых навел тот факт, что повторы были также обнаружены в центральных участках хромосом — центромерах, «узелках» которыми связаны парные хромосомы и к которым прикрепляются белковые нити, растягивающие  хромосомы в две стороны при делении клетки.

Иногда повторы говорят генетикам о предрасположенности человека к тому или иному недугу. Это хорошо изучено на примере возрастных, нейродегенеративных заболеваний.  По количеству повторов в том или ином гене специалисты судят о вероятности развития заболевания в будущем. К примеру, при имеющейся склонности к болезни Генсингтона нормальным считается до 34 повторов. Но если их становится, например, 40, то велика вероятность, что к 40-летнему возрасту заболевание проявит себя. А если у ребенка после рождения  оказалось 100 повторов, то со 100-процентной вероятностью можно говорить о том, что болезнь Генсингтона разовьется у него уже в возрасте 10 лет или раньше. 

Но вернемся к расшифровке генома. При прежнем способе (путем разрезания ДНК на мелкие фрагменты) генетики могли ошибаться с определением длины вышеописанных  повторов. А года три назад была изобретена новая технология чтения генетического текста. Она позволила читать очень длинные последовательности из сотен тысяч, миллионов букв расположенных в цепочке ДНК. Эта технология как раз и позволила прочесть остававшиеся 8% генома, которые были представлены как раз повторяющимися элементами. Она позволила понять, какую на самом деле они имеют протяженность и где точно находятся в геноме. 

Исследователи заявили, что они изучили 3,055 миллиарда пар оснований генома человека. Как их можно себе представить?

– Это те самые буквы, нуклеотиды, из которых состоит текст нашего генома. По 3,055 миллиарда их находится в каждой нашей клетке. По емкости каждую можно сравнить с флэшкой на 3 мегабайта. И таких флэшек в нашем организме 10 в 14-ой степени.