Путешествие к центру генома. Какой смысл нашли генетики в бессмысленных участках ДНК
Какой смысл нашли генетики в бессмысленных участках ДНК
Прообраз человека — это его гены, считали ученые, начиная проект по расшифровке человеческого генома. И когда выяснилось, что восемь процентов прочесть пока не получится, никто не расстроился. Все равно генов там не было — только бессодержательные участки, «мусорная ДНК». Собрать воедино и расшифровать их удалось только сейчас. Тут-то и оказалось, что они говорят о том, в чем гены давно запутались.
В 1879 году немецкий биолог Вальтер Флеминг вглядывался в препараты из семенников саламандры и брюшного жира новорожденных котят, чтобы понять, как размножается все живое. Он знал, что каждой живой клетке полагается ядро. Но заметил, что ядра размножаются не так, как клетка. У них не возникает перемычки, которая делит их на две половины, — вместо этого ядро-шарик превращается в хаотичный клубок из толстых нитей.
Флеминг понятия не имел, из чего сделаны эти волокна и зачем они нужны. Он звал их «хроматическими нитями», поскольку с ними связывались его красители, — а интересовало его, почему при каждом делении каждой дочерней клетке их достается поровну. Сегодня эти нити мы называем хромосомами.
Немец заметил, что за стадией клубка следует стадия звезды, на которой каждая нить сгибается пополам и своей вершиной тянется к центру клетки. После этого все они выстраиваются в одну шеренгу, а потом разворачиваются и симметрично расходятся к полюсам клетки. Флеминг предположил, что «хвосты» нити должны как-то отличаться от вершины, но дальше разбираться не стал — вместо этого взялся выяснять, одинаково ли хромосомы движутся у разных организмов.
К началу ХХI века генетики уже разобрались в том, что происходило на глазах у Флеминга. Они выяснили, что перед делением ядра хромосомы в нем удваиваются, — и потому, собственно, к полюсам расходятся два одинаковых набора. Область, в которой хромосомы сгибаются, ученые назвали центромерой и выяснили, что на ней образуется белковый нарост кинетохор, а за него хватаются моторные белки, чтобы растащить хромосомы по сторонам.
Но все еще не знали, что у центромеры внутри.
Незначительная ДНК
В 1986 году Министерство энергетики США (то самое, которое занималось Манхэттенским проектом) пригласило 43 генетика в Санта Фе, чтобы те подумали, возможно ли сейчас взять и целиком расшифровать ДНК человека. Ученые посовещались и признали задачу вполне достижимой. С одним нюансом. «Некоторые части хромосом могут не поддаваться секвенированию», — резюмировали родоначальники проекта «Геном человека» (подробнее о нем мы рассказывали в тексте «Геном человека: двадцать лет спустя»). Их смущало, что в человеческой ДНК много повторяющихся фрагментов (в сумме они занимают больше половины генома), с которыми не смогут работать ферменты рестриктазы, нарезающие ДНК для секвенирования.
Это, впрочем, никого не остановило, потому что нечитабельные куски генома в то время мало кого занимали. «Тогда все внимание было на генах», — вспоминает Иван Александров, старший научный сотрудник Института общей генетики РАН. Спросом в первую очередь пользовался эухроматин — активные участки хромосом, на которых идет синтез РНК. Они были «клинически интересными», на них можно было найти гены и связать их работу с конкретными болезнями.
В составе гетерохроматина (свернутой, неактивной части хромосом), конечно, тоже могут встречаться «вредные» участки — например, нередко в этих клубках сидят копии генных паразитов транспозонов. Но эта угроза обычно под контролем: свернутость участков не дает транспозонам высказаться, то есть размножиться и перепрыгнуть дальше.
Чаще эти последовательности, хоть и молчат, — в смысле, не производят белка — тоже заняты в полезном деле. Как теломеры — нашлепки на концах хромосом, тысячи повторов одного и того же «слова» ТТАГГГ. Оно ничего не значит, просто с каждым копированием хромосомы несколько десятков теломерных повторов идут под нож, а гены внутри хромосом остаются в целости и могут работать дальше.
Примерно так же — бессмысленным набором букв — выглядят и центромеры. Повторяются в них, правда, уже целые фразы длиной в несколько сотен нуклеотидов — и могут довольно сильно отличаться друг от друга. И это вторая (и главная) причина, по которой «Геном человека» не имел никакой возможности прочитать эти участки.
В то время для секвенирования использовали метод дробовика. Нужно было взять небольшой участок ДНК, сделать множество его копий, потом нарезать их с помощью рестриктаз на короткие кусочки и прочитать каждый по отдельности. Поскольку каждую копию рестриктазы дробят по-новому, то на выходе из одного фрагмента ДНК получается несколько разных коротких отрывков. Дальше в дело вступают биоинформатики: они ищут перекрывающиеся последовательности и, накладывая их друг на друга, восстанавливают полный текст.
В 1998 году Фрэнсис Коллинз сообщил: мы закончили составлять общую карту генома, дайте нам еще пять лет — и мы его расшифруем. Но прочесть генетический текст человека полностью уже не обещал: к 2003-му его подопечные рассчитывали явить миру 90 процентов человеческой ДНК. Остальные десять, вторил руководитель проекта «Геном человека» своим предшественникам из 1986-го, посмотреть не выйдет — для этого нужен технологический скачок.
Метод дробовика неплохо работал для уникальных последовательностей, из которых построены гены в эухроматине. Но перед повторами, которыми изобилует гетерохроматин, он бессилен, потому что рестриктазы пилят его на отрывки длиной около 200 нуклеотидов. А это 33 теломерных повтора (из нескольких тысяч) и чуть больше одного центромерного (из нескольких сотен или тысяч).
«Представьте, что у нас есть какая-нибудь газета, — объясняет биоинформатик Ольга Кунявская из СПбГУ, которая аннотирует центромеры сегодня. — Сто экземпляров. Их разрезали на мелкие кусочки, и порезали по-разному, и нам нужно восстановить все издание. А у нас есть участок в газете, где одно слово с мелкими опечатками повторяется 1500 раз. Понять, в каком порядке они идут [друг за другом], — это практически нереально. Можно алгоритмически доказать, что это невозможно сделать. Можно придумать несколько последовательностей, которые после секвенирования будут давать один и тот же датасет».
К тому же центромеры все еще считали генетически бессмысленными. «Обидно было, — рассказывает Александров. — Крик придумал в свое время эту „мусорную ДНК“, и [с тех пор] считалось, что повторы это какая-то ненужная ДНК, которая паразитически размножается сама собой. А [настоящая] центромера — это что-то вроде гена, который запрятан внутри этой мусорной ДНК. Еще в восьмидесятых годах стало ясно, что это не так, что все эти повторы — и есть центромера, но эта догма [о гене где-то в глубине мусорной ДНК] продержалась лет 15, примерно до начала 2000-х годов».
В 2001 году «Геном человека» опубликовал свой первый черновик. В 2003-м данные отшлифовали начисто и выпустили — хотя текст все равно был неполным. Ученые честно признались, что вообще не занимались гетерохроматином, поэтому часть последовательности осталась нерасшифрованной. Что, впрочем, не помешало им объявить о начале геномной эры в биологии.
Не все отнеслись к этому манифесту серьезно. Американские ученые Стивен Хеникофф и Хармит Малик ехидно отозвались, что ту часть хромосомы, которую впервые рассмотрело человечество в лице Виктора Флеминга, читать даже не начали. Да и сами «чтецы» соглашались, что пробелы хорошо бы закрыть — без этого невозможно точно сказать даже то, какой на самом деле длины наш геном. Но время новых технологий, на которые уповал Коллинз, еще не пришло.
Ручка от хромосомы
Вопрос о длине генома был не единственным, на который должно было ответить секвенирование гетерохроматина. И даже не главным. Например, было совершенно непонятно, как вообще работает увиденная Флемингом система перемещения хромосом во время деления. А точнее, как клетке удается схватить их строго за вершину.
Технические участки есть в любой линейной хромосоме и, как правило, у всех эукариот они очень похожи. Например, теломеры у всех животных устроены примерно одинаково, их повторы зачастую совпадают с точностью до буквы, отличается только количество (у мышей, например, теломерных повторов 7-8 тысяч, а у людей — как минимум в три раза меньше). Это неспроста: с техническими участками ДНК связываются технические же белки. Если эти участки будут слишком быстро мутировать, белки перестанут их распознавать. И если теломера изменится до неузнаваемости, хромосомы в ходе деления клеток начнут ломаться — а следом за ними и клетки.
Но центромеры напротив, очень быстро мутируют. Даже у близких видов эти последовательности сильно отличаются. Флуоресцентные зонды, которые связываются с центромерами человека, никак не реагируют на центромеры шимпанзе (хотя с теломерами все получается). А число этих повторов может изменяться в разы: в клетках одного и того же человека у хромосом, полученных от матери и от отца, центромеры могут быть настолько разной длины, что это даже видно в микроскоп.
То, что центромеры оказались одновременно жизненно необходимой и очень изменчивой частью генома, Хеникофф и Малик назвали «центромерным парадоксом». Удивительно, что многообразная жизнь, которая использует центромеры для размножения своих клеток, все еще жизнеспособна. Если центромеры меняются слишком быстро, то есть риск, что белки кинетохора перестанут их узнавать и собираться в нужном месте, а значит и хромосомы начнут расходиться в дочерние клетки неравномерно. Это как перебирать работающий двигатель самолета посреди рейса — как это сделать, не свалившись в пике? И каким образом ему удается продолжать лететь? В смысле, клеткам животных (и самим животным) — размножаться?
Хеникофф и Малик также заметили, что никто толком не знает, как моторные белки определяют, за какое место тащить хромосому в новую клетку. Поначалу считалось, что это зависит от последовательности нуклеотидов: туда, где есть определенные фрагменты текста, налипает белок-упаковщик CENP-A. На него накручивается нить ДНК, и один центромерный повтор (171 пара нуклеотидов) как раз влезает ровно на одну катушку.
Но время от времени генетики сталкиваются с людьми, у которых CENP-A скручивает ДНК в неположенном месте. Такое происходит, например, если от хромосомы оторвался кусочек — но вместо того, чтобы потеряться при делении, стал еще одной хромосомой, 47-й. После этого он живет дальше: удваивается и передается от материнской клетки дочерним, как отдельная хромосома. Как, почему и в каком месте появляется такая неоцентромера, совершенно неясно. Как правило, это какой-то участок, где почти нет генов. Но там нет и центромерных повторов — и тем не менее, CENP-A все равно раз за разом туда садится. Значит, дело не только в тексте.