Секвенирование дезоксирибонуклеиновой кислоты (ДНК)
Реферат
на тему:
Секвенирование
ДНК
2009
Введение
К концу 70-х годов перед
исследователями, работавшими в сфере молекулярной биологии, остро встала
проблема установления последовательности нуклеотидов в цепи ДНК («секвенирования
ДНК»). Как подойти к решению этой проблемы? За 10 лет до того Эрдманом и Беггом
была решена задача выяснения последовательности аминокислот в белках
(«секвенирования белков») в автоматическом режиме. С этим решением мы уже
ознакомились. Собственно говоря, новым в их методе был только способ
автоматизации. Существо же этого метода было для химии тривиальным. Был найден
способ последовательного отщепления по одной аминокислоте (хотя и в
модифицированном виде) от конца изучаемой белковой цепи с последующей
идентификацией каждого из полученных таким образом простых продуктов.
Отыскание аналогичного подхода
для секвенирования ДНК не вдохновляло исследователей, поскольку для
секвенирования хотя бы одного структурного гена предстояло определять
последовательность в 1—3 тысячи нуклеотидов, не говоря уже о всем геноме, когда
счет должен идти на миллионы, а у высших организмов на миллиарды нуклеотидов.
Первоначальные способы не
автоматизированного секвенирования ДНК
В 1977 году Максам и Гилберт
предложили совершенно иной, оригинальный метод решения проблемы секвенирования.
Им удалось найти химическую реакцию, которая расщепляла молекулу ДНК по месту
расположения одного определенного нуклеотида. Они помечали радиоактивной меткой
первый нуклеотид исследуемого однонитевого (после денатурации) фрагмента ДНК,
представленного, разумеется, огромным количеством копий. Затем проводили
реакцию расщепления в таких условиях, что подавляющее большинство нитей ДНК
разрывалось только в одном из множества мест, где стоял избранный нуклеотид (а
все эти места равноправны). После этого продукты расщепления направлялись для
анализа методом электрофореза в ПААГ. Ауторадиография геля выявляла следующую
картину.
Отрезки ДНК всех возможных
размеров, считая от начала молекулы до известного (подвергшегося химической
атаке) нуклеотида, разделились и обнаружили себя полосами почернения
рентгеновской пленки. Самые короткие отрезки (в 2, 3 и даже один первый
нуклеотид) ушли в геле далеко вперед. Более длинные отрезки отстали тем
сильнее, чем они были длиннее. Степень почернения полос оказалась разная,
поскольку число молекул ДНК, разорвавшихся в каждом из возможных мест было случайным.
Но при достаточном количестве исходного материала все они были хорошо видны.
«Отрезанные» части молекул, напротив, ничем себя в геле не проявляли, так как
не содержали меченого нуклеотида.
Эта картина еще не несла в себе
никакой информации о порядковых номерах нуклеотидов, по которым произошел
разрыв. Однако аналогичные специфические реакции расщепления авторам удалось
найти и для трех остальных нуклеотидов. Они смогли получить соответствующие
картины разделения отрезков ДНК и для них. Затем они вели электрофоретическое
разделение одновременно для всех 4-х случаев в параллельных треках одного геля.
Из сопоставления положений всех полос оказалось возможным получить полную
информацию о последовательности нуклеотидов в исследуемом фрагменте ДНК.
Действительно, все полосы в 4-х треках должны находиться на разных уровнях,
потому что длины соответствующих этим полосам отрезков ДНК будут различаться
между собой хотя бы на один нуклеотид. Вместе с тем, ничего другого, кроме
четырех нуклеотидов, в ДНК нет. Это означает, что совокупность всех отрезков
дискретно исчерпывает все возможные удаления от начала молекулы. А
следовательно, пронумеровав все полосы в геле, начиная с самой удаленной от
старта, совокупно по всем четырем трекам можно получить всю нуклеотидную
последовательность секвенируемого фрагмента ДНК.
Ауторадиография — метод
регистрации положения радиоактивно-меченых веществ в геле путем фиксации их
излучения на рентгеновской пленке. Ведь каждому номеру, оказавшемуся в любом из
треков, будет соответствовать заранее известный нуклеотид, определивший место
разрыва ДНК при подготовке препарата именно для этого трека.
Отметим, что метод Максама и
Гилберта позволяет определить всю последовательность, начиная- с первого
нуклеотида. Но представляет немалые трудности в трактовке результатов
эксперимента. Ведь он требует уверенного определения чередования полос,
находящихся в разных треках. В частности, и таких полос, которые соответствуют
отрезкам ДНК длиною в несколько десятков, а то и сотен нуклеотидов с отличием в
один нуклеотид. Между тем условия подготовки препаратов, да и самого
электрофореза (например, условия теплоотвода) могут быть чуть-чуть разными для
разных треков и это может спутать всю картину определения последовательности.
Особенно в верхних частях пластины геля, где тесно сдвинуты полосы,
соответствующие длинным отрезкам. По этой причине метод Максама и Гилберта не
позволял секвенировать фрагменты ДНК крупнее, чем 200-300 нуклеотидных звеньев.
Кроме того, он не поддавался автоматизации.
В том же 1977 году (чуть позже)
Сенджер и сотр. предложили другой метод секвенирования ДНК. В принципе, он был
во многом аналогичен описанному выше методу. Здесь тоже удавалось получить
четыре набора отрезков ДНК всех возможных размеров, радиоактивно меченых и
заканчивающихся на одном из четырех нуклеотидов. Их точно так же разделяли
электрофорезом в 4-х параллельных треках ПААГ, получали четыре «лестницы» полос
почернения после ауторадиографии и совокупным анализом последовательности полос
в них устанавливали последовательность нуклеотидов в исследуемом фрагменте ДНК.
Впрочем, не совсем всю последовательность. Первые несколько нуклеотидов при
этом могли остаться не определенными по причине, которая станет ясна из
дальнейшего.
Обратимся теперь к тому в чем
два метода существенно различались между собой. А именно, к способу получения
отрезков ДНК всех возможных размеров, оканчивающихся на любой из 4-х
нуклеотидов. Напомню, что Максам и Гилберт радиоактивно метили первый нуклеотид
последовательности и химическим способом расщепляли исследуемый однонитевой
фрагмент ДНК по всем местам нахождения каждого из нуклеотидов.
Сенджер и сотр. предложили
использовать тот же однонитевой фрагмент ДНК в качестве матрицы для
комплементарного синтеза по ней с помощью ДНК-полимеразы I множества неполных
копий всех возможных размеров, оканчивающихся на определенном нуклеотиде. Для
этого избранный нукле-отид должен был быть модифицирован таким образом, чтобы
«не потеряв своего лица» быть включенным в растущую комплементарную цепь ДНК и
... тем самым прекратить ее рост, фиксируя размер скопированного участка
матрицы. Чтобы получить отрезки ДНК всех возможных в этом случае размеров,
модифицированный нуклеотид должен быть примешан к смеси четырех нормальных
нуклеозидтрифосфатов — предшественников биосинтеза ДНК тоже в виде
нуклеозидтрифосфата, но в таком малом количестве, чтобы остановка синтеза при
случайном его включении происходила с одинаковой вероятностью в любом месте
синтезируемой копии.
Очевидно, что именно с этим
модифицированным нуклеотидом следует связать радиоактивную метку, чтобы
локализовать определенный им отрезок ДНК на рентгеновской пленке после
ауторадиографии. Но что же это за модификация? В какой части нуклеотида она
может иметь место? Очевидно, что не в самом нуклеиновом основании. Ведь для
того, чтобы быть «узнанным» ДНК-полимеразой и комплементарно включенным в
растущую цепь ДНК-копии нуклеотид должен «сохранить свое лицо». Значит
модификация должна коснуться дезоксирибозы. Тем более, что именно она участвует
в построении сахаро-фосфатной связи между нуклеотидами, то есть в самом
процессе наращивания полинуклеотидной цепочки.
Обратимся к рисункам 24, 25 и 26
на стр. 34 и 35. Рассматривая их, нетрудно вспомнить, что связь между соседними
нуклеотидами образуется за счет ферментативного отщепления воды от ОН-группы,
которой заканчивается остаток фосфорной кислоты в одном нуклеотиде (этот
остаток присоединен в 5'-положении «своей» дизоксирибозы) и ОН-группы,
присоединенной в 3'-положении к дезоксирибозе его партнера по связи. Между этими
двумя положениями и устанавливается фосфорнодиэфирная связь.
Сама дезоксирибоза, как видно из
сравнения двух Сахаров на рис. 24, получила свое наименование в связи с тем,
что у нее на одну ОН-группу меньше, чем у рибозы. Если для получения нужного
нам модифицированного нуклеотида использовать сахар, у которого вместо
ОН-группы в 3'-положении стоит просто Н, то такой сахар можно назвать
«дидезоксирибозой», и полное название соответствующего ему нуклеотида будет «дидезоксирибонуклеотид».
Когда ДНК-полимераза включит в синтезируемую нить ДНК, в соответствии с
условием комплементарности, дидезоксирибонуклеотид (а она это сделает «не
заметив» подмены), то дальнейшее наращивание нити ДНК-копии прекратится, так
как не будет одной из двух ОН-групп, участвующих в образовании сахаро-фосфатной
связи.
Описанную процедуру авторы
метода сумели повторить и с остальными тремя дидезоксирибонуклеотидами. После
чего провели электрофорез продуктов четырех реакций в четырех параллельных
треках ПААГ и совокупный анализ результатов разделения как в методе Максама и
Гилберта. Первое время оба метода были равноправны. В методе Сенджера и сотр.
было то преимущество, что он допускал большую загрузку геля при электрофорезе
так как в нем нет невидимых отщепленных «хвостов» ДНК, загружающих полосы
меченых отрезков такой же длины. С другой стороны, недостатком метода была
необходимость посадки прай-мера на начало копируемой ДНК, от которого только и
могла начать работать ДНК-полимераза I. Праймер нетрудно было синтезировать
искусственно, но для этого надо было уже знать некоторую начальную
последовательность нуклеотидов в секвенируемом фрагменте ДНК. Разумеется, сам
праймер входил в состав всех отрезков ДНК, разделенных электрофорезом. Но если
он был точно комплементарен началу матрицы, то это не мешало ее полному
секвенированию. Само секвенирование начиналось с первого нуклеотида после
праймера. Заметим на всякий случай, что выяснив последовательность нуклеотидов
в синтезируемой нити ДНК мы узнаем, в силу комплементарности, последовательность
и в самой исходной нити ДНК.
Что же касается трудности
однозначного прочтения последовательности ДНК на основе совокупного
рассмотрения полос в четырех треках, то она в методе Сенджера оставалась такой
же, как зв методе Максама и Гилберта. Однако метод Сенджера и сотр. открыл
перспективу автоматизации трудоемкого процесса секвенирования ДНК, и этим был
совершен скачок в развитии молекулярной биологии.
Переход к автоматическому
секвенированию требовал в первую очередь проведения электрофореза всех четырех
семейств отрезков ДНК в одном треке. Как уже отмечалось, установление
относительного расположения четырех полос, расположенных в разных треках и
отличающихся по длине всего на один нуклеотид, затруднительно. Логика
визуальной оценки ситуации человеком может ввести коррективы в указанную ранее
возможность неодинаковости условий разделения в разных треках. Наверное, этой
логике можно « обучить « и компьютер, но это сильно усложнит его программу и ее
надежность трудно предсказать.
Между тем в обоих методах
переход к электрофорезу в одном треке с использованием радиоактивной метки
невозможен. Для идентификации значения каждой полосы потребовалось бы четыре
различных радиоактивных изотопа. Допустим, что это были бы доступные для
биологических применений ^^ 14C, ^S и
32?. Различие этих изотопов может проявить себя только в степени
почернения рентгеновской пленки. Но, во-первых, энергия р-излучения двух из
этих изотопов (^С и ^S) почти одинаковы, а, во-вторых,
степень почернения будет зависеть еще от одного, вовсе неизвестного фактора —
количества отрезков ДНК, оказавшихся случайно одинаковыми по длине и потому
суммирующих свое излучение в одной полосе. (Не забудем, что исходно для
секвенирования мы имеем не один, а великое множество одинаковых фрагментов ДНК,
независимо друг от друга копируемых в условиях случайных обрывов этого
процесса.)
Разрешение проблемы было найдено
использованием для идентификации полос в геле флюоресценции вместо
радиоактивности. На основе дихлорородамина были разработаны четыре
флюоресцентных красителя разных цветов, с максимами излучения при 544, 569, 597
и 622 тц, лежащими в зеленой, желто-зеленой, оранжевой и красной областях
спектра и легко разделимыми в спектрофотометре. Авторам удалось связать эти
красители с четырьмя дидезоксирибонуклетидами. Таким образом при лазерном
облучении геля каждая полоса в методе Сенджера при электрофорезе в одном треке
заявляла о своей специфичности соответствующим цветом излучения.
Разумеется, каждая полоса в геле,
в силу своей конечной ширины и некой кривой распределения вещества по этой
ширине, испускала свет флюоресценции тоже в виде некоего колоколообразного пика
интенсивности света, растянутого в направлении электрофореза. В нижних своих
частях эти пики могли перекрываться (как перекрывались своими границами и
соответствующие полосы в геле). Но вершины пиков хорошо отделялись друг от
друга, и это позволяло прямо по этим вершинам определять порядковый номер
каждого нуклеотида. А его индивидуальность — по цвету пика.
Практические аспекты
автоматического секвенирования
Первый вопрос, требующий
прояснения — как быть с синтезом праймера, если начало секвенируемого фрагмента
ДНК неизвестно. Ответа может быть два. Первый (тривиальный) — каким-то другим
способом определить начальную последовательность секвенируемой ДНК. Второй —
присоединить к этой ДНК, перед ее началом, с помощью естественной
сахаро-фосфатной связи другую короткую, но хорошо известную последовательность
нуклео-тидов. Синтезировать праймер по ней, на нее же его посадить и таким
образом заставить ДНК-полимеразу считывать интересующую нас матрицу с первого
нуклеотида. Оба варианта решения проблемы можно найти в уже знакомом нам
материале:
1. Выяснение начальной
последовательности секвенируемого фрагмента ДНК
а) Если о нем ничего неизвестно,
то можно воспользоваться «устаревшим» методом Максама и Гилберта, который для
первых десятков нуклеотидов достаточно быстро дает вполне надежные сведения.
б) В случае, если нас интересует
секвенирование определенного гена, направляющего биосинтез вполне конкретного
белка известной структуры, и если есть основание полагать, что этот ген (или
хотя бы его начало) входит в состав обследуемого фрагмента ДНК. А значит и
такой же длины начальную последовательность дезоксирибонуклеотидов
соответствующего гена. Синтезированный праймер в этом случае просто
воспроизведет расшифрованную часть иРНК.
2. Присоединение к началу секвенируемого фрагмента
известной последовательности ДНК для синтеза праймера по ней.
Эту операцию мы уже, по существу
говоря, проделывали, когда рассматривали возможность встраивания фрагментов
чужеродной ДНК, длиною в тысячи нуклеотидов, в плазмиды. Полная
последовательность нуклеотидов для множества плазмид (находящихся в продаже)
хорошо известна. Таким образом мы можем естественным образом связать начало (и
конец) секвенируемого фрагмента ДНК с известной последовательностью нуклеотидов
плазмиды.
Встает вопрос: как узнать точно
в какое место плазмиды включился наш фрагмент и как его потом «вырезать»
обратно вместе с известным, ему предшествующим куском плазмиды — достаточным по
своим размерам для посадки на него надежного праймера? Для ответа на этот
вопрос следует вспомнить о существовании (и доступности на рынке) плазмид с
«поликлоновым сайтом», насчитывающим несколько десятков пар оснований,
искусственно синтезированном так, чтобы содержать в себе «сайты узнавания» для
многих рестриктаз.
Для решения нашей задачи надо
подобрать две рестриктазы, сайты узнавания которых в пределах поликлонового
сайта отстояли бы друг от друга достаточно далеко, на расстояние, большее, чем
длина будущего праймера секвенирования. Одна рестриктаза, сайт узнавания
которой находился бы в «конце» поликлонового сайта (если мы определились с
направлением будущего секвенирования), должна послужить для встраивания
подлежащего секвенированию фрагмента ДНК. Вторая — для его последующего
вырезания из плазмиды вместе с участком поликлонового сайта разделявшим сайты
узнавания обеих рестриктаз. Вся последовательность нуклеотидов на этом участке
известна и потому синтезировать комплементарный к нему праймер не представит
труда.
Последующее секвенирование таким
образом удлиненного фрагмента нашей ДНК либо начнется с его первого нуклеотида,
либо с нескольких предшествующих нуклеотидов, относящихся к копированию
присоединенного участка поликлонового сайта. Эти нуклеотиды легко узнать и
отделить от последовательности самого исследуемого фрагмента ДНК.
Естественно, что ввиду такой
определенности ситуации, фирмы-поставщики плазмид с поликлоновыми сайтами предлагают
и готовые праймеры (обычно 18-членные), которые они вправе называть
«универсальными», ибо они пригодны для секвенирования любых фрагментов ДНК,
таким образом подготовленных.
В последнее время для умножения
количества секвенируемой ДНК клонированием и создания места посадки праймера
стали широко использовать бактериофаг М13. Это — нитевидный фаг, содержащий
однонитевую, полностью расшифрованную ДНК. В нее, с помощью рестриктаз, точно
так же, как в плазмиду можно встроить чужеродную ДНК. Попадая в клетку E.coli этот фаг приобретает
двунитевую структуру и таким образом размножается в клетке («репликативная
форма») до более чем 100 копий. Во время деления клетки продолжает размножаться
и фаговая ДНК. Но одновременно с этим клетка E.coli (не погибая!) выбрасывает в питательную среду готовые
фаговые частицы опять в виде однонитевой ДНК, одетой белком. После удаления E.coli центрифугированием, свободные
фаги обрабатывают фенолом и получают однонитевую ДНК фага вместе с изначально
встроенным в нее фрагментом чужеродной ДНК. Разобравшись таким образом с
проблемой праймера, займемся другими важными практическими аспектами
секвенирования ДНК.
Во-первых отметим, что в
процессе секвенирования матричная ДНК должна все время оставаться строго
однонитевой, без возможных «шпилек» — локальных двунитевых участков,
образующихся в силу наличия в этой ДНК близко расположенных, пусть небольших,
но комплементарных последовательностей. То же самое относится и к меченым
отрезкам ДНК в процессе их разделения электрофорезом. Как мы увидим ниже, в
процессе комплементарного синтеза по методу Сэнджера (он повторяется
многократно — в несколько циклов) такая опасность не возникает, так как в
каждом цикле имеется стадия предварительной полной денатурации при температуре
96°С, а само копирование осуществляется при температуре 60°С. Но электрофорез
приходится проводить в сильно денатурирующей среде: 80% -ном растворе формамида,
содержащим 5 mM раствор ЭДТА Во-вторых, следует
озаботиться тем, чтобы при электрофорезе количество флюоресцентно меченого
материала в каждой полосе (даже такой, в которой содержится наименьшее число
отрезков ДНК) было достаточным для надежной регистрации. Вместе с тем, этого
желательно добиться без чрезмерного расходования исходного материала ДНК,
который обычно дефицитен.
Поэтому реакцию ограниченного
(включением дидезоксирибонуклеотида) матричного синтеза на том реальном
количестве секвенируемой ДНК, которое направляется в эксперимент, повторяют
многократно. Это делается точно так же, как в рассмотренной ранее симметричной
ПЦР-реакции. Но с тем отличием, что используется только один, начальный праймер
(«асимметричная ПЦР-реакция»). Этап элонгации заканчивается по достижении конца
матрицы (если он не был остановлен раньше). Комплементарный синтез от второго
праймера в обратном направлении здесь не фигурирует.
Подобно тому, как это описано в
главе 6, здесь готовят 20 мкл инкубационной смеси, в которой содержится: одно
или двуните-вая нить ДНК секвенируемого фрагмента (в последнем случае будет
копироваться только одна из нитей — та, для которой синтезирован праймер),
избыточное количество 4-х нормальных дезоксирибонуклеозидтрифосфатов,
ограниченное количество 4-х флюоресцентных дидезоксирибонуклеозидтрифосфатов,
термостабильная Taq ДНК-полимераза и в достаточном
количестве синтетический праймер (все это в буфере с MgClg).
Инкубационная смесь прогревается предварительно в тонкостенной полипропиленовой
пробирочке емкостью в 0,2 или 0,5 мл при 96 °С для полной денатурации ДНК.
Затем ее помещают во встроенный в прибор термоблок, где автоматически
осуществляется 25 последовательных циклов, каждый из которых состоит из
следующих, очень быстро сменяющих друг друга термических экспозиций:
— 10 секунд при 96 °С,
— 4 минуты при 60°С.
Экспозиция при 96°С освобождает
однонитевые матричные молекулы секвенируемой ДНК от новосинтезированных
укороченных копий своей последовательности вместе с праймерами и Taq
ДНК-полимеразой.
При 50 °С новые молекулы
праймера гибридизуются с начальными участками освободившихся матриц. Вслед за
ними на эти матрицы садятся и молекулы Taq ДНК-полимеразы.
В течение 4-х минут они ведут
комплементарный синтез ДНК вплоть до момента случайного включения флюоресцентно
меченого дидезоксирибонуклеотида.
Количество копий при таком
однонаправленном синтезе не увеличивается многократно, как при симметричной
ПЦР-реакции с двумя праймерами, а возрастает в лучшем случае всего в 25 раз —
по числу циклов. Однако и этого оказывается достаточно для того, чтобы
ограничить количество исходно вносимой ДНК 0,2 или 0,5 микрограммами
(соответственно для однонитевой или двунитевой молекулы). В интересах реальной
ориентировки, не мешает заметить, что для фрагмента двунитевой ДНК длиной в
1000 пар нуклеотидов в 0,5 мкг содержится более 1011 копий этого
фрагмента. В каждом из циклов ПЦР-реакции все они снова и снова выступают в
качестве матриц для случайным образом укороченных копирований. Это обеспечивает
в конце концов достаточное число одинаковых по длине отрезков
флюоресцентномеченой ДНК в любой полосе электрофоретического разделения.
Впрочем, во избежание
флюоресцентного фона смесь этих отрезков следует очистить от неиспользованных
меченых дидезоксинулеозидтрифосфатов. С этой целью новосинтезированные отрезки
ДНК (вместе с исходными, немеченными матрицами) осаждают добавлением 1 мл
70%-го этанола и центрифугированием в микропробирках на 1,5 мл. Осадок
растворяют в 4 мкл 80%-ного формамида с ЭДТА, прогревают при 96°С 2 минуты и в
количестве 2 мкл вносят на старт трека пластины ПААГ.
Литература
1
Курашвили Л.В., Васильков В.Г., Келина
Н.Ю. Функция печени и состояние липидного обмена у больных до и после
оперативного вмешательства на желудочно-кишечном тракте. //Анестезиология и
реаниматология. - 1996. - N 3. - С.21-25.
2
Курашвили Л.В., Васильков В.Г., Келина
Н.Ю. Состояние метаболизма и гемодинамики печени у больных с хирургической
абдоминальной патологией в процессе интенсивной терапии. - IX Европейский
конгресс. - 1996. - Глазго.