Текст
                    E.S75
Терри А. Браун
ГЕНОМЫ

Терри А. Браун ГЕНОМЫ Перевод с английского А. А. Светлова Под редакцией д. б. н., проф. А. А. Миронова Москва ♦ Ижевск 2011
УДК 577.2 ББК 28.070 Б 875 Издание осуществлено при финансовой поддержке Российского фонда фундаментальных исследований по проекту № 08-04-07075 Браун Т. А. Геномы / Пер. с англ. — М.-Ижевск: Институт компьютерных исследований, 2011. — 944 с. Предлагаемая книга является первым наиболее полным и авторитетным руководством по интенсивно развивающейся области науки — молекулярной генетике, аналогов которо- му в мировой научной литературе нет. Издание охватывает молекулярную генетику от самых основ до экпрессии генома и молекулярной филогении. Изложение сопровождается огромным количеством цветных рисунков, в конце каждой главы приводятся задачи и вопросы, а также библиографический список. Книга предназначена для студентов, аспирантов и исследователей в области молекуляр- ной биологии, генетики и биоинформатики, а также всех специалистов, работающих в смежных с биологией и медициной областях. ISBN 0-8153-4138-5 (англ.) ISBN 978-5-4344-0002-2 (рус.) © Garland Science Publishing, 2007 © Перевод на русский язык: Ижевский институт компьютерных исследований, 2011 Перевод англоязычного издания Genomes 3rd ed./Т. A. Brown опубликован с разрешения издатель- ства Garland, являющегося подразделением компании Taylor & Francis. В данной книге содержится информация, полученная из авторитетных и весьма уважаемых ис- точников. Перепечатанный в виде цитат материал приводится с разрешения авторов и указанием источников. В книге представлен обширный список цитируемой литературы. Приложены все усилия к тому, чтобы опубликованная информация была надежной, однако автор и издатель не могут нести ответственность за достоверность всех приведенных материалов или последствия их использования. Все права защищены. Никакая часть данной книги не может быть перепечатана, воспроизведена, передана или использована в какой бы то ни было форме электронными, механическими или любыми иными средствами, которые известны в настоящее время или будут изобретены впо- следствии, включая фотокопирование, запись на магнитный носитель, микросъемку, или при помощи любой другой системы хранения и обработки информации, если на то нет письменного разрешения издательств. http://shop.rcd.ru http://ics.org.ru
Оглавление Предисловие..........................................................xi Примечание читателю................................................xiii Сокращения........................................................xviii Часть 1, Изучение геномов.............................................1 Глава 1. Геномы, транскриптомы и протеомы.............................3 1.1. ДНК..........................................................6 1.1.1. Гены состоят из ДНК...................................6 1.1.2. Структура ДНК.........................................8 1.2. РНК и транскриптом..........................................16 1.2.1. Структура РНК........................................16 1.2.2. Виды и содержание РНК в клетке.......................18 1.2.3. Созревание РНК-предшественника.......................19 1.2.4. Транскриптом.........................................20 1.3. Белки и протеом.............................................21 1.3.1. Структура белка......................................21 1.3.2. Протеом..............................................25 Глава 2. Изучение ДНК...................................................37 2.1. Ферменты для манипуляций с ДНК..............................39 2.1.1. ДНК-полимеразы.......................................40 2.1.2. Нуклеазы.............................................46 2.1.3. ДНК-лигазы...........................................51 2.1.4. Ферменты модификации концов..........................53 2.2. Клонирование ДНК............................................54 2.2.1. Клонирующие векторы и путь их применения.............56 2.3. Полимеразная цепная реакция (ПЦР)...........................70 2.3.1. Проведение ПЦР.......................................70 2.3.2. Применение ПЦР.......................................72 Глава 3. Картирование геномов...........................................81 3.1. Генетические и физические карты.............................83 3.2. Составление генетических карт...............................84 3.2.1. Первыми известными маркёрами служили гены............84 3.2.2. ДНК-маркёры для составления генетических карт........85 3.2.3. Анализ сцепления — основа составления генетических карт.95 3.2.4. Анализ сцепления генетических признаков у организмов различного типа.....................................103 3.3. Составление физических карт................................110 3.3.1. Составление рестрикционных карт.....................112 3.3.2. Флюоресцентная гибридизация in situ.................119 3.3.3. Картирование с помощью меченых участков последовательности..................................123
vi Оглавление Глава 4. Секвенирование геномов.........................................138 4.1. Методология секвенирования ДНК.................................139 4.1.1. Секвенирование ДНК с обрывом цепи.......................139 4.1.2. Альтернативные методы секвенирования ДНК................146 4.2. Сборка непрерывной последовательности ДНК......................150 4.2.1. Сборка последовательности методом дробовика.............150 4.2.2. Сборка последовательностей методом сборки контигов из клонов...................................................153 4.2.3. Секвенирование методом дробовика для полных геномов...158 4.3. Проекты расшифровки генома человека............................161 4.3.1. Стадия картирования в проекте «Геном человека»..........161 4.3.2. Секвенирование генома человека..........................163 4.3.3. Будущее проектов по изучению генома человека............164 Глава 5. Определение структуры последовательности генома и функций, ее составляющих.........................................................175 5.1. Определение местоположения генов в последовательности генома.176 5.1.1. Картирование генов с помощью анализа последовательности.176 5.1.2. Экспериментальные методы определения местоположения генов...................................................185 5.2. Определение функций отдельных генов............................191 5.2.1. Компьютерный анализ функций гена........................192 5.2.2. Экспериментальное определение функций гена..............197 5.2.3. Более подробные исследования активности белка, кодируемого неизвестным геном...........................205 5.3. Наглядный пример: аннотирование последовательности генома Sacharomyces cerevisiae.................................208 5.3.1. Аннотирование последовательности генома дрожжей.........208 5.3.2. Приписывание функций генам дрожжей......................213 Глава 6. Постижение механизмов функционирования генома..................223 6.1. Изучение транскриптома.........................................224 6.1.1. Изучение транскриптома посредством анализа последовательности......................................224 6.1.2. Изучение транскриптома с помощью анализа на микроматрицах или чипах..............................225 6.2. Изучение протеома..............................................233 6.2.1. Определение профилей белков — методология для опознавания белков в протеоме...........................233 6.2.2. Опознавание межбелковых взаимодействий..................237 6.3. За пределами протеома..........................................245 6.3.1. Метаболом...............................................245 6.3.2. Постижение биологических систем.........................247 Часть 2. Анатомия генома..............................................257 Глава 7. Ядерные геномы эукариотов....................................259 7.1. Ядерные геномы содержатся в хромосомах.........................260 7.1.1. Упаковка ДНК в хромосомах...............................261
Оглавление vii 7.1.2. Особенности хромосом в период метафазы..............262 7.2. Генетические характеристики ядерных геномов эукариотов.....267 7.2.1. Где именно в ядерном геноме эукариотов находятся гены?.268 7.2.2. Каким образом организованы гены в ядерном геноме эукариотов?.................................................269 7.2.3. Сколько генов находится в ядерном геноме эукариотов и каковы их функции?........................................276 7.2.4. Содержание повторной ДНК в ядерных геномах эукариотов..284 7.2.5. Рассеянные повторы..................................286 Глава 8. Геномы прокариотов и органелл эукариотов...................293 8.1. Физические характеристики геномов прокариотов..............294 8.1.1. Хромосомы прокариотов...............................294 8.2. Генетические характеристики геномов прокариотов............299 8.2.1. Каким образом организованы гены в геноме прокариотов?..300 8.2.2. Сколько генов имеется в геноме прокариотов и каковы их функции?.................................................303 8.2.3. Геномы прокариотов и понятие биологического вида....304 8.3. Геномы органелл эукариотов.................................307 8.3.1. Происхождение геномов органелл......................308 8.3.2. Физические характеристики геномов органелл..........309 8.3.3. Генетическое содержание геномов органелл............311 Глава 9. Геномы вирусов и мобильные элементы генома.................321 9.1. Геномы бактериофагов и вирусов эукариотов..................322 9.1.1. Геномы бактериофагов................................322 9.1.2. Геномы вирусов эукариотов...........................327 9.2. Мобильные элементы генома..................................331 9.2.1. Транспозиция через РНК-посредник....................332 9.2.2. ДНК-транспозоны.....................................336 Часть 3. Принципы функционирования геномов..........................347 Глава 10. Доступ к геному...........................................349 10.1. Внутри ядра...............................................350 10.1.1. Внутреннее строение ядра эукариотов................350 10.1.2. Хроматиновые домены................................355 10.2. Модификации хроматина и экспрессия генома.................360 10.2.1. Химическая модификация гистонов....................361 10.2.2. Влияние перестройки нуклеосом на экспрессию генома....365 10.3. Модификация ДНК и экспрессия генома.......................367 10.3.1. Подавление генома путем метилирования ДНК..........367 Глава 11. Сборка комплекса инициации транскрипции...................379 11.1. ДНК-связывающие белки и их сайты связывания...............380 11.1.1. Особые характеристики ДНК-связывающих белков.......381 11.1.2. Определение позиций сайтов связывания с ДНК в геноме..389 11.1.3. Взаимодействие между ДНК и связывающимися с ней белками....................................................394
viii Оглавление 11.2. Взаимодействия белков с ДНК в ходе инициации транскрипции...398 11.2.1. РНК-полимеразы.......................................398 11.2.2. Последовательности, распознаваемые при инициации транскрипции.................................................399 11.2.3. Сборка комплекса инициации транскрипции..............402 11.3. Регулирование инициации транскрипции........................407 11.3.1. Стратегии управления инициацией транскрипции у бактерий.408 11.3.2. Регуляция инициации транскрипции у эукариотов........413 Глава 12. Синтез и созревание РНК.....................................429 12.1. Синтез и созревание РНК бактерий............................430 12.1.1. Синтез транскриптов в организмах бактерий............430 12.1.2. Управление выбором между элонгацией и терминацией....435 12.1.3. Созревание бактериальных РНК.........................441 12.1.4. Деградация бактериальных РНК.........................445 12.2. Синтез и созревание РНК эукариотов..........................447 12.2.1. Синтез мРНК эукариотов РНК-полимеразой II............447 12.2.2. Удаление интронов из ядерной пре-мРНК................454 12.2.3. Синтез функциональных РНК у эукариотов...............465 12.2.4. Сплайсинг пре-рРНК и пре-тРНК у эукариотов...........466 12.2.5. Химическая модификация РНК эукариотов................471 12.2.6. Деградация РНК эукариотов............................475 12.2.7. Перенос РНК в пределах клетки эукариотов.............480 Глава 13. Синтез и процессинг протеома................................492 13.1. Роль тРНК в синтезе белка...................................493 13.1.1. Аминоацилирование: присоединение аминокислот к молекулам тРНК............................................493 13.1.2. Взаимодействия кодон-антикодон: прикрепление молекул тРНК к мРНК.........................................498 13.2. Роль рибосомы в синтезе белка...............................501 13.2.1. Структура рибосомы...................................501 13.2.2. Инициация трансляции.................................504 13.2.3. Стадия элонгации в ходе трансляции...................512 13.2.4. Терминация трансляции................................518 13.2.5. Трансляция у архей...................................519 13.3. Посттрансляционный процессинг белков........................520 13.3.1. Сворачивание белка...................................521 13.3.2. Обработка протеолитическим расщеплением..............525 13.3.3. Обработка химической модификацией....................527 13.3.4. Интеины..............................................529 13.4. Деградация белка............................................530 Глава 14. Регулирование активности генома.............................540 14.1. Непостоянные изменения в активности генома..................543 14.1.1.'. Передача сигнала посредством импорта внеклеточного сигнального соединения......................................544 14.1.2', Передача сигналов опосредствуется рецепторами клеточной ” поверхности...........................................549
Оглавление ix 14.2. Постоянные и полупостоянные изменения в активности генома....559 14.2.1. Перестройки генома....................................559 14.2.2. Изменения в структуре хроматина.......................564 14.2.3. Регулирование генома петлями обратной связи..........566 14.3. Регулирование активности генома в ходе развития организма...566 14.3 .1.ЪЛизогенный цикл бактериофага X.......................567 14.3Д Спорообразование у Bacillus...........................569 14.3. 3. Развитие яйцевода у Caenorhabditis elegans..........573 14.3) 4. Развитие Drosophila melanogaster....................577 Часть 4. Механизмы репликации и эволюции геномов......................593 Глава 15. Репликация генома...........................................595 15.1. Топологическая проблема.....................................597 15.1.1. Экспериментальное доказательство предложенной Уотсоном и Криком схемы репликации ДНК...............................597 15.1.2. ДНК-топоизомеразы решают топологическую проблему наделе.......................................................600 15.1.3. Вариации на тему полуконсервативности................602 15.2. Процесс репликации..........................................604 15.2.1. Инициация репликации генома..........................604 15.2.2. Стадия элонгации репликации..........................608 15.2.3. Терминация репликации................................619 15.2.4. Поддержание концов линейной молекулы ДНК.............622 15.3. Регулирование репликации генома у эукариотов................627 15.3.1. Согласование репликации генома и деления клетки......627 15.3.2. Управление во время S-фазы...........................630 Глава 16. Мутации и репарация ДНК.....................................641 16.1. Мутации.....................................................642 16.1.1. Причины мутаций......................................643 16.1.2. Воздействия мутаций..................................654 16.1.3. Сверхмутация и возможность запрограммированных мутаций....662 16.2. Репарация ДНК...............................................666 16.2.1. Системы прямого восстановления заполняют надрывы и исправляют модификации нуклеотидов некоторых типов.........667 16.2.2. Восстановление вырезанием............................668 16.2.3. Устранение несоответствий: исправление ошибок репликации ...672 16.2.4. Устранение разрывов ДНК..............................674 16.2.5. Обход повреждения ДНК во время репликации генома.....676 16.2.6. Дефекты репарации ДНК лежат в основе многих болезней человека, в том числе и появления раковых образований.......678 Глава 17. Рекомбинация................................................687 17.1. Гомологичная рекомбинация...................................689 17.1.1. Модели гомологичной рекомбинации.....................689 17.1.2. Биохимия гомологичной рекомбинации...................692 17.1.3. Гомологичная рекомбинация и репарация ДНК............696
X Оглавление 17.2. Сайтспецифическая рекомбинация............................697 17.2.1. Встраивание ДНК бактериофага X в геном Е. coli.....698 17.2.2. Сайтспецифическая рекомбинация — помощь в генной инженерии..................................................700 17.3. Транспозиция..............................................701 17.3.1. Репликативная и консервативная транспозиция ДНК-транспозонов...........................................702 17.3.2. Транспозиция ретроэлементов........................703 17.3.3. Каким образом клетки минимизируют вредное влияние транспозиции?..............................................706 Глава 18. Механизм эволюции геномов.................................713 18.1. Геномы: первые десять миллиардов лет......................714 18.1.1. Происхождение геномов..............................714 18.2. Приобретение новых генов..................................719 18.2.1. Приобретение новых генов в ходе событий дупликации.721 18.2.2. Приобретение новых генов от других видов...........735 18.3. Некодирующая ДНК и эволюция генома........................736 18.3.1. Мобильные генетические элементы и эволюция генома...737 18.3.2. Происхождение интронов.............................738 18.4. Геном человека: последние пять миллионов лет..............741 Глава 19. Молекулярная филогенетика.................................752 19.1. От классификации до молекулярной филогенетики.............753 19.1.1. Зарождение молекулярной филогенетики...............753 19.2. Восстановление филогенетических деревьев на основе ДНК....757 19.2.1. Основные характеристики построенных на основе ДНК филогенетических деревьев..................................757 19.2.2. Восстановление дерева..............................761 19.3. Возможности применения молекулярной филогенетики..........771 19.3.1. Примеры использования филогенетических деревьев....771 19.3.2. Молекулярная филогенетика как инструмент изучения предыстории человека.......................................774 Приложение..........................................................792 Словарь терминов....................................................821 лагодарности........................................................871 Предметный указатель................................................874
Предисловие Со времени выпуска второго издания книги «Геномы» прошло четыре года, отмеченных удивительными открытиями. Расшифрованные последовательности хромосом человека появлялись через равные промежутки времени, и был завершен проект секвенирования генома шимпанзе. Число эукариотов с частично или полностью установленными после- довательностями геномов растет впечатляющими темпами, а новые генетические последовательности прокариотов публикуются в виртуальном пространстве каж- дую неделю. Экспериментальные методы изучения транскриптомов и протеомов дают нам ключи к новому пониманию механизма экспрессии генома, а недавно возникшая дисциплина — системная биология — связывает учение о геномах с клеточной биохимией. Все эти достижения были включены в третье издание книги «Геномы». В частности, материал, ранее умещавшийся в самостоятельную главу по анатомии генома, был расширен до трех глав, и, кроме того, я значительно увеличил объем сведений о постгеномике, написав отдельные главы по анализу последовательностей, а также по изучению транскриптомов и протеомов. Наряду с этим, я воспользовался возможностью дать более глубокое описание процессов экспрессии, репликации и рекомбинации генома. Эти изменения привели к увеличению объема «Геномов», и, с тем чтобы компенсировать этот «недостаток», я попытался сделать книгу более удобной для читателя. Выделенные цветом поля теперь используются только для описания технических методов, так что в целом текст книги меньше разбит на разнородные части, что обусловливает более цельное изложение материала. Иллюстрации были полностью переработаны с целью привнесения в рисунки большей ясности и наглядности и придания книге более привлекательного внешнего вида. Списки рекомендуемой дополнительной литературы и перечни задач в конце каждой главы подверглись столь же всесторонней переоценке. В ходе этого пересмотра я учитывал множество отзывов от ряда лекторов и студентов из разных уголков мира. Этих людей буквально «так много, что их невозможно упомянуть», так что я хотел бы сказать им общее «спасибо». Один человек, для которого я приберег индивидуальную благодарность,— Даниела Делнери из Манчестерского университета, комментарии которой касательно глав по постгеномике и молекулярной эволюции были столь исчерпывающи- ми, что я счел ненужным, за малым исключением, самостоятельно проводить какие-либо изыскания в этих областях. Я чрезвычайно признателен Теду Ли с биологического факультета Государственного университета Нью-Йорка за то, что он взял на себя устрашающую (по крайней мере для меня) задачу написания всеобъемлющих наборов вопросов и задач для каждой главы; эти задания для закрепления материала значительно повысили качество книги. Помимо этого, я благодарю Доминика Холдсуорта и Джеки Харбора из «Гарленд сайенс» за огром- ное содействие в работе над третьим изданием книги «Геномы», а также Мэтью Макклементса за выполненную им превосходную переработку иллюстративного материала книги. Наконец, третье издание «Геномов» не появились бы на свет
xii Предисловие без поддержки моей жены Кери. В разделе «Благодарности» к первому изданию я написал: «Если вы находите эту книгу полезной, то вы должны благодарить Кери, не меня, потому что именно она способствовала тому, что настоящая книга была написана». И мне очень приятно, что один или два человека и в самом деле откликнулись на мой призыв. Т. А. Браун, Манчестер
Примечание читателю Я постарался сделать третье издание «Геномов» настолько удобным для читате- ля, насколько это возможно. С этой целью я снабдил его различными методическими средствами, одни из которых помогают читателю свободно оперировать материалом книги, другие — делают ее эффективным учебным пособием. Организация книги «Геномы» разделены на четыре части: Часть 1 — «Изучение геномов» — начинается с вводной главы, которая знакомит читателя с геномами, транскриптомами и протеомами, после чего переходит к методам, сосредоточенным на клонировании и ПЦР, которые использовались в догеномную эпоху для исследования отдельных генов (глава 2). Затем описываются более специализи- рованные методы, применяемые для изучения геномов, в том порядке, в котором они использовались бы в типичном проекте расшифровки генома: методы построения генетических и физических карт (глава 3); методология секвенирования ДНК и стра- тегии, используемые для сборки непрерывной последовательности генома (глава 4); методы опознавания генов в последовательности генома и определения функций этих генов в клетке (глава 5) и, наконец, подходы к изучению транскриптомов и протеомов (глава 6). Проект «Геном Человека» был мною положен в основу композиции 1-й части, однако данный лейтмотив отнюдь не заглушает все прочие темы, и я постарался в пол- ной мере охватить стратегии, которые использовались ранее и используются поныне для изучения геномов других организмов. Часть 2 — «Анатомия геномов» — рассматривает анатомию геномов различного типа, встречающихся на нашей планете. Глава 7 освещает ядерные геномы эукариотов и ставит главный акцент на геноме человека. Глава 8 рассматривает геномы прокариотов и органелл эукариотов, причем последние включены сюда ввиду их прокариотического происхождения. Наконец, глава 9 описывает геномы вирусов и мобильные генетические элементы; они сгруппированы вместе, потому что мобильные элементы некоторых типов имеют определенное отношение к геномам вирусов. Часть 3 — «Механизм функционирования геномов» — охватывает материал, суть которого в прошлом была неадекватно описана как: «ДНК переходит в РНК и, да- лее, — в белок». Глава 10 обращается к приобретающему все большую значимость во- просу о том, как структура хроматина влияет на экспрессию генома. Глава 11 описывает сборку комплексов инициирования транскрипции у прокариотов и эукариотов и вклю- чает детальное рассмотрение ДНК-связывающих белков, каковые играют центральные роли на начальных стадиях экспрессии генома. Главы 12 и 13 сообщают подробности о синтезе транскриптома и протеома, а глава 14 рассматривает регулирование актив- ности генома. Сохранить объем главы 14 в разумных пределах трудно, поскольку к ре- гулированию генома имеют отношение очень много различных тем, но я надеюсь, что, используя конкретные примеры для иллюстрации общих вопросов, сумел достигнуть удовлетворительного баланса между краткостью и широтой охвата.
xiv Примечание читателю Часть 4 — «Принципы репликации и эволюции геномов» — связывает ре- пликацию, мутацию и рекомбинацию ДНК с последовательной эволюцией геномов, происходящей с течением времени. В главах 15-17 описаны молекулярные процессы, отвечающие за репликацию, мутацию, репарацию и рекомбинацию ДНК, а в главе 18 рассмотрены пути, по которым эти процессы, как принято считать, сформировали структуру и генетическое содержание геномов за время эволюции. Наконец, глава 19 посвящена использованию все более и более информативных сведений молекулярной филогенетики для установления эволюционных отношений между последователь- ностями ДНК. Организация глав Основные результаты Каждая глава начинается с перечня «основных результатов». Они были сформули- рованы очень тщательно и представляют собой не просто ряд конспектов фактического содержания каждой главы, но, напротив, показывают уровень и качество знаний, кото- рые студент должен приобрести по прочтении главы. Поэтому «основные результаты» перечисляют то, что студент должен уметь описать, нарисовать, обсудить, объяснить, оценить, при этом каждый глагол подобран таким образом, чтобы в точности указать действие умудренного знакомством с этой главой студента. Цель данного средства со- стоит в том, чтобы избавить студентов от сомнений по поводу того, что они должны из- влечь из каждой главы, а следовательно, и беспокойств о том, достаточно ли тщательно они проработали материал. Иллюстрации Хорошая схема несомненно стоит тысячи слов, плохая может запутать читателя, а излишняя попросту отвлекает. Поэтому я постарался сделать так, чтобы каждая иллюстрация была необходима и служила своей цели, а не просто разбивала бы текст и придавала бы книге привлекательный вид. Также я старался сделать рисунки воспро- изводимыми, потому что, по моему мнению, оное делает их намного более полезными в качестве учебного пособия для студента. Я никогда не понимал склонности некоторых авторов превращать иллюстрации учебника в произведения искусства, потому что если студент не может перерисовать ту или иную диаграмму, тогда это просто иллюстрация, которая не помогает студенту усвоить информацию, каковую она призвана в себе нести. Иллюстрации в «Геномах» настолько ясны, просты и незагромождены, насколько это возможно. Технические примечания Основной текст дополнен и расширен рядом технических примечаний, заключен- ных в отдельные рамки. Каждое техническое примечание представляет собой само- стоятельное описание какого-либо метода или группы методов, важных в изучении геномов. Технические примечания предназначены для чтения вкупе с основным текстом, причем каждое из них расположено в том месте книги, где применение этого метода упоминается в первый раз.
Примечание читателю xv Вопросы, задачи и тесты по рисункам В конце каждой главы приведены упражнения для самостоятельной работы че- тырех различных типов: • Вопросы закрытого типа охватывают ключевые пункты главы и проверяют пони- мание студентом основ материала. Традиционалисты иногда ставят под сомнение ценность вопросов закрытого типа из-за формальной оценки знаний, но не может быть никакого сомнения в их ценности как средства повторения пройденного материала: если студенты могут точно ответить на каждый из таких вопросов, то они почти наверняка превосходно знают фактическое содержание главы. • Вопросы открытого типа требуют самостоятельно сформулированного ответа длиной 50-300 слов или иногда просят нарисовать диаграмму либо таблицу с по- яснениями. Вопросы в полной мере охватывают содержание соответствующей главы, сформулированы довольно близко к тексту, и ответы на большую часть из них могут быть проверены путем простого сопоставления их с соответствующи- ми частями текста. Студент может пользоваться вопросами открытого типа для систематической работы над материалом главы или может выбирать отдельные вопросы, с тем чтобы оценивать свою способность отвечать на вопросы по опреде- ленным темам. Вопросы открытого типа могут быть использованы также и на контрольных работах «с закрытой книгой». • Изыскательские задачи требуют более развернутого ответа. Они изменяются по характеру и трудности, самая простая из них требует немного больше усилий, чем обыкновенный литературный обзор, при этом цель этих задач состоит в том, чтобы студент продвинулся в своих изысканиях на несколько стадий от той точки, от которой отправляются «Геномы». Иные задачи требуют, чтобы студент оценил утверждение или гипотезу на основании своего понимания материала книги, по возможности дополняя его чтением дополнительной литературы по предмету. Есть надежда, что эти задачи в некоторой степени разовьют мышление и критическое осмысление пройденного материала. Отдельные задачи довольно трудны, в не- которых случаях до такой степени, что нет и не может быть однозначного ответа на поставленный вопрос. Они предназначены для того, чтобы вызвать прения и обсуждения, которые расширяют круг знаний участвующих в них студентов и по- нуждают их тщательно обдумывать свои утверждения. За изыскательские задачи можно приняться студентам, работающим индивидуально, или же, напротив, они могут служить отправной точкой для обсуждения в группе. • Тесты по рисункам подобны вопросам открытого типа, но ставят отобранные иллюстрации предстоящей главы в фокус упражнения. Эти тесты ценны в качестве средства соединения фактической информации, полученной от чтения текста, со структурами и процессами, которые иллюстрированы рисунками. Хорошая схема действительно стоит тысячи слов, но только в том случае, если эта схема изучена тщательно и полностью понята. Тесты по рисункам как раз помогают добиться такого понимания. Ответы на нечетные вопросы закрытого типа, открытого типа и тесты по рисункам даны в приложении. По запросу, ответы на все вопросы будут высланы преподавателям, приобретшим книгу, через Garland Science Classwire™. Для изыскательских задач вместо ответов будет предоставлено руководство к решению.
xvi Примечание читателю Дополнительная литература Списки литературных источников в конце каждой главы включают те исследовател ь- ские статьи, обзоры и книги, которые мне видятся как самые полезные источники дополни- тельного материала. Мое намерение на всем протяжении «Геномов» состояло в том, чтобы студенты могли использовать такие списки литературы для получения дополнительной информации при написании развернутых докладов или диссертаций на определенные темы. Поэтому я включал в них исследовател ьские статьи, но только в том случае, если был уверен в том, что их содержание будет понятно большинству читателей книги, а не только особо одарённым единицам. Акцент поставлен на доступные обзоры типа Перспектив «Science», Новостей и Обзоров «Nature» и статей в журналах «Trends»; одно из достоинств таких общих статей состоит в соответствующем контексте и «каркасе» для той или иной части работы. Большинство списков литературы разделено на секции, отражающие организацию инфор- мации в главе, и в некоторых случаях я добавлял в конце сведений об источнике несколько слов, характеризующих отличительную ценность каждого такого источника, с тем чтобы помочь читателю принять решение, который из них стоит просмотреть в первую очередь. Списки литературы для чтения далеко не всеисчерпывающие, и я поощряю читателей про- вести некоторое время за просмотром полок своих собственных библиотек1) в поиске других книг и статей. Зачастую бывает, что такой просмотр позволяет обнаружить интересные вещи, о существовании которых и не подозреваешь! Словарь терминов Лично я весьма одобряю использование словарей терминов в качестве методи- ческих средств и поэтому привел обширный глоссарий в третьем издании «Геномов». Каждому термину, который выделен полужирным шрифтом в тексте книги, дано опреде- ление в словаре терминов, наряду со множеством допол нительныхтерминов, с которыми читатель мог бы встретиться при обращении к книгам или статьям из списков литера- туры для чтения. Каждый термин из словаря терминов приведен также и в алфавитном указателе, так что читатель может быстро найти путь к соответствующим страницам, где интересующий его термин из словаря описан более подробно. Для преподавателей Ресурс Garland Science Classwire™, расположенный по адресу http://www.classwire. com/garlandscience, предлагает учебные ресурсы и инструменты систематизации курса для читающих его преподавателей. Он содержит изображения из третьего издания «Геномов» в форматах JPEG и PowerPoint®. Вопросы закрытого типа, вопросы откры- того типа, изыскательские задачи и тесты по рисункам, для которых в приложении не дано никаких ответов или руководств, полезны для задания их в качестве домашней работы и в качестве вопросов к экзамену. Ответы и руководства к этим упражнениям будут высланы преподавателям по запросу через Classwire™. Преподаватели, кото- рые приобрели настоящее издание «Геномов», могут дополнительно получить доступ к ресурсам из других наших учебников. Classwire™ может послужить также гибким и удобным в работе инструментом систематизации курса, который позволяет препо- давателям создавать веб-сайты для своих занятий. Он предлагает такие средства, как составитель программы курса, календарь курса, центр сообщений, планировщик курса, виртуальный рабочий день и менеджер ресурсов. Для всего этого не требуется знания программирования и владения тонкими техническими навыками. * и Интернета. — Прим. ред.
Примечание читателю xvii Перечень рецензентов Автор и издатель выражают глубочайшую признательность следующим рецензен- там за их кропотливый труд над совершенствованием этого издания. Дин Деннер, Медицинская школа Университета Эмори Даниела Делнери, Манчестерский университет Юрий Дуброва, Лестерский университет Барт Эгген, Гронингенский университет Роберт Фоулер, Государственный университет Сан-Хосе Адриан Хол, Университет Шеффилда Холама Глин Дженкинс, Аберистуитский университет Торстен Кристенсен, Орхусский университет Майк Макперсон, Университет Лидса Эндрю Рид, Манчестерский университет Дарси Расселл, Бейкерский колледж Амал Шервингтон, Университет Центрального Ланкашира Роберт Слейтер, Хартфордширский университет Клаас Сварт, Вагенингенский университет Джон Тейлор, Ньюкаслский университет Гёйдо ван ден Акервекен, Утрехтский университет Васси Варе, Лехигский университет Мэтью Аптон, Манчестерский университет
Сокращения 5-bU 5-бромоурацил CRM машина перестройки хромати- А аденин; аланин на ABF фактор связывания ARS CstF фактор стимуляции расщепле- Ac/Ds мобильные элементы расте- ния ний — активатор/диссоциа- СТАВ цетил триметил аммонийбромид тор С-КД С-концевой домен ala аланин cys цистеин ANT-C комплекс Antennapedia D аспарагиновая кислота arg аргинин DAG 1,2-диацилглицерин ARMS амплификация рефракторной Dam ДНК-аденинметилаза мутационной системы DAPI 4,6-диамино-2-фенилиндолди- ARS автономно реплицирующаяся гидрохлорид последовательность DASH динамическая аллелеспецифи- asn аспарагин ческая гибридизация А-сайт акцепторный сайт рибосомы DBS участок связывания двуните- ASO аллелеспецифический олигону- войДНК клеотид Dem ДНК-цитозинметилаза asp аспарагиновая кислота Dfd Deformed ВАС бактериальная искусственная DMSO диметилсульфоксид хромосома Dnmt ДНК-метилтрансфераза bis 1Ч,1Ч’-метиленбисакриламид DPE нижерасположенный промотор- BLAST основное программное средство ный элемент поиска локальных выравнива- DSB двунитевой разрыв ний DSP1 белок 1 системы развития Bx-C комплекс Bithorax спина-брюхо C цистеин; цитозин dsRAD РНК-зависимая дезаминаза CAP белок-катаболитный регулятор dsRBD домен связывания двунитевой CASP CTD-связанный SR-подобный РНК белок E глутаминовая кислота СЕРН Центр изучения полиморфиз- Е-сайт сайт выхода из рибосомы мов человека EDTA этилендиаминтетраацетат CHEF электрофорез в геле с ограни- ченными контуром однородны- ми электрическими полями eEF EEO фактор элонгации у эукарио- тов величина электроэндосмоса CJD болезнь Крейцфельда-Якоба EF фактор элонгации Col колицин elF фактор инициации у эукарио- CPSF фактор расщепления и специ- тов фичности полиаденилирова- ния EMS этилметансульфонат
Сокращения xix eRF фактор высвобождения (релиз- фактор) у эукариот ICAT закодированный изотопом яр- лык по сродству ES эмбриональный ствол ICF иммунная недостаточность, ESE энхансер сплайсинга неустойчивость центромеры ESS сайленсер сплайсинга и лицевые аномалии EST ярлык экспрессируемой после- IF фактор инициации довательности 1g иммуноглобулин F фертильность; фенилаланин IHF клеточный фактор встраивания FEN эндонуклеаза откидной створки ile изолейцин FIGE гель-электрофорез в обращае- Inr инициатор мом поле Ins(l,4,5)P: 3 инозитол-1,4,5-трифосфат FISH флюоресцентная гибридизация IPTG изопропилтиогалактозид in situ IRES внутренний участок входа ри- FRAP восстановление флюоресценции босомы после фотообесцвечивания IS инсерционная последователь- G глицин; гуанин ность G1 фаза G1 митоза ITF клеточный фактор встраивания G2 фаза G2 митоза ITR концевой инвертированный по- GABA у-аминомасляная кислота втор GAP белок, активирующий ГТФазу JAK киназа Януса GFP зеленый флюоресцентный белок К лизин gin глутамин L лейцин glu глутаминовая кислота LCR управляющая локусом область giy глицин leu лейцин GNRP белок, высвобождающий ну- клеотид гуанин LINE длинный рассеянный ядерный элемент GTF общий фактор транскрипции LTR длинный концевой повтор H гистидин lys лизин ГАТ гипоксантин + аминоптерин + M метионин; фаза митоза тимидин MALDI-TOF времяпролетная масс-спектро- HBS гетеродуплексный участок свя- зывания метрия с лазерной десорбцион- ной ионизацией матрицы his гистидин MAP белки, ассоциированные с ми- HLA лейкоцитарный антиген чело- века кротрубочками; активируемый митогеном белок HMG группа ядерных негистоновых белков с высокой электрофоре- MAR область прикрепления к ма- триксу тической подвижностью MeCP метил-СрС-связывающий бе- HOM-C комплекс гомеотического гена лок HPRT гипоксантинфосфорибозил- met метионин трансфераза MGMT О6-метилгуанин-ДНК-метил- HTH спираль-поворот-спираль трансфераза I изолейцин mol моль
хх Сокращения MudPIT метод многомерной идентифи- кации белков MULE Mutator-подобный транспони- руемый элемент N 2'-дезоксинуклеозид-5'-трифос- фат; аспарагин NHEJ негомологическое соединение концов NJ объединение соседей NMD опосредствованный бессмыс- ленным кодоном распад РНК OFAGE электрофорез в геле с ортого- нально чередующимся полем OLA анализ методом лигирования олигонуклеотидов Отр белок внешней мембраны ORC комплекс узнавания области инициации OTU оперативная таксономическая единица Р пролин P-сайт пептидильный сайт рибосомы РАС искусственная хромосома на основе бактериофага Р1 PADP полиаденилатсвязывающий белок PAUP филогенетический анализ по критерию бережливости PCNA ядерный антиген пролифери- рующих клеток phe фенилаланин PHYLIP программный пакет для фило- генетического анализа PIC предынициаторный комплекс PNA (ПНК) пептидная нуклеиновая кисло- та pro пролин PSE проксимальный элемент после- довательности PSI-BLAST позиционное итеративное основ- ное программное средство поис- ка локальных выравниваний PtdIns(4,5)P2 фосфатидилинозитол-4,5- бисфосфат PTRF фактор высвобождения поли- меразы I и транскрипта Ри пурин Ру пиримидин Q глутамин R аргинин; пурин RACE быстрое размножение концов кДНК RBS участок связывания рибосомы RC комплекс репликации RF фактор высвобождения RFC фактор репликации С RFLP полиморфизм длины рестрик- та RHB домен гомологии Rel RISC РНК-индуцируемый подавляю- щий комплекс RLF фактор лицензирования репли- кации RMP белок-посредник репликации RPA белок репликации А RRF фактор повторного использова- ния рибосом RTVL ретровирусоподобный эле- мент S серин; стадия синтеза SAGE последовательный анализ экс- прессии генов SAP активируемый стрессом белок SAR область прикрепления к карка- су SCAF SR-подобный CTD-связанный фактор SCS специализированная структура хроматина Se-cis селеноцистеин ser серин siPHK короткая интерферирующая РНК SINE короткий рассеянный ядерный элемент SMAD семейство, связанное с SMA/MAD
Сокращения xxi SNP полиморфизм отдельного ну- val клеотида VNTR SRF фактор сывороточной реак- ции W SSB белок однонитевого связыва- X-gal ния SSLP полиморфизм длины последо- Y вательности YAC STAT передатчик сигнала и актива- тор транскрипции Yip STR простой тандемный повтор STS меченый участок последова- АДФ тельности АМФ Т треонин; тимин АП TAF TBP-связанный фактор ТАР очистка по тандемному срод- АТФ ству АТФаза TBP связывающийся с блоком ТАТА белок; связывающийся с тело- мерой белок БГЭ ВИО ТЕМЭД Н,1Ч,1Ч',1Ч'-тетраметилэтиленди- ВИЧ амин TF фактор транскрипции ГДФ ГМФ TGF трансформирующий фактор ро- ста thr Ti треонин опухолеродный ГТФ HDAC гяРНК TIC TAF- и инициаторзависимый кофактор ДНК Tm температура плавления ДНКаза Tn TOL транспозон толуол дНТФ TPA активатор профибринолизина дсн дАТФ ткани TRAP trp РНК-связывающий белок аттенюации ДЦТФ тРНК транспортная РНК trp триптофан ДДАТФ tyr тирозин U урацил ддЦТФ UCE вышележащий элемент управ- ления ддГТФ UTR нетранслируемая область валин переменное число тандемных повторений аденин или тимин; триптофан 5-бромо-4-хлоро-3-индолил- P-D-галактопиранозид пиримидин; тирозин дрожжевая искусственная хро- мосома дрожжевая интегрируемая плазмида аденозин-5'-дифосфат аденозин-5'-монофосфат апуриновый/апиримидино- вый аденозин-5'-трифосфат аденозин-5’-трифосфатаза бычья губчатая энцефалопатия вирус иммунной недостаточно- сти обезьян вирус иммунной недостаточно- сти человека гуанозин-5'-дифосфат гуанозин-5'-монофосфат гуанозин-5'-трифосфат гистондезацетилаза гетерогенная ядерная РНК дезоксирибонуклеиновая кис- лота дезоксирибонуклеаза 2'-дезоксинуклеозид-5'-трифос- фат додецил сульфат натрия 2'-дезоксиаденозин-5'-трифос- фат 2’-дезоксицитидин-5'-трифос- фат 2',3'-дидезоксиаденозин-5'-три- фосфат 2’,3'-дидезоксицитидин-5'-три- фосфат 2',3’-дидезоксигуанозин-5'-три- фосфат
xxii Сокращения ДДНТФ 2',3'-дидезоксинуклеозид-5'- трифосфат ддТТФ 2',3’-дидезокситимидин-5'-три- фосфат дГТФ 2’-дезоксигуанозин-5'-трифос- фат ЖХВР жидкостная хроматография вы- сокого разрешения ккал килокалория кДНК комплементарная ДНК кДа килодальтон ЛОШ логарифм отношения шансов мкм микрометр млрд п. н. миллиард пар нуклеотидов млн п. н. миллионов пар нуклеотидов миРНК микроРНК мРНК матричная РНК мцРНК малая цитоплазматическая РНК млн л. миллионов лет мякРНК малая ядрышковая РНК мяРНК малая ядерная РНК мяРНП малый ядерный рибонуклео- протеид нг нанограмм нм нанометр НАД никотинамидадениндинуклео- тид НАД-Н никотинамидадениндинуклео- тид восстановленный ННРПОК наследственный неполипозный рак прямой и ободочной кишки НТФ нуклеозид-5'-трифосфат ОЗУ память с произвольной выбор- кой ОРС открытая рамка считывания пг пикограмм п. н. пара нуклеотидов ПЦР полимеразная цепная реакция ПНФаза полинуклеотидфосфорилаза РНК рибонуклеиновая кислота РНКи РНК-интерференция РНКаза рибонуклеаза РНП рибонуклеопротеид рРНК рибосомная РНК РТ-ПЦР ревертазная ПЦР РПЭ-ПЦР ПЦР с рассеянными повторны- ми элементами слРНК сплайсированная лидерная РНК СПИД синдром приобретенного имму- нодефицита ТК тимидинкиназа тмРНК транспортно-матричная РНК тыс. п. н. тысяч пар нуклеотидов УФ ультрафиолетовый УТФ уридин-5’-трифосфат ЦТФ цитидин-5'-трифосфат цАМФ циклический АМФ цГМФ циклический ГМФ ЭРВ эндогенный ретровирус ЯМР ядерный магнитный резонанс
Часть 1 Изучение геномов Часть 1 — «Изучение геномов» — описывает методы и научные подходы, которые лежат в основе наших знаний о геномах. Мы начинаем со вводной главы, которая знакомит читателя с геномами, транскриптомами и протеомами, и затем, в главе 2, переходим к методам, ко- торые сосредоточены на клонировании ДНК и полимеразной цепной реакции и использу- ются для изучения коротких фрагментов ДНК, таких как отдельные гены. Глава 3 открывает наше изложение геномики, описывая прин- ципы построения генетических и физических карт, а глава 4 показывает связь между карти- рованием и секвенированием. По мере чтения главы 4 читатель убедится в том, что хотя кар- та может быть ценным помощником в сборке длинной последовательности ДНК, картиро- вание не всегда является необходимой пред- посылкой к секвенированию генома. В главе 5 мы рассматриваем различные подходы, при- меняемые для истолкования последователь- ности генома, а в главе 6 мы изучаем методы, употребляемые для исследования механизмов функционирования генома путем управления синтезом транскриптома и протеома и — по- средством этого — определения биохимиче- ских возможностей клетки. Глава 1 Геномы, транскриптомы и протеомы Глава 2 Изучение ДНК Глава 3 Картирование геномов Глава 4 Секвенирование геномов Глава 5 Определение структуры последовательности генома и функций её составляющих Глава 6 Понимание механизма функционирования генома
Глава 1 Геномы, транскриптомы и протеомы По прочтении главы 1 вы сможете: • Давать определения терминам «геном», «транскриптом» и «протеом», а также отвечать на вопрос о том, каким образом они взаимодействуют в процессе экс- прессии генома. • Описывать два эксперимента, по результатам которых молекулярные биологи пришли к заключению о том, что гены находятся в ДНК, а также разъяснять ограничения этих экспериментов. • Давать подробное описание структуры полинуклеотидов и указывать харак- терные химические различия между ДНК и РНК. • Обсуждать данные, на основании которых Уотсон и Крик построили модель структуры ДНК в виде двойной спирали, и описывать основные характеристики этой структуры. • Проводить различия между кодирующей и функциональной РНК и приводить примеры РНК обоих типов. • Вкратце описывать процессы синтеза и созревания РНК в клетке. • Давать подробное описание различных уровней структуры белка и объяснять, почему в основе разнообразия белков лежит разнообразие аминокислот. • Описывать основные характеристики генетического кода. • Объяснять, по какой причине функция белка зависит от последовательности аминокислот. • Перечислять главные роли белков в живых организмах и связывать разнообразие первых с функцией генома. Жизнь, какой мы ее видим, создается геномами мириад организмов, с которыми мы делим нашу планету. Каждый из этих организмов обладает геномом, который содержит биологическую информацию, необходимую для построения и поддержания организма живущего в настоящий момент времени представителя данного вида. Большинство геномов, в том числе геном человека и геномы всех остальных клеточных форм жизни, построены из ДНК (дезоксирибонуклеиновой кислоты), однако некоторые вирусы име- ют геномы из РНК (рибонуклеиновой кислоты). ДНК и РНК — полимерные молекулы, состоящие из цепей мономерных звеньев, называемых нуклеотидами. Геном человека, типичный для геномов всех многоклеточных животных, состоит из двух различных частей (см. рис. 1.1):
4 Часть 1. Изучение геномов Ядерный геном Митохондриальный геном °р8°о °ООО Рис. 1.1. Ядерный и митохондриальный компоненты генома человека • Ядерный геном включает приблизительно 3 200 000 000 нуклеотидов, распреде- ленных по 24-м линейным молекулам ДНК (самая короткая — 50000000 нуклео- тидов в длину, а самая длинная — 260 000 000), при этом каждая из них содержится в отдельной хромосоме. Этот набор из 24 хромосом состоит из 22 аутосом и двух половых хромосом: X и У. В целом на ядерный геном человека приходится при- близительно 35000 генов1). • Митохондриальный геном — кольцевая молекула ДНК длиной 16569 нуклео- тидов, многочисленные копии которой расположены в производящих энергию органеллах, называемых митохондриями. Митохондриальный геном человека содержит всего лишь 37 генов. Каждая из приблизительно 1013 клеток в теле взрослого человека имеет свою соб- ственную копию (или копии) генома; единственные исключения составляют клетки не- скольких особых типов — например, красные кровяные тельца, у которых в их полностью дифференцированном состоянии нет ядра. В подавляющем большинстве клетки являются диплоидными и, таким образом, содержат по две копии всех аутосом плюс две половые хромосомы (XX у женщин и ХУу мужчин), то есть всего 46 хромосом. Такие клетки называют соматическими, в отличие от половых клеток, или гамет, которые являются гаплоидны- ми и содержат лишь 23 хромосомы — по одной из каждой пары аутосом и одну половую хромосому. Клетки обоих типов заключают в себе около 8000 копий митохондриального генома — приблизительно по 10 копий в каждой митохондрии. Геном — хранилище биологической информации, но сам по себе он не способен выдать эту информацию клетке. Использование биологической информации, содер- жащейся в геноме, возможно лишь благодаря согласованным действиям ферментов и других белков, которые участвуют в сложной серии биохимических реакций, назы- В В последнем релизе — 24 тыс. генов. — Прим. ред.
Глава 1. Геномы, транскриптомы и протеомы 5 ГЕНОМ Транскрипция ТРАНСКРИПТОМ РНК-копии активных генов, кодирующих белки Трансляция ПРОТЕОМ Ассортимент белков клетки Рис. 1.2. Геном, транскриптом и протеом ваемой экспрессией генома (см. рис. 1.2). Первичным продуктом экспрессии генома является транскриптом, представляющий собой совокупность молекул РНК, получен- ных из тех кодирующих белок генов1), биологическая информация которых необходима клетке в данный момент времени. Транскриптом поддерживается за счет процесса, названного транскрипцией, в ходе которой отдельные гены копируются в молекулы РНК. Вторичный продукт экспрессии генома — протеом — есть ассортимент белков клетки, определяющий характер биохимических реакций, которые клетка способна осуществлять. Белки, составляющие протеом, синтезируются посредством трансляции отдельных молекул РНК, входящих в состав транскриптома. Эта книга посвящена геномам и их экспрессии. В ней рассказывается о том, как геномы изучаются (часть 1), как они организованы (часть 2), как функционируют (часть 3) и как реплицируются и эволюционируют (часть 4). Возможность написать эту книгу появилась лишь совсем недавно. Начиная с 1950-х гг. молекулярные биологи изучали отдельные гены или маленькие группы генов и на основании результатов этих исследований создали бога- тейшую научную теорию о механизмах функционирования генов. Однако методы, которые позволили исследовать полные геномы, появились лишь в последние 10 лет. Отдельные гены все еще интенсивно изучаются, но теперь такая информация об отдельных генах ин- терпретируется в контексте генома как целого. Этот новый, более широкий ракурс не только охватывает геномы, но и распространяется на всю биохимию и клеточную биологию. Сегодня ученым уже недостаточно понять отдельные биохимические пути или внутриклеточные процессы. Вызов незнанию теперь брошен системной биологией, которая пытается спле- сти все эти пути и процессы в сети, могущие описывать общие законы функционирования живых клеток и живых организмов. Эта книга проведет вас через сокровищницу наших современных знаний о геномах и покажет вам, что эта захватывающая область исследования образует основу нашего непрестанно совершенствующегося понимания биологических систем. Однако сначала мы должны обратить внимание на главные принципы молекулярной биологии и рассмо- треть основные характеристики биологических молекул трех типов, входящих в состав геномов и участвующих в их экспрессии: ДНК, РНК и белков. В последнее время выясняется все большая роль некодирующих РНК, поэтому в транскриптом вклю- чают все РНК, быть может за исключением рибосомных и транспортных, а не только белок-кодирующих. — Прим. ред.
6 Часть 1. Изучение геномов 1.1. ДНК ДНК была открыта в 1869 г. Иоганном Фридрихом Мишером, швейцарским биохи- миком, работавшим в германском городе Тюбингене. Первые экстракты, которые Мишер получил из белых кровяных телец человека, представляли собой неочищенные смеси ДНК и хромосомных белков, но в следующем году он переехал в Швейцарию, город Базель (в котором теперь располагается научно-исследовательский институт, названный его име- нем), и приготовил чистый образец нуклеиновой кислоты из спермы лосося. Химические анализы Мишера показали, что ДНК имеет кислотный характер и богата фосфором, а также позволили ему предположить, что отдельные молекулы являются очень большими, хотя лишь в 1930-х гг., когда к ДНК были применены биофизические методы исследования, удалось окончательно установить огромную длину ее полимерных цепей. 1.1.1. Гены состоят из ДНК Сегодня тот факт, что гены состоят из ДНК, настолько общеизвестен, что даже трудно себе представить, что в течение первых 75-ти лет после ее открытия истинная роль ДНК не подозревалась. Уже в 1903 г. У С. Саттон осознал, что структуры наследо- вания генов соответствуют поведению хромосом во время деления клетки; именно эта догадка привела к созданию хромосомной теории — предположению, что гены нахо- дятся в хромосомах. Исследование клеток методами цитохимии (после окрашивания их красителями, специфично связывающимися лишь с биохимическими веществами одного типа) показало, что хромосомы состоят из ДНК и белка, наличествующих при- близительно в равных количествах. После этого биологи пришли к выводу о том, что должны существовать миллиарды различных генов и поэтому генетический материал должен быть способен принимать множество различных форм. Но ДНК, казалось, не удовлетворяла данному требованию, потому что в начале двадцатого века думали, что все молекулы ДНК были одинаковыми. С другой стороны, было известно, и притом точ- но, что белки представляют собой весьма изменчивые полимерные молекулы, причем каждая образована уникальной комбинацией 20-ти химически различных аминокис- лотных мономеров1) (раздел 1.3.1). На основании этих фактов ученые попросту приняли гипотезу о том, что гены состоят из белка, а не из ДНК. Ошибочное представление о структуреДНК продолжало пребывать в умах ученых, но к концу 1930-х гг. стало известно, что ДНК, подобно белку, обладает огромной из- менчивостью. Первоначальная гипотеза о том, что генетическим материалом является белок, не утратила своей силы, но в конечном счете была ниспровергнута результатами двух важных экспериментов: • Освальд Эвери, Колин Маклеод и Маклин Маккарти показали, что ДНК есть актив- ный компонент трансформирующего начала (экстракта бактериальных кле- ток), которое, будучи смешано с безвредным штаммом Streptococcus pneumoniae, преобразует эти бактерии в вирулентную форму, способную вызывать у мышей пневмонию при введении в организм (см. рис. 1.3, а). В 1944 г., когда результаты этого эксперимента были опубликованы, лишь несколько микробиологов призна- ли, что наблюдаемая трансформация обусловлена передачей генов из экстракта клеток в живые бактерии. Но как только это положение было принято, истинное значение «эксперимента Эвери» стало ясным: гены бактерий должны были со- стоять из ДНК. На самом деле набор аминокислот не был точно известен вплоть до 60-х годов XX века. Например, два цистеина, соединенные S-S связью, считались отдельной аминокислотой — цистином. — Прим. ред.
а) Трансформирующее начало Глава 1. Геномы, транскриптомы и протеомы 7 б) Эксперимент Херши-Чейз Мышь выживает с . ДНК Белковый капсид Безвредные бактерии Безвредные бактерии + Мышь умирает трансформирующее начало. обработанное протеазой Безвредные бактерии + Мышь умирает трансформирующее начало Фаг, прикрепленный | Перемешивание в мешалке А А СО со А Фаги отсоединены или рибонуклеазой Безвредные бактерии + Мышь выживает трансформирующее начало, обработанное дезоксирибонуклеазой । Центрифугирование Бактериальный осадок “ 70 % 32Р 20 % 35S Рис. 1.3. Два эксперимента, которые позволили предположить, что гены состоят из ДНК: а) Эвери с сотрудниками показал, что трансформирующее начало состоит из ДНК. В двух верхних строках показана череда событий при введении мышам безвредных бактерий Streptococcus pneumoniae как с до- бавлением трансформирующего начала (клеточного экстракта, полученного из вирулентного штамма S. pneumoniae), так и без него. Если трансформирующее начало присутствует, то мышь умирает, потому что гены в трансформирующем начале преобразуют безвредные бактерии в вирулентную форму, при- чем эти вирулентные бактерии впоследствии извлекаются из легких мертвой мыши. Две нижние строки показывают, что обработка протеазой или рибонуклеазой не оказывает никакого воздействия на транс- формирующее начало и что трансформирующее начало инактивируется дезоксирибонуклеазой. б) Эксперимент Херши-Чейз, в котором были использованы бактериофаги Т2. Каждый бактериофаг содержит молекулу ДНК, заключенную в белковый капсид, к которому прикреплены «тело» и «ноги», позволяющие бактериофагу прикрепляться к поверхности бактерии и вводить свои гены в ее клетку. ДНК бактериофагов была помечена 32Р, а белок — 35S. Спустя несколько минут после инфицирования культура была перемешана, чтобы отделить пустые частицы фага от поверхности клеток. Затем культура была центрифугирована, в результате чего бактерии вместе с генами фагов собрались в капле осадка на дне пробирки, а более легкие частицы фагов остались плавать в суспензии. Херши и Чейз обнаружили, что бактериальный осадок содержит большую часть помеченного 32Р компонента фагов (ДНК) и только 20 % материала, помеченного 35S (белка фагов). Во втором эксперименте Херши и Чейз показали, что новые фаги, порожденные в конце цикла инфицирования, содержали менее 1 % белка из родительских фагов. Более подробное описание цикла инфицирования бактериофагами приведено на рис. 2.19 • Альфред Херши и Марта Чейз применяли мечение радиоактивными изотопами, с тем чтобы показать, что при заражении бактериальной культуры бактериофа- гами (тип вируса) главным компонентом бактериофагов, который проникает в клетки бактерий, является ДНК (см. рис. 1.3, б). Это было важнейшее наблюдение, потому что к тому времени уже было известно, что в течение цикла инфицирова- ния гены инфицирующих бактериофагов используются для управления синтезом
8 Часть 1. Изучение геномов новых бактериофагов и что этот синтез происходит в клетках бактерий. Однако если в клетки бактерий вводится только ДНК инфицирующих бактериофагов, то из этого следует, что гены этих бактериофагов должны состоять из ДНК. Хотя теперь нам и ясно, что эти два эксперимента предоставляют очевидные ре- зультаты, которые говорят нам, что гены состоят из ДНК, биологов того времени было не так легко убедить в этом. Оба эксперимента имеют ограничения, которые оставляют скептикам возможность утверждать, что белок все же может быть генетическим мате- риалом. Например, были сомнения о специфичности фермента дезоксирибонуклеазы, которую Эвери с сотрудниками применяли для инактивации трансформирующего начала. Этот результат — ядро доказательства того, что трансформирующим началом является ДНК, — был бы ошибочным, если, как казалось возможным, фермент содержал бы нижтожное количество (следы) загрязняющей протеазы и, следовательно, был бы способен вызывать также деградацию белка. Ни один из экспериментов с бактериофага- ми не позволяет сделать окончательного вывода, как подчеркнули Херши и Чейз, когда они опубликовали полученные ими результаты: «Наши эксперименты ясно показывают, что физическое разделение фага Т2 на генетическую и негенетическую составляющие возможно... Химическое определение генетической составляющей, однако, должно подождать до тех пор, пока на некоторые вопросы... не будет найден ответ». Огляды- ваясь в прошлое, можно сказать, что эти два эксперимента важны не из-за того, что они говорят нам, но потому, что они заставили биологов задуматься о том, что ДНК могла бы быть генетическим материалом и поэтому заслуживает изучения. Именно результаты этих экспериментов побудили Уотсона и Крика работать с ДНК, и, как мы позже увидим, именно совершенное ими открытие двойной спирали — структуры ДНК — разрешило приводивший ученых в замешательство вопрос о том, каким образом гены могут репли- цироваться, и окончательно убедило научный мир в том, что гены состоят из ДНК. 1.1.2. Структура ДНК Имена Джеймса Уотсона и Фрэнсиса Крика настолько тесно связаны с ДНК, что легко забыть о том факте, что когда они начали свою совместную работу в октябре 1951 г., подробная структура полимерной цепи ДНК уже была известна. Их вклад со- стоял не в том, что они определили структуру ДНК perse, но в том, что они показали, что в живых клетках две цепи ДНК переплетаются и образуют двойную спираль. Поэтому сначала мы должны ознакомиться с теми данными, которые были известны Уотсону и Крику, когда они приступали к своей работе. Нуклеотиды и полинуклеотиды ДНК — линейный, неразветвленный полимер, мономерные звенья которого пред- ставлены четырьмя химически различными нуклеотидами, могущими сочетаться между собой в любом порядке и образовывать цепи длиной в сотни, тысячи или даже мил- лионы единиц. Каждый нуклеотид в полимере ДНК состоит из трех компонентов (см. рис. 1.4): • 2'-дезоксирибозы, которая представляет собой пентозу, относящуюся к клас- су сахаров, состоящих из пяти атомов углерода. Эти пять атомов углерода про- нумерованы числами 1' (произносится «один-штрих»), 2' и так далее. Название «2'-дезоксирибоза» указывает на то, что этот специфический сахар есть произво- дная рибозы, в которой гидроксильная группа (-ОН), присоединенная к 2’-атому углерода в молекуле рибозы, была заменена атомом водорода (-Н);
Глава 1. Геномы, транскриптомы и протеомы 9 • азотистого основания — цитозин, тимин (моноциклические пиримидины), аденин или гуанин (дициклические пурины). Основание присоединено к Г-атому углерода молекулы сахара посредством (З-Ы-гликозидной связи, исходящей из атома азота номер один в пиримидинах или номер девять в пуринах; • фосфатной группы, состоящей из одного, двух или трех связанных между собой фосфатных остатков и прикрепленная к 5'-атому углерода в молекуле сахара. Фосфаты обозначаются буквами а, р и у, где а-фосфат непосредственно соединен с молекулой сахара. Молекулу, состоящую только из сахара и основания, называют нуклеозидом; добавление фосфатных остатков превращает его в нуклеотид. Хотя клетки содержат нуклеотиды с одним, двумя или тремя фосфатными остатками, материалом для син- теза ДНК служат лишь нуклеозидтрифосфаты. Полные химические названия четырех нуклеотидов, которые полимеризируются в ДНК, следующие: • 2'-дезоксиаденозин-5'-трифосфат; • 2’-дезоксицитидин-5’-трифосфат; • 2'-дезоксигуанозин-5’-трифосфат; • 2'-дезокситимидин-5’-трифосфат. Сокращенные названия этих четырех нуклеотидов соответственно дАТФ, дЦТФ, дГТФ и дТТФ или, при описании последовательности ДНК, соответственно А, С, G и Т. В полинуклеотиде отдельные нуклеотиды связаны фосфодиэфирными связями, образованными между 5'- и З’-атомами углерода (см. рис. 1.5). Из структуры этих связей мы можем видеть, что реакция полимеризации (см. рис. 1.6) происходит с удалением двух внешних фосфатных остатков (Р- и у-фосфаты) из одного нуклеотида и отщеплением гидроксильной группы, соединенной с З’-атомом углерода второго нуклеотида. Обратите внимание, что два конца полинуклеотида химически различны: на одном имеется сво- бодная трифосфатная группа, прикрепленная к 5'-атому углерода (5’-, или 5'-Р-конец), а) Нуклеотид О“ О" л ~ 1Р О“ , г- ’а 5* O-P-O-P-O-P-O-CHz Основание о о 0 4'Сн НС1 Фосфатная группа он н | Сахар б) Четыре основания ДНК nh2 Аденин (А) nh2 I Гуанин (G) Тимин (Т) Цитозин (С) I Рис. 1.4. Структура нуклеотида: а) общая структура дезокси рибонуклеотида — нуклеотида, образующего ДНК; б) четыре основания, входящие в состав дезоксирибонуклеотидов
10 Часть 1. Изучение геномов 5'-Р-конец О’ О’ О- он З'-ОН-конец Рис. 1.5 Короткий полинуклеотид ДНК, показывающий структуру фосфодиэфирной связи. Обратите внимание, что два конца полинуклеотида химически различны 5'-Р-конец Рис. 1.6. Реакция полимеризации, в ходе которой производится синтез полинуклеотида ДНК. Синтез ведется в направлении 5'->3', и при этом но- вый нуклеотид добавляется к З'-атому углерода на конце существующего полинуклеотида. 0- и у-фосфаты при- соединяемого нуклеотида удаляются в виде молекулы пирофосфата
Глава 1. Геномы, транскриптомы и протеомы 11 а на другом — незамещенная гидроксильная группа, соединенная с З'-атомом углерода (3'-, или З'-ОН-конец). Это означает, что полинуклеотид характеризуется химическим направлением, обозначаемым как 5'—>3' (вниз на рис. 1.5) или как 3'—>5' (вверх на рис. 1.5). Важное следствие полярности фосфодиэфирной связи заключается в том, что химическая реакция, необходимая для продолжения полимера ДНК в направлении 5’—>3', отличается от реакции, способной наращивать полимерную цепь в направлении 3'->5'. Все природные ферменты ДНК-полимеразы способны осуществлять синтез только в направлении 5'—>3', что значительно усложняет процесс, в ходе которого двунитевая ДНК реплицируется (раздел 15.2). Данные, подтвердившие гипотезу о двойной спирали До 1950 г. различные эксперименты показывали, что молекулы клеточной ДНК со- стоят из двух или нескольких полинуклеотидов, соединенных друг с другом некоторым неизвестным образом. Возможность того, что раскрытие природы этого соединения могло бы обеспечить понимание принципа работы генов, побудила Уотсона и Крика, по- мимо других ученых, попытаться разрешить эту загадку структуры. По словам Уотсона, приведенным в его книге «Двойная спираль», их работа была отчаянной гонкой про- тив знаменитого американского биохимика Лайнуса Полинга, который первоначально предложил неправильную модель тройной спирали, что дало Уотсону и Крику время, необходимое им для завершения работы над моделью структуры двойной спирали. Сейчас уже трудно отделить факт от вымысла, особенно относительно роли, сыгранной Розалиной Франклин, чьи исследования с помощью рентгеноструктурного анализа обеспечили большую часть экспериментальных данных, свидетельствующих в пользу двойной спирали, и которая сама была очень близка к разгадке ее структуры. Но одно совершенно ясно — открытие двойной спирали, совершенное Уотсоном и Криком в суб- боту 7 марта 1953 г., было исключительным по своему масштабу научным прорывом в биологии двадцатого века. Для того чтобы вывести структуру двойной спирали, Уотсон и Крик использовали информацию четырех категорий: • Биофизические данные различных видов. Особенно важным было содержание воды в волокнах ДНК, потому что это позволило определить плотность ДНК в во- локне. Число нитей в спирали и интервал между нуклеотидами должны были со- ответствовать плотности волокна. Модель тройной спирали Полинга опиралась на неправильно измеренное значение плотности, которое привело к предположению, что молекула ДНК упакована плотнее, чем это есть на самом деле. • Рентгеновские дифрактограммы (см. техническое примечание 11.1), большая часть которых была получена Розалиной Франклин, показали спиральный характер структуры и обозначили некоторые из основных параметров этой спирали. • Отношения оснований, установленные Эрвином Чаргаффом в Колумбийском университете в Нью-Йорке. Чаргафф выполнил длинный ряд хроматографиче- ских исследований образцов ДНК из различных источников и показал, что хотя абсолютные значения количества оснований различны у разных организмов, ко- личество аденина всегда совпадает с количеством тимина, а количество гуанина равно количеству цитозина (см. рис. 1.7). Эти отношения оснований позволили сформулировать правила спаривания оснований, которые явились ключом к от- крытию структуры двойной спирали.
12 Часть 1. Изучение геномов Бактерии Escherichia coli Клетки человека Очистка ДНК Рис. 1.7. Эксперименты по установлению отно- шений оснований, выполненные Чаргаффом. ДНК была извлечена из разных организмов и обработана кислотой, с тем чтобы гидроли- зировать фосфодиэфирные связи и высвобо- дить отдельные нуклеотиды. Затем количество нуклеотидов каждого вида было определено с помощью хроматографии. Приведенные на рисунке численные данные показывают неко- торые из фактических результатов, полученных Чаргаффом. Они указывают на то, что в преде- лах погрешности эксперимента количество аде- нина совпадает с количеством тимина, а коли- чество гуанина равно количеству цитозина Хроматография для определения количества каждого нуклеотида I 1 Отношение оснований Отношение оснований А:Т 1,00 А:Т 1,09 G:C 1,00 G:C 0,99 • Моделирование — единственный серьезный метод исследования, который Уот- сон и Крик выполнили самолично. Масштабные модели возможных структур ДНК позволили им проверить свой вариант относительного расположения различных атомов, дабы убедиться в том, что пары, которые образуют связи, не расположены слишком далеко друг от друга, а также в том, что остальные атомы не находятся столь близко, чтобы мешать друг другу. Основные характеристики двойной спирали Двойная спираль правосторонняя, а это означает, что, если бы она была винтовой лестницей и вы поднимались по ней вверх, то перила на внешней стороне лестницы находились бы справа от вас. Две нити спирали бегут во встречных направлениях (см. рис. 1.8, а). Спираль стабилизируется химическими взаимодействиями двух ти- пов: • Спаривание оснований между двумя нитями осуществляется путем образования водородных связей между аденином на одной нити и тимином на другой нити или же между цитозином и гуанином (см. рис. 1.8, б). Водородные связи возникают за
Глава 1. Геномы, транскриптомы и протеомы 13 связи Тимин (Т) Аденин (А) Цитозин (С) Гуанин (G) Рис. 1.8. Структура двойной спирали ДНК: а) два представления двойной спирали. Слева показана структура, где сахаро-фосфатные «основные цепи» обоих полинуклеотидов изображены в виде серых лент, а пары оснований прорисованы зеленым цветом. Справа приведена химическая структура из трех пар оснований; б) А спаривается сТ, a G образует пару с С. Основания показаны контурно, а водородные связи обозначены пунктирными линиями. Обратите внимание, что пара оснований G-С имеет три водо- родные связи, тогда как пара оснований А-Т — только две счет слабого электростатического притяжения между одним электроотрицатель- ным атомом (например, кислорода или азота) и атомом водорода, соединенным со вторым электроотрицательным атомом. Водородные связи длиннее ковалентных и намного слабее их; типичная энергия такой связи при 25 °C равна 1-10 ккал моль-1, тогда как энергия ковалентной связи доходит до 90 ккал моль-1. Помимо выполне- ния своей роли в двойной спирали ДНК, водородные связи стабилизируют вторич- ные структуры белков. Два сочетания нуклеотидов в парах оснований—А спарен с Т и G спарен с С — объясняют отношения оснований, установленные Чаргаффом. Эти пары — единственные, которые являются допустимыми, частично из-за строения
14 Часть 1. Изучение геномов азотистых оснований и относительных положений атомов, способных к образова- нию водородных связей, и частично потому, что пара должна быть между пурином и пиримидином: пара пурин-пурин была бы слишком большая, чтобы поместиться внутри спирали, а пара пиримидин-пиримидин была бы слишком маленькой. • Стекинг-взаимодействие, иногда называемое п-п-взаимодействием, обусловлено гидрофобными взаимодействиями между смежными парами оснований и придает двойной спирали дополнительную стабильность, как только нити соединились спариванием оснований. Эти гидрофобные взаимодействия возникают потому, что структура воды, образуемая за счет водородных связей, вталкивает гидрофобные группы во внутренние части молекулы. Для удержания двух полинуклеотидов вместе важно и спаривание оснований, и их стекинг, но спаривание оснований имеет еще одно значение благодаря его биологиче- ским следствиям. Ограничение, состоящее в том, что А может спариваться только с Т, a G может образовывать пару только с С, означает, что в ходе репликации ДНК могут производиться совершенные копии родительской молекулы посредством простого способа, состоящего в использовании последовательностей уже существующих нитей для считывания с них последовательности новых нитей. Это так называемый направ- ляемый матрицей синтез ДНК, и эта система используется всеми клеточными ДНК- полимеразами (раздел 15.2.2). Поэтому спаривание оснований позволяет молекулам ДНК реплицироваться системой, которая является настолько простой и изящной, что, как только структура двойной спирали была провозглашена Уотсоном и Криком, все биологи окончательно убедились в том, что гены действительно состоят из ДНК. Двойная спираль обладает гибкостью структуры Двойную спираль, описанную Уотсоном и Криком и показанную на рис. 1.8, а, называют В-формой ДНК. Ее характерные особенности заключаются в размерных па- раметрах: диаметр спирали 2,37 нм, подъем 0,34 нм на пару оснований и шаг (то есть высота полного витка спирали) 3,4 нм, что соответствует десяти парам оснований на один виток. Полагают, что в живых клетках ДНК находится преимущественно в такой В-форме, но теперь ясно, что молекулы геномной ДНК не полностью однородны по структуре. Главным образом это связано с тем, что все нуклеотиды в спирали обладают гибкостью, позволяющей им принимать слегка отличающиеся молекулярные формы. Чтобы принимать эти разные конформации, относительные положения атомов в ну- клеотиде должны немного изменяться. Для этого есть ряд возможностей, но самые важные конформационные изменения включают вращение вокруг p-N-гликозидной связи, изменение ориентации основания относительно сахарного звена и вращение вокруг связи между 3'- и 4'-атомами углерода. Вращение обоих видов оказывает на двойную спираль существенное влияние: изменение ориентации основания влияет на относительное расположение двух полинуклеотидов, а вращение вокруг связи 34' затрагивает конформацию сахаро-фосфатной основной цепи. Поэтому вращения в пределах отдельных нуклеотидов ведут к значительным из- менениям в общей структуре спирали. С 1950-х гг. было известно, что, когда волокна, содержащие молекулы ДНК, подвергнуты воздействию различной относительной влаж- ности, происходят изменения в размерных параметрах двойной спирали. Например, видоизмененная версия двойной спирали, называемая A-формой (см. рис. 1.9), имеет диаметр 2,55 нм, подъем 0,29 нм на пару оснований и шаг 3,2 нм, что соответствует 11 парам оснований на виток (см. табл. 1.1). К другим разновидностям относят В'-, С-, С’-,
Глава 1. Геномы, транскриптомы и протеомы 15 Таблица 1.1. Характерные параметры различных конформаций двойной спирали ДНК Параметр В-ДНК А-ДНК Z-ДНК Тип спирали Правосторонняя Правосторонняя Левосторонняя Диаметр спирали, нм 2,37 2,55 1,84 Подъем на пару осно- ваний, нм 0,34 0,29 0,37 Высота полного вит- ка (шаг), нм 3,4 3,2 4,5 Число пар оснований на полный виток 10 11 12 Топология большой Широкая, Узкая, глубокая Плоская бороздки глубокая Топология малой Узкая, мелкая Широкая, мелкая Узкая, глубокая бороздки С"-, D-, Е- и Т-ДНК. Все они — правосторонние спирали, подобные В-форме. Возможна также более существенная перестройка структуры, которая ведет к левосторонней Z-ДНК (рис. 1.9), представляющей собой более тонкую версию двойной спирали и об- ладающей диаметром всего 1,84 нм. Линейные размеры различных форм двойной спирали не показывают, каковы самые, по всей вероятности, существенные различия между ними. Они состоят не в разности значений диаметра и шага, но в степени доступности внутренних областей спирали с поверхности структуры. Как показано на рис. 1.8 и 1.9, ДНК В-формы не имеет абсолютно гладкой поверхности: вместо этого вдоль спирали винтовыми линиями за- кручиваются две бороздки. Одна из этих бороздок относительно широкая и глубокая и называется большой бороздкой; другая — узкая и менее глубокая и называется ма- лой бороздкой. А-ДНК также имеет две бороздки (рис. 1.9), но в данной конформации по сравнению с В-ДНК большая бороздка еще глубже, а малая бороздка — более мелкая и более широкая. Z-ДНК тоже отличается от остальных форм: одна бороздка фактически не существует, а другая очень узкая и глубокая. В ДНК всех форм часть внутренней поверхности по крайней мере одной из бороздок образована химическими группами, прикрепленными к нуклеотидным основаниям. В главе 11 мы увидим, что экспрессия биологической информации, содержащейся в ге- номе, опосредствуется ДНК-связывающими белками, которые прикрепляются к двойной спирали и регулируют активность генов, содержащихся в ней. Для того чтобы исполнить свои функции, каждый ДНК-связывающий белок должен прикрепиться к ней в опреде- ленном положении поблизости от гена, на чью активность он должен повлиять. Этой цели может достичь (по крайней мере с некоторой степенью точности) белок, способ- ный проникать в бороздку, в которой последовательность ДНК может «считываться» без раскрытия спирали, сопровождаемого разрывом пар оснований. Важное следствие этого условия заключается в том, что ДНК-связывающий белок, структура которого позволяет ему распознавать определенную последовательность нуклеотидов в В-ДНК, например, не мог бы быть способен распознать такую же последовательность, если ДНК приняла бы иную конформацию. Как мы увидим в главе 11, конформационные
16 Часть 1. Изучение геномов В-ДНК А-ДНК z-днк Рис. 1.9. Структуры В-ДНК (слева), А-ДНК (в центре) и Z-ДНК (справа). Модели упаковки (сверху) и струк- турные модели (снизу) отображают различные конформации молекул ДНК. Обратите внимание на взаимные различия в диаметре спиралей, в числе пар оснований на полный виток и в топологии боль- шой и малой бороздок у этих молекул. Перепечатано с разрешения KendrewJ. (Ed.), Encyclopaedia of Molecular Biology. © 1994 Blackwell Publishing изменения вдоль молекулы ДНК, наряду с другими структурными полиморфизма- ми, обусловленными последовательностью нуклеотидов, могут играть важную роль в предопределении специфичности взаимодействий между геномом и специфическими ДНК-связывающими белками. 1.2. РНК и транскриптом Первичный продукт экспрессии генома — транскриптом (см. рис. 1.2) — пред- ставляет собой совокупность молекул РНК, полученных из тех кодирующих белок генов, биологическая информация которых востребована клеткой в данный момент времени. Молекулы РНК транскриптома, равно как и многие другие молекулы РНК, транскрибированные с не кодирующих белки генов, синтезируются в ходе процесса, называемого транскрипцией. В этом разделе мы окинем взглядом структуру РНК и за- тем более подробно рассмотрим молекулы РНК различного типа, присутствующие в живых клетках. 1.2.1. Структура РНК РНК — полинуклеотид подобный ДНК, но с двумя важными химическими отличия- ми (см. рис. 1.10). Во-первых, сахар в нуклеотиде РНК представлен рибозой, а во-вторых,
Глава 1. Геномы, транскриптомы и протеомы 17 Рис. 1.10. Химические различия между ДНК и РНК: а) РНК содержит рибону- клеотиды, в которых сахар представ- лен рибозой, а не 2'-дезоксирибозой. Отличие этих сахаров состоит в том, что в молекуле рибозы к 2-атому углерода прикреплена гидроксильная группа, а не атом водорода; б) вместо тимина РНК содержит пиримидин урацил а) Рибонуклеотид О" О" О" Ills' "О —Р —О —Р —О —Р —О —СН2 II II II | .0^1 о о о сн нс1' WI н он он б) Урацил Основание HN СН СН РНК содержит урацил вместо тимина. Таким образом, четыре нуклеотида, используемые в качестве строительного материала для синтеза РНК, следующие: • аденозин-5'-трифосфат; • цитидин-5’-трифосфат; • гуанозин-5’-трифосфат; • уридин-5'-трифосфат. В сокращенной форме названия этих нуклеотидов записываются соответственно как АТФ, ЦТФ, ГТФ и УТФ или, в однобуквенной записи, — соответственно А, С, G и U. Как и в случае ДНК, полинуклеотиды РНК образованы за счет фосфодиэфирных связей 35 ’, но эти фосфодиэфирные связи менее устойчивы, чем таковые в полинуклео- тиде ДНК, из-за косвенного влияния гидроксильной группы, прикрепленной к 2'-атому углерода в молекуле сахара. Длина цепей РНК редко превышает несколько тысяч нуклео- тидов, и хотя многие из них образуют внутримолекулярные пары оснований (например, см. рис. 13.2), большинство из них одно-, а не двунитевые. Ферменты, ответственные за транскрипцию ДНКвРНК, называют ДНК-зависимыми РНК-полимеразами. Это название указывает на то, что ферментативная реакция, ко- торую они катализируют, дает в результате полимеризацию РНК из рибонуклеотидов и происходит по зависимой от (направляемой) ДНК схеме, а это означает, что последо- вательность нуклеотидов в матричной ДНК определяет последовательность нуклеоти- дов в синтезируемой РНК (см. рис. 1.11). Допустимо сокращать название фермента до РНК-полимеразы, если контекст, в котором употребляется это название, гарантирует малую вероятность спутать его с РНК-зависимыми РНК-полимеразами, которые участвуют в репликации и экспрессии геномов некоторых вирусов. Химическая основа направляемого матрицей синтеза РНК эквивалентна представленной на рис. 1.6 для случая синтеза ДНК. Рибонуклеотиды добавляются один за другим к растущему З'-концу РНК-транскрипта, при этом тип каждого нуклеотида определяется правилами спарива- ния оснований: А образует пару с Т ил и U; G спаривается с С. Точно так же, как и в случае
18 Часть 1. Изучение геномов ДНК 3'—-TACCCAACGCAATTC----------- 5' AUGG----- 5' 3' РНК Рис. 1.11. Направляемый матрицей синтез РНК. РНК-транскрипт синтезируется в на- правлении 5'->3’, а ДНК при этом считыва- ется в направлении 3'—>5\ причем после- довательность транскрипта определяется спариванием его оснований с основаниями ДНК-матрицы 3Z—TACCCAACGCAATTC---------5" AUGGGUUG —► 5' У полимеризации ДНК, во время присоединения каждого нуклеотида р- и у-фосфаты от- щепляются от подаваемого мономера, а гидроксильная группа отрывается от З'-атома углерода в нуклеотиде на конце цепи. 1.2.2. Виды и содержание РНК в клетке Типичная бактерия содержит 0,05-0,10 пг РНК, что составляет приблизительно 6 % ее полной массы. Клетка млекопитающих, будучи намного крупнее, содержит больше РНК (в целом — 20-30 пг), но эта величина представляет лишь 1 % полной массы клет- ки. Наилучший способ понять содержание РНК в клетке — это разделить эти вещества на категории и подкатегории в зависимости от выполняемой ими функции. Известно несколько способов такой классификации, и наиболее содержательная схема показана на рис. 1.12. Первичное разделение — между кодирующей РНК и некодирующей РНК. Кодирующая РНК образует транскриптом и состоит из молекул только одного класса, информационных, или матричных РНК (мРНК), которые представляют собой транс- крипты кодирующих белки генов и, следовательно, транслируются в белки на второй стадии экспрессии генома. Матричные РНК редко составляют более 4 % от общего коли- Рис. 1.12. Виды и содержание РНК в клетке. На этой схеме представлены виды РНК, встречающиеся во всех организмах, и ее категории, присутствующие только в клетках эукариотов
Глава 1. Геномы, транскриптомы и протеомы 19 чества РНК и, будучи недолговечны, деградируют вскоре после синтеза. Бактериальные мРНК имеют периоды полураспада не более нескольких минут, а у эукариотов большая часть мРНК деградирует в течение нескольких часов после синтеза. Столь быстрый обо- рот означает, что состав транскриптома непостоянен и может быстро менять структуру путем изменения скорости синтеза тех или иных мРНК. РНК второго вида упоминается как «некодирующая», поскольку эти молекулы не транслируются в белки. Однако лучшим названием будет «функциональная РНК», поскольку оно подчеркивает тот факт, что, хотя некодирующая РНК и не является частью транскриптома, различные ее виды все же играют важные роли в клетке. Известно несколько видов функциональной РНК, наиболее значимы из которых следующие: • Рибосомная РНК (рРНК) присутствует во всех организмах и обычно является самой многочисленной РНК в клетке (в активно делящихся бактериях она состав- ляет более 80 % от общего количества РНК). Ее молекулы являются компонентами рибосом — структур, в которых осуществляется синтез белка (раздел 13.2). • Транспортная РНК (тРНК) — маленькие молекулы, которые также вовлечены в синтез белка и, подобно рРНК, встречаются во всех организмах. Функция тРНК состоит в переносе аминокислот к рибосоме и обеспечении соединения аминокис- лот в порядке, определяемом последовательностью нуклеотидов транслируемой мРНК (раздел 13.1). • Малая ядерная РНК (мяРНК, snPHK), также называемая U-PHK, потому что ее молекулы богаты уридиннуклеотидами, находится в ядрах эукариотов. Эти моле- кулы участвуют в сплайсинге (одном из ключевых шагов процесса созревания), который преобразует первичные транскрипты кодирующих белки генов в моле- кулы зрелой мРНК (раздел 12.2.2). • Малая ядрышковая РНК (мякРНК, snoPHK) размещается в ядрышках клеток эукариотов. Она играет центральную роль в химической модификации молекул рРНК, направляя ферменты, которые осуществляют модификации, к определен- ным нуклеотидам, где должны быть выполнены изменения, например добавления метильной группы (раздел 12.2.5). • МикроРНК (миРНК, miPHK) и короткая интерферирующая РНК (киРНК, siPHK) — маленькие молекулы РНК, которые регулируют экспрессию отдельных генов1) (раздел 12.2.6). 1.2.3. Созревание РНК-предшественника Наряду со зрелой РНК, описанной выше, клетки содержат также молекулы РНК- предшественника. РНК многих видов, особенно у эукариотов, первоначально синтези- руется в виде молекулы РНК-предшественника, или пре-РНК, которая должна созреть, прежде чем сможет выполнять свою функцию. В число различных этапов созревания (события процессинга), полный свод которых вместе с подробным описанием приведен в главе 12, входят следующие (см. рис. 1.13): • Модификация концов происходит во время синтеза мРНК эукариотов. В итоге большинство ее молекул получает необычный единичный нуклеотид, называемый кэпом, на свой 5'-конец и поли-А хвост — на З'-конец. На самом деле есть еще много типов РНК, задействованных в различных процессах. — Прим. ред.
20 Часть 1. Изучение геномов Пред-РНК ------ (-------------------1-------- Модификация концов Сплайсинг Раздел Разделы 12.2.1 12.2.2 и 112.2.4 Разрезание Разделы 12.1.3 и 12.2.3 Химическая модификация Разделы 12.1.3 и 12.2.5 I Новая химическая группа Кэп Поли-А хвост Позиция удаленного интрона Рис. 1.13. Схематическое представление событий обработки РНК четырех типов. В организмах разных биологических видов происходят различные (не все) события из данного набора • Сплайсинг — удаление сегментов из внутренней части РНК-предшественника. Многие гены, особенно эукариотов, имеют внутренние сегменты, которые не несут никакой биологической информации. Их называют интронами, и в ходе транскрипции гена они копируются наряду с содержащими информацию экзона- ми. Интроны удаляются из пре-мРНК путем реакций разрезания и соединения. Незрелая пре-мРНК образует фракцию ядерной РНК, называемую гетерогенной ядерной РНК (гяРНК). • События разрезания особенно важны в процессинге молекул рРНК и тРНК, многие из которых первоначально синтезируются с единиц транскрипции, определяющих сразу несколько молекул. Поэтому для того чтобы произвести зрелую РНК, цепи пре-рРНК и пре-тРНК должны быть разрезаны на куски. Процессинг данного типа происходит как у прокариотов, так и у эукариотов. • Химическая модификация производится с рРНК, тРНК и мРНК. Молекулы рРНК и тРНК всех организмов модифицируются путем добавления новых химических групп, при этом эти группы присоединяются к определенным нуклеотидам в каж- дой молекуле РНК. Химическая модификация мРНК, называемая редактированием РНК, имеет место у многих эукариотов. 1.2.4. Транскриптом Хотя транскриптом и составляет менее 4 % от общего количества РНК в клетке, это наиболее значимый компонент, потому что в него входят молекулы кодирующей РНК, которые используются на следующей стадии экспрессии генома. Важно обратить внимание на то, что транскриптом никогда не синтезируется de novo. Каждая клетка получает часть транскриптома своих материнских клеток при ее появлении на свет в результате клеточного деления и поддерживает свой транскриптом на протяжении всего периода жизни. Даже находящиеся в состоянии покоя клетки бактериальных спор или семян растений имеют транскриптом, хотя трансляция этого транскриптома в белки может быть полностью остановлена. Поэтому транскрипция отдельных кодирующих белки генов не приводит к синтезу транскриптома, но вместо этого поддерживает транс- криптом, заменяя деградировавшие молекулы мРНК, и вызывает изменения в составе транскриптома через включение и выключение различных наборов генов.
Глава 1. Геномы, транскриптомы и протеомы 21 Даже у простейших организмов вроде бактерий и дрожжей многие гены активны в любой момент времени. Поэтому транскриптомы очень сложны и содержат копии со- тен, если не тысяч, различных молекул мРНК. Обычно молекулы мРНК того или иного вида составляют лишь малую долю всей мРНК клетки, причем даже наиболее многочис- ленная разновидность редко вносит более 1 % в общее количество мРНК. Исключения представляют клетки, для которых характерна высокоспециализированная биохимия, отраженная в транскриптомах, в которых преобладают мРНК одной или нескольких разновидностей. Хороший пример — развивающиеся семена пшеницы: они в больших количествах синтезируют белки-глиадины, которые накапливаются в дремлющем зерне и обеспечивают источник аминокислот для прорастающих зародышей. В развивающихся семенах молекулы мРНК, предназначенные для синтеза глиадинов, могут составлять не менее 30 % транскриптома некоторых клеток. 1.3. Белки и протеом Вторичный продукт экспрессии генома — протеом (см. рис. 1.2) — есть ассорти- мент белков клетки, определяющий характер биохимических реакций, которые клетка способна выполнять. Эти белки синтезируются путем трансляции молекул мРНК, входящих в состав транскриптома. 1.3.1. Структура белка Белок, подобно молекуле ДНК, представляет собой линейный, неразветвленный полимер. Мономерные звенья белков называют аминокислотами (см. рис. 1.14), и об- разующиеся из них полимеры, или полипептиды, редко бывают более 2 000 единиц в длину. Как и в случае ДНК, основные характеристики структуры белка были опреде- лены в первой половине двадцатого века, причем эта стадия биохимии белка достигла высшей точки в 1940-х и в начале 1950-х гг., когда Полинг и Кори описали главные конформации, или вторичные структуры, принимаемые полипептидами. В последние годы интерес науки сфокусировался на вопросе о том, каким образом эти вторичные структуры объединяются и образуют сложные, трехмерные формы белков. Четыре уровня структуры белка Структуры белков традиционно классифицируют на четыре уровня. Эти уровни являются иерархическими, при этом белок строится поэтапно, и каждый уровень струк- туры зависит от нижележащего:. • Первичная структура белка образуется за счет объединения аминокислот в полипеп- тид. Аминокислоты соединяются посредством пептидных связей, которые образуют- СОО- I I I I I I H3N— С — Н Рис. 1.14. Общая структура аминокислот. Все аминокислоты име- ют одинаковую общую структуру, включая центральный а-углерод, i с которым соединены: атом водорода, карбоксильная группа, ами- 1 ногруппа и боковая группа, или радикал R. У аминокислот разных R видов боковые группы различны (см. рис. 1.18)
I1 I2 H3N—С—СОО" + H3N—С—СОО" н н |*н20 R1 Н R2 I I I H3N—С —С—- N—C—СОО“ N-конец | || | С-конец НО н I I Пептидная связь 22 Часть 1. Изучение геномов Рис. 1.15. В полипептидах аминокислоты соеди- нены между собой пептидными связями. На ри- сунке показана химическая реакция, в результате которой две аминокислоты связываются вместе пептидной связью. Такая реакция полимериза- ции называется конденсацией, потому что в ре- зультате ее протекания высвобождается вода ся в ходе реакции полимеризации между карбоксильной группой одной аминокис- лоты и аминогруппой второй аминокис- лоты (см. рис. 1.15). Обратите внимание, что, как и в случае полинуклеотида, оба конца полипептида химически различны: один несет на себе свободную аминогруппу и называется амино-, NH2- или N-концом; другой имеет свободную карбоксильную группу и называется карбоксильным, СООН- или С-концом. Поэтому направление полипептида может быть выражено либо как N->C (на рис. 1.15—слева направо), либо как C->N (на рис. 1.15 — справа налево). • Ко вторичной структуре относятся различные конформации, которые может принимать полипептид. Вторичные структуры двух главных типов — а-спираль и [3-лист (см. рис. 1.16). Они стабилизируются, главным образом, водородными связями, которые образуются между различными аминокислотами полипептида. В большинстве своем полипептиды достаточно длинные и могут быть свернуты в целый ряд вторичных структур, одна за другой по длине молекулы. • Третичная структура обусловлена сворачиванием компонентов вторичной струк- туры полипептида в трехмерную конфигурацию (см. рис. 1.17). Третичная структура сохраняет свою устойчивость с помощью различных химических сил, в особенно- сти — водородных связей между отдельными аминокислотами, электростатиче- ских взаимодействий между боковыми группами заряженных аминокислот (см. рис. 1.18) и гидрофобных сил, которые требуют, чтобы аминокислоты с неполяр- ными («боящимися воды») боковыми группами были ограждены от воды путем погружения их во внутренние области белковой молекулы. Кроме того, эту роль могут выполнять ковалентные связи — дисульфидные мостики, — образуемые между остатками аминокислоты цистеина, находящимися в различных позициях последовательности полипептида. • Четвертичная структура строится путем объединения двух и более полипепти- дов (при этом каждый из них свернут в свою собственную третичную структуру) в многосубъединичный белок. Не все белки образуют четвертичные структуры, но это свойство присуще многим белкам со сложными функциями, в том числе не- скольким, вовлеченным в экспрессию генома. Некоторые четвертичные структуры сплачиваются дисульфидными мостиками между различными полипептидами, что дает устойчивые многосубъединичные белки, которые не могут быть легко разъединены на составные части. К другим четвертичным структурам относят- ся более свободные объединения субъединиц, стабилизируемые водородными связями и гидрофобными силами; это означает, что такие белки, в зависимости
Глава 1. Геномы, транскриптомы и протеомы 23 Рис. 1.16. Две главные единицы вторичной структуры, обнаружи- ваемые в белках: а) а-спираль и б) 0-лист. Полипептидные цепи изображены схематично. Боковые группы не были показаны, с тем чтобы не загромождать рисунок. Устойчивость каждой из струк- тур обеспечивается водородны- ми (Н) связями между группами С=О и N-H различных пептидных связей. Представленная здесь конформация 0-листа антипа- ра ллельна, то есть две составляю- щие его цепи бегут во встречных направлениях. Существуют также параллельные 0-листы а) а-спираль б) 0-лист Водородная N-конец Рис. 1.17. Третичная структура белка. Приведенная здесь во- ображаемая структура белка состоит из трех а-спиралей, по- казанных в виде локонов, и четы- рехнитевого 0-листа, обозначен- ного стрелками
24 Часть 1. Изучение геномов от функциональных требований клетки, могут возвращаться к составляющим их полипептидам или изменять свой субъединичный состав. В основе разнообразия белков лежит разнообразие аминокислот Белки обладают богатым разнообразием функций. Это связано с тем, что аминокис- лоты, из которых они построены, сами по себе химически разнообразны. Поэтому разные последовательности аминокислот дают различные сочетания химических реакционных способностей, причем эти комбинации определяют не только общую структуру собран- ного из них белка, но также и расположение на поверхности его структуры химически активных групп, которые обусловливают химические свойства белка. Разнообразие аминокислот связано с природой боковых групп, потому что у всех аминокислот именно эти части отличаются друг от друга и структура этих частей зна- чительно варьирует. Белки состоят из набора 20-ти аминокислот (рис. 1.18; табл. 1.2). Некоторые из них имеют боковые группы, которые представляют собой маленькие, отно- сительно простые структуры, например, единственного атома водорода (в аминокислоте, называемой глицином) или метильной группы (аланин). Другие боковые группы — большие, сложные ароматические боковые цепи (фенилаланин, триптофан и тирозин). В основном, этот набор представлен незаряженными аминокислотами, но две из них за- ряжены отрицательно (аспарагиновая кислота и глутаминовая кислота), а три заряжены положительно (аргинин, гистидин и лизин). Некоторые аминокислоты полярны (напри- мер, глицин, серин и треонин), другие неполярны (например, аланин, лейцин и валин). а) Неполярные боковые группы СНз I Аланин Н3С СНз \н I Валин НзС СНз СН I СНз I Лейцин СНз I СН, I НзС—СН I Изолейцин НзС—СНз / \ HN хСНз ^С“ W ТОО- СНз I S I СН, I СНз I Метионин б) Полярные боковые группы НО СНз SH I I I Н СНз НО—СН СНз 1111 Глицин Серин Треонин Цистеин Прол ин Фенилаланин Триптофан СНз СНз СНз I I I Тирозин Аспарагин Глутамин в) Отрицательно заряженные боковые группы V к I Аспарагиновая кислота I СНз I СН, I Глутаминовая кислота г) Положительно заряженные боковые группы ЫНз H3N i=N+Ha I I СНз NH I I ch, CH2 ^-7 I I HCZ I СНз СНз N—C I I H I СНз CH3 СНз I I I Лизин Аргинин Гистидин Рис. 1.18. Боковые группы аминокислот. Эти 20 аминокислот традиционно рассматриваются в качестве определяемых генетическим кодом
Глава 1. Геномы, транскриптомы и протеомы 25 Рис. 1.19. Структуры селеноцистеина и пирро- лизина. Части молекул, показанные коричне- вым цветом, отражают различия между этими аминокислотами и, соответственно, отличия от цистеина и лизина SeH I сн2 I Селеноцистеин Н С—сн2 // \ N, X—СНз \н н I с=о I NH I сн2 I сн2 I сн2 I сн2 I Пирролизин Представленные на рис. 1.18 20 аминокислот традиционно рассматриваются в ка- честве аминокислот, определяемых генетическим кодом (раздел 1.3.2). Именно эти ами- нокислоты соединяются одна за другой при трансляции молекулы мРНК в белок. Однако эти 20 аминокислот сами по себе не представляют предел химического разнообразия белков. Разнообразие оказывается даже еще большим из-за двух факторов: • по крайней мере две дополнительные аминокислоты — селеноцистеин и пирро- лизин (рис. 1.19) — могут быть вставлены в полипептидную цепь в ходе синтеза белка, причем их вставка обусловена модифицированным считыванием генети- ческого кода (см. рис. 13.1.1); • во время процессинга белка некоторые аминокислоты модифицируются добав- лением новых химических групп (например, ацетилированием или фосфорили- рованием) или присоединением крупных боковых цепей, состоящих их сахарных звеньев (раздел 13.3.3). Поэтому белки обладают огромным потенциалом химической изменчивости, одна часть коего непосредственно определяется геномом, другая — проистекает из характера процессинга белка. 1.3.2. Протеом Протеом охватывает все белки, находящиеся в клетке в данное время. «Типичная» клетка млекопитающих, например клетка печени (гепатоцит), как полагают, содержит 10 000-20 000 различных белков, всего около 8109 отдельных молекул, что составляет приблизительно 0,5 нг белка или 18-20 % от общей массы клетки. Число копий отдель- ных белков изменяется в чрезвычайно широких пределах, от менее чем 20 000 молекул на клетку для белков самых редких типов до 100 миллионов копий для наиболее рас- пространенных. Любой белок, число копий которого превышает 50 000 на одну клетку, считают относительно избыточным, и в среднестатистической клетке млекопитающих в эту категорию попадают около 2000 белков. При исследовании протеомов клеток
26 Часть 1. Изучение геномов Таблица 1.2. Буквенные обозначения аминокислот Аминокислота Обозначение Трехбуквенное Однобуквенное Аланин Ала А Аргинин Apr R Аспарагин Асн N Аспарагиновая кислота Асп D Валин Вал V Гистидин Гис Н Глицин Гл и G Глутамин Глн Q Глутаминовая кислота Глу Е Изолейцин Иле I Лейцин Лей L Лизин Лиз К Метионин Мет М Пролин Про Р Серин Сер S Тирозин Тир Y Треонин Тре Т Триптофан Трп W Фенилаланин Фен F Цистеин Цис С млекопитающих различных типов среди таких избыточных белков просматривается очень мало различий; это предполагает, что большинство из них — вспомогательные белки, которые исполняют обыденные биохимические отправления, происходящие во всех клетках. Белки, которые придают клетке ее специализированную функцию, часто оказываются весьма редкими, хотя встречаются исключения вроде огромных количеств гемоглобина в красных кровяных тельцах. Связь между транскриптомом и протеомом Поток информации от ДНК к РНК, устанавливающийся в ходе транскрипции, не представляет из себя никакой концептуальной трудности. Полинуклеотиды ДНК и РНК имеют весьма подобные структуры, и мы можем легко понять, как РНК-копия гена может быть получена путем направляемого матрицей синтеза, в котором учитываются правила спаривания оснований, с которыми мы уже знакомы. Вторую стадию экспрессии генома, в ходе которой молекулы мРНК транскриптома направляют синтез белков, по- нять не так легко, если действовать аналогичным образом, то есть просто рассматривать структуры молекул, которые в ней участвуют. В начале 1950-х гг., вскоре после того, как была открыта структура двойной спирали ДНК, несколько молекулярных биологов по-
Глава 1. Геномы, транскриптомы и протеомы 27 пытались разработать схемы, согласно которым аминокислоты могли бы прикрепляться к мРНК упорядоченным образом, но во всех этих моделях по крайней мере некоторые из связей должны были быть короче или длиннее, чем допускали законы физической химии, и посему каждая такая гипотеза незаметно уходила в небытие. В конечном счете, в 1957 г., Фрэнсис Крик проложил путь через джунгли запутанных гипотез и предсказал существование стыковочной молекулы-переходника, которая могла бы образовывать мост между мРНК и синтезируемым полипептидом. Вскоре после этого стало ясно, что такими стыковочными молекулами являются молекулы тРНК, и как только этот факт был установлен, была быстро построена подробная модель механизма синтеза белков. Мы исследуем этот процесс в разделе 13.1. Другим моментом синтеза белка, интересовавшим молекулярных биологов в 1950-х гг., была информационная проблема. Она относится ко второму важному компоненту связи между транскриптомом и протеомом — генетическому коду, кото- рый и определяет, как последовательность нуклеотидов мРНК транслируется в после- довательность аминокислот белка. В 1950-х гг. было признано, что для описания всех 20-ти аминокислот, обнаруженных в белках, необходим триплетный генетический код — такой, в котором каждое кодовое слово, или кодон, состояло бы из трех нуклеотидов. Двухбуквенный код описывал бы только 42 = 16 кодонов, что недостаточно для кодиро- вания всех 20-ти аминокислот, тогда как трехбуквенный код мог бы дать 43 = 64 кодона. Генетический код был составлен в 1960-х гг. — частично путем анализа полипептидов, являющихся результатом проводимой в бесклеточных системах трансляции искусствен- ных молекул мРНК с известной или предсказуемой последовательностью, и частично путем анализа на основе очищенных рибосом, в ходе которого определяли взаимное соответствие последовательностей РНК и получаемых с них аминокислот. Когда эта работа была закончена, стало ясно, что известные 64 кодона делятся на группы, и при том члены каждой группы кодируют одну и ту же аминокислоту (рис. 1.20). Только триптофан и метионин имеют лишь по одному кодону, все остальные аминокислоты кодируются двумя, тремя, четырьмя или шестью кодонами. Эту особенность кода на- зывают вырожденностью. Код имеет также четыре пунктуационных кодона, которые указывают точки в пределах мРНК, в которых трансляция последовательности нуклео- тидов должна начинаться и заканчиваться (рис. 1.21). Старт-кодоном обычно служит триплет 5'-AUG-3', который определяет также метионин (так что большинство новых синтезированных полипептидов начинается с метионина), хотя в нескольких мРНК для этой цели употребляются другие кодоны, как то: 5'-GUG-3' и 5'-UUG-3’. Три стоп-кодона представлены триплетами 5'-UAG-3', 5'-UAA-3' и 5'-UGA-3'. Генетический код не универсален Первоначально думалось, что генетический код должен быть один и тот же во всех организмах. Довод состоял в том, что, будучи когда-то утвержден, код не мог бы более изменяться, потому что предоставление нового значения любому отдельному кодону привело бы к масштабным нарушениям аминокислотных последовательностей белков. Это суждение представляется вполне обоснованным, так что кажется удивительным, что в действительности генетический код не универсален. Код, показанный на рис. 1.20, верен для подавляющего большинства генов в подавляющем большинстве организмов, но отклонения от него широко распространены. В частности, митохондриальные геномы часто используют нестандартный код (таблица 1.3). Это явление было впервые открыто в 1979 г. группой Фредерика Сенгера в Кембридже, Великобритания, который обнару- жил, что несколько митохондриальных мРНК человека содержат последовательность
28 Часть 1. Изучение геномов иии иис Фен иси исс Ррп UAU UAC Тир UGU UGC Цис UUA ПоГл UCA vcp UAA стпп UGA стоп UUG леи UCG UAG Ь 1 UI1 UGG Трп сии CCU CAU CGU CUC Лей ССС Пгп САС Гис CGC Дпг CUA ССА 1 ipu САА CGA “pi CUG CCG CAG Глн CGG AUU ACU AAU AGU AUC Иле АСС Тпр ААС Асн AGC Сер AUA АСА । рс ААА AGA AUG Мет ACG AAG ЛИЗ AGG Apr GUU GCU GAU GGU GUC Do п GCC Ала GAC Асп GGC Гли GUA DdJI GCA GAA Г п\/ GGA GUG GCG GAG 1 Лу GGG Рис. 1.20. Генетический код. Аминокислоты обозначены стандартными трехбуквенными обозначениями (см. табл. 1.2) 5'-UGA-3', которая обычно кодирует завершение трансляции, во внутренних позициях, где синтез белка, как следует ожидать, не должен останавливаться. Сравнения с ами- нокислотными последовательностями белков, кодируемых этими мРНК, показали, что в митохондриях человека триплет 5'-UGA-3' является кодоном триптофана и что данное отклонение является лишь одним из четырех отклонений кода, наблюдаемых в этой генетической системе. Митохондриальные гены в других организмах также показывают отклонения кода, хотя по крайней мере одно из них — использование триплета 5'-CGG-3' в качестве кодона триптофана в митохондриях растений, — вероятно, корректируется в ходе редактирования РНК (раздел 12.2.5), прежде чем происходит трансляция. Нестандартные коды известны также и для ядерных геномов низших эукариотов. Зачастую модификация ограничена только в пределах маленькой группы организмов, и нередко она вовлекает переназначение стоп-кодонов (таблица 1.3). В среде прокарио- тов модификации менее распространены, но известен один пример у вида Mycoplasma. ирнк I I Кодон начала Кодон окончания (обычно AUG) (UAA, UAG или UGA) Более важный тип видоизменения кода — контекстнозависимое пере- назначение кодонов, каковое происхо- дит, когда белок, который должен быть синтезирован, содержит селеноцистеин или пирролизин. Белки, содержащие пирролизин, редки и, вероятно, присут- ствуют только в группе прокариотов, называемой археями (глава 8), но селе- нопротеины широко распространены во многих организмах (например, фермент Рис. 1.21. Позиции пунктуационных кодонов в мРНК глутатионпероксидаза, которая помога-
Глава 1. Геномы, транскриптомы и протеомы 29 Таблица 1.3. Примеры отклонений от стандартного генетического кода Организм Кодон Должен кодировать Фактически кодирует Митохондриальные геномы Млекопитающие UGA стоп Трп AGA, AGG Apr стоп AUA Иле Мет Drosophila UGA стоп Трп AGA Apr Сер AUA Иле Мет Saccharomyces cerevisiae UGA стоп Трп CUN Лей Тре AUA Иле Мет Грибы UGA стоп Трп Кукуруза CGG Apr Трп Ядерные геномы и геномы прокариотов Различные протисты UAA, UAG стоп Глн Candida cylindracea CUG Лей Сер Micrococcus sp. AGA Apr стоп AUA Иле стоп Euplotes sp. UGA стоп Цис Mycoplasma sp. UGA стоп Трп CGG Apr стоп Контекстнозависимые переназначения кодонов Различные UGA стоп Селеноцистеин Археи UAG стоп Пирролизин Примечание: буква N означает любой нуклеотид. ет защищать клетки людей и других млекопитающих от окислительного повреждения). Селеноцистеин кодируется триплетом 5’-UGA-3', а пирролизин — кодоном 5'-UAG-3'. Таким образом, эти кодоны имеют двойное значение, потому что в рассмотренных ор- ганизмах они, как обычно, используются в качестве стоп-кодонов (таблица 1.3). Кодон 5’-UGA-3’, который определяет селеноцистеин, отличается от истинных стоп-кодонов наличием структуры типа шпильки в мРНК, помещенной у прокариотов непосредственно ниже кодона селеноцистеина, а у эукариотов — в З'-нетранслируемой области (то есть в части мРНК после стоп-кодона). Опознавание кодона селеноцистеина требует взаи- модействия между шпилечной структурой и специальным белком, который вовлечен в трансляцию таких мРНК. По всей вероятности, аналогичная система работает и для определения пирролизина.
30 Часть 1. Изучение геномов Связь между протеомом и биохимией клетки Биологическая информация, кодируемая геномом, находит свое заключительное выражение в белке, биологические свойства которого определяются его свернутой структурой и пространственным расположением химических групп на его поверхности. Путем определения белков различных типов геном способен строить и поддерживать протеом, полные биологические свойства которого формируют фундаментальное осно- вание жизни. Протеом способен играть эту роль благодаря огромному разнообразию белковых структур, которые могут быть сформированы, разнообразию, позволяющему белкам выполнять целый спектр различных биологических функций. Эти функции можно разбить на следующие категории. • Биохимический катализ — это роль белков особого типа, называемых фермен- тами. Ферментами катализируются центральные метаболические пути, которые снабжают клетку энергией, равно как и процессы биосинтеза, в результате кото- рых образуются нуклеиновые кислоты, белки, углеводы и жиры. Биохимический катализ также ведет последовательную экспрессию генома через согласованные действия ферментов наподобие РНК-полимеразы. • Формирование структуры, которая на клеточном уровне определяется белками, составляющими клеточный скелет, является первостепенной функцией также и некоторых внеклеточных белков. Пример — коллаген, который является важным компонентом костей и сухожилий. • Движение — осуществляется сократительными белками, из которых самыми из- вестными примерами являются актин и миозин в волокнах клеточного скелета. • Транспорт материалов по всему телу — важная деятельность белков: например, гемоглобин переносит кислород в кровотоке, а альбумин сыворотки переносит жирные кислоты. • Регулирование клеточных процессов — опосредствуется сигнальными белками типа STAT (преобразователи сигналов и активаторы транскрипции, раздел 14.1.2) и белками типа активаторов, которые связываются с геномом и влияют на уровни экспрессии как отдельных генов, так и групп генов (раздел 11.3). Действия групп клеток регулируются и координируются внеклеточными гормонами и цитокинами, многие из которых — белки (например, инсулин — гормон, который управляет уровнями сахара в крови, а интерлейкины — группа цитокинов, которые регули- руют деление и дифференцировку клетки). • Защита тела и отдельных клеток — функция ряда белков, в том числе антител и белков, участвующих в свертывании крови. • Функции хранения — выполняются белками типа ферритина, который действует как склад железа в печени, и глиадинов, которые запасают аминокислоты в дрем- лющих семенах пшеницы. Такое разнообразие функций белка и придает протеому его способность преоб- разовать проект, заложенный в геноме, в существенные особенности процесса жизни. Заключение Геном — хранилище биологической информации, которой наделен каждый орга- низм, живущий на нашей планете. Подавляющее большинство геномов состоит из ДНК, за малым исключением в лице тех вирусов, которые имеют геномы из РНК. Экспрессия
Глава 1. Геномы, транскриптомы и протеомы 31 генома — процесс, в ходе которого информация, содержащаяся в геноме, выражается в клетке. Первичным продуктом экспрессии генома является транскриптом — совокуп- ность молекул РНК, полученных из кодирующих белок генов, которые являются актив- ными в клетке в определенное время. Вторичный продукт — протеом — представляет собой ассортимент белков клетки, определяющих характер биохимических реакций, которые клетка способна выполнять. Экспериментальные данные, показывающие, что гены состоят из ДНК, впервые были получены между 1945-м и 1952-м гг., но именно открытие структуры двойной спирали Уотсоном и Криком в 1953 г. убедило биологов в том, что ДНК действительно является генетическим материалом. Полинуклеотид ДНК — неразветвленный полимер, состоящий из многочисленных копий четырех хими- чески различных нуклеотидов. В двойной спирали два полинуклеотида закручиваются один вокруг другого, при этом находящиеся в нуклеотидах основания располагаются на внутренней части молекулы. Полинуклеотиды соединены водородными связями между основаниями, причем А всегда спаривается с Т, a G всегда образует пару с С. РНК также представляет собой полинуклеотид, но, во-первых, отдельные его нуклеотиды отлича- ются по структуре от встречающихся в ДНК нуклеотидов, а во-вторых, молекулы РНК обычно однонитевые. Копированием генов в молекулы РНК занимаются ДНК-зависимые РНК-полимеразы в ходе процесса, названного транскрипцией, в результате которого синтезируется не только транскриптом, но также и ряд функциональных молекул РНК, которые не кодируют белки, но тем не менее играют в клетке жизненно важные роли. Многие РНК первоначально синтезируются в виде молекул-предшественников, которые обрабатываются реакциями разрезания и соединения, а также химическими модификациями, после чего получаются их зрелые формы. Белки также представляют собой неразветвленные полимеры, но в них элементарными структурными единицами являются аминокислоты, сцепленные между собой пептидными связями. Последова- тельность аминокислот — первичная структура белка. Более высокие уровни струк- туры — вторичная, третичная и четвертичная — формируются путем сворачивания первичной структуры в трехмерные конформации и последующей ассоциации отдель- ных полипептидов в многобелковые структуры. Белки функционально разнообразны, потому что отдельные аминокислоты имеют различные химические свойства, что при сочетании различными способами дает белки с широким диапазоном химических осо- бенностей. Белки синтезируются посредством трансляции мРНК, в ходе которой правила генетического кода определяют, какую аминокислоту будет кодировать каждый три- плет нуклеотидов. Генетический код не универсален, его разновидности встречаются в митохондриях и у низших эукариотов, а некоторые кодоны в отдельно взятом гене могут иметь два разных значения.
32 Часть 1. Изучение геномов Задания для закрепления материала *Ответы к нечетным вопросам могут быть найдены в приложении Вопросы закрытого типа 1.1 *. Какое из следующих утверждений о геноме организма является ЛОЖ- НЫМ? а. Геном содержит генетическую ин- формацию для построения и под- держания живого организма. Ь. Геномы клеточных организмов состоят из ДНК. с. Геном способен экспрессировать заложенную в нем информацию без участия ферментов и белков. d. Геномы эукариотов состоят из ядерной и митохондриальной ДНК. 1.2 . К соматическим клеткам относят те, что: а. Содержат гаплоидный набор хро- мосом. Ь. Порождают гаметы. с. Не имеют митохондрий. d. Содержат диплоидный набор хро- мосом и составляют большинство клеток человека. 1.3 *. Которое из следующихутверждений описывает поток генетической ин- формации в клетках? а. ДНК транскрибируется в РНК, которая затем транслируется в белок. Ь. ДНК транслируется в белок, ко- торый затем транскрибируется в РНК. с. РНК транскрибируется в ДНК, которая затем транслируется в белок. d. Белки транслируются в РНК, ко- торая затем транскрибируется в ДНК. 1.4 . В начале двадцатого столетия дума- ли, что белки, в принципе, могут не- сти генетическую информацию. На основе каких из следующих данных было сделано это заключение? а. Хромосомы состоят из приблизи- тельно равных количеств белка и ДНК. Ь. Было известно, что белки состоят из 20-ти различных аминокислот, тогда как ДНК состоит только из 4-х нуклеотидов. с. Различные белки, как было извест- но, имеют уникальные последова- тельнослитогда как все молекулы ДНК, как думали, имеют одну и ту же последовательность. d. Все вышеперечисленное. 1.5 *. Связями какого типа отдельные ну- клеотиды молекулы ДНК соединены друг с другом? а. Гликозидными. Ь. Пептидными. с. Фосфодиэфирными. d. Электростатическими. 1.6 . Какие из следующих методов Уотсон и Крик активно использовали в раз- гадке структуры ДНК? а. Построение моделей молекул ДНК с тем, чтобы убедиться в пра- вильном взаимном расположении атомов. Ь. Рентгеноструктурный анализ мо- лекул ДНК. с. Хроматографические исследова- ния с целью определить относи- тельный состав нуклеотидов ДНК из различных препаратов. d. Генетические исследования, ко- торые продемонстрировали, что генетическим материалом явля- ется ДНК.
Глава 1. Геномы, транскриптомы и протеомы 33 1.7 *. Эрвин Чаргафф изучал ДНК различ- ных организмов и показал, что: а. ДНК является генетическим ма- териалом. Ь. РНК транскрибируется с ДНК. с. Количество аденина в данном организме равно количеству ти- мина (а количество гуанина — ко- личеству цитозина). d. Двойная спираль скрепляется в единый тяж водородными свя- зями между основаниями. 1.8 . Определение транскриптома клетки формулируется как: а. Все молекулы РНК, присутствую- щие в клетке. Ь. Кодирующие белок молекулы РНК, присутствующие в клетке. с. Молекулы рибосомной РНК, при- сутствующие в клетке. d. Молекулы транспортной РНК, присутствующие в клетке. 1.9 *. Как ДНК-зависимые РНК-полиме- разы выполняют синтез РНК? а. Они используютДНК как матрицу для полимеризации рибонуклео- тидов. Ь. Они используют белки как матри- цу для полимеризации рибону- клеотидов. с. Они используют РНК как матрицу для полимеризации рибонуклео- тидов. d. Им не требуется никакой матри- цы для полимеризации рибону- клеотидов. 1.10 . Функциональная РНК какого типа яв- ляется главным компонентом структур, необходимых для синтеза белка? а. Матричная РНК. Ь. Рибосомная РНК. с. Малая ядерная РНК. d. Транспортная РНК. 1.11 *. Определение протеома клетки зву- чит как: а. Все белки, которые клетка способ- на синтезировать. Ь. Все белки, присутствующие в клет- ке на протяжении всей ее жизни. с. Все белки, представленные в клет- ке в данный момент времени. d. Все белки, которые активно син- тезируются в клетке в данный момент времени. 1.12 . Какой уровень структуры белка описывает свернутую конформацию многосубъединичного белка? а. Первичная структура. Ь. Вторичная структура. с. Третичная структура. d. Четвертичная структура. 1.13 *. Ковалентные связи какого типа соединяют остатки цистеина, рас- положенные в различных местах полипептида? а. Дисульфидный мостик. Ь. Водородная связь. с. Пептидная связь. d. Фосфодиэфирная связь. 1.14 . Считается, что в большинстве своем избыточные белки в клетке явля- ются вспомогательными белками. Какова же их функция? а. Они ответственны за специфиче- ские функции клеток определен- ных типов. Ь. Они ответственны за регулиро- вание экспрессии генома в клет- ках. с. Они ответственны за удаление от- ходов метаболизма из клеток. d. Они ответственны за общие био- химические действия, которые происходят во всех клетках. 1.15 *. Которое из следующих утверждений относится к вырожденности генети- ческого кода? а. Каждый кодон может определять более одной аминокислоты. Ь. Большинство аминокислот имеет более одного кодона. с. Есть несколько старт-кодонов. d. Стоп-кодоны могут кодировать также и аминокислоты.
34 Часть 1. Изучение геномов 1.16 . Какая из следующих функций бел- ков не относится к биологическим? а. Биологический катализ. Ь. Регулирование клеточных про- цессов. Вопросы открытого типа 1.1 *. Расположите во времени события: открытие ДНК, открытие того факта, что ДНК является генетическим ма- териалом, открытие структуры ДНК и расшифровка первого генома. 1.2 . Химические взаимодействия каких двух типов стабилизируют двойную спираль? 1.3 *. Почему специфичное спаривание между А и Т, а также между G и С дает гарантию высокой точности репли- кации ДНК? 1.4 . Каковы два важных химических от- личия между РНК и ДНК? 1.5 *. Почему молекул ы мРНК имеют корот- кие периоды полураспада по сравне- нию с другими молекулами РНК? 1.6 . Действительно ли мРНК претер- певает трансляцию в той же самой форме, в какой она синтезируется с матрицы ДНК? 1.7 *. Испытывают ли когда-либо клетки недостаток в транскриптоме? Обо- снуйте ваш ответ. Изыскательские задачи 1.1 *. В тексте (страница 11) есть утверж- дение, что Уотсон и Крик открыли структуру двойной спирали ДНК в субботу 7 марта 1953 г. Обоснуйте это утверждение. 1.2 . Подумайте, почему двойная спираль незамедлительно приобрела всеоб- щее признание как верная структура ДНК. с Перенос генетической информа- ции. d. Транспорт молекул в многокле- точных организмах. 1.8. В чём состоит важная роль водо- родных связей, электростатических взаимодействий и гидрофобных сил во вторичной, третичной и четвер- тичной структуре белков? 1.9* . За счет чего белки могут иметь так много разнообразных структур и функций, когда все они синтези- руются только из 20-ти аминокис- лот? 1.10. В дополнение к наличию известных 20-ти аминокислот белки имеют до- бавочное химическое разнообразие из-за двух факторов. Каковы эти два фактора и каково их значение? 1.11* . Каким образом кодон 5’-UGA-3' может функционировать и как стоп-кодон, и как кодон для видо- измененной аминокислоты селено- цистеина? 1.12. Как геном управляет биологической активностью клетки? 1.3*. Какие эксперименты привели к откры- тию генетического кода в 1960-е гг.? 1.4. На транскриптом и протеом смотрят как соответственно на промежуточ- ный и наконечный продукт экспрес- сии генома. Оцените обоснованность и ограничения этих терминов в ра- курсе нашего понимания экспрессии генома.
Глава 1. Геномы, транскриптомы и протеомы 35 Тесты по рисункам 1.1*. Обсудите, как каждый из этих экспериментов помог продемонстрировать, что именно ДНК, а не белки, содержит генетическую информацию. а) Трансформирующее начало б) Эксперимент Херши-Чейз Безвредные бактерии Мышь выживает Безвредные бактерии + Мышь умирает трансформирующее начало Безвредные бактерии + Мышь умирает трансформирующее начало, обработанное протеазой с . ДНК Белковый капсид Фаг, прикрепленный к бактерии | Перемешивание в мешалке А A CD CD А Фаги отсоединены или рибонуклеазой Безвредные бактерии + Мышь выживает трансформирующее начало, обработанное дезоксирибонуклеазой । Центрифугирование Бактериальный осадок “ 70 % 32Р 20 % 1.2. Найдите дезоксирибозу, фосфатные группы и различные азотистые основания. Можете ли вы определить в дезоксирибозе атомы углерода с 1-го по 5-й? О“ О- О- l-y I р 1а “О-Р-О-Р-О-Р-О- II II II ООО N nh2 I NH2 nh2
36 Часть 1. Изучение геномов Дополнительная литература Книги и статьи об открытии двойной спирали и других важных вехах в изу- чении ДНК Brock, T.D. (1990) The Emergence of Bacterial Genetics. Cold Spring Harbor Laboratory Press, New York. A detailed history that puts into context the work on the transforming principle and the Hershey-Chase experiment. Judson, H.F. (1979) The Eighth Day of Creation. Jonathan Cape, London. A highly readable account of the development of molecular biology up to the 1970s. Kay,L. E. (1993) The Molecular Vision of Life. Oxford University Press, Oxford. Contains a particularly informative explanation of why genes were once thought to be made of protein. Lander, E.S. and Weinberg, R. A. (2000) Genomics: journey to the center of biology. Science 287:1777-1782. A brief description of genetics and molecular biology from Mendel to the human genome sequence. Maddox, B. (2002) Rosalind Franklin: The DarkLadyofDNA. HarperCollins, London. McCarty, M. (1985) The Transforming Principle: Discovering that Genes are Made ofDNA. Norton, London. Olby,R. (1974) The Path to the Double Helix. Macmillan, London A scholarly account of the research that led to the discovery of the double helix. Watson, J. D. (1968) The Double Helix. Atheneum, London. The most important discovery of twentieth century biology, written as a soap opera. Крик Ф. Безумный поиск. М.-Ижевск: РХД, 2004.
Глава 2 Изучение ДНК По прочтении главы 2 вы сможете: • Описывать операции, выполняемые в ходе клонирования ДНК и полимеразной цепной реакции (ПЦР), и называть области применения и досадные ограничения этих методов. • Перечислять действия и охарактеризовывать основное назначение ферментов различного типа, используемых в исследовании рекомбинантной ДНК. • Идентифицировать важные особенности ДНК-полимераз и проводить разли- чие между разными ДНК-полимеразами, применяемыми в исследованиях под эгидой геномики. • Описывать, с примерами, способ, которым эндонуклеазы рестрикции разрезают ДНК, и объяснять, как изучают результаты переваривания рестриктазами. • Проводить различие между лигированием тупых и липких концов и объяснять, как эффективность лигирования тупых концов может быть увеличена. • Описывать (достаточно подробно) ключевые особенности плазмидных клони- рующих векторов и пояснять, как эти векторы используются в экспериментах с клонированием. • Охарактеризовывать применение векторов на бактериофаге X для клонирова- ния ДНК. • Приводить примеры векторов, используемых для клонирования длинных ку- сков ДНК, и оценивать преимущества и ограничения векторов каждого из обо- значенных типов. • Озвучивать основные моменты клонирования ДНК у дрожжей, животных и рас- тений. • Описывать технологию проведения ПЦР, обращая особое внимание на значе- ние затравок и температур, используемых во время воздействия тепловых циклов. Фактически все, что мы знаем о геномах и экспрессии генома, было открыто экс- периментально: теоретические изыскания сыграли очень небольшую роль в этой или любой другой области молекулярной и клеточной биологии1). В принципе, можно изу- чать «факты» о геномах, не зная многого о том, как эти факты были получены, но если мы хотим прийти к настоящему пониманию данного предмета, мы должны подробно ознакомиться с методами и научными подходами, которые использовались для изучения геномов. Следующие пять глав охватывают эти методы исследования. Сначала мы об- ратимся к методам, основанным на клонировании ДНК и полимеразной цепной реакции. Эти методы очень эффективны при работе с короткими сегментами ДНК, в том числе с отдельными генами, и позволяют получать массу информации на этом уровне. В главе 3 Это не совсем верно — теоретические исследования геномов позволили сделать ряд важных и неожи- данных открытий, которые впоследствии получили экспериментальное подтверждение. — Прим. ред.
38 Часть 1. Изучение геномов мы перейдем к методам, разработанным для построения карт геномов, и увидим, как методы генетического картирования, впервые развитые почти столетие назад, были обогащены дополнительными методами для физического картирования геномов. Глава 4 устанавливает связь между картированием и секвенированием и показывает, что, хотя карта и может служить ценным помощником при сборке длинной последовательности ДНК, картирование не всегда является необходимой предпосылкой к секвенированию генома. В главе 5 мы рассматриваем различные подходы, которые используются для ис- толкования последовательности генома, а в главе 6 — исследуем методы, применяемые для изучения экспрессии генома. По мере чтения главы 6 вы начнете осознавать, что понимание того, как геном определяет биохимические возможности живой клетки, есть одна из главных исследовательских задач в современной биологии. Инструментарий методов, употребляемых молекулярными биологами для изуче- ния молекул ДНК, был собран в течение 1970-х и 1980-х гг. До того времени единственным путем, позволявшим изучать отдельные гены, была классическая генетика, имеющая в своем арсенале процедуры, которые мы встретим в главе 3. Развитие более прямых методов изучения ДНК стимулировалось крупными достижениями в области биохимиче- ских исследований, благодаря чему в начале 1970-х гг. молекулярные биологи приобрели ферменты, которые они теперь могли использовать для манипулирования молекулами ДНК в пробирке. В естественном виде эти ферменты синтезируются в живых клетках и вовлекаются в такие процессы, как репликация, репарация и рекомбинация ДНК, которые мы встретим в главах 15,16 и 17. Для определения функций этих ферментов многие из них были очищены, а реакции, которые они катализируют, — досконально изучены. После этого молекулярные биологи приняли эти чистые ферменты на воору- жение как инструменты для того, чтобы управлять молекулами ДНК предопределен- ным образом — делать их копии, разрезать их на более короткие фрагменты и снова соединять их вместе, но уже в комбинациях, не существующих в природе (рис. 2.1). Такие манипуляции лежат в основе технологии рекомбинантной ДНК, в которой новые, или «рекомбинантные», молекулы ДНК строятся из частей встречающихся в природе хромосом и плазмид. Методология рекомбинантной ДНК привела к развитию клонирования ДНК, или клонирования генов, в котором короткие фрагменты ДНК, возможно, содержащие един- ственный ген, встраиваются в хромосому плазмиды или вируса и затем реплицируются в организме хозяина — бактерии или эукариота (рис. 2.2). В разделе 2.2 мы подробно опишем, как выполянется клонирование гена и укажем причины, благодаря которым этот метод произвел революцию в молекулярной биологии. Гены Копирование Разрезание Перестановка Рис. 2.1. Примеры манипуляций, которые могут быть выполнены с молекулами ДНК
Глава 2. Изучение ДНК 39 Рис. 2.2. Клонирование ДНК. В этом примере предназначенный для клонирования фрагмент ДНК встраивается в плазмидный вектор, который затем последовательно реплицируется внутри бактерии- хозяина ДНК плазмиды Встройка новой ДНК Клонирование гена стало распространенным экс- периментальным методом к концу 1970-х гг. Следующее главное крупное техническое достижение появилось в се- редине 1980-х гг., когда была изобретена полимеразная цепная реакция (ПЦР). ПЦР представляет собой неслож- ный метод: все, чего он достигает, — это многократное копирование короткого сегмента молекулы ДНК (рис. 2.3), однако эта реакция приобрела огромное значение для многих областей биологического исследования, и не в по- следнюю очередь — в изучении геномов. Подробно ПЦР будет рассмотрена в разделе 2.3. I Новая ДНК Репликация в бактериях Бактериальная 1 культура \ Ген Полимеразная цепная реакция (ПЦР) Рис. 2.3. Полимеразная цепная реакция (ПЦР) применяется для получения копий отобранного сегмента молекулы ДНК. В этом примере копируется один-единственный ген 2.1. Ферменты для манипуляций с ДНК Технология рекомбинантной ДНК была одним из главных факторов, которые внесли вклад в быстрый прогресс знания об экспрессии генов, произошедший в течение 1970-х и 1980-х гг. Основа технологии рекомбинантной ДНК — способность управлять молекулами ДНК в пробирке. Это, в свою очередь, зависит от наличия очищенных ферментов (их действия известны и поддаются управлению), каковые поэтому могут быть использованы для привнесения заданных изменений в молекулы ДНК, которыми манипулирует биолог. Ферменты, доступные молекулярному биологу, делятся на четыре широкие категории. • ДНК-полимеразы (раздел 2.1.1) представляют собой ферменты, которые синте- зируют новые полинуклеотиды, комплементарные существующей матрице ДНК или РНК (рис. 2.4, а). • Нуклеазы (раздел 2.1.2) расщепляют молекулы ДНК, разрывая фосфодиэфирные связи, соединяющие один нуклеотид со следующим (рис. 2.4, б).
40 Часть 1. Изучение геномов • Лигазы (раздел 2.1.3) соединяют молекулы ДНК друге другом, синтезируя фосфо- диэфирные связи между нуклеотидами или на концах двух разных молекул, или на двух концах одной и той же молекулы (рис. 2.4, в). • Ферменты модификации концов (раздел 2.1.4) производят изменения на концах молекул ДНК, благодаря чему открывают в проекте экспериментов с лигированием новое дополнительное измерение и выступают одним из средств мечения молекул ДНК радиоактивными и другими маркёрами (техническое примечание 2.1). 2.1.1. ДНК-полимеразы Многие из методов, применяемых для изучения ДНК, зависят от синтеза ДНК-копий всех или части имеющихся в наличии молекул ДНК или РНК. Это требование существен- но для ПЦР (раздел 2.3), секвенирования ДНК (раздел 4.1), мечения ДНК (техническое примечание 2.1) и многих других процедур, занимающих центральное место в иссле- дованиях молекулярной биологии. Фермент, который синтезирует ДНК, называют ДНК-полимеразой, а тот, который копирует существующую молекулу ДНК или РНК, называют направляемой матрицей ДНК-полимеразой (ДНК- или РНК-зависимой ДНК полимеразой). а) ДНК-полимеразы Матрица ДНК Матрица РНК .............. ДНК-копии б) Нуклеазы I— Эндонуклеаза I Экзонуклеаза Внутренние разрезы Нуклеотиды удаляются с концов в) Лигазы Одна молекула ДНК Две молекулы ДНК Рис. 2.4. Действия: а) ДНК-полимераз, б) нуклеаз и в) лигаз, а) Деятельность ДНК-зависимой ДНК-полимеразы показана слева, а деятельность РНК-зависимой ДНК-полимеразы — справа, б) Действия эндонуклеаз и экзо- нуклеаз. в) Серая молекула ДНК лигируется сама с собой (слева) и со второй молекулой ДНК (справа)
Глава 2. Изучение ДНК 41 Техническое примечание 2.1: мечение ДНК Прикрепление к молекулам ДНК радиоактивных, флюоресцентных или иного типа маркёров Мечение ДНК лежит в основе многих процедур молекулярной биологии, вклю- чая гибридизацию по Саузерну (раздел 2.1.2), флюоресцентную гибридизацию in situ (FISH; раздел 3.3.2) и секвенирование ДНК (раздел 4.1). Оно позволяет определять местоположение специфической молекулы ДНК — на нитроцеллю- лозной или нейлоновой мембране, в хромосоме или в геле — путем обнаруже- ния сигнала, испускаемого тем или иным маркёром. В некоторых приложени- ях используются также меченые молекулы РНК (техническое примечание 5.1). Для того чтобы метить молекулы ДНК, часто используются радиоактивные маркёры. Можно синтезировать нуклеотиды, в которых один из атомов фосфора будет заменен на 32Р или на 33Р, либо один из атомов кислорода в фосфатной группе будет заменен на 35S, либо же один или несколько атомов водорода будут заменены на 3Н (см. рис. 1.4). Такие радиоактивные нуклеотиды также служат субстратом для ДНК-полимераз и таким образом встраиваются в молекулу ДНК посредством любой реакции синтеза нити, катализируемой ДНК-полимеразой. Кроме того, по- меченные нуклеотиды или отдельные фосфатные группы могут быть прицеплены к одному или обоим концам молекулы ДНК в ходе реакций, катализируемых Т4- полинуклеотидкиназой или концевой дезоксинуклеотидилтрансферазой (раз- дел 2.1.4). Радиоактивный сигнал может быть обнаружен счетом сцинтилляций, но для большинства экспериментов молекулярной биологии необходима позиционная информация, так что обнаружение сигнала осуществляется экспозицией чувстви- тельной к рентгеновскому излучению пленки (авторадиография1^: см. пример на рис. 2.11) или чувствительного к радиации фосфоресцирующего экрана (фосфорес- центная визуализация). Выбор между различными радиоактивными метками за- висит от требований процедуры. Изотоп 32Р дает высокую чувствительность, потому что он обладает высокой энергией эмиссии, но хорошая чувствительность сопрово- ждается низким разрешением из-за рассеивания сигнала. Изотопы низкой эмиссии типа 35S или 3Н дают меньшую чувствительность, но зато большее разрешение. Требования охраны здоровья и окружающей среды привели к тому, что в по- следние годы радиоактивные маркёры стали менее популярными и для многих процедур они теперь в значительной степени заменены нерадиоактивными альтер- нативами. Наиболее полезные из них — флюоресцентные маркёры, которые явля- ются основными компонентами методов типа FISH (раздел 3.3.2) и секвенирования ДНК (раздел 4.1.1). Флюоресцентные метки с различными длинами волны эмиссии (то есть, различных цветов) встраиваются в нуклеотиды или присоединяются не- посредственно к молекулам ДНК и детектируются подходящей пленкой, флюорес- Данный метод изредка встречается также и под именем радиоавтографии, но термин «автора- диография» в большей мере отражает суть этого метода, поскольку принято располагать приставки, обозначающие сущностные (радио) качества объекта при корне слова, а все указывающие обстоятель- ственные (авто) признаки—дальше от него. По сути это метод регистрации распределения радиоактив- ных веществ в исследуемом объекте. Пленка с чувствительной к радиоактивному излучению эмульсией накладывается на поверхность (срез). Радиоактивные вещества как бы сами себя фотографируют (авто- матически). Места почернения на пленке после проявления соответствуют локализации радиоактивных частиц. Используется в биологии, медицине, технике. — Прим, перев.
42 Часть 1. Изучение геномов центной микроскопией или датчиком флюоресценции. Способы нерадиоактивного мечения других типов основаны на хемилюминесцентной эмиссии, но они имеют то неудобство, что сигнал не генерируется непосредственно меткой, но вместо этого должен быть «проявлен» обработкой меченой молекулы химикалиями. В наиболее популярном из таких методов используется мечение ДНК ферментом щелочной фос- фатазой, которая детектируется с применением производных диоксетана. которые этим ферментом дефосфорилируются с возбуждением хемилюминесценции. Механизм действия направляемой матрицей полимеразы Направляемая матрицей ДНК-полимераза синтезирует новый полинуклеотид ДНК, последовательность которого предписывается через правила спаривания оснований нуклеотидной последовательностью копируемой молекулы ДНК или РНК (рис. 2.5). Новый полинуклеотид всегда синтезируется в направлении 5’->3': ДНК-полимеразы, которые производили бы ДНК в другом направлении, неизвестны в природе. Важная особенность направляемого матрицей синтеза ДНК состоит в том, что ДНК-полимераза неспособна использовать в качестве матрицы полностью однонитевую молекулу. Чтобы начать синтез ДНК, этот фермент должен иметь под рукой короткую двунитевую область на З'-конце, к которой (с уже ее З'-конца) он будет присоединять новые нуклеотиды (рис. 2.6, а). Способ удовлетворения этой потребности в живых клет- ках при репликации генома описан в главе 15. В пробирке реакция копирования ДНК инициируется прикреплением к матрице короткого синтетического олигонуклеотида, как правило, длины приблизительно 20 нуклеотидов, который и служит затравкой для синтеза ДНК. На первый взгляд, потребность в затравке могла бы показаться нежеланным осложнением, связанным с применением ДНК-полимераз в технологии рекомбинантной ДНК, но это было бы глубочайшим заблуждением. Поскольку отжиг затравки к матрице зависит от комплементарного спаривания оснований, позиция в пределах молекулы матрицы, с которой начнется копирование ДНК, может быть задана за счет синтеза за- травки с соответствующей последовательностью нуклеотидов (рис. 2.6, б). Благодаря этому может быть скопирован короткий специфичный сегмент намного более длин- ной молекулы матрицы, что намного ценнее, чем копирование случайного фрагмента, которое лишь и было бы возможным, не будь необходимости в затравливании синтеза ДНК (так что функция позиционирования с лихвой окупает все затраты, связанные с затравливанием). В полной мере значение затравливания вы оцените, когда мы будем рассматривать ПЦР в разделе 2.3. Вторая общая особенность направ- 5 ляемых матрицей ДНК-полимераз — то, ДНК 3'--TACCCAACGCAATTC ATGG----► 5' 3' Новая ДНК 3'--TACCCAACGCAATTC ATGGGTTG----► 5' 3' Рис. 2.5. Действие ДНК-зависимой ДНК-по- лимеразы. Новые нуклеотиды прибавляются к З'-концу растущего полинуклеотида, при этом последовательность этого нового полинуклеоти- да определяется последовательностью матрицы 5" ДНК. Сравните с процессом транскрипции (на- правляемый ДНК синтез РНК), представленным на рис. 1.11
Глава 2. Изучение ДНК 43 а) Для синтеза ДНК необходима затравка yjLU I i I I I I L1 1 I I I g* Затравка уТ77. ....... .-XX. ДНК-полимераза -1L1I11J 1111 1 J LX Синтез ДНК не происходит Новая ДНК । I I I I I1. .XXX Синтез ДНК б) Затравка определяет ту часть молекулы ДНК, которая будет скопирована Затравка 5* У . - 1XJ.JJX 1-XXIJJX1-XIJJJ J XIJ.1 .... .JJ, ... i ;; И I _г._, Рис. 2.6. Роль затравки в направляемом матрицей синтезе ДНК. а) Для того чтобы начать синтез нового полинуклеотида, ДНК-полимеразе необходима затравка, б) Последовательность этого олигонуклеотида определяет позицию, в которой он прикрепляется к матрице ДНК и, следовательно, определяет об- ласть матрицы, которая будет скопирована. Когда для получения новой ДНК in vitro используется ДНК- полимераза, затравкой обычно служит короткий олигонуклеотид, полученный химическим синтезом. Подробное описание процесса затравливания синтеза ДНК in vivo приведено в разделе 15.2.2 что многие из этих ферментов являются многофункциональными, то есть способными расщеплять молекулы ДНК, равно как и синтезировать их. Это отражение способа, кото- рым ДНК-полимеразы действуют в клетке во время репликации генома (раздел 15.2). На- ряду со способностью осуществлять синтез ДНК в направлении 5'->3’, ДНК-полимеразы могут также производить действия одной или обеих экзонуклеаз (рис. 2.7). • Действие экзонуклеазы 3'^5' позволяет ферменту удалять нуклеотиды с З'-конца нити, которая только что была синтезирована. Это действие называют коррек- цией, потому что оно позволяет полимеразе исправлять ошибки путем удаления нуклеотида, который был вставлен неправильно. • Действие экзонуклеазы 5'->3' встречается реже, но присуще некоторым ДНК- полимеразам, коим для выполнения своей природной функции необходима способ- ность удалять в ходе репликации генома по крайней мере часть полинуклеотида, уже присоединенного к матричной нити, которую такая полимераза копирует. Виды ДНК-полимераз, используемых в научных исследованиях Некоторые из направляемых матрицей ДНК-полимераз, применяемых в исследо- ваниях молекулярной биологии (таблица 2.1), представляют собой варианты фермента ДНК-полимеразы I Escherichia colt, который играет центральную роль в репликации генома этой бактерии (раздел 15.2). Этот фермент, иногда называемый полимеразой Корнберга в честь открывшего ее исследователя Артура Корнберга, обладает действием экзонуклеаз 3'->5’ и 5'->3’, что ограничивает его применимость для манипуляции ДНК. В основном, его применяют при мечении ДНК (техническое примечание 2.1).
44 Часть 1. Изучение геномов Рис. 2.7. Синтез ДНК и действия экзонуклеаз, присущие ДНК- пол имеразам. Все ДНК-полимеразы могут синтезировать ДНК, а многие обладают также и свойствами одной или обеих экзонуклеаз Из действий двух таких экзонуклеаз именно действие экзонуклеазы 5 >3' вызывает боль- шинство проблем, когда для манипуляций моле- кулами в пробирке используется ДНК-полимераза. Это связано с тем, что фермент, обладающий та- ким действием, способен удалять нуклеотиды с 5'-концов полинуклеотидов, которые только что были синтезированы (рис. 2.8). Маловероятно, что полинуклеотиды будут расщеплены полностью, потому что действие полимеразы обычно намного сильнее, чем функция экзонуклеазы, но некоторые методы не будут работать, если 5'-концы новых полинуклеотидов будут укорочены каким-либо образом. В частности, секвенирование ДНК бази- руется на синтезе новых полинуклеотидов, начи- нающихся одинаковыми для всех них 5'-концами, которые были помечены затравкой, используемой для инициации реакций секвенирования. Если же имеет место «откусывание» 5'-концов, не важно, до какой степени, то определить правильную последовательность ДНК ста- новится невозможно. Когда секвенирование ДНК начали претворять в жизнь в конце 1970-х гг., в нем использовалась видоизмененная версия фермента Корнберга, названная полимеразой Клёнова. Полимераза Клёнова первоначально приготовлялась путем раз- резания естественного фермента ДНК-полимеразы I Е. coli на два сегмента с помощью протеазы. Один из этих фрагментов сохранял действия полимеразы и экзонуклеазы 3’—>5', но терял функцию экзонуклеазы 5’->3', присущую необработанному ферменту. Этот фермент все еще часто называют фрагментом Клёнова в память об этом старом а) Синтез ДНК в направлении 5' -> 3’ Затравка Новая ДНК 5* lllllllllllllllltlllllll Матрица ДНК-полимераза б) Действие экзонуклеазы 3’ 5’ Неверный нуклеотид 5> 3'i > - ДНК-полимераза обращает свое направление в) Действие экзонуклеазы 5' -> 3’ Замещенные нуклеотиды lllllllllllllIIIIIIIII ТТТЩГЩ5< методе его приготовления, но в настоящее время его почти всегда готовят из клеток Е. coli, в которых ген полимеразы был спроектирован таким образом, чтобы конечный фермент имел желательные свойства. Но фактически полимераза Клёнова теперь редко используется в секвенировании и находит свое главное применение в мечении ДНК (см. техническое примечание 2.1). Это связано с тем, что в 1980-е гг. был разработан фермент по имени секвеназа (см. табл. 2.1), который имеет превосходящие свойства в отношении секвенирования. В разделе 4.1.1 мы Новая ДНК н Л 5 YTTTTTTTTT1!* 3 возвратимся к свойствам секвеназы 3' 5' и посмотрим, почему благодаря им этот фермент является идеальным Действие экзонуклеазы 5' -> 3’ для секвенирования. Сегмент новой ДНК расщепляется U5 Рис. 2.8. Благодаря действию экзонуклеазы 5'->3', ДНК-полимераза может расщеплять 5'-концы полинуклеотида, который только что был синтезирован
Глава 2. Изучение ДНК 45 Таблица 2.1. Особенности направляемых матрицей ДНК-полимераз, применяемых в исследованиях молекулярной биологии Полимераза Описание Основное применение Перекрестная ссылка ДНК-полимераза I Неизмененный фермент Е. coli Мечение ДНК Техническое примечание 2.1 Полимераза Клёнова Измененная версия ДНК- полимеразы IЕ coli Мечение ДНК Техническое примечание 2.1 Секвеназа Измененная версия ДНК- полимеразы I фага Т7 Секвенирование ДНК Раздел 4.1.1 Полимераза Taq ДНК-полимераза I Thermus aquaticus ПЦР Раздел 2.3 Обратная полимераза РНК-зависимая ДНК- Синтез кДНК Раздел 5.1.2 полимераза, полученная из различных ретровирусов Фермент ДНК-полимераза I Е. coli имеет оптимальную температуру реакции 37 °C, каковая является обычной температурой естественной окружающей среды бактерии в кишечнике млекопитающих, например человека. Поэтому в пробирке реакции с использованием полимеразы Корнберга, фрагмента Клёнова или секве- назы проводятся при 37 °C и прерываются повышением температуры до 75 °C или выше, что заставляет белок развертываться, или денатурировать, и терять свою ферментативную активность. Этот режим совершенно адекватен для большинства методов молекулярной биологии, но по причинам, которые станут ясными в разделе 2.3, ПЦР требует термостабильной ДНК-полимеразы — такой, которая способна функционировать при температурах намного выше 37 °C. Подходящие ферменты могут быть получены из бактерий типа Thermus aquaticus, которые живут в горя- чих источниках при температурах до 95 °C и чей фермент ДНК-полимераза I имеет оптимальную рабочую температуру 72 °C. Биохимическая основа термостабильности белка до конца не ясна, но, по всей вероятности, она связана со структурными осо- бенностями, которые уменьшают степень денатурации белка, которая происходит при повышенных температурах. Большое значение в исследованиях молекулярной биологии имеет ДНК- полимераза еще одного типа. Это обратная транскриптаза (иногда называемая ревертазой), которая представляет собой РНК-зависимую ДНК-полимеразу и, таким образом, снимает копии ДНК с РНК-, а не с ДНК-матриц. Обратные транс- криптазы вовлечены в циклы репликации ретровирусов (раздел 9.1.2), в том числе вирусов иммунодефицита человека, которые вызывают синдром приобретенного иммунодефицита, или СПИД; эти вирусы имеют геномы из РНК, которые копируются в молекулы ДНК после заражения хозяина. В пробирке обратная транскриптаза может быть использована для получения копий ДНК из молекул мРНК. Эти копии назы- вают комплементарными ДНК (кДНК). Их синтез важен для некоторых способов клонирования генов и методов, применяемых для картирования областей генома, кодирующих заданные молекулы мРНК (раздел 5.1.2).
46 Часть 1. Изучение геномов 2.1.2. Нуклеазы В технологии рекомбинантной ДНК нашел свое применение целый спектр нуклеаз (таблица 2.2). Некоторые нуклеазы имеют широкий диапазон действий, но большинство из них представлено или экзонуклеазами, удаляющими нуклеотиды с концов молекул ДНК и (или) РНК, или эндонуклеазами, делающими разрезы во внутренних фосфодиэ- фирных связях. Некоторые нуклеазы являются специфичными к ДНК, а некоторые — к РНК, одни работают только с двунитевой ДНК, а другие — только с однонитевой ДНК, иные же вовсе не разбирают молекул, на которые они воздействуют. В последующих главах мы встретим примеры различных нуклеаз, когда будем рассматривать методы, в которых они используются. Здесь мы подробно рассмотрим нуклеазы только одного типа: эндонуклеазы рестрикции, которые играют центральную роль во всех аспектах технологии рекомбинантной ДНК. Эндонуклеазы рестрикции позволяют разрезать молекулы ДНК в определен- ных позициях Эндонуклеаза рестрикции — фермент, который связывается с молекулой ДНК в области определенной последовательности и делает двунитевой разрез в этой по- следовательности или около нее. Из-за специфичности последовательности позиции разрезов в пределах молекулы ДНК могут быть предсказаны (при условии, что по- следовательность ДНК известна); это позволяет вырезать определенные сегменты из более крупной молекулы. Такая возможность лежит в основе клонирования генов и всех других аспектов технологии рекомбинантной ДНК, в которой требуются фрагменты ДНК с известной последовательностью. Известно три типа эндонуклеаз рестрикции. В случае типов I и III нет никакой воз- можности строгого управления позицией разреза относительно определенной последо- вательности в молекуле ДНК, которая опознается ферментом. Поэтому такие ферменты менее полезны, ибо последовательности получающихся фрагментов точно не известны. Ферменты II типа не страдают этим недостатком, потому что разрез всегда произво- дится в одном и том же месте — или в пределах распознаваемой последовательности Таблица 2.2. Свойства важных нуклеаз, применяемых в исследованиях молекулярной биологии Нуклеаза Описание Главное использование Перекрестная ссылка Эндонуклеазы рестрикции Специфичные к по- следовательности ДНК-эндонуклеазы из многих источников Много применений Раздел 2.1.2 Нуклеаза S1 Эндонуклеаза, специ- фичная к однонитевой ДНК и РНК, из гриба Aspergillus oryzae Картирование транскриптов Раздел 5.1.2 Дезоксирибону- клеаза I Эндонуклеаза, спец- ифичная к двуните- вой ДНК и РНК, из Escherichia coli Нуклеазный футпринтинг Раздел 11.1.2
Глава 2. Изучение ДНК 47 (сайта узнавания), или очень близко к ней (рис. 2.9). Например, фермент II типа EcoRI (выделенный из Е. coli) разрезает ДНК только в гексануклеотиде 5’-GAATTC-3'. Поэтому переваривание ДНК ферментом II типа дает воспроизводимый набор фрагментов, по- следовательности которых предсказуемы, если последовательность целевой молекулы ДНК известна. Всего было выделено более 2500 ферментов II типа, и более 300 из них до- ступно для использования в лаборатории. Многие ферменты имеют гексануклеотидные целевые участки, но другие узнают более короткие или более длинные последователь- ности (таблица 2.3). Известны также примеры ферментов с вырожденными сайтами узнавания; это означает, что они разрезают ДНК во всех участках из семейства таких связанных участков. Например, Hinfl (из Haemophilus influenzae) опознает последователь- ность 5'-GANTC-3' (где N — любой нуклеотид) и, таким образом, производит разрезы в последовательностях 5’-GAATC-3’, 5'-GATTC-3', 5’-GAGTC-3' и 5’-GACTC-3’. Большинство ферментов делает разрезы в пределах сайта узнавания, но немногие типа BsrB\ произ- водят разрез в определенной позиции вне этой последовательности. Таблица 2.3. Некоторые примеры эндонуклеаз рестрикции Фермент Последователь- ность узнавания (сайт узнавания) Тип концов Конечные последовательности А1и\ 5'-AGCT-3' 3'-TCGA-5' Тупые 5'-AG СТ-3' З'-ТС GA-5' Sou3A\ 5'-GATC-3' 3'-CTAG-5' Липкие, выдается 5' 5'- GATC-3' З'-CTAG -5' Hinft 5'-GANTC-3' 3'-CTNAG-5' Липкие, выдается 5' 5'-G ANTC-3' З'-CTNA G-5' BamHl 5'-GGATCC-3' 3'-CCTAGG-5' Липкие, выдается 5' 5'-G GATCC-3' З'-CCTAG G-5' BsrBi 5'-CCGCTC-3' 3'-GGCGAG-5' Тупые 5'- NNNCCGCTC-3' 3'- NNNGGCGAG-5' EcoBA 5'-GAATTC-3' 3'-CTTAAG-5' Липкие, выдается 5’ 5'-G AATTC-3' З'-CTTAA G-5' Pstl 5'-CTGCAG-3' 3'-GACGTC-5' Липкие, выдается 3’ 5'-CTGCA G-3' З'-G ACGTC-5' NotA 5'-GCGGCCGC-3' 3'-CGCCGGCG-5' Липкие, выдается 5’ 5'-GC GGCCGC-3' З'-CGCCGG CG-5' Bgl\ 5'-GCCNNNNNGGC-3' 3'-CGGNNNNNCCG-5' Липкие, выдается 3' 5'-GCCNNNN NGGC-3' З'-CGGN NNNNCCG-5' Сокращение: N—любой нуклеотид. Обратите внимание, что в подавляющем большинстве сайты узнавания обладают симметрией инверсии: при чтении в направлении 5’->3' опознавательная последовательность одинакова в обеих нитях.
48 Часть 1. Изучение геномов Разрезы, производимые в различных позициях 1Ш Опознавательная I Эндонуклеаза рестрикции I или III типа последовательность । Эндонуклеаза рестрикции II типа t Все разрезы в одной и той же позиции Рис. 2.9. Разрезы, производимые эндо- нуклеазами рестрикции. В верхней части схемы ДНК разрезана эндонуклеазой ре- стрикции I или III типа. Разрезы сделаны в немного различных позициях относи- тельно последовательности узнавания, так что получающиеся фрагменты имеют различную длину. В нижней части схемы показано действие фермента II типа. Все молекулы разрезаны точно в одной и той же позиции, что дало абсолютно идентич- ные пары фрагментов Ферменты рестрикции раз- резают ДНК двумя различными способами. Многие делают простой двунитевой разрез, после которого остаёеся тупой, или ровный, конец, но другие разрезают две нити ДНК в разных позициях, обычно отсто- ящих друг от друга на два или на четыре нуклеотида, так что полу- чающиеся фрагменты ДНК имеют на каждом конце короткие однонитевые выдающиеся куски. Их называют липкими, или неровными, концами, потому что в результате спаривания оснований между ними молекула ДНК может обратно склеиться воедино (рис. 2.10, а). Некоторые дающие липкие концы рестриктазы оставляют 5'-выступы (например, 5аиЗА1 и Hinfl), тогда как другие оставляют З’-выступы (например, PstI) (рис. 2.10, б). Одна особенность, которая крайне важна в технологии рекомбинантной ДНК, состоит в том, что некоторые пары ферментов рестрикции имеют различные сайты узнавания, но дают одни и те же липкие концы; например, рестриктазы 5апЗА1 и ZtamHI обе дают липкий конец 5’-GATC-3’, хотя сайт узнавания 5аиЗА1 состоит из четырех пар оснований, a ZtamHI опознает последо- вательность из шести пар оснований (рис. 2.10, в). Анализ результатов переваривания рестриктазами После обработки ДНК эндонуклеазой рестрикции полученные фрагменты могут быть исследованы электрофорезом в агарозном геле (техническое примечание 2.2) с целью определения их размеров. Если исходная ДНК была относительно короткой молекулой и после рестрикции было получено не более двадцати фрагментов, то обычно возможно подобрать такую концентрацию агарозы, чтобы каждый фрагмент просма- тривался в виде отдельной полосы в геле. Если начальная ДНК длинна и, таким образом, дает много фрагментов после переваривания ферментом рестрикции, то независимо от выбранной концентрации агарозы гель может попросту показать размытое пятно ДНК, потому что там присутствуют фрагменты всевозможной длины, которые все сли- ваются воедино. Это часто наблюдаемый результат, когда геномная ДНК разрезается ферментом рестрикции. Если последовательность исходной ДНК известна, то могут быть предсказаны последовательности и, следовательно, размеры фрагментов, полученных после обра-
Глава 2. Изучение ДНК 49 Техническое примечание 2.2: электрофорез в агарозном геле Разделение молекул ДНК различной длины Гель-электрофорез — стандартный метод для разделения молекул ДНК раз- личной длины. Он находит множество применений в анализе размеров фрагментов ДНК и может употребляться также и для разделения молекул РНК (см. техническое примечание 5.1). Электрофорез заключается в движении заряженных молекул в электрическом поле: отрицательно заряженные молекулы мигрируют к положительному электро- ду, а положительно заряженные молекулы мигрируют к отрицательному электроду Первоначально этот метод выполняли в водном растворе, в котором преобладаю- щими факторами, влияющими на скорость миграции, были форма молекулы и ее электрический заряд. Это не особенно пригодно для разделения ДНК, потому что большинство молекул ДНК имеет одинаковую форму (линейную), и, хотя заряд молекулы ДНК зависит от ее длины, различия в заряде недостаточны, чтобы обе- спечить эффективное разделение. Ситуация меняется, когда электрофорез выпол- няется в геле, потому что теперь форма и заряд молекулы отходят на второй план, а критическим детерминантом скорости перемещения становится ее длина. Это связано с тем, что гель представляет собой сеть пор, через которые молекулы ДНК должны проходить, чтобы достигнуть положительного электрода. Более коротким молекулам поры препятствуют меньше, чем более длинным молекулам, и поэтому первые продвигаются через гель быстрее. По этой причине молекулы различной длины образуют полосы в геле. В молекулярной биологии используются гели двух типов: агарозные гели, которые описаны здесь, и полиакриламидные гели, которые будут описаны в тех- ническом примечании 4.1. Агароза — полисахарид, который образует гели с порами в пределах от 100 до 300 нм в диаметре, причем размер пор зависит от концентрации агарозы в геле. Поэтому концентрация геля определяет диапазон фрагментов ДНК, которые могут быть разделены. Диапазон разделения зависит также от величины электроэндосмоса (ЭЭО) агарозы, каковая служит мерой количества связанных анионов сульфата и пирувата. Чем больше ЭЭО, тем медленнее скорость миграции отрицательно заряженной молекулы, например ДНК. Агарозный гель приготовляют следующим образом: размешивают необхо- димое количество порошка агарозы в буферном растворе, нагревают его, чтобы растворить агарозу, и затем выливают расплавленный гель на плексигласовую пластину с лентой по бортам, предотвращающей расползание геля. Затем в гель помещается решетка, чтобы оформить лунки для образцов. Далее гелю позволяют схватиться и после этого выполняют электрофорез в геле, погруженном под буфер. С тем чтобы следить за ходом электрофореза, к образцам ДНК перед их загрузкой до- бавляют один или два красителя с известной скоростью перемещения. Полосы ДНК визуализируются путем вымачивания геля в растворе бромистого этидия, при этом данное соединение встраивается между парами оснований ДНК и флюоресцирует, будучи активировано ультрафиолетовым излучением (рис. Т2.1). В зависимости от концентрации агарозы в геле фрагменты от 100 п. н. до 50 тыс. п. н. в длину мо- гут быть разделены на резкие полосы после электрофореза (рис. Т2.2). Например, 0,3%-й гель может использоваться для молекул от 5 тыс. п. н. до 50 тыс. п. н. в длину,
50 Часть 1. Изучение геномов Лунка для образцов I Вымачивание в 0,5 мкг/мл растворе Д, бромистого этидия в течение 15 минут Агарозный гель Пленка-подложка из прозрачного для УФ- лучеи пластика Рис. Т2.2. Диапазон размеров фрагментов, лежащий в пределах разрешающей способности, зависит от концентрации агарозы в геле. Электрофорез был выполнен стремя различными концентрациями ага- розы. Метки указывают размеры полос на левой и правой дорожке. Фотография любезно предостав- лена «BioWhittaker Molecular Applications» Полосы ДНК флюоресцируют УФ УФ УФ эис. Т2.1. Полосы ДНК в агарозном геле визуа- лизируются путем окрашивания бромистым эти- дием а 5%-й гель — для молекул длины 100-500 п.н. В 4%-м или 5%-м агарозном геле могут быть разделены фрагменты длиной менее 150 п. н., что позволяет различать между собой полосы, представляющие молекулы, которые отличаются друг от друга размером лишь только на один-единственный нуклеотид. Однако в случае более крупных фрагментов разделять молекулы близкого размера удается не всегда, даже в гелях с более низкой концентрацией агарозы. ботки специфическим ферментом рестрикции. В таком случае полоса, соответствующая желательному фрагменту (например, содержащему тот или иной ген), может быть идентифицирована, вырезана из геля и очищена с выделением из нее ДНК. Даже если его размер неизвестен, фрагмент, содержащий ген или какой-либо иной сегмент ДНК, представляющий интерес, может быть идентифицирован методом так называемой гибридизации по Саузерну при условии, что часть последовательности в пределах этого фрагмента известна или может быть предсказана. Первый шаг — переместить фрагменты рестрикции из агарозного геля на мембрану из нейлона или нитроцеллю- лозы. Это делают, помещая мембрану на гель и позволяя буферу промочить ее, увлекая ДНК из геля к мембране, где она становится связанной (рис. 2.11, а). В результате этого процесса полосы ДНК становятся закрепленными на поверхности мембраны в относи- тельных позициях, аналогичных таковым в геле.
Глава 2. Изучение ДНК 51 а) Тупые и липкие концы IIIIIIIIIIIIIIIH уШШ1( 1111UU 5* * iflllHii '"JIIILH 5' Тупые концы Липкие концы б) 5'- и З'-выступы гШП^ПШ Г у | BamHI | Pstl гШП««е 5“ТС1ШП? vTWTGC>3' *свлшп1- 3^^—CCTAG5* G****»5 3 «G yACGTC*——— 5 в) Липкий конец, произведенный различными ферментами 5/ттттт^^ттттт у 3'1L1Ucctagg*11u 5' | BamHI 5“тс« йппжшп? | Sau3AI гШШста65. 5'GATCnnn? Рис. 2.10. Результаты переваривания ДНК различными эндонуклеазами рестрикции, а) Тупые концы и липкие концы. 6) Липкие концы различных типов: З'-выступы, производимые BamHI, и З'-выступы, производимые Pst\. в) Одни и те же липкие концы, произведенные двумя различными эндо- нуклеазами рестрикции: 5'-выступ с последовательностью 5'-GATC-3' производится и BamHI (опознает 5'-CGATCC-3') и ЗаиЗМ (опознает 5'-САТС-3') Следующий шаг — подготовка гибридизирующего зонда, который представляет собой меченую молекулу ДНК, последовательность которой комплементарна последова- тельности целевой ДНК, которую мы желаем детектировать. Зондом мог бы, например, служить синтетический олигонуклеотид, последовательность которого соответствует части интересующего нас гена. Поскольку зонд и целевые ДНК взаимно комплементарны, они могут спариваться или гибридизироваться между собой, при этом позиция гибри- дизированного зонда на мембране идентифицируется путем детектирования сигнала, выделяемого меткой, прикрепленной к зонду. Для проведения гибридизации мембрана помещается в стеклянную бутыль с меченым зондом и некоторым буфером, после чего бутыль плавно вращается в течение нескольких часов, с тем чтобы зонд имел достаточ- ную возможность гибридизировать свою целевую ДНК. Затем мембрану промывают, чтобы удалить с ее поверхности все зонды, которые не гибридизировались, и, наконец, детектируют сигнал от метки (см. техническое примечание 2.1). В представленном на рис. 2.1, б примере зонд помечен радиоактивной меткой, а сигнал детектируется авто- радиографией. Полоса, которая заметна на авторадиограмме, соответствует фрагменту рестрикции, который гибридизируется с зондом и, значит, содержит искомый ген. 2.1.3. ДНК-лигазы Фрагменты ДНК, которые были получены путем обработки эндонуклеазой рестрик- ции, можно снова соединить вместе или прикрепить к новому фрагменту с помощью
52 Часть 1. Изучение геномов а) Перенос ДНК из геля на мембрану ДНК-маркеры Рестрикты ДНК Агарозный гель Гель Фитиль Подложка Бумажные салфетки Нейлоновая мембрана Нейлоновая мембрана б) Гибридизационный анализ Зонд ДНК Нейлоновая мембрана Полосы гибридизации Л* 3 Радиоавтограмма 2 3 Рис. 2.11. Гибридизация по Саузерну, а) Перемещение ДНК из геля на мембрану, б) Мембрана зондируется меченно радиоактивно молекулой ДНК. На полученной авторадиограмме одна полоса гибридизации заметна на дорожке 2 и две — на дорожке 3 ДНК-лигазы. Данная реакция требует энергии, которая обеспечивается добавлением к реакционной смеси или АТФ, или никотинамидадениндинуклеотида (НАД) в зависи- мости от типа применяемой лигазы. Наиболее широко используемую ДНК-лигазу получают из клеток Е. coli, зараженных бактериофагом Т4. Этот фермент участвует в репликации ДНК фага и кодируется его геномом. В природе его роль заключается в синтезе фосфодиэфирных связей между не- связанными нуклеотидами, принадлежащими какому-либо одному из полинуклеотидов двунитевой молекулы (рис. 2.12, а). Чтобы соединить вместе два фрагмента рестрикции, лигаза должна синтезировать две фосфодиэфирные связи, — по одной в каждой из нитей (рис. 2.12, б). Это ни в коем разе не выходит за пределы возможностей фермента, но реакция может произойти, только если концы, которые должны быть соединены, случайно сойдутся достаточно близко друг с другом — лигаза не способна ухватиться за них и свести их вместе. Если две молекулы ДНК имеют комплементарные липкие концы и эти концы сошлись в результате случайных событий диффузии в лигирующей смеси, то между двумя выступами могут образоваться переходные спаривания. Такие пары оснований не особенно устойчивы, но они могут сохраняться достаточное для фермента лигазы время, чтобы он мог прикрепиться к стыку и синтезировать фосфодиэфирные связи, а тем самым — соединить концы вместе (рис. 2.12, в). Если же молекулы ДНК имеют тупые концы, то они не могут спариться друг с другом даже временно, и процесс лигирования становится намного менее эффективным, даже когда концентрация ДНК высока и пары концов находятся в относительно тесной близости. Большая эффективность лигирования липких концов способствовала развитию методов преобразования тупых концов в липкие концы. В одном таком методе корот- кие двунитевые молекулы, названные линкерами или адаптерами, прикрепляются к тупым концам. Линкеры и адаптеры работают немного различными способами, но и те и другие содержат сайт узнавания для эндонуклеазы рестрикции и, таким образом, производят липкий конец после обработки соответствующим ферментом (рис. 2.13).
Глава 2. Изучение ДНК 53 Другой способ создания липкого конца — при- крепление гомополимерного хвоста, которое состоит в добавлении нуклеотидов одного за другим к З'-концу нити тупого конца (рис. 2.14). Вовлеченный в эти реакции фермент называют концевой дезоксинуклеотидилтрансфера- зой, которую мы встретим в следующем раз- деле. Если реакционная смесь содержит ДНК, фермент и только один из четырех стандартных нуклеотидов, то новый отрезок полученной однонитевой ДНК будет полностью состоять только из нуклеотидов исключительно этого вида. Это может быть, например, поли-G хвост, который позволит молекуле спариться с други- ми молекулами, несущими поли-С хвосты и соз- данными таким же способом, но с добавлением в реакционную смесь не дГТФ, а дЦТФ. 2.1.4. Ферменты модификации концов Одним из ферментов модификации кон- цов является концевая дезоксинуклеотидил- трансфераза (см. рис. 2.14), получаемая из ткани вилочковой железы теленка. По сути, она представляет собой независимую от ма- трицы ДНК-полимеразу, потому что способна синтезировать новый полинуклеотид ДНК без спаривания поступающих нуклеотидов с суще- ствующей нитью ДНК или РНК. Его главная роль в технологии рекомбинантной ДНК за- ключается в прикреплении гомополимерного хвоста, как было описано выше. Также часто используются два других фермента модификации концов. Это щелоч- ная фосфатаза и полинуклеотидкиназа Т4, которые действуют в дополнение друг другу. Щелочная фосфатаза, которую получают из различных источников, включая Е. coli и ки- шечную ткань теленка, удаляет фосфатные группы с 5'-концов молекул ДНК, что препят- ствует лигированию этих молекул друг с дру- гом. Два конца, несущих 5’-фосфаты, могут быть лигированы друг с другом, и обработанный фосфатазой конец может лигироваться с не- обработанным фосфатазой концом, но связь не может образоваться между парой концов, если ни один из них не несет 5'-фосфат. Поэто- а) Роль ДНК-лигазы in vivo Отсутствующая фосфодиэфирная связь i 111111 и 11ТТТПТ;, 1 Отсутствующая связь, синтезированная ДНК-лигазой б) Лигирование in vitro pl||l|ll|||||g rlJUlUHUUg git......wii^ummumg Две связи, синтезированные ДНК-лигазой в) Лигирование липких концов более эффективно ^11111111111 ГГГПГП^ in । и и । П||1Г1гш и Переходное спаривание между липкими концами Две связи, синтезированные ДНК-лигазой Рис. 2.12. Лигирование молекул ДНК с по- мощью ДНК-лигазы. а) В живых клетках ДНК- лигаза синтезирует отсутствующие фосфодиэ- фирные связи в одной из нитей двунитевых молекул ДНК. б) Чтобы связать две молекулы ДНК in vitro, ДНК-лигаза должна образовать две фосфодиэфирные связи, по одной в каждой из нитей, в) Лигирование in vitro более эффек- тивно, когда молекулы имеют совместимые липкие концы, потому что переходное спари- вание между этими концами скрепляет обе молекулы между собой и таким образом уве- личивает возможности ДНК-лигазы скрепить их и синтезировать новые фосфодиэфирные связи. Роль ДНК-лигазы во время репликации ДНК in vivo показана на рис.15.18
54 Часть 1. Изучение геномов му разумно используя щелочную фосфатазу можно направлять действие ДНК-лигазы предопределенным образом, так чтобы были получены только желательные продукты лигирования. Полинуклеотидкиназа Т4, получаемая из клеток Е. coli, зараженных бак- териофагом Т4, исполняет обратную щелочной фосфатазе реакцию, добавляя фосфаты к 5’-концам. Подобно щелочной фосфатазе, этот фермент используется в ходе сложных экспериментов с лигированием, но его главное применение состоит в мечении концов молекул ДНК (см. техническое примечание 2.1). 2.2. Клонирование ДНК Клонирование ДНК — логическое продолжение методов манипулирования моле- кулами ДНК с помощью эндонуклеаз рестрикции и лигаз. Вообразим, что ген животного был получен в виде единого фрагмента рестрикции после переваривания более крупной молекулы ферментом рестрикции ZtamHI, который оставляет липкие концы 5'-GATC-3’ (рис. 2.15). Вообразим также, что плазмида — маленькая кольцевая ДНК, способная реплицироваться внутри бактерии, — была очищена из экстракта Е. coli и обработана ZtamHI, которая разрезает плазмиду в одной определенной позиции. Кольцевая плазмида Тупоконечная Линкеры молекула ДНК Линкеры, прикрепленные к концам молекулы ДНК Опознавательная последовательность Вал?Н1 | BamHI у"!!! 111111ITTT1Q г" Липкий конец, произведенный BamHI Рис. 2.13. Линкеры используются для наращивания липких концов на молекуле с тупыми концами. В этом примере все линкеры содержат последовательность узнавания для эндонуклеазы рестрикции BomHI. ДНК-лигаза прикрепляет линкеры к концам молекулы ступыми концами входе реакции, которая получается относительно эффективной, потому что линкеры присутствуют в высокой концентрации. Затем добавляется фермент рестрикции, чтобы расщепить линкеры и произвести липкие концы. Об- ратите внимание, что в процессе лигирования линкеры лигируют друг друга, так что к каждому концу тупоконечной молекулы прикрепляется ряд линкеров (сцепка). Когда добавляется фермент рестрикции, такие линкерные сцепки разрезаются на сегменты, причем однонитевая половина наиболее удаленного от края линкера остается прикрепленной к молекуле ДНК. Адаптеры подобны линкерам, но имеют по одному тупому концу и по одному липкому концу. Поэтому тупоконечная ДНК снабжается липкими концами путем простого лигирования ее с адаптерами: нет никакой необходимости выполнять про- цедуру рестрикции
Глава 2. Изучение ДНК 55 Рис. 2.14. Прикрепление гомополимерного конца. В этом примере на обоих концах тупоконечной молеку- лы ДНК синтезируется поли-G хвост. Хвосты, состоящие из других нуклеотидов, синтезируются путем введения в реакционную смесь соответствующих дНТФ была таким образом преобразована в линей- ную молекулу, опять же с липкими концами 5’-GATC-3’. Смешаем эти две молекулы ДНК вместе и добавим ДНК-лигазу. Будут получе- ны различные продукты рекомбинантного лигирования, один из которых представляет собой свернутую кольцом плазмиду с геном животного, вставленным в позицию, перво- начально занимаемую участком рестрикции EamHI. Если теперь повторно ввести такую Тупоконечная молекула ДНК ylJJ LULL! 11 Ll’y. Концевая дезоксинуклеоти- X дилтрансфераза + дГТФ Поли-G хвост рекомбинантную плазмиду в Е. coli и если вставленный ген не утратил свою реплика- тивную способность, то плазмида со вставленным в нее геном будет реплицироваться, а ее копии — переходить в дочерние бактерии после деления клетки. Большое число циклов репликации плазмиды и деления клеток даст в конечном итоге колонию реком- бинантных бактерий Е coli, причем каждая бактерия будет содержать многочисленные копии этого гена животного. Данный ряд операций, представленный на рис. 2.15, и со- ставляет процесс, названный клонированием генов или ДНК. Когда клонирование ДНК было впервые изобретено в начале 1970-х гг., оно произвело коренной переворот в молекулярной биологии, сделав возможными эксперименты, которые до этого невозможно было и вообразить. Это связано с тем, что клонирование позволяет по- лучить чистый образец отдельного гена, отде- ленного ото всех остальных генов клетки. Рас- смотрим основную процедуру клонирования, представленную в несколько ином ракурсе (рис. 2.16). В этом примере фрагмент ДНК, который будет клонирован, — один из компонентов смеси многих различных фрагментов, причем каждый из них несет неповторимый ген или часть гена. Такой смесью вполне может быть представлен полный геном. Каждый из этих фрагментов вставляется в отдельную молекулу плазмиды, с тем чтобы произвести семейство рекомбинантных плазмид, одна из которых не- сет интересующий нас ген. Обычно в какую-либо отдельно взятую клетку хозяина переносится только одна рекомбинантная молекула. Таким образом, хотя конечный набор клонов и может содержать много различных рекомбинантных молекул, каждый отдельный клон будет содер- Участки рестрикции BamHI ДНК животного Плазмида Е. coli I BamHI 1 Ген животного^ Лигирование^ >L Ген животного (у встраивается . / в плазмиду Бактерия Е. coli Рекомбинантная плазмида внутри I Реплицирование 1 внутри бактерии — Колония Е. coli Множество копий рекомбинантной плазмиды Рис. 2.15. Схема клонирования генов
56 Часть 1. Изучение геномов жать многочисленные копии только одной рекомбинантной молекулы. Затем ген отде- ляется от всех других генов, содержавшихся в исходной смеси. Очистка рекомбинантной молекулы от бактериальной колонии или от жидкой культуры, выращенной из колонии, даст количество ДНК порядка микрограмм, что достаточно для ее анализа путем секвени- рования ДНК или одним из несметного числа других методов, изобретенных для изучения клонированных генов, со многими из которых мы ознакомимся в дальнейших главах. 2.2.1. Клонирующие векторы и их применения В экспериментах, показанных на рис. 2.15 и 2.16, плазмида выступает клонирующим вектором, предоставляя свою репликатив- ную способность, которая позволяет клони- рованному гену размножаться в клетке хо- зяина. Плазмиды эффективно реплицируются в бактериальных хозяевах, потому что каждая плазмида обладает областью инициации, ко- торая опознается ДНК-полимеразами и други- ми белками, обычно реплицирующими хромосомы бактерии (раздел 15.2.1). Поэтому репликативный аппарат клетки хозяина размножает плазмиду и любые новые гены, которые были в нее вставлены. Геномы бактериофагов также могут использоваться как клонирующие векторы, потому что они тоже обладают областями инициации, которые позволяют им быть размноженными в бактериях — или за счет ферментов хозяина, или за счет ДНК-полимераз и других белков, кодируемых генами самого фага. Следующие два раздела описывают, как плазмидные и фаговые векторы используются для клонирования ДНК в Е. coli. Плазмиды обыкновенно не знакомы эукариотам, хотя Saccharomyces cerevisiae об- ладает одной, что иногда используется в целях клонирования; поэтому большинство векторов для использования в клетках эукариотов основано на вирусных геномах. Напротив, имея хозяина-эукариота, данное требование репликации можно обойти, выполняя эксперимент таким образом, что ДНК, которая будет клонирована, вставля- ется в одну из хромосом хозяина. Эти подходы к клонированию в клетках эукариотов описаны далее в этой главе. Плазмиды^ Фрагменты ДНК Конструирование молекул рекомбинантной ДНК Каждая несет отличный от других фрагмент Трансформация Высев на чашку Петри Каждая колония содержит многочисленные копии только одной молекулы рекомбинантной ДНК Рис. 2.16. Клонирование позволяет получить чистый образец гена Векторы, построенные на плазмидах Е. coli Самый легкий способ понять, как используется клонирующий вектор, это начать с самых простых плазмидных векторов Е coli, которые иллюстрируют все основные принципы клонирования ДНК. Тогда мы сможем обратить наше внимание на особые свойства фаговых векторов и векторов, используемых с хозяевами-эукариотами. Один из самых популярных плазмидных векторов — pUC8, член ряда векторов, которые впервые были представлены в начале 1980-х гг. Ряд pUC получают из более
Глава 2. Изучение ДНК 57 давнего клонирующего вектора pBR322, который в свое время был построен путем лигирования друг с другом фрагментов рестрикции из трех встречающихся в природе плазмид Е. coli: Rl, R6,5 и pMBl. pUC8 — маленькая плазмида, включающая только 2,7 тысяч пар нуклеотидов (тыс.п.н.). Наряду со своей областью инициации, она несет следующие два гена (рис. 2.17): • Ген устойчивости к ампициллину. Присутствие этого гена означает, что бакте- рия, содержащая плазмиду pUC8, способна синтезировать фермент, названный Р-лактамазой, который позволяет клетке противостоять ингибирующему рост воздействию антибиотика. Это означает, что клетки, содержащие плазмиды pUC8, можно отличить от тех, которые их не содержат, высевая бактерии на агаровую среду, содержащую ампициллин. Нормальные клетки Е coli чувствительны к ампи- циллину и не могут расти в присутствии антибиотика. Таким образом, устойчивость к ампициллину представляет собой селективный маркёр для pUC8. • Ген lacZ’, который кодирует часть фермента р-галактозидазы. р-Галактозидаза — один из ряда ферментов, вовлеченных в поломку связей между лактозой, глюкозой и галактозой. Он обычно кодируется геном lacZ, который находится на хромосоме Е coli. Некоторые штаммы Е coli имеют видоизмененный ген lacZ, такой, в котором отсутствует сегмент, упоминаемый как lacZ' и кодирующий а-пептидную часть Р-галактозидазы. Эти мутанты могут синтезировать фермент, только если они содержат плазмиду типа pUC8, которая несет отсутствующий сегмент lacZ' этого гена. Чтобы провести эксперимент клонирования с pUC8, в пробирке с очищенной ДНК выполняют манипуляции, показанные на рис. 2.15, приводящие к построению рекомби- нантной плазмиды. Чистая ДНК плазмиды pUC8 может быть весьма легко получена из вытяжек бактериальных клеток (техническое примечание 2.3), и после манипуляций плазмиды могут быть повторно введены в Е coli посредством трансформации — процесса, в ходе которого «голая» ДНК принимается бактериальной клеткой. Именно Рис. 2.17. pUC8. Карта показывает по- зиции гена устойчивости к ампицилли- ну, гена lacZ', область репликации (or/) и группы участков рестрикции в пределах гена lacZ1 Группа уникальных участков рестрикции
58 Часть 1. Изучение геномов Техническое примечание 2.3: очистка ДНК Методы для подготовки чистых образцов ДНК из живых клеток играют центральную роль в исследованиях молекулярной биологии Первый шаг в очистке ДНК состоит в разрушении клеток, из которых должна быть получена ДНК. С материалами некоторых типов этот шаг выполняется до- вольно легко: например, выращенные в культуре животные клетки разрушаются путем простого добавления детергента типа додецил сульфата натрия (ДСН), кото- рый разрушает клеточные мембраны, выпуская содержимое клеток наружу. Клетки других типов имеют прочные стенки и, таким образом, требуют более радикальной обработки. Растительные клетки обычно замораживают и затем размалывают пе- стиком в ступе, что является единственным эффективным способом разрушения их целлюлозных стенок. Бактерии типа Escherichia coli могут быть лизированы сочета- нием ферментативной и химической обработки. В качестве фермента применяют лизоцим, получаемый из яичного белка, который разрушает полимерные вещества в стенке бактериальной клетки, а употребляемый химикалий представлен этилен- диаминтетраацетатом (ЭДТА), который образует комплекс с ионами магния и еще более нарушает целостность клеточной стенки. Таким образом, разрушение клеточ- ной мембраны путем добавления детергента вызывает разрывание клеток. После разрушения клеток для очистки ДНК из полученного экстракта могут применить два различных подхода. Первый состоит в расщеплении или удалении всех остальных компонентов клетки, кроме ДНК; этот метод работает лучше всего, если клетки не содержат большие количества жиров или углеводов. Сначала экс- тракт центрифугируется на низкой скорости, с тем чтобы удалить мусор, такой как частицы клеточной стенки, которые образуют каплю осадка на дне пробирки (рис. Т2.3). Надосадочный слой переносится в другую пробирку и смешивается с фенолом, который заставляет белок выпадать в осадок на границе раздела между органическим и водным слоями. Водный слой, который содержит растворенные нуклеиновые кислоты, собирают и добавляют фермент рибонуклеазу, разбивающий РНК на смесь нуклеотидов и коротких олигонуклеотидов. Полинуклеотиды ДНК, которые остаются неповрежденными, могут теперь быть переведены в осадок до- бавлением этанола, осаждения путем центрифугирования и повторного перевода во взвесь в соответствующем объеме буфера. Во втором подходе к очистке ДНК, вместо того чтобы расщеплять все осталь- ное, кроме ДНК, сама ДНК избирательно удаляется из экстракта. Один из способов Клеточная ДНК, РНК, вытяжка белок Центрифуга Перенос надосадочного слоя в новую пробирку I Клеточный мусор Водный слой Фенол <ДНК РНК> Этанол 1 Перенос водного слоя । в новую пробирку, I выдержка в присутствии 4 ! Центрифуга _________рибонуклеазы________ «Центрифуга Ib Поверхность раздела у* (коагулированные белки) " j Фенол Осажденная ДНК Рис. Т2.3. Очистка ДНК от клеточного экстракта путем расщепления или удаления всех остальных компонентов
Глава 2. Изучение ДНК 59 достичь этого — ионообменная хрома- тография, которая разделяет молекулы согласно тому как сильно они связаны с электрически заряженными частицами в хроматографической смоле. ДНК и РНК, а также некоторые белки заряжены от- рицательно и поэтому связываются с по- ложительно заряженной смолой. Самый простой способ выполнить ионообменную хроматографию состоит в том, чтобы по- местить смолу в колонку и добавить кле- точный экстракт сверху (рис. Т2.4). По мере того как экстракт проходит через колонку, все отрицательно заряженные молекулы связываются со смолой. Связи, образован- ные за счет ионного взаимодействия, как известно, могут быть разрушены добавле- нием солевого раствора, при этом менее прочно связанные молекулы отделяются от смолы при относительно низких концен- трациях соли. Это означает, что если через Клеточная вытяжка Соль Ионообменная смола Белок и РНК Больше^соли I На выброс ДНК I колонку проходит раствор с постепенно Рис. Т2.4. Очистка ДНК с помощью ионооб- увеличивающейся концентрацией соли, менной хроматографии то молекулы различных типов элюируют в последовательности белок, РНК и ДНК, отражающей их относительные силы свя- зывания. Фактически, столь тщательное разделение обычно не требуется, так что используются только два солевых раствора. Первый содержит NaCl в концентрации 1,0 моль/л при pH 7,0 и достаточен для элюирования белка и РНК, после которого связанной остается только ДНК. После него добавляют второй раствор, содержащий NaCl в концентрации 1,25 моль/л при pH 8,5, который элюирует ДНК, теперь уже свободную от примесей РНК и белка. Оба подхода, описанных выше, позволяют выделять в чистом виде всю ДНК, содержащуюся в клетке. Если задача состоит в том, чтобы получить из бактериаль- ных клеток только плазмидную ДНК (например, рекомбинантные клонирующие векторы), необходимы специальные методы. Один популярный метод основан на том факте, что, хотя как плазмиды, так и бактериальная хромосома состоят из сверхскрученной ДНК, лизис бактериальной клетки неизбежно ведет к частичному разрушению бактериальной хромосомы, что ведет к потере сверхспирализации ДНК. Поэтому клеточный экстракт содержит сверхскрученную ДНК плазмиды и несверх- скрученную хромосомную ДНК, и плазмиды могут быть очищены методом, который различает молекулы ДНК в этих различных конформациях. Один из таких методов предполагает добавление гидроокиси натрия, пока pH клеточного экстракта не до- стигнет величины 12,0-12,5, что заставляет пары оснований в несверхскрученной ДНК разрываться. Полученные отдельные нити запутываются в нерастворимую сеть, которая может быть удалена центрифугированием, после которого сверхскрученные плазмиды остаются в надосадочном слое.
60 Часть 1. Изучение геномов такую систему изучал Эвери со своими коллегами в экспериментах, показавших, что бактериальные гены состоят из ДНК (раздел 1.1.1). У многих бактерий, включая Е. coli, трансформация есть не особенно эффективный процесс, но скорость трансформа- ции может быть значительно увеличена, если перед добавлением ДНК создать взвесь клеток-хозяев в хлориде кальция, а после кратковременно выдержать смесь при 42 °C. Даже после таких процедур лишь очень маленькая доля клеток принимает плазмиду. Именно по этой причине настолько важен маркёр устойчивости к ампициллину — он позволяет отбирать небольшое количество трансформантов из большой популяции нетрансформированных клеток. Карта pUC8, показанная на рис. 2.17, указывает, что ген lacZ1 содержит группу уникальных участков рестрикции. Лигирование новой ДНК с любым из этих участков приводит к инсерционной инактивации гена и, следовательно, к потере активности Р-галактозидазы. Это ключ к различению рекомбинантной плазмиды, — содержащей вставленный кусок ДНК, — и нерекомбинантной плазмиды, которая не несет в себе никакой новой ДНК. Идентификация рекомбинантов важна, потому что манипуляции, иллюстрированные на рис. 2.15 и 2.16, дают множество разнообразных продуктов ли- гирования, а в их числе и плазмиды, которые повторно свернулись кольцом без вставки новой ДНК. Массовый анализ на предмет присутствия или отсутствия р-галактозидазы по сути своей весьма прост. Вместо проверки того, расщеплена ли лактоза на глюкозу и галактозу, присутствие молекул функциональной р-галактозидазы в клетках про- веряется гистохимическим анализом с помощью вещества по имени Х-гель (5-бромо- 4-хлоро-3-индолил-р-В-галактопиранозид), который преобразуется этим ферментом в продукт синего цвета. Если Х-гель (плюс индуктор фермента, например изопропилтио- галактозид IPTG) добавляется к агару наряду с ампициллином, то нерекомбинантные колонии, клетки которых синтезируют р-галактозидазу, будут окрашены в синий цвет, тогда как рекомбинанты с разрушенным геном lacZ', которые не способны производить Р-галактозидазу, будут белы (рис. 2.18). Такую систему называют Lac-отбором. Агар + ампициллин + Х-гель Рис. 2.18. Выбор рекомбинантов с помощью pUC8
Глава 2. Изучение ДНК 61 Клонирующие векторы на основе геномов бактериофагов, специфичных к Е. coli Клонирующие векторы на основе бактериофагов Е. coli были сконструированы на заре революции рекомбинантной ДНК. Главной причиной поиска вектора нового типа была неспособность плазмид типа pUC8 вмещать фрагменты ДНК размером более 10 тыс. п. н., при этом более крупные вставки подвергались перестройкам или интерфе- ренции репликационной системой плазмиды, в результате чего молекулы рекомбинант- ной ДНК выпадали из клеток хозяина. Первые попытки разработать векторы, способные нести в себе более крупные фрагменты ДНК, сосредоточились на бактериофаге X. Чтобы реплицироваться, бактериофаг должен проникнуть в бактериальную клетку и перенастроить ферменты бактерии на экспрессию информации, содержащейся в генах фага, с тем чтобы бактерия начала синтезировать новые фаги. Как только репликация завершена, новые фаги покидают бактерию, обычно вызывая ее гибель, и идут дальше, чтобы заразить новые клетки (рис. 2.19, а). Такие действия фагов ученые называют литическим циклом инфицирования, потому что он завершается лизисом бактерии. Помимо литического цикла, бактериофаг X (в отличие от бактериофагов многих других типов) может проходить также и лизогенный цикл инфицирования, в ходе которого геном бактериофага X встраивается в хромосому бактерии, где он может оставаться в со- стоянии покоя на протяжении многих поколений, реплицируясь наряду с хромосомой хозяина при каждом делении клетки (рис. 2.19, б). Размер генома бактериофага X — 48,5 тыс.п.н., из которых приблизительно 15 тыс.п.н. или около того являются необязательными, или «факультативными», — в том смысле, что в этой области содержатся гены, которые необходимы лишь для встраивания ДНК фага в хромосому Е. coli (рис. 2.20, а). Поэтому такие сегменты могут быть удалены без снижения способности фага заражать бактерии и управлять синтезом новых частиц бактериофага X в ходе литического цикла. На основе бактериофага X был и разработаны векторы двух типов (рис. 2.20, б): • векторы вставки, в которых вся дополнительная ДНК или часть ее была удалена и в некоторой позиции в пределах урезанного генома введен уникальный сайт рестрикции; • векторы замены, в которых факультативная ДНК содержится в пределах нахо- дящегося между парой участков рестрикции вкладочного фрагмента, который заменяется лигируемой в вектор ДНК, предназначенной для клонирования. Геном бактериофага X линеен, но два естественных конца молекулы имеют одно- нитевые выступы длиной 12 нуклеотидов, названные cos-сайтами, которые имеют комплементарные последовательности и, таким образом, могут спариваться друг с дру- гом. Поэтому клонирующий вектор X может быть получен в виде кольцевой молекулы, которой можно манипулировать в пробирке точно так же, как и плазмидой, и повторно вводить в Е. coli путем трансфекции (этот термин употребляют для обозначения за- ражения бактерий голой ДНК фага). В качестве альтернативы может использоваться более эффективная система поглощения, называемая упаковкой in vitro. Эта проце- дура начинается с отбора линейной версии клонирующего вектора, затем первичная рестрикция разрезает молекулу на два сегмента — левое и правое плечо, каждое с cos- участком на одном конце. После этого, чтобы произвести сшивку, в которой различные фрагменты будут связаны друг с другом в порядке левое плечо-новая ДНК-правое плечо, выполняют лигирование с тщательно сбалансированным количеством каждого плеча и ДНК вставки (см. рис. 2.21). Затем эти сцепки добавляются к смеси для упаков-
62 Часть 1. Изучение геномов Голова Бактериофаг X Хвост I Бактериофаг X * прикрепляется к бактерии Е. coli а) Литический цикл инфицирования ДНК бактериофага X управляет синтезом новых фагов б) Лизогенный цикл инфицирования Встраивание ДНК бактериофага X в хромосому бактерии ДНК Белковая оболочка Лизис клетки ДНК бактериофага X, встроенная в хромосому бактерии Новые фаги X выходят наружу ДНК бактериофага X впрыскивается в клетку Возвращение к литическому циклу по прошествии бактерией многих клеточных делений Новые фаги X выходят наружу Рис. 2.19. Литический и лизогенный циклы инфицирования бактериофагом X. а) В литическом цикле вскоре после инфицирования производятся новые фаги, б) Во время лизогенного цикла геном фага встраивается в хромосомную ДНК бактерии, где он может оставаться в состоянии покоя на протяжении многих поколений ки in vitro, которая содержит все белки, необходимые для синтеза частицы Х-фага. Эти белки спонтанно формируют фаговые частицы и помещают внутрь этих частиц любой фрагмент ДНК длины от 37 тыс.п.н. до 52 тыс.п.н., ограниченный с обеих сторон cos- участками. Поэтому упаковочная смесь вырезает из конструкций комбинации типа левое
Глава 2. Изучение ДНК 63 а) Геном бактериофага X содержит «факультативную» ДНК Функции генов Белковая Встраивание в оболочка ДНК хозяина Репликация ДНК Лизис клетки I Геном бактериофага X Удаления в этой области не затрагивают ход литического цикла б) Векторы вставки и замены Р Х-вектор вставки I Новая ДНК, встроенная * в участок рестрикции Р Р Р Р Х-вектор * м замены : Новая ДНК заменяет вкладочный фрагмент Р Р Р = участок рестрикции Рис. 2.20. Клонирующие векторы, основанные на бактериофаге X. а) В геноме бактериофага X гены распределены на функциональные группы. Например, область, отмеченная как «белковая оболочка», включает 21 ген, кодирующий белки, которые или являются компонентами капсида фага, или требуются для сборки капсида, а область «лизис клетки» включает четыре гена, вовлеченных в лизис бактерии в конце литической стадии цикла инфицирования. Области генома, которые могут быть удалены без вреда для способности фага проходить литический цикл, обозначены зеленым цветом, б) Различия между Х-вектором вставки и Х-вектором замены плечо-новая ДНК-правое плечо длиной 37-52 тыс. п. н. и строит Х-фаги на их основе. За- тем фаги смешивают с клетками Е. coli, и в ходе естественного процесса инфицирования вектор с новой ДНК переносится в бактерии. После инфицирования клетки высеваются в чашку с агаром. Цель — получить не отдельные колонии, но произвести ровный слой бактерий по всей поверхности агара. Бактерии, которые были инфицированы упакованным клонирующим вектором, умира- ют в течение приблизительно 20 минут, потому что гены бактериофага X, содержащиеся в плечах вектора, направляют репликацию ДНК и синтез новых фагов при помощи литического цикла, при этом каждый из этих новых фагов содержит свою собственную копию вектора и копию клонированной ДНК. В результате гибели и лизиса бактерии эти фаги выходят в окружающую среду, где они заражают новые клетки и начинают новый круг репликации фага и лизиса. Конечный результат — чистая зона, названная бляшкой, которая заметна на газоне бактерий, растущем в чашке с агаром (рис. 2.22). При использовании некоторых Х-векторов все бляшки состоят из рекомбинантных фа- гов, потому что лигирование двух плеч без вставки новой ДНК дает молекулу, которая является слишком короткой и не может быть упакована. При работе с другими векторами возникает необходимость отличать рекомбинантные бляшки от нерекомбинантных.
64 Часть 1. Изучение геномов cos-Участки к, I „ Линейная версия ;..,1'||||чн||'|Ч. вектора вставки | Рестрикт । iTTTTTT тпттг* Левое плечо Правое плечо I Лигирование с клонируемой ДНК .ЛТППУЩТППТГ' Вставленная ДНК Rcos L Rcos L Может быть упакована т Инфекционный бактериофаг X R cos L R cos L Слишком коротка для упаковки Рис. 2.21. Клонирование с помощью век- тора вставки на бактериофаге X. Линей- ная форма вектора показана в верхней части схемы. Обработка соответствую- щей эндонуклеазой рестрикции произ- водит левое и правое плечи, каждое из которых имеет один тупой конец и один конец с 12-нуклеотидным выступом cos- участка. ДНК, которая будет клонирована, является тупоконечной и, таким образом, вставляется между этими двумя плечами в ходе шага лигирования. Эти плечи так- же лигируются друг с другом через свои cos-участки, формируя сцепку. Некоторые части сцепки включают в себя группу типа левое плечо-новая ДНК-правое плечо и, при условии, что эта комбинация имеет длину 37-52 тыс. п. н., будут заключены в капсид посредством in v/tro-упаковочной смеси. Части сцепки, состоящие из левого плеча, лигированного непосредственно к правому плечу, и не содержащие новую ДНК, являются слишком короткими и не будут упакованы Для этого используются различные методы, в том числе система р-галактозидазы, описанная выше на примере плазмидного вектора pUC8 (см. рис. 2.18), которая при- менима также к тем Х-векторам, что несут в себе фрагмент гена lacZ со вставленной в него клонируемой ДНК. Векторы для размножения более длинных фрагментов ДНК Частица фага X может вмещать в себя ДНК длиной до 52 тыс.п.н., так что если из его генома удалить 15 тыс.п.н., то в ней можно клонировать вплоть до 18 тыс.п.н. новой ДНК. Этот предел выше тако- вого для плазмидных векторов, но все еще очень маленький по сравне- Инфекция, наблюдаемая в виде бляшки - чистой зоны на газоне бактерий Рис. 2.22. Инфекция бактериофагом визуализируется в виде бляшки на газоне бактерий нию с размерами полных геномов. Такое сравнение важно, потому что библиотека клонов — коллекция клонов, вставки которых охватыва- ют полный геном, — часто является отправной точкой для проекта, на- целенного на определение последо- вательности этого генома (глава 4). Если Х-вектор используется с ДНК человека, то необходимо более по- лумиллиона клонов для того, чтобы был 95%-й шанс присутствия в би- блиотеке всех специфических частей генома (таблица 2.4). Конечно, воз-
Глава 2. Изучение ДНК 65 Таблица 2.4. Размеры геномных библиотек человека, приготовленных в клонирующих векторах раз- личных типов Число клонов* Тип вектора Размер вставки, тыс. п. н. Р = 95% Р = 99% X-Вектор замены 18 532 500 820 000 Космидный, фосмидный 40 240 000 370 000 Р1 125 77 000 118 000 ВАС, РАС 300 32 000 50 000 YAC 600 16 000 24 500 МегаУАС 1400 6 850 10 500 *3начения рассчитаны по уравнению: N = ln(l - Р)/In(1 - а/b), где N—необходимое число клонов, Р—вероятность того, что любой данный сегмент генома присутствует в библиотеке, а — средний размер фрагментов ДНК, вставленных в вектор, и b — размер генома. можно подготовить библиотеку, включающую в себя полмиллиона клонов, особенно если используются автоматизированные методы, но столь объемная коллекция далека от идеала. Было бы намного лучше сократить число клонов, используя вектор, способный оперировать с фрагментами ДНК длины более, чем 18 тыс. п. н. Многие разработки тех- нологии клонирования за последние 20 лет были направлены на обнаружение способов достичь именно этой цели. Одна из возможностей состоит в том, чтобы использовать космиду — плазмиду, которая несет в себе cos-участок Х-вектора (рис. 2.23). Сцепки молекул космид, связан- ные своими cos-участками, служат субстратами для системы упаковки in vitro, потому что cos-участок — единственная последова- тельность, необходимая молекуле ДНК, чтобы быть опознанной как «геном бактериофага X» белками, которые упаковывают ДНК в части- цы фага X. Частицы, содержащие космидную ДНК, являются столь же инфекционными, как и реальные фаги X, но как только космида попадает в клетку, она не может направлять синтез новых фаговых частиц и вместо этого реплицируется, как и всякая плазмида. Поэто- му рекомбинантная ДНК получается из коло- ний, а не из бляшек. Как и в случае Х-векторов других типов, верхний предел длины клони- руемой ДНК устанавливается свободным про- странством, имеющимся в пределах частицы фага X. Сама космида может иметь размер 8 тыс.п.н. или даже меньше, так что в части- цу фага X могут быть вставлены до 44 тыс. п. н. новой ДНК, прежде чем будет достигнут ее предел упаковки. Благодаря этому размер Рис. 2.23. Типичная космида. pJB8 имеет в раз- мере 5,4 тыс. п. н. и несет в себе ген устойчиво- сти к ампициллину (ampR), сегмент ДНК фага X, содержащий cos-участок, и область репликации Escherichia coli (ori)
66 Часть 1. Изучение геномов Позиции истоков репликации Рис. 2.24. Ключевые структурные компоненты хромосомы эукариота. За более подробной информацией относительно этих структур обращайтесь к разделам 7.1.2 (центромеры и теломеры) и 15.2.1 (область репликации) геномной библиотеки человека уменьшается приблизительно до одной четверти миллиона клонов, что является усовершенствовани- ем по сравнению с библиотекой на Х-векторах, но это число клонов, с которыми приходится работать, по-прежнему огромно. Первое главное крупное до- стижение в попытках клонировать фрагменты ДНК намного длиннее, чем 50 тыс. п. н., пришло с изобрете- нием дрожжевых искусственных хромосом, или YAC. Эти векторы размножаются в S. cerevisiae, а не в Е. coli и основаны на хромосомах, а не на плазмидах или вирусах. Первые YAC были сконструированы после того, как исследования естественных хромосом показали, что, наряду с содержащимися в ней генами, каждая хромосома несет в себе три важных компонента (рис. 2.24): • центромеру, которая играет ключевую роль во время деления ядра; • теломеры — специальные последовательности, которые отмечают концы молекул хромосомной ДНК; • одну или несколько областей инициации, в которых начинается синтез новой ДНК при делении хромосомы. В YAC последовательности ДНК, которые лежат в основе этих компонентов хромо- сомы, сцеплены с одним и более селективными маркёрами и по крайней мере с одним участком рестрикции, в который может быть вставлена новая ДНК (рис. 2.25). Все эти компоненты могут содержаться в молекуле ДНК размером 10-15 тыс. п. н. Естественные хромосомы дрожжей варьируют в размере от 230 тыс. п. н. до более чем 1700 тыс. п. н., так что YAC имеют потенциал для клонирования фрагментов ДНК размером порядка млн п. н. Когда этот потенциал был осознан, создали стандартные YAC, способные клонировать фрагменты размером 600 тыс. п. н., и специальные типы, способные обращаться с ДНК длины до 1400 тыс.п.н. Это наибольшая емкость клонирующего вектора какого-либо типа, и в нескольких первых проектах расшифровки генома YAC широко применялись. К сожалению, оказалось, что YAC некоторых типов вызывают проблемы со стабиль- ностью вставки, заключающиеся в том, что последовательность клонированной ДНК перестраивается в новые комбинации. По этой причине молекулярные биологи имеют большой интерес к векторам других типов — таким, которые не могут клонировать столь большие части ДНК, но зато меньше страдают от проблем неустойчивости. К таким векторам относятся нижеследующие. • Бактериальные искусственные хромосомы, или ВАС, основанные на встречаю- щейся в естественной среде обитания F-плазмиде Е. coli. В отличие от плазмид, применявшихся для конструирования первых клонирующих векторов, F-плазмида является относительно большой и основанные на ней векторы имеют более вы- сокую емкость для вмещения в себя вставленной ДНК. ВАС разработаны таким образом, что рекомбинанты могут быть идентифицированы Lac-отбором (см. рис. 2.18) и благодаря этому очень удобны в применении. Они способны клони-
Глава 2. Изучение ДНК 67 ОБОЗНАЧЕНИЯ CE/V4 Центромера из дрожжевой хромосомы IV TEL Теломера ori Область начала репликации ТЯР1-] SUP4 Селективные маркёры URA3-* Рис. 2.25. Работа с YAC. а) Клонирующий вектор pYAC3.6) Чтобы клонировать с помощью pYAC3, кольцевой вектор переваривается с помощью ВатН\ и SnaBI. Рестрикция BomHI удаляет вкладочный фрагмент, на- ходящийся между двумя теломерами в кольцевой молекуле. SnaBI делает разрез в пределах гена SUP4 и тем самым обеспечивает участок, в который будет вставлена новая ДНК. В результате лигирования двух плеч вектора с новой ДНК образуется структура, показанная в основании схемы. Эта структура несет функциональные копии селективных маркёров TRP1 и URA3. Штамм хозяина содержит инактивирован- ные копии этих генов, что означает, что ему в качестве питательных веществ необходимы триптофан и урацил. После трансформации клетки высеваются на минимальную среду, не содержащую триптофан и урацил. На этой среде могут выжить и произвести колонии только клетки, которые содержат вектор и, следовательно, способны синтезировать триптофан и урацил. Обратите внимание, что если вектор несет в себе два правых плеча или два левых плеча, то он не даст начало колониям, потому что трансформи- рованные клетки будут по-прежнему нуждаться в одном из питательных веществ. Присутствие вставки ДНК в клонированных векторных молекулах проверяют путем теста на инактивацию гена SUP4. Его вы- полняют пробой с окрашиванием: на соответствующей среде колонии, содержащие рекомбинантные векторы (то есть со вставкой), окрашиваются в белый цвет; нерекомбинанты (содержащие векторы, но не содержащие вставки) — в красный ровать фрагменты длиной 300 тыс.п.н. и более, а вставки очень устойчивы. ВАС интенсивно использовались в проекте «Геном человека» (раздел 4.3), и в настоящее время они остаются самыми популярными векторами для клонирования больших частей ДНК. • Векторы на бактериофаге Р1 очень похожи на Х-векторы, будучи основаны на урезанной версии генома природного фага, при этом вместимость клонирующего вектора определяется размером делеции и объемом свободного пространства внутри фаговой частицы. Геном фага Р1 больше генома бактериофага X, и фаговая частица крупнее, так что Pl-вектор может клонировать более длинные фрагменты ДНК, чем Х-вектор, — вплоть до 125 тыс.п.н. при существующей технологии.
68 Часть 1. Изучение геномов • Полученные на основе бактериофага Р1 искусственные хромосомы, или РАС, объединяют особенности Pl-векторов и ВАС и имеют вместимость до 300 тыс.п.н. • Фосмиды содержат области инициации F-плазмиды и cos-участок бактериофага X. Они подобны космидам, но имеют более низкое копийное число в Е. coli, что пред- полагает их меньшую подверженность проблемам неустойчивости. Размеры геномных библиотек человека, приготовленных в векторах этих типов, приведены в таблице 2.4. Клонирование в других организмах Клонирование — не просто средство получения ДНК для секвенирования и других типов анализа. Оно служит также инструментом для изучения механизма экспрессии генов и способа регуляции их экспрессии, для выполнения экспериментов генной ин- женерии, нацеленных на изменение биологических характеристик организма хозяина, и для синтезирования важных животных белков (типа фармацевтических препаратов) в новой клетке-хозяине, из которойэти белки могут быть выделены в больших количе- ствах, чем это возможно при обычной очистке тканей животного. Для осуществления всех этих многообразных целей часто бывает необходимо, чтобы гены клонировались в других организмах, а не в Е. coli. Клонирующие векторы на основе плазмид или фагов были разработаны для ра- боты с большинством хорошо изученных видов бактерий типа Bacillus, Streptomyces и Pseudomonas, притом эти векторы используются в точности таким же образом, что и их аналоги на основе Е. coli. Также имеются плазмидные векторы для дрожжей и грибов. Некоторые из них несут область инициации из 2-мкм-кольца — плазмиды, присутствующей во многих штаммах S. cerevisiae, но другие плазмидные векторы имеют только область инициации из Е. coli. Пример: У1р5-вектор для S. cerevisiae, являющийся всего-навсего плазмидой Е. coli, которая содержит копию гена дрожжей по имени URA3 (рис. 2.26, а). Присутствие области инициации Е. coli означает, что YIр5 — челночный век- тор, который может использоваться или с Е. coli, или с 5. cerevisiae в качестве организма- хозяина. Это очень полезная особенность, потому что клонирование в S. cerevisiae есть относительно неэффективный процесс и производство большого количества клонов трудноосуществимо. Если эксперимент требует, чтобы в смеси клонов был идентифи- цирован желаемый рекомбинант (как иллюстрировано на рис. 2.16), то может оказаться невозможным получить достаточно много рекомбинантов, с тем чтобы было в чем искать необходимый. Дабы избегнуть этой проблемы, конструирование молекул ре- комбинантной ДНК и выбор правильного рекомбинанта выполняют с Е. coli в качестве хозяина. Как только правильные клоны идентифицированы, рекомбинантные молекулы YIp5 очищают и перемещают в S. cerevisiae, обычно путем смешивания ДНК с протопла- стами — клетками дрожжей, стенки которых были удалены обработкой ферментами. Без области инициации вектор не способен независимо размножаться внутри клеток дрожжей, но он может сохраниться, если встроится в одну из хромосом дрожжей, что может произойти путем гомологичной рекомбинации (раздел 5.2.2) между геном URA3, несомым вектором, и хромосомной копией этого гена (рис. 2.26, б). Фактически название «Yip» означает: «дрожжевая встраиваемая плазмида». Будучи встроен, вектор Yip, а вместе с ним и любая ДНК, которая была в него вставлена, реплицируются наряду с хромосомами хозяина. Встраивание в хромосомную ДНК является особенностью также многих клони- рующих систем, используемых с животными и растениями, и формирует основу кон-
Глава 2. Изучение ДНК 69 б) Вставка У1р5 в хромосомную ДНК дрожжей а) Ylp5 Хромосомная ш ДНК дрожжей ( Y|P5 ) \иядзJ Мутация^^Гомологичная рекомбинация Мутация * Нет мутаций URA3 Встроенная имз ДНК Ylp5 hi Рис. 2.26. Клонирование с помощью Yip. a) Y1 р5, типичная дрожжевая встраиваемая плазмида. Плазмида содержит ген устойчивости к ампициллину (атря), ген устойчивости к тетрациклину (tet*), ген дрожжей URA3 и область репликации Escherichia coli (ori). Присутствие ori Е. coli означает, что рекомбинантные молекулы YIр5 могут быть построены в Е. coli перед их перемещением в клетки дрожжей. Поэтому Ylp5 представляет собой челночный вектор — он может перемещаться между двумя биологическими видами. 6) Ylp5 не имеет области репликации, которая может функционировать в клетках дрожжей, но может сохраняться, если она встраивается вхромосомную ДНК дрожжей путем гомологичной рекомбинации между плазмидой и хромосомными копиями гена URA3. Хромосомный ген несет маленькую мутацию, что означает его нефункциональность, и клетки хозяина характеризуются генотипом ura3~. Один из пары генов URA3, который формируется после встраивания ДНК плазмиды, мутированный, а другой — нет. Поэтому рекомбинантные клетки обладают генотипом ura3+ и могут быть отобраны путем высева на минимальную среду, лишенную урацила струирования нокаутных мышей, которые используются для определения функций новообнаруженных в геноме человека генов (раздел 5.2.2). Векторы представяют собой животные эквиваленты У1ров. Когда цель состоит в том, чтобы вылечить генетическую болезнь или рак гемотерапией, применяют клонирование генов животных при помо- щи аденовирусов и ретровирусов. Подобный диапазон векторов был разработан и для того, чтобы клонировать гены в растениях. Плазмиды могут быть введены в зародыши растений бомбардировкой покрытыми ДНК микроснарядами — процесс, названный биолистикой. Встраивание плазмидной ДНК в хромосомы растений, сопровождаемое ростом зародыша, приводит к получению растения, которое содержит клонированную ДНК в большинстве или всех своих клетках. Некоторый успех был достигнут также и с растительными векторами, основанными на геномах вирусов мозаики цветной капу- сты (ВМЦК) и геминивирусов, но самые интересные типы растительных клонирующих векторов — полученные из Ti-плазмиды: большой бактериальной плазмиды, обнару- женной в почвенном микроорганизме Agrobacterium tumefaciens. Часть Ti-плазмиды — область, названная Т-ДНК, — встраивается в хромосому растения, когда эта бактерия заражает стебель растения и вызывает появление корончатых галлов. Т-ДНК несет ряд генов, которые экспрессируются в клетках растения и вызывают различные физиоло- гические изменения, характерные для данной болезни. Так, были разработаны векторы типа pBIN19 (рис. 2.27), использующие эту естественную систему генной инженерии. Рекомбинантный вектор вводится в клетки A tumefaciens, которым позволяют заразить взвесь клеток или культуру каллюса растения, а из них могут быть выращены зрелые трансформированные растения.
70 Часть 1. Изучение геномов Участки рестрикции Левая граница Т-ДНК PBIN19 10 тыс. п. н. Правая граница Т-ДНК Рис. 2.27. Растительный клонирующий вектор pBIN19. pBIN19 несет ген lacZ' (см. рис. 2.18), ген устойчивости к канамицину (kanR), область репли- кации Escherichia coli (ori) и две граничные последо- вательности из области Т-ДНК Ti-плазмиды. Эти две граничные последовательности рекомбинируют с хромосомной ДНК растения, в результате чего расположенный между ними сегмент ДНК встав- ляется в ДНК растения. Ориентация граничных последовательностей в pBIN19 означает, что гены lacZ и kanR, равно как и любая новая ДНК, лиги- рованная в участки рестрикции в пределах lacZ', перемещаются в ДНК растения. Рекомбинантные клетки растения отбирают, высевая на содержа- щий канамицин агар, и затем восстанавливают до целых растений. Обратите внимание, что pBIN19 представляет собой еще один пример челночно- го вектора, при этом рекомбинантные молекулы конструируются в Е. coli с помощью системы от- бора lacZ\ после чего переносятся в Agrobacterium tumefaciens и далее — в растение 2.3. Полимеразная цепная реакция (ПЦР) Клонирование ДНК — мощный метод и его вклад в наши знания о генах и геномах трудно переоценить. Клонирование, однако, имеет и существенный недостаток: оно отнимает много времени и, кое в чем, уйму сил. На выполнение манипуляций, необхо- димых для вставки фрагментов ДНК в клонирующий вектор, последующего введения лигированных молекул в клетки хозяина и отбора рекомбинантов уйдет несколько дней. Если план эксперимента предполагает создание большой библиотеки клонов, а затем и просмотр этой библиотеки с целью идентификации клона, который содержит интересующий нас ген (см. техническое примечание 2.4), то может потребоваться не- сколько недель, а то и месяцев для завершения проекта. ПЦР дополняет клонирование ДНК в том, что она позволяет достичь того же резуль- тата — выделения заданного фрагмента ДНК в чистом виде — за намного более короткое время, возможно, всего лишь за несколько часов. Тем не менее ПЦР дополняет, но отнюдь не заменяет клонирование, потому что она имеет свои собственные ограничения, наи- более важное из которых состоит в необходимости знать последовательность по крайней мере части фрагмента, который должен быть очищен. Несмотря на это ограничение, ПЦР получила ведущую роль во многих областях исследований молекулярной биологии. Сперва мы изучим сам метод, а затем рассмотрим варианты его применения. 2.3.1. Проведение ПЦР ПЦР заключается в многократно повторяющемся копировании выбранной об- ласти молекулы ДНК (см. рис. 2.3). В отличие от клонирования, ПЦР осуществляется в пробирке и не предполагает использования живых клеток: копирование выполня- ется не клеточными ферментами, а очищенной термостабильной ДНК-полимеразой Т. aquaticus (раздел 2.1.1). Причина, по которой необходим термостабильный фермент, станет ясна, когда мы более подробно рассмотрим события, происходящие во время протекания ПЦР.
Глава 2. Изучение ДНК 71 Техническое примечание 2.4: работа с библиотекой клонов Коллекции клонов используются как источник генов и других сегментов ДНК В качестве средства получения отдельных генов, а также и других сегментов ДНК для дальнейшего изучения путем секвенирования и других методов технологии рекомбинантной ДНК начиная с 1970-х гг. создавались библиотеки клонов на основе материала из различных организмов. Такие библиотеки могут быть приготовлены или из геномной ДНК, или из кДНК с помощью плазмидного или бактериофагово- го вектора. Обычно клоны хранят в виде бактериальных колоний или бляшек на агаровых пластинках размером 23x23 см и плотностью 100000-150000 клонов на пластинку. Так, например, полная библиотека человека может уместиться всего лишь на 1-8-ми пластинках в зависимости от типа используемого клонирующего вектора (см. табл. 2.4). Клон, содержащий ген или другую часть ДНК, которую не- обходимо найти, можно идентифицировать тремя методами: Гибридизационный анализ может быть выполнен с меченым олигонуклео- тидом или с другой молекулой ДНК, которая (что точно известно) комплементарна искомой последовательности. Чтобы это сделать, нейлоновая или нитроцеллюлоз- ная мембрана помещается на поверхность агаровой чашки и затем осторожно сни- мается так, чтобы «поднять» колонии или бляшки. Обработка щелочью и протеазой расщепляет клеточный материал, оставляя нетронутой ДНК из каждого клона, которая затем прочно связывается с поверхностью мембраны путем нагревания или ультрафиолетового излучения. После этого к мембране прикладывается меченый зонд (точно так же, как при гибридизации по Саузерну (рис. 2.11)), и позиция, в ко- торой зонд прикрепился, определяется соответствующим методом обнаружения. При таком раскладе позиция сигнала гибридизации на мембране соответствует местоположению интересующего нас клона на агаровой пластинке. ПЦР (раздел 2.3) может использоваться для проверки клонов на содержание интересующей нас последовательности. Это не может быть сделано in situ, так что отдельные клоны должны быть перемещены в лунки лотка микротитра. Поэтому основанный на ПЦР подход к идентификации клонов относительно труден, ибо на одном лотке могут быть размещены лишь несколько сотен клонов. Поэтому проводят серии ПЦР с затравками, специфичными к искомой последовательности, с каждым клоном в свою очередь, по возможности применяя комбинаторный подход с целью уменьшить число реакций ПЦР, которые необходимо провести, чтобы идентифици- ровать ту, которая дает положительный результат (см. рис. 4.14). Иммунологические методы могут использоваться, если искомая последова- тельность представляет собой ген, экспрессируемый в клетке, в которой была при- готовлена библиотека клонов. Если экспрессия гена происходит, то будет произведен белковый продукт, а он может быть детектирован путем просмотра библиотеки с помощью меченого антитела, которое связывается только с этим белком. Как и в гибридизационном анализе, клоны сначала перемещают на мембрану и затем обрабатывают, с тем чтобы разрушить клетки и связать белок с поверхностью мем- браны. Затем на мембрану воздействуют меченым антителом, которое проявляет позицию клона, содержащего интересующий нас ген.
72 Часть 1. Изучение геномов Область для размножения *'|| ГПТП 'ППТТТТ*. Целевая ДНК Денатурация при 94 °C 5'ТТТГГТТТГПТПТГ 3‘ yLLIllLlLL-LLUUl у Охлаждение до 50-60 °C 5'i । П I III IITJJJII i 3‘ __ Затравки yililwtHIIHIi 5‘ | Синтез ДНК при 72 °C f. JllllllllllinL.1 3' I * •>/ «Длинные» продукты Рис. 2.28. Первая стадия ПЦР Чтобы выполнить эксперимент ПЦР, целевая ДНК смешивается с ДНК-пол имеразой Taq, парой оли- гонуклеотидных затравок и фондом нуклеотидов. Количество целевой ДНК может быть очень малень- ким, потому что ПЦР чрезвычайно чувствительна и начнет работать даже с одной-единственной стар- товой молекулой. Затравки необходимы для того, чтобы инициировать реакции синтеза ДНК, которые будут выполняться полимеразой Taq (см. рис. 2.6). Они должны прикрепиться к целевой ДНК с каждой стороны сегмента, который подлежит копированию: поэтому последовательности этих сайтов связывания должны быть известны, с тем чтобы можно было синтезировать затравки с соответствующими по- следовательностями. Реакция начинается с нагрева смеси до 94 °C. При этой температуре водородные связи, которые скрепляют два полинуклеотида двойной спирали, разрываются, так что целевая ДНК становится дена- турированной до однонитевых молекул (рис. 2.28). Затем температуру снижают до 50-60 °C, что приво- дит к некоторому воссоединению отдельных нитей целевой ДНК, но также позволяет затравкам прикре- питься к своим позициям отжига. После этого может быть начат синтез ДНК, так что температуру поднимают до 72 °C — оптимального для полимеразы Taq значения. На этой первой стадии ПЦР на каждой из нитей целевой ДНК синтезируется набор «длинных» продуктов. Эти полинуклеотиды имеют идентичные 5’-концы, но случайные З’-концы, причем последние представляют позиции, в которых синтез ДНК заканчивается случай- ным образом. Когда цикл денатурация-отжиг-синтез повторяется, длинные продукты выступают в качестве матриц для синтеза новой ДНК и дают начало «коротким» про- дуктам, 5’- и З’-концы которых определяются позициями отжига затравок (рис. 2.29). В последующих циклах число коротких продуктов возрастает по экспоненциальному закону (удваиваясь во время каждого цикла), пока один из компонентов реакции не исчерпывается. Это означает, что после 30-ти циклов в реакционной смеси будет более чем 250 миллионов коротких продуктов, полученных из каждой стартовой молекулы. В реальных единицах это соответствует нескольким микрограммам продукта ПЦР из нескольких нанограмм или даже меньшего количества целевой ДНК. Результаты ПЦР могут быть определены различными способами. Обычно про- дукты анализируют посредством электрофореза в агарозном геле, который покажет единственную полосу, если ПЦР работала, как и ожидалось, и размножила единственный сегмент целевой ДНК (рис. 2.30). Последовательность продукта может быть определена и другими методами, описанными в разделе 4.1.1. 2.3.2. Применение ПЦР ПЦР — настолько прямая и незамысловатая процедура, что иногда трудно по- нять, как она смогла стать настолько важной в современном исследовании. Сначала мы рассмотрим ее ограничения. Для того чтобы синтезировать затравки, которые в ходе отжига прикрепятся в надлежащих позициях, должны быть известны последовательно-
Глава 2. Изучение ДНК 73 сти граничных областей ДНК, которая будет размножена. Это означает, что ПЦР не может быть использована для очистки фрагментов генов либо каких-либо иных частей генома, которые никогда не изучались прежде. Вто- рое ограничение — длина отрезка ДНК, ко- торый может быть скопирован. Области до 5 тыс.п.н. могут быть размножены без осо- бой трудности, а размножение более длинных фрагментов—до 40 тыс. п. н. — является воз- можным при использовании модификаций стандартной технологии. Однако фрагменты более 100 тыс. п. н., которые необходимы для проектов секвенирования геномов и которые могут быть получены путем клонирования в ВАС или другом векторе высокой емкости, являются недосягаемыми для ПЦР. Каковы сильные места ПЦР? Первое среди них — простота, с которой продукты, представляющие отдельный сегмент генома, могут быть получены из ряда различных об- разцов ДНК. С одним важным примером этого преимущества мы встретимся в следующей главе, когда будем рассматривать способы ти- пизации маркёров ДНК в проектах генетиче- ского картирования (раздел 3.2.2). Подобным образом ПЦР используется для просмотра об- разцов ДНК человека на предмет мутаций, связанных с генетическими болезнями типа талассемии и кистозного фиброза. Она также формирует основу генетического профилиро- вания, в котором типизируются изменения длины микросателлитов (см. рис. 7.24). Вторая важная особенность ПЦР — ее способность работать с крохотными количе- ствами отправной ДНК. Это означает, что ПЦР 5*- t _ з* adllllllllimiy Продукты первого цикла LHIHLUW Денатурация | Синтез ДНК в 1111ИIII111Г Продукты второго цикла ашщггг | Денатурация TTWWW | Синтез ДНК Тптгггпттг I Продукты третьего цикла «Короткий» продукт - накапливается экспоненциально Рис. 2.29. Синтез «коротких» продуктов в ходе ПЦР. Из продуктов первого цикла, показанных наверху схемы, следующий цикл денатурация- отжиг-синтез дает четыре продукта, два из которых идентичны продуктам первого цикла, а два — полностью состоят из новой ДНК. В ходе третьего цикла последние дают начало «корот- ким» продуктам, которые в последующих циклах накапливаются по экспоненте iiiiiiiiiiiiaii । it 11II1111jggp можно применять для получения последо- вательностей из ничтожных количеств ДНК, которые присутствуют в волосах, пятнах крови и других судебно-медицинских образцах, а также из костей и других останков, сохранившихся в археологических участках. В клинической диагностике ПЦР способна обнаружить присутствие вирусной ДНК задолго до того, как вирус достигнет уровней, необходимых для инициирования ответной реакции. Это особенно важно для ранней идентификации вызываемых вирусами раковых образований, потому что это дает шанс начать программы лечения прежде, чем рак станет устойчивым. Все вышеупомянутое — только несколько из возможных вариантов применения ПЦР. В настоящее время этот метод является главным компонентом инструментария молекулярного биолога, и мы обнаружим еще много примеров его использования, по мере того как будем проходить очередные главы этой книги.
74 Часть 1. Изучение геномов Электрофорез в агарозном геле 1 2 3 Рис. 2.30. Анализ результатов ПЦР при помощи электрофореза в агарозном геле. ПЦР была выполнена в микроцентрифужной пробирке. Образец загружают на дорожку 2 агарозного геля. Дорожка 1 содер- жит маркёры размера ДНК, а дорожка 3 содержит образец ПЦР, выполненной вашим коллегой. После электрофореза гель окрашивается бромистым этидием (см. техническое примечание 2.2). Дорожка 2 содержит единственную полосу ожидаемого размера, что свидетельствует об успешном проведении ПЦР. На дорожке 3 нет ни одной полосы — значит, эта ПЦР не удалась Заключение За последние 35 лет молекулярные биологи создали всесторонний инструмента- рий методов, которые могут использоваться для изучения ДНК. Эти методы образуют основу технологии рекомбинантной ДНК и привели к разработке процедур клониро- вания ДНК и полимеразной цепной реакции (ПЦР). Главной особенностью технологии рекомбинантной ДНК является использование очищенных ферментов, чтобы произ- водить заданные изменения в молекулах ДНК в пробирке. Четыре основных типа фер- ментов, употребляемых для этой цели, представлены: ДНК-полимеразами, нуклеазами, лигазами и ферментами модификации концов. ДНК-полимеразы синтезируют новые полинуклеотиды ДНК и используются в таких процедурах, как секвенирование ДНК, ПЦР и мечение ДНК. Самые важные нуклеазы — эндонуклеазы рестрикции, которые разрезают двунитевые молекулы ДНК в определенных последовательностях нуклеоти- дов и, следовательно, нарезают молекулу на предсказуемый набор фрагментов, размеры которых могут быть определены при помощи электрофореза в агарозном геле. Лигазы соединяют молекулы вместе, а ферменты модификации концов выполняют массу раз- нообразных реакций, в том числе несколько, применяемых для мечения молекул ДНК. Клонирование ДНК является средством получения чистого образца отдельного гена или другого сегмента молекулы ДНК. Многие различные типы клонирующих векторов были разработаны для исполь- зования с Е. coli в качестве организма-хозяина, самые простые из них основаны на маленьких плазмидах, которые несут маркёры типа гена lacZ1. Этот ген позволяет идентифицировать рекомбинантные колонии, потому что они выглядят белыми, а не синими, когда в среде для выращивания присутствует Х-гель. Бактериофаг X также при- менялся как основа создания ряда клонирующих векторов для Е. coli, включая гибриды типа плазмида-фаг, названные космидами, которые используются, чтобы клонировать фрагменты ДНК до 44 тыс. п. н. длины. Векторы других типов, такие как бактериальные искусственные хромосомы, могут быть использованы для клонирования ещё более длинных частей ДНК, вплоть до 300 тыс.п.н. в длину. Подобные векторы высокой ем- кости используются при построении библиотек клонов — коллекций клонов, вставки которых охватывают полный геном и которые используются в качестве материального фонда для проектов секвенирования геномов. В качестве хозяев для осуществления клонирования ДНК вместо Е. coli могут быть использованы также и другие организмы.
Глава 2. Изучение ДНК 75 Векторы нескольких типов были разработаны для Saccharomyces cerevisiae, и созданы специализированные методы клонирования ДНК в животных и растениях. ПЦР пред- ставляет собой дополнение к клонированию ДНК, позволяя быстро очищать заданные сегменты ДНК, но по крайней мере часть последовательности ДНК этого фрагмента должна быть известна. В ходе ПЦР термостабильная ДНК-полимераза делает повторные копии целевой последовательности и копий, произведенных на более ранних циклах реакции. Начиная лишь с единственной целевой молекулы, более 250-ти миллионов копий могут быть получены в течение 30-ти циклов ПЦР. Задания для закрепления материала * Ответы к нечетным вопросам могут быть найдены в приложении Вопросы закрытого типа 2.1 *. Какие из следующих ферментов ис- пользуются для расщепления моле- кулДНК? а. ДНК-полимеразы. Ь. Нуклеазы. с. Лигазы. d. Киназы. 2.2 . Почему направляемой матрицей ДНК-полимеразе для запуска син- теза ДНК необходима затравка? а. Этим полимеразам для присоеди- нения нового нуклеотида нужна 5'-фосфатная группа. Ь. Этим полимеразам для присоеди- нения нового нуклеотида нужна З'-гидроксильная группа. с. Затравка требуется для того, что- бы ДНК-полимераза могла при- крепиться к матрице ДНК. d. Затравка гидролизуется, с тем чтобы обеспечить энергию, не- обходимую для синтеза ДНК. 2.3 *. Действие экзонуклеазы 3'—>5’ при- суще ДНК-полимеразе для того, чтобы: а. Удалять 5'-конец нити полинукле- отида, присоединенного к копи- руемой матричной нити. Ь. Удалять поврежденные нуклео- тиды с матричной нити во время синтеза ДНК. с. Удалять нуклеотиды с концов мо- лекул ДНК, чтобы гарантировать порождение тупых концов. d. Удалять неправильные нуклеоти- ды из недавно синтезированной нити ДНК. 2.4 . Версия полимеразы Клёнова из ДНК-полимеразы I Е. coli пригодна для проведения исследований, по- скольку она не обладает действием экзонуклеазы 5>3 Ее пригодность обусловлена тем, что действие экзо- нуклеазы 5’—>3': а. Сильнее, чем собственно акив- ность полимеразы. Ь. Предотвратит встраивание ради- оактивных или флюоресцентных меток в ДНК. с. Может препятствовать проведе- нию некоторых исследователь- скихпроцеду^укорачивая 5’-кон- цы молекул ДНК. d. Не дает полимеразе обнаружи- вать ошибки при встраивании новых нуклеотидов.
76 Часть 1. Изучение геномов 2.5 *. Температура 75 °C прерывает синтез ДНК, осуществляемый ДНК-поли- меразой IЕ coli. Это связано с тем, что: а. ДНК-полимераза I Е coli денату- рируется при этой температуре. Ь. ДНК денатурируется при этой температуре. с. Затравки денатурируют при этой температуре. d. Температура слишком высока для протекания ферментативных ре- акций. 2.6 . Какая из следующих характеристик в точности описывает обратные транскриптазы? а. Они присутствуют во всех виру- сах и представляют собой РНК- зависимые ДНК-полимеразы. Ь. Они присутствуют во всех РНК- содержащих вирусах и представ- ляют собой ДНК-зависимые РНК- полимеразы. с. Они присутствуют в ретровиру- сах и представляют собой РНК- зависимые ДНК-полимеразы. d. Они присутствуют во всех ви- русах и представляют собой независимые от матрицы ДНК- полимеразы. 2.7 *. Ферменты рестрикции всех трех типов связываются с молекулами ДНК в определенных последова- тельностях; однако ферменты II типа предпочтительны для иссле- довательских целей. С которой из следующих причин это связано? а. Ферменты II типа разрезают ДНК в определенном участке. Ь. Ферменты II типа всегда разреза- ют ДНК таким образом, чтобы по- лучить тупоконечные молекулы. с. Ферменты II типа всегда разре- зают ДНК таким образом, чтобы получить молекулы с липкими концами. d. Ферменты II типа — единствен- ные ферменты рестрикции, спо- собные расщеплять двунитевую ДНК. 2.8 . Какой метод используется для раз- деления фрагментов ДНК различных размеров после перевариваривания их ферментами рестрикции? а. Секвенирование ДНК. Ь. Гель-электрофорез. с. Клонирование генов. d. ПЦР. 2.9 *. Связи какого типа синтезирует ДНК- лигаза? а. Водородные связи между основа- ниями. Ь. Фосфодиэфирные связи между нуклеотидами. с. Связи междуоснованиями и остат- ками сахара дезоксирибозы. d. Пептидные связи между амино- кислотами. 2.10 . Какая из следующих полимераз не нуждается в матрице? а. ДНК-полимераза I. Ь. Секвеназа. с. Обратная транскриптаза. d. Концевая дезоксинуклеотидил- трансфераза. 2.11 *. При помощи которого из следующих методов клетки Е coli принимают в себя ДНК плазмиды в лаборатор- ных экспериментах? а. Конъюгация. Ь. Электрофорез. с. Трансдукция. d. Трансформация. 2.12 . Что такое геномная библиотека? а. Коллекция рекомбинантных мо- лекул со вставками, которые со- держат все гены организма. Ь. Коллекция рекомбинантных молекул со вставками, которые содержат полный геном организ- ма. с. Коллекция рекомбинантных мо- лекул, которые экспрессируют все гены организма.
Глава 2. Изучение ДНК 77 d. Коллекция рекомбинантных мо- лекул, которые были секвениро- ваны. 2.13 *. Вектор какого из следующих типов был бы наиболее подходящим для введения ДНК в клетку человека? а. Плазмида. Ь. Бактериофаг. с. Космида. d. Аденовирус. 2.14 . Что из следующего НЕ используется для введения молекул рекомбинант- ной ДНК в растения? а. Биолистика. Ь. Космиды. с. Ti-плазмида. d. Вирусы. 2.15 *. ПЦР выгодна для клонирования генов по всем нижеперечисленным причинам, кроме: а. ПЦР не требует, чтобы последова- тельность гена была известна. Ь. ПЦР — очень быстрый метод вы- деления того или иного гена. с. ПЦР по сравнению с клонирова- нием генов требует очень малень- ких количеств стартовой ДНК. d. ПЦР в высокой степени пригодна для картирования маркёров ДНК. Вопросы открытого типа 2.1 *. Что означает термин «клонирова- ние генов»? 2.2 . Как исследователь может иденти- фицировать отдельный содержащий интересующий его ген фрагмент, по- лученный при переваривании фер- ментом рестрикции геномной ДНК, которая содержит тысячи различ- ных фрагментов рестрикции? 2.3 *. Назовите полезный и быстрый ме- тод повышения эффективности ли- гирования тупоконечных молекул ДНК. 2.4 . Почему плазмиды являются удобны- ми клонирующими векторами? 2.5 *. Для чего плазмиды содержат гены устойчивости к антибиотикам? 2.6 . Что такое Х-гель, добавляемый к среде в экспериментах с клониро- ванием? 2.7 *. Почему бактериофаг X пригоден в качестве клонирующего вектора? 2.8 . Почему для создания библиотек кло- нов выгодны векторы, которые мо- гут нести большие вставки ДНК? 2.9 *. Какиетрисвойстванормальныххро- мосом должны иметь дрожжевые ис- кусственные хромосомы, чтобы они могли поддерживаться в клетках? 2.10 . Почему начальные продукты ПЦР, — произведенные за несколько первых циклов реакции, — длинные и раз- ных размеров, а все конечные про- дукты ПЦР имеют более короткий и одинаковый размер? 2.11 *. Каким образом затравки определя- ют специфику ПЦР? 2.12 . Какого типа последовательности ДНК не могут быть размножены по- средством ПЦР?
78 Часть 1. Изучение геномов Изыскательские задачи 2.1 *. Вскоре после того, как в начале 1970-х гг. были проведены первые эксперименты по клонированию, ряд ученых отстаивал мнение о том, что должен быть введен временный мораторий на исследования такого рода. Чем обосновывались опасения этих ученых и до какой степени эти опасения были оправданны? 2.2 . Какими свойствами должен об- ладать идеальный клонирующий вектор? До какой степени этим тре- бованиям удовлетворяет любой из существующих ныне клонирующих векторов? 2.3 *. Каким способом, кроме расшифров- ки последовательности молекулы, можно было бы определить пози- ции участков рестрикции в молеку- леДНК? 2.4 . Рассмотрите примеры использова- ния клонирования генов в произ- водстве животных белков в клетках бактерий. 2.5 *. Специфичность затравок — опре- деляющее свойство успешной ПЦР. Если затравки в ходе отжига при- крепятся к целевой ДНК в более чем одной позиции, то, кроме искомого, будут синтезированы дополнитель- ные продукты. Исследуйте факторы, которые определяют специфичность затравки, и оцените влияние темпе- ратуры отжига на исход ПЦР. Тесты по рисункам 2.1 *. Какова роль затравки (показана синим цветом) в реакциях синтеза ДНК, катали- зируемых ДНК-полимеразой? Для синтеза ДНК необходима затравка Затравка 3f-LLl1............ 5' 3,ТТТ....................... 5' ДНК-полимераза Новая ДНК I l. l l.LLJ-l IJLLUJJL Синтез ДНК не происходит imiiiiiii Синтез ДНК Участки рестрикции BamHI __ ДНК животного Плазмида Е. coli ±ВатН\ 1 Ген животного ( ) и4 /'О' Лигирование JL Ген животного встраивается в плазмиду 2.2. Что если разрезаемая BamHI плазмида, исполь- зуемая в этом эксперименте, с высокой частотой обратно лигируется сама с собой и поэтому будет выделено очень мало рекомбинантных плазмид? Каким образом можно улучшить реакцию лигирова- ния, с тем чтобы увеличить выход рекомбинантных плазмид?
Глава 2. Изучение ДНК 79 2.3*. Этот клонирующий вектор обладает бактериальной областью инициа- ции, селективным маркёром (ген устойчивости к антибиотику) и cos- участками бактериофага. К какому типу относится этот клонирующий вектор и какого размера вставлен- ную молекулу он может в себе не- сти? 2.4. Какого типа реакция представлена на этом рисунке? Обозначьте этапы этого процесса и укажите темпера- туры для каждой его процедуры. Область для размножения уШШППТТШТу Целевая ДНК I 5 Ti l l ГI 14 ITI Г1 III'3 уЛ t-tl 1 1Л.1 I 1 1 1 » 1 1 L Willi ЦНИИ «Длинные» продукты Дополнительная литература Учебники и практические справочники по методам, применяемым для иссле- дования ДНК Brown,Т. А. (2006) Gene Cloning and DNA Analysis: An Introduction, 5th Ed. Blackwell Scientific Publishers, Oxford. Brown,T.A. (ed.) (2000) Essential Molecular Biology: A Practical Approach, Vol. 1 and 2, 2nd Ed. Oxford University Press, Oxford. Includes detailed protocols for DNA cloning and PCR. Dale, J. W. (2004) Molecular Genetics of Bacteria, 4th Ed. Wiley, Chichester. Provides a detailed description of plasmids and bacteriophages. Ферменты для манипулирования ДНК Brown, Т.А. (1998) Molecular Biology Labfax. Volume I: Recombinant DNA, 2nd Ed. Academic Press, London. Contains details of all types of enzymes used to manipulate DNA and RNA. REBASE: http://rebase.neb.com/rebase/ A comprehensive list of all the known restriction endonucleases and their recognition sequences. Smith, H.O. and Wilcox, K.W. (1970) A restriction enzyme from Haemophilus influenzae. J. Mol. Biol. 51: 379-391. One of the first full descriptions of a restriction endonuclease.
80 Часть 1. Изучение геномов Клонирование ДНК Frischauf,A.-M., Lehrach, Н., Poustka,A. and Murray, N. (1983) Lambda replacement vectors carrying polylinker sequences./. Mol. Biol. 170: 827-842. Hohn, B. and Murray, K. (1977) Packaging recombinant DNA molecules into bacteriophage particles in vitro. Proc. Natl Acad. Sci. USA 74: 3259-3263. Vieira, J. and Messing, J. (1982) The pUC plasmids, an M13mp7-derived system for insertion mutagenesis and sequencing with synthetic universal primers. Gene 19:259-268. Клонирующие векторы высокой емкости Burke, D. T., Carle, G. F. and Olson, M. V. (1987) Cloning of large segments of exogenous DNA into yeast by means of artificial chromosome vectors. Science 236: 806-812. YACs. loannou, P. A., Amemiya, С. T., Games, J., Kroisel, P. M., Shizuya, H., Chen, C., Batzer, M. A. and de Jong, P. J. (1994) Pl-derived vector for the propagation of large human DNA fragments. Nat Genet 6: 84-89. PACs. Kim, U.-J., Shizuya, H., de Jong, P. J., Birreii, B. and Simon, M. I. (1992) Stable propagation of cosmid and human DNA inserts in an F factor based vector. Nucleic Acids Res. 20:1083-1085. Fosmids. Monaco, A. P. and Larin, Z. (1994) YACs, BACs, PACs and MACs - artificial chromosomes as research tools. Trends Biotechnol. 12: 280-286. A good review of high-capacity cloning vectors. Shizuya, H., Birren,B., Kim,U.J., Mancino,V., Slepak,T., Tachiiri,Y. and Simon, M. (1992) Cloning and stable maintenance of 300-kilobase-pair fragments of human DNA in Escherichia coli using an F-factor-based vector. Proc. Natl Acad. Sci. USA 89: 8794-8797. The first description ofaBAC. Sternberg, N. (1990) Bacteriophage PI cloning system for the isolation, amplification, and recovery of DNA fragments as large as 100 kilobase pairs. Proc. Natl Acad. Sci. USA 87: 103-107. Bacteriophage Pl vectors. Клонирование в организмах животных и растений Bevan, М. (1984) Binary Agrobacterium vectors for plant transformation. Nucleic Acids Res. 12:8711-8721. Colosimo,A., Goncz,K. K., Holmes, A. R., Kunzelmann, K., Novelli,G., Malone, R.W., Bennett, M. J. and Gruenert, D. C. (2000) T ransfer and expression of foreign genes in mammalian cells. Biotechniques 29: 314-321. Hansen,G. and Wright,M.S. (1999) Recent advances in the transformation of plants. Trends Plant Sci. 4: 226-231. Kost, T. A. and Condreay, J. P. (2002) Recombinant bac-uloviruses as mammalian cell gene-delivery vectors. Trends Biotechnol. 20:173-180. ПЦР Mullis, K.B. (1990) The unusual origins of the polymerase chain reaction. Sci. Am. 262 (4): 56-65. Saiki,R.K., Gelfand, D. H„ Stoffel, S., Scharf, S. J., Higuchi,R., Horn,G.T., Mullis, K.B. and Erlich, H. A. (1988) Primer-directed enzymatic amplification of DNA with a thermostable DNA polymerase. Science 239: 487-491.
Глава 3 Картирование геномов По прочтении главы 3 вы сможете: • Объяснять, почему карта представляет собой важное вспомогательное средство при секвенировании геномов. • Проводить различие между понятиями «генетическая карта» и «физическая карта». • Описывать маркёры различных типов, применяемые для построения генетиче- ских карт, и излагать, как маркёры каждого типа получают очки. • Обрисовывать принципы наследования согласно открытиям Менделя и по- казывать, как последующие генетические исследования привели к развитию анализа сцепления между генными локусами. • Объяснять, каким образом анализ сцепления используется для построения генетических карт, описывая подробности того, как такой анализ проводится в организмах различных типов, включая людей и бактерии. • Озвучивать ограничения генетического картирования. • Оценивать сильные и слабые стороны различных методов, применяемых для построения физических карт геномов. • Описывать принципы составления рестрикционных карт. • Описывать, как для построения физических карт используется флюоресцентная гибридизация in situ (FISH), включая ее модификации, применяемые для повы- шения чувствительности этого метода. • Объяснять, что лежит в основе карт меченых участков последовательности (STS), и перечислять различные последовательности ДНК, которые могут быть использованы в качестве STS. • Описывать, каким образом в картировании STS используются радиационные гибриды и библиотеки клонов. Следующие две главы описывают методы и стратегии, применяемые для рас- шифровки последовательностей геномов. Секвенирование ДНК, очевидно, главнейший среди этих методов, но секвенирование имеет одно главное ограничение: даже с самой искушенной технологией за один эксперимент редко удается определить последова- тельность размером более 750 п.н. или около того. Это означает, что последователь- ность длинной молекулы ДНК приходится выстраивать из множества более коротких последовательностей. Это осуществляется путем разбиения молекулы на фрагменты, определения последовательности каждого из них и, наконец, поиска перекрытий и по- строения основной последовательности с помощью компьютера (рис. 3.1). Этот метод
82 Часть 1. Изучение геномов ДНК 500 п. н. Рис. 3.1. Метод дробовика для сборки последовательно- сти. Молекула ДНК разбивается на маленькие фрагменты, каждый из которых секвенируется. Основная последова- тельность собирается путем отыскания перекрытий между последовательностями отдельных фрагментов. На практи- ке, чтобы установить, что две последовательности должны быть связаны вместе, необходимо перекрытие нескольких десятков пар оснований дробовика — стандартный подход к секвенированию небольших гено- мов прокариотов (раздел 4.2.1), но с более крупными геномами он осу- ществляется гораздо труднее, пото- му что необходимый анализ данных несоразмерно усложняется по мере увеличения числа фрагментов (для п фрагментов число возможных пе- рекрытий определяется выражени- ем вида 2п2 - 2п). Вторая проблема с применением метода дробовика состоит в том, что он может вести к ошибкам при анализе повторных областей генома. Когда повторяю- щаяся последовательность раз- деляется на фрагменты, многие из получившихся частей содержат одинаковые или весьма подобные мотивы последовательности. Мож- но запросто ошибочно собрать эти последовательности таким обра- зом, что часть повторной области окажется неучтенной, или даже со- единить друг с другом не имеющие ничего общего в территориальном смысле части одной и той же молекулы или даже разных хромосом (рис. 3.2). В силу трудностей в применении метода дробовика к большой молекуле, которая содержит весомую долю повторяющейся ДНК, этот подход не может быть непосредствен- но использован для секвенирования генома эукариота. Вместо этого сначала должна быть создана карта генома. Карта генома служит руководством для экспериментов секвенирования, показывая позиции генов и других отличительных особенностей. Как только карта генома получена, входящая в проект стадия секвенирования может пойти по одному из двух путей (рис. 3.3). • Согласно методу дробовика для полных геномов (раздел 4.2.3), который в целом основан на том же самом подходе, что и стандартный метод дробовика, использу- ются отличительные особенности на карте генома в качестве ориентиров, чтобы помочь сборке основной последовательности из огромных чисел коротких после- довательностей, которые будут получены в процессе работы. Обращение к карте гарантирует также и то, что области, содержащие повторную ДНК, будут собраны правильно. Метод дробовика для полных геномов — быстрый способ получить схему последовательности генома эукариота. • Следуя методу сборки контигов из клонов (раздел 4.2.2), геном разбивается на поддающиеся манипулированию сегменты, каждый по несколько сотен тыс. п. н. или несколько млн п. н. в длину, которые являются достаточно короткими для точного секвенирования методом дробовика. Как только последовательность того или иного сегмента расшифровывается, его помещают в надлежащее местоположение
Глава 3. Картирование геномов 83 Рис. 3.2. Проблемы метода дробовика, а) Молекула ДНК содержит тандемный повторный элемент, состоящий из многих копий последовательности GATTA. В ходе просмотра последовательности ДНК между двумя такими фрагментами идентифицируется перекрытие, но это копии с концов тандемно- го повторения. Если ошибка не распознана, то внутренняя область тандемного повторения не будет включена в основную последовательность. 6) Во втором примере молекула ДНК содержит две копии повторяющегося элемента. Когда последовательности просматриваются, два фрагмента оказываются перекрытыми, но один фрагмент содержит левую часть одного повтора, а другой фрагмент — правую часть второго повтора. В таком случае неудача в распознавании ошибки приведет к тому, что сегмент ДНК, расположенный между этими двумя повторениями, будет выброшен из основной последователь- ности. Если эти два повторения были бы на разных хромосомах, то последовательности этих хромосом могли бы по ошибке быть связаны вместе на карте. Такой поэтапный подход требует больше времени, чем секвенирование методом дробовика для полных геномов, но дает более точную и свободную от ошибок последовательность. При применении обоих методов карта обеспечивает контур для выполнения стадии секвенирования в ходе проекта. Если карта указывает позиции генов, то она может быть использована также и для того, чтобы на начальной стадии направлять проект сборки контигов из клонов на вызывающие особый интерес области генома, с тем чтобы по- следовательности важных генов были получены как можно быстрее. 3.1. Генетические и физические карты Согласно общепринятой классификации, методы картирования геномов подраз- деляют на две категории. • Генетическое картирование базируется на использовании генетических мето- дов, чтобы строить карты, показывающие позиции генов и других особенностей последовательности генома. В число таких генетических методов входят экспе- рименты по скрещиванию или, в случае людей, экспертиза семейных анамнезов (родословных). Генетическое картирование описано в разделе 3.2. • Физическое картирование использует методы молекулярной биологии, чтобы исследовать молекулы ДНК непосредственно, с тем чтобы строить карты, показы- вающие позиции особенностей последовательности, в том числе генов. Физическое картирование описано в разделе 3.3.
84 Часть 1. Изучение геномов 500 тыс. п. н. Метод сборки контигов ।__________. из клонов Маркёры Метод дробовика ! 1 I для полных геномов F СН * Карта генома \ Секвенирование полного генома методом дробовика {Секвенирование нанесенного на карту сегмента методом дробовика Собранная вседик, последовательность Позиция лоследовательчосги уже известна Собранные воедино последовательности Маркёры, употребляемые / для закрепления собранных / последовательностей на карте Рис. 3.3. Альтернативные подходы к секвенированию генома. Геном, состоящий из линейной молеку- лы ДНК размером 2,5 млн п. н., был нанесен на карту, и установлены позиции восьми маркёров (А-Н). Слева метод сборки контигов из клонов начинает с сегмента ДНК, позиция которого на карте генома была идентифицирована, потому что он содержит маркёры А и В. Этот сегмент секвенируется методом дробовика, и основная последовательность помещается в ее известную позицию на карте. Справа метод дробовика для полных геномов производит беспорядочное секвенирование полного генома. В резуль- тате мы получаем куски с непрерывной последовательностью, возможно сотни тыс.п.н. в длину. Если эта непрерывная последовательность содержит маркёр, то она может быть помещена на карту генома. Обратите внимание, что в любом из методов чем больше будет маркёров на карте генома, тем лучше. Более подробное описание этих стратегий секвенирования приведено в разделе 4.2 3.2. Составление генетических карт Подобно любой другой карте, генетическая карта должна показывать позиции каких-либо отличительных признаков. На географической карте такими маркёрами служат узнаваемые особенности ландшафта, такие как реки, дороги и здания. Какие же маркёры мы можем узреть на генетическом пейзаже? 3.2.1. Первыми известными маркёрами служили гены При создании первых генетических карт в начале XX века объектами служили организмы типа плодовой мушки, а в качестве маркёров на протяжении нескольких десятилетий использовали гены. Чтобы быть полезным для генетического анализа, ген должен существовать по крайней мере в двух формах, или аллелях, и при этом каждый из них определял бы отличительный фенотип — например, длинные или короткие стебли у растений гороха, первоначально изучаемых Грегором Менделем. Вначале единствен- ными генами, которые могли быть изучены, были такие гены, которые определяют зрительно легко различимые фенотипы. Так, например, первые карты плодовой мушки показывали позиции генов, определяющих цвета тела, цвета глаз, формы крыльев и тому
Глава 3. Картирование геномов 85 подобные признаки, при этом все эти фенотипы различимы при простом наблюдении мух в микроскоп малой мощности или при их осмотре невооруженным глазом. Этот подход был прекрасен в эпоху становления генетики, но вскоре ученые мужи поняли, что в их распоряжении имеется только ограниченное число визуальных фенотипов, на- следование которых могло быть изучено, и во многих случаях их анализ был усложнен, потому что на один фенотип может влиять сразу несколько генов. Например, к 1922 г. на карту плодовой мушки было нанесено более 50-ти генов, расположенных на четырех хромосомах, но девять из этих генов определял и цвет глаз. В более поздних исследовани- ях генетикам, изучавшим плодовых мушек, пришлось научиться различать такие цвета мушьих глаз, как красный, светло-красный, пунцовый, гранатовый, телесный, киновар- ный, рубиновый, сепии, алый, розовый, пурпурный, бордовый, багряный и коричневый. Чтобы строить более сложные карты генов, необходимо было найти характеристики, которые различались бы более четко и однозначно, чем визуальные. Решение было найдено в том, чтобы использовать в качестве фенотипических признаков организма его биохимические особенности. Это было особенно важно в от- ношении организмов двух типов — микробов и человека. Микробы, такие как бактерии и дрожжи, имеют очень мало визуальных характеристик, так что картирование генов этих организмов должно полагаться на биохимические фенотипы, например приведен- ные в таблице 3.1. Что касается людей, то они, конечно, дают возможность использо- вать визуальные характеристики, но начиная с 1920-х гг. исследования генетической изменчивости человека базировались главным образом на биохимических фенотипах, которые могут быть отмечены путем определения групп крови. Эти фенотипы вклю- чают не только стандартные группы крови типа ряда АВО, но также и варианты белков сыворотки крови и иммунологических белков типа лейкоцитарных антигенов человека (система HLA). Большое преимущество этих маркёров заключается в том, что многие из значимых генов имеют множественные аллели. Например, ген по имени HLA-DRB1 име- ет по крайней мере 290 аллелей, a HLA-B — более 400. Это обстоятельство существенно для способа, которым выполняется картирование генов человека (раздел 3.2.4). Вместо того чтобы ставить запланированные эксперименты по размножению, которое является обязательной процедурой для экспериментальных организмов типа плодовых мушек или мышей, данные о наследовании генов человека приходится кропотливо собирать, изучая фенотипы, проявляемые членами семейств, браки которых были устроены по личным мотивам, а не из прихоти пытливого генетика. Если все члены некоторого се- мейства несут один и тот же аллель изучаемого гена, то никакая полезная информация не может быть получена. Поэтому для целей картирования генов необходимо подыскать семейства, в которых браки заключались случайным образом и между индивидуумами с различными аллелями. Этот принцип особенно эффективен, если изучаемый ген имеет, скажем, не 2, а 290 аллелей. 3.2.2. ДНК-маркёры для составления генетических карт Гены — очень полезные маркёры, но они ни в коем случае не идеальны. Одна про- блема, особенно с большими геномами, например с геномами позвоночных животных и цветковых растений, состоит в том, что карта, основанная исключительно на генах, не может быть очень подробной. Эта проблема сохранялась бы даже в том случае, если бы на карту могли быть нанесены все гены, потому что в большинстве геномов эукариотов они разбросаны и отстоят далеко друг от друга с обширными пропусками между ними (см. рис. 7.12). Проблема еще более осложняется тем фактом, что только часть от общего
86 Часть 1. Изучение геномов Таблица 3.1. Типичные биохимические маркёры, используемые для генетического анализа Saccharomyces cerevisiae Маркёр Фенотип Метод опознавания клеток, несущих данный маркёр ADE2 Требует аденин Растет только в среде, содержащей аденин CAN1 Устойчив к канаванину Растет в присутствии канаванина CUP1 Устойчив к меди Растет в присутствии меди CYH1 Устойчив к циклогексимиду Растет в присутствии циклогексимида LEU2 Требует лейцин Растет только в среде, содержащей лейцин SUC2 Способен сбраживать саха- розу Растет, если сахароза — единственный углевод в среде URA3 Требует урацил Растет только в среде, содержащей урацил числа генов существует в удобно различимых аллельных формах. Поэтому карты генов не всеобъемлющие. Нам по-прежнему нужны маркёры других типов. Нанесенные на карту особенности, которые не являются генами, называют ДНК- маркёрами. Как и в случае генов-маркёров, всякий маломальски пригодный ДНК-маркёр должен иметь по крайней мере два аллеля. Есть три типа особенностей последователь- ности ДНК, которые удовлетворяют этому требованию: полиморфизмы длины фраг- ментов рестрикции (RFLP), полиморфизмы длины простых последовательностей (SSLP) и полиморфизмы отдельных нуклеотидов (SNP). Полиморфизмы длины рестриктов RFLP были первым типом ДНК-маркёров, который был изучен. Вспомним, что ферменты рестрикции разрезают молекулы ДНК в определенных сайтах узнавания (раз- дел 2.1.2). Такая специфичность последовательности означает, что обработка молекулы ДНК ферментом рестрикции должна всегда производить один и тот же набор фрагментов. С молекулами геномной ДНК так происходит не всегда, потому что некоторые участки рестрикции являются полиморфными и существуют в виде двух аллелей, причем один аллель показывает правильную для участка рестрикции последовательность и поэтому разрезается при обработке ДНК ферментом, а второй аллель несет видоизменение по- следовательности, так что участок рестрикции уже не опознается. В результате видо- изменения последовательности, после обработки ферментом два смежных фрагмента рестрикции остаются связанными вместе, что ведет к полиморфизму длины (рис. 3.4). Это RFLP, и его позиция на карте генома может быть получена по данным анализа наследования его аллелей — точно так же, как это делают при использовании генов в качестве маркёров. По оценкам ученых, в геноме типичного млекопитающего при- сутствует приблизительно 105 RFLP. Чтобы оценить счет RFLP, необходимо определить размер всего лишь одного или двух отдельных фрагментов рестрикции на фоне многих несоответствующих фрагмен-
Глава 3. Картирование геномов 87 тов. Это нетривиальная пробле- ма: фермент типа EcoR\, с сайтом узнавания из шести нуклеоти- дов, должен произвести прибли- зительно один разрез на каждые 46 = 4096 п.н. и, таким образом, дать почти 800000 фрагмен- тов (если используется с ДНК человека). После разделения электрофорезом в агарозном геле эти 800 000 фрагментов Полиморфный участок рестрикции ДНК (аллель 1) А ДНК (аллель 2) Добавление эндонуклеазы рестрикции J F ... j L 4 фрагмента 3 фрагмента Рис. 3.4. Полиморфизм длины рестрикта (RFLP). Молекула ДНК слева имеет полиморфный участок рестрикции (отмеченный звездочкой), который отсутствует в молекуле справа. RFLP об- наруживается после обработки ферментом рестрикции, потому что одна из молекул разрезается на четыре фрагмента, тогда как другая разрезается на три фрагмента производят размытое пятно. ДНК и RFLP нельзя различить на общем фоне. Одним из способов визуализации RFLP является гибридизация по Саузерну с ис- пользованием зонда, который покрывает полиморфный уча- сток рестрикции (рис. 3.5, а), но в наши дни чаще используется ПЦР. Затравки для ПЦР разраба- тывают таким образом, чтобы они отжигались к обеим сторонам полиморфного участка, и RFLP типизируется путем обработки размноженного фрагмента ферментом рестрикции и последующего пробега образца в агарозном геле (рис. 3.5, б). Полиморфизмы длины простых последовательностей SSLP — множества повторных последовательностей, которые показывают изме- нения длины, при этом различные аллели содержат разное число повторных единиц (рис. 3.6, а). В отличие от RFLP, SSLP могут быть многоаллельными, поскольку каждый SSLP может иметь целый ряд различных вариантов длины. Существуют SSLP двух ти- пов: • минисателлиты, также известные как переменное число тандемных повторе- ний (VNTR), в которых повторная единица может иметь длину до 25 п. н.; • микросателлиты, или простые тандемные повторения (STR), чей повторяю- щийся элемент короче — обычно 13 п.н. или меньше1^. ДНК-маркёры, основанные на микросаттелитах, завоевали большую популярность, чем минисателлиты, по двум причинам. Во-первых, минисателлиты не распространены равномерно по всему геному, а, как правило, чаще встречаются в теломерных областях на концах хромосом. В географических понятиях это равносильно попытке использо- вать карту с береговыми маяками, чтобы проложить себе путь в центральной части острова. Микросателлиты более удобно распределены по геному. Во-вторых, самый быстрый способ типизировать полиморфизм длины — прибегнуть к ПЦР, но быстрая и точная типизация посредством ПЦР возможна при длине последовательностей не более 300 п. н. Большинство минисателлитных аллелей длиннее этой величины, потому Обычно границей для длины элемента микросателлитов считают 7 п. н. — все, что длиннее, относят к минисателлитам. — Прим. ред.
88 Часть 1. Изучение геномов а) Гибридизация по Саузерну полиморфный участок Зонд ДНК Гибридизационные полосы Нейлоновая мембрана б) ПЦР Карта участков рестрикции Авторадиография Полиморфный участок 1 Rj ^2 «3 |/ i + Карта участков рестрикции Затравки ПЦР ПЦР сопровождается обработкой рестриктазами Электрофорез в агарозном геле ——————— 1 2 3 Рис. 3.5. Два метода оценки счета RFLP. a) RFLP могут быть оценены гибридизацией по Саузерну. ДНК переваривается соответствующим ферментом рестрикции и разделяется в агарозном геле. Пятно фраг- ментов рестрикции переносится на нейлоновую мембрану и гибридизируется с частью ДНК, которая покрывает полиморфный участок рестрикции. Если этотучасток отсутствует, то детектируется единствен- ный фрагмент рестрикции (дорожка 2); если этотучасток присутствует, то детектируются два фрагмента (дорожка 3). 6) RFLP может быть типизирован также и при помощи ПЦР с применением затравок, которые отжигаются к обеим сторонам полиморфного участка рестрикции. После ПЦР продукты обрабатывают соответствующим ферментом рестрикции и затем анализируют посредством электрофореза в агарозном геле. Если искомый участок отсутствует, то на агарозном геле наблюдается одна полоса (дорожка 2); если участок присутствует, то можно видеть две полосы (дорожка 3) что их повторные единицы относительно велики и тяготеют к скоплению в целые мно- жества, так что для их типизации необходимы продукты ПЦР длины несколько тыс.п.н. Микросателлиты, используемые в роли ДНК-маркёров, обычно состоят из 10-30 копий повторения, которое не больше чем 6 п. н. в длину, и, таким образом, намного более при- годны для анализа посредством ПЦР. В геноме человека имеется 5-105 микросателлитов с повторными единицами длины 6 п.н. и менее. При исследовании посредством ПЦР аллель, присутствующий в STR, выявляется по точной длине продукта ПЦР (рис. 3.6, б). Изменения длины могут визуализироваться при помощи электрофореза в агарозном геле, но стандартный гель-электрофорез является трудоемкой процедурой, которую трудно автоматизировать, и поэтому не подходит для высокопроизводительного анализа, востребованного сообществом современных исследователей геномов. Вместо него STR обычно типизируют капиллярным электро- форезом в полиакриламидном геле (см. техническое примечание 4.1). Большинство систем капиллярного электрофореза использует флюоресцентное детектирование, так что перед началом проведения ПЦР к одной или обеим затравкам прикрепляется флюоресцентная метка (техническое примечание 2.1). После ПЦР продукт загружается в капиллярную систему и движется мимо датчика флюоресценции. Компьютер, соеди- ненный с датчиком, сопоставляет время прохождения продукта ПЦР с соответствую-
Глава 3. Картирование геномов 89 Рис. 3.6. STR и способ их типизации, а) Два аллеля короткого тандемного повторения, называемого также микросателлитом. В ал- леле 1 мотив «GA» повторяется три раза, а в аллеле 2 он повторяется пять раз. б) Ти- пизация STR при помощи ПЦР. STR и часть окружающей его последовательности раз- множается, и размер продукта определяется посредством электрофореза в агарозном геле или капиллярного электрофореза. В агароз- ном геле дорожка А содержит продукт ПЦР, а дорожка В содержит ДНК-маркёры, кото- рые показывают размеры полос, полученных после ПЦР этих двух аллелей. Полоса на до- рожке А имеет тот же размер, что и больший из двух ДНК-маркёров, что свидетельствует о том, что ДНК, которая была тестирована, со- держала аллель 2. Результаты капиллярного электрофореза отображаются в виде элек- трофореграммы, где позиция пика указывает размер продукта ПЦР. Электрофореграмма автоматически калибруется по маркёрам длины, так что может быть рассчитана точная длина продукта ПЦР. Изображение любезно предоставлено Сьюзен Со а) Два варианта некоторого STR б) Типизация STR посредством ПЦР Капиллярный электрофорез Электрофорез в агарозном геле щими данными для набора маркёров длины и таким образом точно идентифицирует продукт по его длине. Полиморфизмы отдельных нуклеотидов Это позиции генома, в которых некоторые индивидуумы имеют один нуклеотид (например, G), а другие имеют отличающийся от него нуклеотид (скажем, С) (рис. 3.7). В каждом геноме имеется огромное число SNP (в геноме человека более четырех мил- лионов), некоторые из них также порождают RFLP, но многие не делают этого, потому что последовательность, в которой они лежат, не опознается никаким ферментом рестрикции. Во всякой позиции генома может присутствовать любой из четырех известных нуклеотидов, так что можно вообразить, будто каждый SNP имеет четыре аллеля. Теоре- тически это возможно, но на практике большинство SNP существует в виде всего лишь двух вариантов. Это связано с тем, что все SNP возникают, когда в геноме происходят точечные мутации (раздел 16.1), преобразовывающие один нуклеотид в другой. Если такая мутация имеет место в репродуктивных клетках индивидуума, то один или более потомков этого индивидуума могут унаследовать эту мутацию и, по смене многих по-
90 Часть 1. Изучение геномов Аллель 1 а |. .AGTCAGAAATC.,| .AGTCACAAATC.,| Аллель 2 Рис. 3.7. Полиморфизм отдельного нуклеотида (SNP) колений, данный SNP может в конечном счете стать закрепленным в этой популяции. Но существует только два аллеля — первоначальная последовательность и ее мутиро- вавшая версия. Для того чтобы появился третий аллель, в той же самой позиции генома в организме другого индивидуума должна произойти новая мутация и этот индивидуум, а так же и его потомки, должны воспроизводиться таким образом, чтобы новый аллель стал закрепленным. Хотя такой сценарий и правдоподобен, он маловероятен: вследствие этого подавляющее большинство SNP биаллельно. Это неудобство более чем перевеши- вается огромным числом SNP, присутствующих в каждом геноме, — по крайней мере один на каждые 10 тыс.п.н. ДНК в большинстве эукариотов. Поэтому1) SNP позволяют строить очень подробные карты геномов. Значение, которое SNP приобрели в исследовании генома, подтолкнуло развитие быстрых методов их типизации. Некоторые из этих методов базируются на анализе ги- бридизацией олигонуклеотидов. Олигонуклеотид — короткая однонитевая молекула ДНК, обычно менее 50 нуклеотидов в длину, которая синтезируется в пробирке. Если условия являются абсолютно правильными, то олигонуклеотид гибридизируется с дру- гой молекулой ДНК только в том случае, если он способен образовать с этой второй мо- лекулой полностью спаренную структуру. Если имеет место хотя бы одно-единственное несоответствие — единственная позиция в пределах олигонуклеотида, которая не образует пару оснований, — то гибридизация не происходит (рис. 3.8, а). Поэтому ги- бридизация олигонуклеотида позволяет различать два аллеля того или иного SNP. На основе гибридизации олигонуклеотидов были изобретены различные стратегии про- смотра, в том числе следующие. • Технология чипов ДНК (техническое примечание 3.1) использует стеклянную или кремниевую пластину-подложку площадью 2,0 см2 или меньше, несущую на себе множество различных олигонуклеотидов в виде высокоплотной матрицы. Предназначенная для тестирования ДНК помечается флюоресцентным маркёром и наносится пипеткой на поверхность чипа. Гибридизация детектируется путем анализа чипа с помощью флюоресцентного микроскопа, при этом позиции, в ко- торых испускается флюоресцентный сигнал, показывают, какие олигонуклеотиды гибридизировались с тестируемой ДНК. Поэтому в одном эксперименте может быть типизировано целое множество SNP. * У Эта цифра сильно занижена. В геноме человека плотность SNP составляет 1 на 1000 или даже 1 на 800 п. н. При этом надо понимать, что человек — молодой вид. У более старых видов плотность SNP выше. У оболочников эта величина достигает 1 на 10 п. н.! — Прим. ред.
Глава 3. Картирование геномов 91 а) Гибридизация олигонуклеотида весьма специфична Полностью спаренный основаниями гибрид стабилен Олигонуклеотид CTGGTCGTCAGTCTTTAGTT । । । । । । । । । । । । । । । । । । । । i===GACCAGCAGTCAGAAATCAA =«=. Целевая ДНК SNP Одно несовпадение - гибрид нестабилен Несовпадение - пара оснований не может образоваться CTGGTCGTCAGTC*TTTAGTT i iS=GACCAGCAGTCACAAATCAA^— « б) Детектирование гибридизации с помощью гашения флюоресцентного красителя SNP Флюоресцентный сигнал Рис. 3.8. Типизация SNP посредством анализа гибридизацией олигонуклеотидов, а) При очень жест- ких условиях гибридизации устойчивый гибрид получается только в том случае, если олигонуклеотид способен сформировать с целевой ДНК спаренную всеми основаниями структуру. Если есть хотя бы одно-единственное несоответствие, то гибрид не образуется. Чтобы достигнуть такого уровня жестко- сти, температура выдержки должна быть чуть ниже температуры плавления Тт олигонуклеотида. При температурах выше Тт даже полностью спаренный основаниями гибрид неустойчив. При температурах ниже Тт более чем на 5 °C, могут быть устойчивы и гибриды с несоответствиями. Тт для олигонуклео- тида, представленного на рисунке, будет около 58 °C. Тт в °C рассчитывается по формуле Тт = (4 х число нуклеотидов G и С) + (2 х число нуклеотидов А и Т). Эта формула дает приближенное значение Тт для олигонуклеотидов длины 15-30 нуклеотидов. 6) Один из способов типизации SNP — гибридизация в растворе. Олигонуклеотидный зонд несет две концевые метки. Одна из них — флюоресцентный краситель, а другая — гасящее его вещество. Два конца олигонуклеотида спариваются основаниями друг с другом, так что флюоресцентный сигнал гасится. Когда зонд гибридизируется со своей целевой ДНК, концы молекулы отделяются друг от друга, позволяя флюоресцентному красителю испускать свой сигнал. Такие две метки называют «молекулярными маяками»
92 Часть 1. Изучение геномов Техническое примечание 3.1: микроматрицы ДНК и чипы ДНК Высокоплотные массивы молекул ДНК для параллельных гибридизационных анализов Микроматрицы ДНК и чипы ДНК дают возможность выполнять большое число экспериментов по гибридизации параллельно. Свое предназначение они осущест- вляют главным образом в массовой типизации полиморфизмов типа SNP (раз- дел 3.2.2) и в сравнении популяций РНК различных клеток (раздел 6.1.2). Хотя терминология не совсем точна, микроматрицы и чипы, строго говоря, представляют собой матрицы двух разных типов. В обеих архитектурах большое число зондов ДНК, каждый с отличной от других последовательностью, закрепля- ется в определенных позициях на твердой поверхности. Зондами могут служить синтетические олигонуклеотиды или иные короткие молекулы ДНК наподобие кДНК или продуктов ПЦР. При создании микроматрицы их могут наносить на пред- метное стекло микроскопа или на отрезок нейлоновой мембраны. Эта технология позволяет достигнуть лишь относительно низкой плотности — как правило, 6400 зондов в виде массива 80x80 единиц на площадке 18x18 мм, что достаточно для исследования популяций РНК, но менее пригодно для высокопроизводительных анализов, необходимых для типизации SNP. Чтобы подготовить действительно высокоплотные массивы, олигонуклеотиды синтезируются in situ на поверхности пластинки из стекла или кремния, в результате чего получается чип ДНК Стандартный метод синтеза олигонуклеотидов состоит в добавлении нуклеотидов один за другим к наращиваемому концу олигонуклео- тида, при этом его последовательность определяется тем порядком, в котором нуклеотидные субстраты добавляются в реакционную смесь. Если бы этот метод применялся для синтеза на чипе, то все олигонуклеотиды имели бы одну и ту же последовательность. Вместо этого используются видоизмененные нуклеотидные Активируемый светом синтез Присоединение только к активированным олигонуклеотидам Рис. Т3.1. Синтез олигонуклеотидов на поверхности чипа ДНК
Глава 3. Картирование геномов 93 субстраты — такие, которые могут быть активированы светом прежде, чем они прикрепятся к концу наращиваемого олигонуклеотида. Нуклеотиды добавляют- ся один за другим к поверхности чипа, при этом используется фотолитография [Аналогичная той, что используется при изготовлении микропроцессоров. — Прим, ред.], чтобы направлять импульсы света на отдельные позиции в массиве и таким образом определять, какой из наращиваемых олигонуклеотидов будет продолжен путем присоединения определенного нуклеотида, добавляемого на каждом этапе процесса (рис. Т3.1). При данной технологии удается достичь плотности до 300 000 олигонуклеотидов на см2, так что при использовании ДНК-чипов для типизации SNP в одном эксперименте могут быть типизированы 150 000 полиморфизмов (при том условии, что в наличии имеются олигонуклеотиды для обоих аллелей каждого SNP). Чипы и микроматрицы просты в применении. Чип или матрица выдержива- ется с меченой целевой ДНК, чтобы произошла гибридизация. Позиции, в которых происходит гибридизация с целевой ДНК, определяются путем сканирования по- верхности и записи точек, в которых детектируется сигнал, испускаемый меткой. Можно использовать радиоактивные метки, при этом сигналы детектируются электронно при помощи фосфорографии, но она обеспечивает лишь низкое разрешение и не подходит для высокоплотных чипов. Более высокое разрешение может быть достигнуто ме- чением флюоресцентными метками и детектированием их при помощи их лазерно- го сканирования или флюо- ресцентной конфокальной микроскопии (рис. Т3.2). Рис. Т3.2. Визуализация гибридизации зонда с флюоресцентной меткой на микроматрице. Метка была детектирована конфокальным лазерным сканированием и интенсивность сигнала преоб- разована в спектр псевдоцветов, где красный показывает самую полную гибридизацию, далее следуют оранжевый, желтый, зеленый, голубой, синий и фиолетовый (последний представляет фоновый уровень гибридизации). Каждое пятно на микроматрице — отличный от других клон кДНК, приготовленный из мРНК клеток крови человека, а зонд — кДНК из мРНК костного мозга человека. Дополнительная информация об использовании чипов и микроматриц ДНК для ис- следования популяций мРНК приводится в разделе 6.1.2. Изображение любезно предоставлено Томом Страчаном и перепечатано с разрешения журнала «Nature»
94 Часть 1. Изучение геномов • Методы гибридизации в растворе выполняют в лунках лотка микротитра, где каждая лунка содержит отличный от других олигонуклеотид, используя систему детектирования, способную различать негибридизированную однонитевую ДНК и двунитевой продукт, который получается в результате спаривания олигонуклео- тида с тестируемой ДНК. Было разработано несколько таких систем. В одной из них используется пара меток, в которую входит флюоресцентный краситель и веще- ство, которое гасит флюоресцентный сигнал, когда сближается с испускающим его красителем. Краситель прикрепляется к одному концу олигонуклеотида, а гасящее вещество — к другому его концу. Обычно не наблюдается никакой флюоресценции, потому что олигонуклеотид сконструирован таким образом, что оба его конца спа- риваются основаниями друг с другом, в результате чего гаситель флюоресценции оказывается рядом с красителем (рис. 3.8, б). Если же между олигонуклеотидом и тестируемой ДНК происходит гибридизация, то данное спаривание оснований нарушается и гаситель отдаляется от красителя, позволяя ему вырабатывать флюоресцентный сигнал. В других методах типизации используется олигонуклеотид, чье несовпадение с SNP происходит в его 5’- или З'-оконечностях. При соответствующих условиях олигонуклео- тид этакого типа гибридизируется с несовпадающей матричной ДНК с коротким, ни с чем не спаренным своими основаниями «хвостом» (рис. 3.9, а). Эту особенность используют двумя различными способами. • Анализ лигированием олигонуклеотидов (OLA) основан на применении двух олигонуклеотидов, которые отжигаются смежно друг к другу, при этом З'-конец одного из этих олигонуклеотидов точно попадает в SNP. Этот олигонуклеотид образует полностью спаренную основаниями структуру, если в матричной ДНК присутствует одна версия SNP, и когда это происходит, данный олигонуклеотид может быть лигирован к своему партнеру (рис. 3.9, б). Если исследуемая ДНК со- держит другой аллель этого же SNP, то З’-нуклеотид исследуемого олигонуклеотида не отожжется к матрице и никакого лигирования не произойдет. Поэтому аллель типизируется путем определения того, синтезирован ли продукт лигирования — а) Гибридизация с олигонуклеотидом с концевым несоответствием Полностью спаренный основаниями гибрид ~ Олигонуклеотид 5' 3' TCGGTCGCTGGTCGTCAGTC *• — AGCCAGCGACCAGCAGTCAGe“=-a* Целевая ДНК Гибриде не спаренным основаниями хвостом Олигонуклеотид 5' г 3' TCGGTCGCTGGTCGTCAGTС iie=AGCCAGCGACCAGCAGTCAC*=»« Целевая ДНК б) Анализ лигированием в) Тест ARMS олигонуклеотидов Нет несовпадений .. 1111111111111пшш..днк SNP ''1'1'''' ’''''' I Лигирование _.ТПТ.............. lt._. ^происходит . Продукт ПЦР синтезируется Несовпадение Несовпадение Нет лигирования Продукт ПЦР отсутствует Рис. 3.9. Методы типизации SNP. а) При соответствующих условиях, олигонуклеотид, не совпадающий с SNP своим 5'- или З'-концом, гибридизируется с несовпавшей матричной ДНК, оставляя короткий не спаренный основаниями «хвост», б) Типизация SNP посредством анализа лигированием олигонуклео- тидов. в) Тест ARMS
Глава 3. Картирование геномов 95 обычно пробегом прореагировавшей смеси в системе капиллярного электрофореза, как было описано выше на примере типизации STR. • Система размножения термостабильных мутаций, или тест ARMS, основан на том же самом принципе, что и OLA, но в этом методе контрольным олигонуклеоти- дом выступает одна из пары затравок ПЦР. Если контрольная затравка отжигается к SNP, то он может быть продолжен с помощью полимеразы Taq и ПЦР может иметь место, но если она не отжигается, из-за того что присутствует альтернативная версия SNP, то никаких продуктов ПЦР не производится (рис. 3.9, в). 3.2.3. Анализ сцепления — основа составления генетических карт Теперь, когда мы собрали набор маркёров для построения генетической карты, мы можем пройти дальше и взглянуть на сами методы картирования. Все эти методы осно- ваны на сцеплении генетических признаков, которое, в свою очередь, было выведено на почве плодотворных открытий в генетике, совершенных в середине девятнадцатого столетия Грегором Менделем. Законы наследственности и открытие сцепления генетических признаков Генетическое картирование основано на законах наследственности в их первозданном виде, как они и были впервые описаны Грегором Менделем в 1865 г. На основании резуль- татов своих опытов по размножению растений гороха, Мендель заключил, что каждое из растений гороха обладает двумя аллелями каждого гена, но проявляет только один фенотип. Прийти к выводу о том, что если растение размножается путем самоопыления (то есть го- мозиготно по тому или иному анализируемому признаку), то оно обладает двумя идентич- ными аллелями и поэтому показывает соответствующий фенотип, несложно (рис. 3.10, а). Однако Мендель показал, что если скрещиваются два самоопыляющихся растения с раз- личными фенотипами, то все потомство (поколение FJ проявляет один и тот же фенотип. Эти растения Fx должны быть гетерозиготными, а это означает, что они обладают двумя различными аллелями, по одному для каждого фенотипа — один аллель, унаследованный от матери, и один — от отца. Мендель постулировал, что в таком гетерозиготном состоянии один аллель преодолевает все проявления другого аллеля: исходя из этого, он описал фено- тип, экспрессированный в растениях Fr как доминирующий над вторым, рецессивным (подавляемым)фенотипом (рис. 3.10, б). Менделевская интерпретация гетерозиготного состояния абсолютно верна для пар аллелей, которые он изучал, но теперь мы знаем, что в некоторых случаях, с которыми он не сталкивался, это простое правило доминирования-рецессивности может оказаться гораздо сложнее. К таким случаям относятся: • неполное доминирование, когда гетерозиготная форма проявляет фенотип, промежуточный между двумя гомозиготными формами. Примером служит цвет окраски цветков на растениях, таких как гвоздика (но не горох): когда красные гвоздики скрещивают с белыми, гетерозиготы Fx оказываются ни красными, ни белыми, но розовыми (рис. 3.11, а); • кодоминирование, при котором гетерозиготная форма показывает оба гомо- зиготных фенотипа. Группы крови человека представляют несколько примеров кодоминирования. Например, две гомозиготные формы ряда MN суть М и N, при этом такие индивидуумы синтезируют соответственно гликопротеины крови только М- или N-типа. Гетерозиготы, однако, синтезируют оба гликопротеина и, следовательно, обозначаются MN (рис. 3.11, б).
96 Часть 1. Изучение геномов а) Самоопыление размножающихся в чистой линии растений гороха Родители Поколение F, Рис. 3.10. Гомозиготность и гетерозиготность. Мендель изучал на своих растениях гороха семь пар контрастных признаков, одной из которых служили фиолетовый и белый цвет окраски цветков, как показано на этой схеме. а) Самоопыляющиеся растения всегда дают цветки с родительским цветом. Эти растения — гомозиготы, и каждое из них обладает парой идентичных аллелей, обозначенных здесь как VV (фиолетовые цветки) и WW (белые цвет- ки). б) Когда два самоопыляющихся растения скрещиваются между собой, в поколении на- блюдается только один из фенотипов. Мендель пришел к выводу, что генотип растений был VW, так что аллель V — доминантный, а аллель W — рецессивный Поколение F2 Фиолетовые цветки Белые цветки W WW б) Перекрестное опыление двух чистых типов Родители Фиолетовые цветки X W Белые цветки WW Поколение F, Фиолетовые цветки VW Наряду с открытием доминирова- ния и рецессивности, Мендель провел дополнительные эксперименты, кото- рые позволили ему установить два за- кона генетики, носящих его имя. Пер- вый закон Менделя гласит, что аллели распределяются независимо. Другими словами, если аллели родителя — А и а, то член поколения Fx имеет равные шансы наследования одного из аллелей: А или а. Второй закон Менделя утверж- дает, что пары аллелей распределяют- ся независимо, так что наследование аллелей гена А не зависит от наследова- ния аллелей гена В. Благодаря этим за- конам исходы генетических скрещива- ний вполне предсказуемы (рис. 3.12). Когда труды Менделя были вновь открыты в 1900 г., его второй закон вол новал ранних генетиков, потому что вскоре было установлено, что гены рас- положены на хромосомах, и было признано, что все организмы имеют намного больше генов, чем хромосом. Хромосомы наследуются как нерушимые единицы, так что был сделан вывод, что аллели некоторых пар генов будут наследоваться совместно, потому что они находятся на одной и той же хромосоме (рис. 3.13). Таким образом, был сфор- мулирован принцип сцепления генетических признаков, и быстро была показана его верность, хотя результаты не совсем соответствовали ожиданиям. Полное сцепление, которое предвиделось между многими парами генов, не осуществилось. Пары генов или наследовались независимо, как ожидалось для генов в разных хромосомах, или они показывали лишь неполное сцепление: иногда они наследовались вместе, а иногда — порознь (рис. 3.14). Разрешение этого противоречия между теорией и наблюдениями было определяющим шагом в развитии методов составления генетических карт.
Глава 3. Картирование геномов 97 а) Неполное доминирование Белые цветки WW Родители Розовые цветки RW Поколение F, б) Кодоминирование -О Л Л® 0©® С© © © ©О ММ * NN I о ®©® 0 о Родители Поколение MN Рис. 3.11. Два типа взаимодействия аллелей, с которыми не сталкивался Мендель: а) неполное доми- нирование и б) кодоминирование Неполное сцепление объясняется поведением хромосом во время мейоза Этот шаг удалось совершить Томасу Ханту Моргану который силою своего во- ображения перемахнул через пропасть между неполным сцеплением и поведением хромосом во время деления ядра клетки. В конце девятнадцатого столетия цитологи выделяли два типа деления ядра: митоз и мейоз. Митоз более всеобычен, будучи процессом, посредством которого диплоидное ядро соматической клетки делится на
98 Часть 1. Изучение геномов Родители Генотипы поколения МОНОГИБРИДНОЕ СКРЕЩИВАНИЕ Высокие Tt х Tt Высокие Фенотипы поколения F} Звысоких:! низкому ДИГИБРИДНОЕ СКРЕЩИВАНИЕ Родители Высокие, гладкие TtRr х TtRr Высокие, гладкие Генотипы поколения TR Tr tR tr TR TTRR TTRr TtRR TtRr Tr TTRr TTrr TTRr Ttrr tR TtRR TtRr ttRR ttRr tr TtRr Ttrr ttRr ttrr Фенотипы поколения F1 Эвысоких, гладких: Звысоким, морщинистым: Знизким, гладким:!низкому, морщинистому Рис. 3.12. Законы Менделя позволяют предсказать исход генетических скрещиваний. Показаны два скрещивания с их предсказуемыми результатами. При моногибридном скрещивании прослеживается наследование аллелей одного гена — в нашем случае это аллель Т (высокие растения гороха) и аллель t (низкие растения гороха). Аллель Т является доминантным, at — рецессивным. Сетка показывает генотипы и фенотипы поколения Fv предсказанные на основании первого закона Менделя, который гласит, что аллели распределяются независимо. Когда Мендель провел такое скрещивание, он получил 787 высоких растений гороха и 277 низких растений и вывел соотношение 2,84:1. При дигибридном скрещивании отслеживается наследование двух генов. Второй ген определяет форму горошин, при этом аллель R (гладкие горошины) — доминантный аллель, а г (морщинистые горошины) — рецессивный. Представленные генотипы и фенотипы предсказаны согласно первому и второму законам Менделя, последний из которых гласит, что пары аллелей распределяются независимо два дочерних ядра, оба из которых тоже диплоидные (рис. 3.15). Чтобы произвести все клетки, необходимые организму человека в течение всей его жизни, понадобится приблизительно 1017 митозов. Перед началом митоза каждая хромосома в ядре репли- цируется, но получающиеся дочерние хромосомы не расходятся друг от друга тут же. Поначалу они остаются прикрепленными своими центромерами. Дочери не отделяются друг от друга до того момента митоза, когда хромосомы распределяются между двумя Рис. 3.13. Гены на одной и той же хромосоме должны показать сцепление. Гены А и В находятся на одной и той же хромосоме и, следовательно, должны быть унаследованы вместе. Поэтому второй закон Менделя не должен распространяться на наследование генов А и В. Ген С находится на другой хромосоме, так что второй закон будет справедлив как для наследования генов А и С, так и для на- следования генов В и С. Мендель не открыл сцепления, потому что все семь генов, которые он изучал, были расположены на разных хромосомах растений гороха
Глава 3. Картирование геномов 99 Гены Цвет цветков Аллели СКРЕЩИВАНИЕ РОДИТЕЛЕЙ Форма пыльцевого зерна Фиолетовый Красный Фиолетовый, продолговатая Красный, круглая Продолговатая Круглая Все фиолетовые, продолговатые Заключение Фиолетовые цветки доминируют над красными Продолговатые пыльцевые зерна доминируют над круглыми X СКРЕЩИВАНИЕ в поколении F, Если гены не сцеплены - Скрещивание в поколении даст соотношение 9 фиолетовые, продолговатые : 3 фиолетовые, круглые : 3 красные, продолговатые : 1 красные, круглые — Если гены сцеплены - Скрещивание в поколении F, даст соотношение 3 фиолетовые, продолговатые : 1 красные, круглые Фиолетовые, ж Фиолетовые, продолговатые продолговатые I Фактические результаты Заключение: Гены показывают неполное сцепление 4831 - фиолетовые, продолговаты' ________________ 390 - фиолетовые, круглые 391 - красные, продолговатые 1338 - красные, круглые Рис. 3.14. Неполное сцепление. Неполное сцепление было открыто в начале двадцатого столетия. Пред- ставленное на рисунке скрещивание было проведено Бэтсоном, Саундерсом и Пюннеттом в 1905 г. с душистым горошком. Скрещивание родителей дает типичный дигибридный результат (см. рис. 3.12), где все растения показывают один и тот же фенотип, что указывает на то, что фиолетовый цвет окраски цветков и продолговатая форма пыльцевых зерен определяются доминантными аллелями. Скрещивание между членами поколения дает неожиданные результаты, поскольку потомство не показывает ни со- отношение 9:3:3:1 (ожидаемое для генов на различных хромосомах), ни соотношение 3:1 (ожидаемое, если гены полностью сцеплены). Для неполного сцепления всегда типично необычное соотношение новыми ядрами. Очевидно, это важно, чтобы каждое из новых ядер получило полный набор хромосом, и большинство интриг, затеваемых клеткой во время митоза, как ока- зывается, направлено на достижение именно этой конечной цели. Митоз иллюстрирует основные события, происходящие во время деления ядра, но здесь нас интересуют именно отличительные особенности мейоза. Мейоз происходит только в репродуктивных клетках, и в результате диплоидная клетка дает начало четы- рем гаплоидным гаметам, каждая из которых может впоследствии слиться с гаметой противоположного пола в ходе полового воспроизводства. Тот факт, что в результате мейоза образуются четыре гаплоидные клетки, тогда как митоз дает начало двум ди- плоидным клеткам, легко объяснить: мейоз обусловливает два деления ядра, одно за другим, тогда как митоз — только одно деление ядра. Это важное отличие, но опреде- ляющее различие между митозом и мейозом является более тонким. Вспомним, что в диплоидной клетке находится по две отдельные копии каждой хромосомы (глава 1).
100 Часть 1. Изучение геномов ИНТЕРФАЗА Рис. 3.15. Митоз. В течение интерфазы (период между делениями ядра) хромосомы находятся в растяну- той форме (раздел 7.1.1). В начале митоза хромосомы уплотняются и к поздней профазе представляют собой оформленные структуры, видимые в световом микроскопе. Каждая хромосома уже подверглась репликации ДНК, но две дочерние хромосомы еще скреплены между собой центромерой. Во время метафазы ядерная мембрана расходится (у большинства эукариотов), и хромосомы выстраиваются в ряд в центре клетки. После этого микротрубочки подтягивают дочерние хромосомы к обоим концам клетки. В телофазе вокруг каждого набора дочерних хромосом заново образуются ядерные мембраны. Итак, родительское ядро дало начало двум идентичным дочерним ядрам. Для простоты показана только одна пара гомологичных хромосом; один член пары красный, другой — синий Мы обращаемся к ним как к парам гомологичных хромосом. В процессе митоза гомо- логичные хромосомы остаются отделенными друг от друга, при этом каждый член пары реплицируется и передается в дочернее ядро независимо от своего гомолога. В мейозе, однако, пары гомологичных хромосом никоим образом не являются независимыми. Во время профазы I все хромосомы выстраиваются в ряд со своими гомологами и образуют биваленты (рис. 3.16). Это происходит после того, как каждая хромосома реплициро- валась, но прежде, чем реплицированные структуры разделятся, так что бивалент фак- тически содержит четыре копии хромосомы, каждой из которых предстоит найти свой путь в одну из четырех гамет, которые будут произведены в конце мейоза. В пределах бивалента нити хромосомы (хроматиды) могут подвергнуться физическому разбиению и обмену сегментами ДНК. Этот процесс называют кроссинговером, или рекомбинаци- ей, он был открыт бельгийским цитологом Янсенсом в 1909 г. Это событие произошло лишь за два года до того, как у Моргана зародилась мысль о неполном сцеплении. Каким образом открытие кроссинговера помогло Моргану объяснить неполное сце- пление? Чтобы понять это, нам надо подумать об эффекте, который кроссинговер может иметь на наследование генов. Рассмотрим два гена, каждый из которых имеет два аллеля. Назовем первый ген А и его аллели А и а, а второй ген — Вс аллелями ВиЬ. Вообразим, что эти два гена расположены на хромосоме номер 2 Drosophila melanogaster — вида плодовой мушки, изучаемой Морганом. Мы будем следовать мейозу диплоидного ядра, в котором одна копия хромосомы 2 несет аллели А и В, а вторая — а и Ь. Эта ситуация иллюстрирована на рис. 3.17. Рассмотрим два альтернативных сценария.
Глава 3. Картирование геномов 101 Рис. 3.16. Мейоз. Показаны события, вовлекающие одну пару гомологичных хромосом; один член пары выделен красным цветом, другой — синим. В начале мейоза хромосомы уплотняются, и каждая гомологичная пара выстраивается в ряд, с тем чтобы сформировать бивалент. В пределах бивалента может произойти кроссинговер, заключающийся в разбиении плеч хромосом и в обмене ДНК. Затем мейоз продолжается парой митотических делений ядер, первое из которых дает два ядра (а в каждом из них — по две копии всех хромосом, все еще скрепленные своими центромерами), а второе — четы- ре ядра (и в каждом из них —уже по одной копии всех хромосом). Поэтому такие конечные продукты мейоза — гаметы — являются гаплоидными • Между генами А и В кроссинговер не возникает. Если происходит именно это, то две из получившихся гамет будут содержать копии хромосомы с аллелями А и В, а другие две будут содержать аллели а и Ь. Другими словами, две гаметы имеют генотип АВ, а две — генотип ab. • Между генами А и В кроссинговер происходит. Это приводит к тому, что гомологич- ные хромосомы обмениваются между собой сегментами ДНК, содержащими ген В. В конечном итоге каждая гамета имеет отличный от других генотип: одна — АВ, другая — аВ, следующая —АЬ и последняя — ab. Теперь мы подумаем о том, что случилось бы, если бы мы наблюдали результаты мейоза в сотне идентичных клеток. Если кроссинговеры никогда не происходят, то по- лучающиеся гаметы будут иметь следующие генотипы: 200 АВ 200 ab Это полное сцепление: гены А и В ведут себя во время мейоза как единоцельная единица. Но если (что более вероятно), в некоторых ядрах происходят кроссинговеры между генами А и В, то пары аллелей не будут наследоваться как единые единицы. Скажем, кроссинговеры происходят в ходе 40-ка из 100 мейозов. Тогда получатся сле- дующие гаметы:
102 Часть 1. Изучение геномов 160 АВ 160 ab 40 АЬ 40 аВ Сцепление неполное: оно лишь частичное. Помимо гамет с двумя родительскими генотипами (АВ, ab), мы видим гаметы с рекомбинантными генотипами (АЬ, аВ). От неполного сцепления до составления генетических карт Как только Морган понял, как неполное сцепление можно объяснить кроссинго- вером в ходе мейоза, он смог изобрести способ наносить на карту относительные по- зиции генов на хромосоме. Фактически самая важная работа была проделана не самим Морганом, а студентом из его лаборатории — Артуром Стёртевантом...1) Стёртевант сделал допущение о том, что кроссинговер является случайным событи- ем, так что он может произойти в любой позиции на протяжении пары вытянутых одна вдоль другой хроматид. Если это допущение верно, то два гена, которые расположены близко друг к другу, будут разделяться кроссинговерами реже, чем два гена, которые сильнее отдалены друг от друга. Более того, частота, с которой гены разъединяются кроссинговерами, будет прямо пропорциональна тому, как далеко друг от друга они находятся на своей хромосоме. Поэтому частота рекомбинации является мерой рас- стояния между двумя генами. Если определить частоты рекомбинации для различных ПРОФАЗА I Генотипы Генотипы 2АВ : 2ab 1 АВ: 1аВ : 1 АЬ: 1аЬ пар генов, то можно построить карту их относи- тельных позиций на хромосоме (рис. 3.18). Оказалось, что допущение Стёртеванта о случайном характере кроссинговеров верно не во всех отношениях. Сравнения между гене- тическими картами и фактическими позициями генов на молекулах ДНК, определенными при помощи физического картирования и секвени- рования ДНК, показали, что в некоторых обла- стях хромосом, названных горячими точками рекомбинации, события кроссинговера более вероятны, чем в других. Это означает, что рас- стояние на генетической карте не обязательно указывает физическое расстояние между двумя маркёрами (см. рис. 3.25). Также мы теперь по- Рис. 3.17. Влияние кроссинговера на сцепленные гены. Рисунок показывает пару гомологичных хромосом: одна выделена красным цветом, другая — синим. Буквами А и В обозначены сцепленные гены, характеризуемые аллелями А, а, В и Ь. Слева представлен мейоз без крос- синговера между генами А и В: первые две из получив- шихся гамет имеют генотип АВ, а другие две — ab. Спра- ва показан кроссинговер между генами А и В: четыре получившиеся гаметы демонстрируют все возможные генотипы — АВ, аВ, АЬ и ab ...который так увлекся своими экспериментами, что сам претерпел трансформацию — в лауреата учрежденной его же тезкой премии Альфреда Генри Стёртеванта. — Прим, персе.
Глава 3. Картирование геномов 103 Рис. 3.18. Создание генетической карты на основании частот рекомбинации. Пример взят из оригинальных экспериментов, проводимых Артуром Стёртевантом с плодовыми мушками. Все четыре гена находятся на Х-хромосоме плодовой мушки. Частоты рекомбинации между генами показаны наряду с их выведенными позициями на карте нимаем, что одна хроматида в одно и то же время может участвовать в более чем одном кроссинго- вере, и что есть ограничения на то, сколь близко друг к другу эти кроссинговеры могут происходить; все это ведет к еще большему числу погрешностей в процедуре картирования. Несмотря на эти досад- ные ограничения, анализ сцепления генетических признаков обычно позволяет сделать правильные выводы о порядке взаимного расположения генов и получить оценки расстояний, достаточно точные для построения генетических карт, которые имеют ценность как основа для проектов секвенирования генома1). Поэтому мы чуть углубимся в эту область Гены m Белые глаза Частоты рекомбинации Миниатюрные крылья Ярко-красные глаза Между m и v = 3,0% Между m и у = 33,7% Между v и w = 29,4 % Между w и у = 1,3% Выведенные позиции на карте У w v m 0 1,3 30,7 33,7 и посмотрим, как анализ сцепления генетических признаков выполняется с организ- мами различных типов. 3.2.4. Анализ сцепления генетических признаков у организмов различ- ного типа Чтобы познакомиться с тем, как анализ сцепления генетических признаков вы- полняется на практике, мы должны рассмотреть три совершенно разные ситуации: • анализ сцепления генетических признаков у видов наподобие плодовой мушки и мыши, с которыми мы можем выполнять запланированные эксперименты по скрещиванию; • анализ сцепления генетических признаков у людей, с которыми мы не можем проводить запланированные эксперименты, но вместо этого можем изучать их семейные родословные; • анализ сцепления генетических признаков у бактерий, которые не подвергаются мейозу. Анализ сцепления генетических признаков при возможности проведения за- планированных экспериментов по скрещиванию Анализ сцепления генетических признаков первого типа — современный аналог метода, разработанного Морганом и его коллегами. Данный метод основан на анализе потомства от экспериментальных скрещиваний, поставленных между родителями с известными генотипами, и применим, по крайней мере в теории, ко всем эукариотам. Этические соображения не допускают применения такого подхода к человеку, а про- Единица расстояния между генетическими маркёрами, когда вероятность сегрегации (расщепления) признаков равна 1 %, называется сантиморганидой и примерно (со всеми оговорками) равна 1 млн п. н. — Прим. ред.
104 Часть 1. Изучение геномов блемы практического характера, такие как продолжительность периода беременности и времени, необходимого новорожденному, чтобы достигнуть зрелости (и, следователь- но, участвовать в последующих скрещиваниях), ограничивают эффективность этого метода при работе с некоторыми животными и растениями. Если мы вернемся к рис. 3.17, то увидим, что ключ к картированию гена таится в спо- собности определять генотипы гамет, получаемых в ходе мейоза. В немногих ситуациях это возможно путем непосредственного исследования гамет. Например, гаметы, производимые некоторыми микробными эукариотами, в том числе дрожжами Saccharomyces cerevisiae, могут быть выращены в колонии гаплоидных клеток, генотипы которых можно опреде- лить биохимическими тестами. Прямая генотипизация гамет возможна также и с высшими эукариотами, если использовать ДНК-маркёры, поскольку ПЦР можно проводить с ДНК из отдельных сперматозоидов. Это позволяет типизировать длину фрагментов рестрикции, длину простых повторов и SNP. К сожалению, типизация спермы весьма трудоемка. Поэтому для высших эукариотов обычный анализ сцепления генетических признаков выполняют не прямым исследованием гамет, но определением генотипов диплоидного потомства, которое следует из слияния двух гамет — по одной от каждого члена родительской пары. Другими словами, выполняется генетическое скрещивание. Сложности с генетическим скрещиванием состоят в том, что получающееся ди- плоидное потомство является продуктом не одного мейоза, а двух (по одному в обоих родителях), и в большинстве организмов события кроссинговера происходят с равной вероятностью при производстве мужских и женских гамет. Так или иначе мы должны быть способны выпутать из генотипов диплоидного потомства события кроссоверов, которые произошли в каждом из этих двух мейозов. Это означает, что скрещивание следует планировать и проводить с особым вниманием. Стандартная процедура — использовать анализирующее скрещивание. Оно представлено на рис. 3.19, где мы поставили анализирующее скрещивание с целью нанести на карту два гена, которые мы встречали ранее: ген А (аллели А и а) и ген В (аллели В и Ь), расположенные на хро- мосоме 2 плодовой мушки. Определяющий признак анализирующего скрещивания — генотипы обоих родителей: • Один родитель — двойная гетерозигота. Это означает, что у этого родителя име- ются все четыре аллеля: его генотип — АВ/ab. Это обозначение указывает на то, что одна пара гомологичных хромосом несет аллели А и В, а другая — а и Ь. Двой- ные гетерозиготы могут быть получены путем скрещивания двух скрещиваемых в чистой линии организмов, например АВ/АВ х ab/ab. • Второй родитель — размножаемая в чистой линии двойная гомозигота. В этом родителе обе гомологичные копии хромосомы 2 одинаковые: в примере, показан- ном на рис. 3.19, оба имеют аллели а и Ь, и генотип такого родителя — ab/ab. Двойная гетерозигота имеет тот же самый генотип, что и клетка, мейоз которой мы прослеживали на рис. 3.17. Поэтому наша цель состоит в том, чтобы вывести генотипы гамет, произведенных этим родителем и вычислить долю рекомбинантов. Обратите внимание, что все гаметы, произведенные вторым родителем (двойной гомозиготой) будут иметь генотип ab независимо от того, являются л и они родительскими или реком- бинантными гаметами. Аллели а и b оба рецессивные, так что мейоз в этом родителе не отражается в каких-либо заметных фенотипических признаках потомства. Это означает, что, как показано на рис. 3.19, фенотипы диплоидного потомства могут быть однозначно преобразованы в генотипы гамет от родителя-двойной гетерозиготы. Поэтому анализи- рующее скрещивание позволяет нам проводить прямой осмотр одного мейоза в отдель-
Глава 3. Картирование геномов 105 Рис. 3.19. Анализирующее скрещивание между ал- лелями, показывающими доминирование и рецес- сивность. А и В — маркёры с аллелями А, а, Ви Ь. Получающееся потомство просчитывается наблюде- нием его фенотипов. Поскольку родитель-двойная гомозигота (родитель 2) имеет оба рецессивных аллеля — а и Ь, — он фактически не вносит никакого вклада в фенотипы потомства. Поэтому фенотип каждого индивидуума в поколении тот же, что и генотип гаметы от родителя 1, который дал начало этому индивидууму Аллели А и В доминируют над аллелями а и Ь 1 АВ/аЬ РОДИТЕЛИ X 2 аЬ/аЬ Анализирующее скрещивание АВ АЬ аВ аЬ ab аЬ аЬ аЬ Гаметы ГЕНОТИПЫ ПОКОЛЕНИЯ F, АВаЬ АЬ аЬ аВ аЬ аЬ аЬ ФЕНОТИПЫ АВ АЬ аВ ab Каждый из фенотипов тот же, что и генотип гаметы родителя № 1 ности и, следовател ьно, вычислять для двух изучаемых генов частоту их рекомбинации и расстояние на карте между ними. Если в одном скрещивании отслежи- вается более двух маркёров, то эффектив- ность этого типа анализа сцепления гене- тических признаков еще более возрастает. Он не только быстрее, чем другие методы, воспроизводит частоты рекомбинации, но также позволяет определять относитель- ный порядок маркёров на хромосоме путем простого просмотра данных. Это обуслов- лено тем, что необходимы два события рекомбинации, чтобы отцепить центральный маркёр от двух внешних маркёров в ряде из трех маркёров, тогда как любой из двух внешних маркёров может быть отцеплен от них всего лишь путем одной рекомбинации (рис. 3.20). Двойная рекомбинация менее вероятна, чем одинарная, так что выщепле- ние центрального маркёра будет происходить относительно нечасто. Набор типичных данных от скрещивания с тремя контрольными признаками представлен в таблице 3.2. Анализирующее скрещивание было поставлено между тройной гетерозиготой [АВС/ abc) и тройной гомозиготой [abc/abc). Самое частое потомство — с одним из двух роди- тельских генотипов, являющееся результатом отсутствия событий рекомбинации в об- ласти, содержащей маркёры А, В и С. Два других класса потомства относительно часты (в представленном примере — 51 и 63 потомка). Оба из них, как можно предположить, являются результатом единственной рекомбинации. Анализ их генотипов показывает, что в потомстве из первого класса маркёр А отцепился от маркёров В и С, а у потомков Таблица 3.2. Набор типичных данных анализирующего скрещивания по трем определительным признакам Генотипы потомства Число потомков Выведенные события рекомбинации ABC/abc abc/abc 987 Ни одного (родительские генотипы) aBC/abc Abc/abc 51 Одно, между А и В/С AbC/abc aBc/abc 63 Одно, между В и А/С ABc/abc abC/abc 2 Два: одно между С и А, второе — между С и В
106 Часть 1. Изучение геномов Аллели А и В кодоминантны по отношению к аллелям а и b РОДИТЕЛИ 1 х 2 Анализирующее АВ/ab АЬ/АЬ скрещивание Единичный кроссовер АВ АЬ аВ ab Гаметы ГЕНОТИПЫ ПОКОЛЕНИЯ F. АВАЬ АЬАЬ аВАЬ аЬАЬ ОПРЕДЕЛЕННЫЕ АЛЛЕЛИ А+В+Ь А+Ь А+а+В+Ь А+а+Ь Двойной кроссовер det d Е f Рис. 3.20. Эффекты кроссинговеров в ходе диги- бридного скрещивания. Для того чтобы любой из двух внешних маркёров мог отцепиться от остальных, достаточно лишь одного события ре- комбинации, но для выщепления центрального маркёра от двух внешних маркёров потребуется две рекомбинации Генотипы гамет родителя № 1 устанавливают по определенным аллелям. Если определяется только аллель А, то гамета родителя № 1 имеет генотип А. Если определяются аллели А + а, то гамета родителя № 1 имеет генотип а, и т. п. Рис. 3.21. Анализирующее скрещивание между аллелями, показывающими кодоминирование. Гены А и В являются маркёрами, пары аллелей которых кодоминантны. В этом конкретном при- мере родитель-двойная гомозигота имеет гено- тип АЬ/АЬ. Аллели, присутствующие в каждом индивидууме поколения F1? определяются непо- средственно — например, при помощи ПЦР. Эти комбинации аллелей позволяют вывести генотип гаметы родителя 1, которая дала начало всем ин- дивидуумам второго класса маркёр В отцепился от маркёров А и С. Следовательно, маркёры А и В яв- ляются внешними маркёрами. Этот вывод подтверждается числом потомков, у которых маркёр С отцепился от маркёров А и В. Таких потомков только два, а это говорит о том, что для получения данного генотипа необходима двойная рекомбинация. Поэтому маркёр С должен быть расположен между маркёрами А и В. Осталось рассмотреть лишь один дополнительный момент. Если, как в примерах на рис. 3.19 и в таблице 3.2, в анализирующем скрещивании исследуются гены, ал- лели которых показывают доминантность и рецессивность, то двойная или тройная гомозигота-родитель должен нести аллели для рецессивных фенотипов. Если, с другой стороны, используются кодоминантные маркёры, то двойная гомозигота-родитель может иметь любую комбинацию гомозиготных аллелей (например АВ/АВ, АЬ/АЬ, aB/aB или ab/ab). Рис. 3.21, на котором представлен пример анализирующего скрещи- вания такого типа, раскрывает причину этого. Обратите внимание, что ДНК-маркёры,
Глава 3. Картирование геномов 107 типизированные посредством ПЦР, показывают, что в действительности имеет место кодоминирование: поэтому на рис. 3.21 развертывается типичный сценарий, наблю- даемый в тех случаях, когда анализ сцепления генетических признаков выполняется с ДНК-маркёрами. Составление генетической карты на основе анализа родословной человека Что касается человека, то, конечно, невозможно заранее подобрать желаемые ге- нотипы родителей и поставить скрещивания, специально предназначенные для целей картирования. Вместо этого данные для вычисления частот рекомбинации приходится добывать путем анализа генотипов членов последовательных поколений существующих семей. Это означает, что в распоряжении ученого имеются только ограниченные данные, и их интерпретация часто бывает затруднена, потому что заключаемый между людьми брак редко дает удобное анализирующее скрещивание и часто генотипы одного или нескольких членов семейства неизвестны, потому что данные индивидуумы мертвы или не склонны к сотрудничеству. Эти проблемы проиллюстрированы на рис. 3.22. В данном примере мы изучаем генетическую болезнь, присущую семейству из двух родителей и шестерых детей. Гене- тические болезни часто используются как маркёры генов человека, при этом состояние болезни является одним аллелем, а здоровое состояние — вторым аллелем. Родословная на рис. 3.22, а показывает нам, что больна мать и четверо ее детей. Из анамнезов членов ее семейства мы знаем, что бабушка по матери также страдала от этой болезни, но и она сама и ее муж — дедушка по матери — уже умерли. Мы можем включить их в родослов- ную, обозначив косыми чертами, указывающими на то, что их уже нет в живых, но мы не можем получить никакой дополнительной информации об их генотипах. Мы знаем, что ген болезни расположен на той же хромосоме, что и микросателлит, который мы назовем М, четыре аллеля которого — Мг М2, М3 и М4 — присутствуют у ныне живу- щих членов семейства. Наша цель состоит в том, чтобы нанести на карту позицию гена болезни относительно этого микросателлита. Чтобы установить частоту рекомбинации между геном болезни и микросател- литом М, мы должны определить, сколько детей из числа отпрысков являются реком- бинантами. При взгляде на генотипы этих шестерых детей, мы видим, что номера 1, 3 и 4 несут аллель болезни и аллель Мх микросателлита. Номера 2 и 5 обладают аллелем здоровья и аллелем М2 микросателлита. Поэтому мы можем выстроить две альтернатив- ные гипотезы. Согласно первой, две копии соответствующих гомологичных хромосом в матери имеют генотипы болъной-М1 и здоровый-М2; поэтому дети 1,2,3,4 и 5 имеют родительские генотипы, а ребенок 6 — один-единственный рекомбинант (рис. 3.22, б). Это предполагает, что ген болезни и микросателлит сцеплены относительно тесно и что кроссинговеры между ними происходят нечасто. Согласно альтернативной гипотезе хромосомы матери имеют генотипы здоровый-М2 и болъной-М2; это означает, что дети 1-5 суть рекомбинанты, а ребенок 6 имеет родительский генотип. Это подразумевает, что ген и микросателлит расположены на хромосоме относительно далеко друг от друга. Мы не можем определить, какая из этих альтернативных гипотез верна: данные разочаровывающе неоднозначны. Наиболее удовлетворительное разрешение задачи, поставленной перед нами ро- дословной на рис. 3.22, состояло бы в том, чтобы узнать генотип бабушки. Вообразим, что это семейство из мыльной оперы и что бабушка на самом деле жива. Ко всеобщему удивлению она вновь появляется на экране, и как раз вовремя, чтобы спасти снижаю- щиеся рейтинги телезрителей. Ее генотип в отношении микросателлита М оказывается
108 Часть 1. Изучение геномов а) Родословная [ Обозначения? О Здоровая женщина ф Больная женщина □ Здоровый мужчина м}м3 М2М3 м.м< м,м3 М2М< М2М< Больной мужчина Мертв(а) б) Возможные интерпретации родословной МАТЕРИНСКИЕ ХРОМОСОМЫ Гипотеза 1 Больной Ц Гипотеза 2 Здоровый /И, Здоровый М2 Больной М2 Ребенок 1 Больной Родительский Рекомбинантный Ребенок 2 Здоровый М2 Родительский Рекомбинантный Ребенок 3 Больной Родительский Рекомбинантный Ребенок 4 Больной Родительский Рекомбинантный Ребенок 5 Здоровый М2 Родительский Рекомбинантный Ребенок 6 Больной М2 Рекомбинантный Родительский Частота рекомбинации 1/6=16,7% 5/6 = 83,3 % в) Восстановление генотипа бабушки по матери AW | ^Аллель болезни должен быть сцеплен с М, 1 ВЕРНА ГИПОТЕЗА 1 м}м2 Рис. 3.22. Пример анализа родословной человека, а) Родословная показывает наследование генетической болезни в семье, в которой оба родителя и шестеро их детей живы, а информация о бабушке и дедушке со стороны матери известна из семейных хроник. Аллель болезни (закрашенные символы) является до- минирующим над аллелем здорового состояния (пустые символы). Цель нашего анализа состоит в том, чтобы определить степень сцепленности между геном болезни и микросателлитом М путем типизации аллелей этого микросателлита (М1? М2 ит. д.) в геномах ныне живущих членов семейства. 6) Родословная может быть интерпретирована двумя разными способами: гипотеза 1 дает низкую частоту рекомбина- ции и полагает, что ген болезни сильно сцеплен с микросателлитом М. Гипотеза 2 предполагает, что ген болезни и микросателлит связаны намного слабее. На виде в проблема решена повторным появлением бабушки по матери, генотип микросателлита которой согласуется только с гипотезой 1 МгМ5 (рис. 3.22, в). Это говорит нам, что хромосома, унаследованная матерью, имеет генотип болезнъ-Мг Поэтому мы можем с уверенностью заключить, что гипотеза 1 верна и что только ребенок 6 является рекомбинантом. К сожалению, живущие в реальной жизни генетики не властны воскрешать клю- чевые фигуры, задействованные в сценариях поставленных ими экспериментов, хотя они могут получать ДНК из старых патологоанатомических образцов тканей, таких как
Глава 3. Картирование геномов 109 готовые препараты и карты Гатри. Неполные родословные анализируют статистически, используя меру называемую счет Л ОШ. Аббревиатура Л ОШ означает «логарифмическое отношение шансов» (при этом шанс выпадает на то, что гены сцеплены) и используется главным образом, чтобы определить, лежат л и два изучаемых маркёра на одной и той же хромосоме, другими словами, сцеплены ли рассматриваемые гены или нет. Если анализ с помощью ЛОШ устанавливает сцепление, то он может обеспечить также и меру наи- более вероятной частоты рекомбинации. В идеале имеющиеся данные должны быть собраны путем анализа не одной, а нескольких родословных, что увеличило бы досто- верность результата. Такой анализ более однозначен для семейств с большим числом детей, и, как мы видели на рис. 3.22, важно, чтобы был известен генотип членов по крайней мере трех поколений. По этой причине были учреждены коллекции семейств, такие как поддерживаемая Centre d'Etudes du Polymorphisme Humaine (СЕРН) — Центр исследований полиморфизмов человека в Париже. Собрание СЕРН содержит культиви- руемые клеточные линии семейств, в которых могли быть получены образцы от обеих бабушек и обоих дедушек, а также по крайней мере от восьми детей второго поколения. Эта коллекция доступна для картирования при помощи ДНК-маркёров любому иссле- дователю, который соглашается предоставить полученные данные центральной базе данных СЕРНЧ Составление генетических карт бактерий И последний тип генетического картирования, который нам осталось рассмо- треть, — стратегия, применяемая при работе с бактериями. Главная трудность, с которой генетики столкнулись при попытке развить методы генетического картирования для бактерий, состоит в том, что эти организмы, как правило, являются гаплоидными и, таким образом, не подвергаются мейозу. Поэтому должен был быть изобретен какой-то иной способ вызвать кроссинговеры между гомологичными сегментами ДНК бактерий. Решение было найдено в использовании трех естественных способов, к которым при- бегают бактерии для передачи частей ДНК от одного партнера другому (рис. 3.23): • В процессе конъюгации две бактерии входят в физический контакт, и одна бакте- рия (донор) передает ДНК второй бактерии (реципиенту). Переданная ДНК может быть копией части или, возможно, всей хромосомы клетки-донора, или это может быть сегмент хромосомной ДНК — до 1 млн п. н. в дл ину — встроенный в плазмиду. Последнее называют передачей эписомы. • Трансдукция заключается в передаче маленького сегмента ДНК — до 50 тыс. п. н. или около того — от донора рецепиенту через бактериофаг. • В ходе трансформации клетка реципиента вбирает из окружающей среды фраг- мент ДНК, редко длиннее 50 тыс. п. н., выпущенный из клетки-донора. Обычно используются биохимические маркёры, при этом доминирующий (ди- кого типа) фенотип проявляется в обладании некоторой биохимической характери- стикой (например, способностью синтезировать триптофан), а рецессивный фенотип проявляется в обладании комплементарной характеристикой (например, неспособ- ностью синтезировать триптофан). Передача гена обычно устанавливается между штаммом доноров, который обладает аллелем дикого типа, и штаммом реципиентов с рецессивным аллелем, причем факт передачи штамму реципиентов устанавливается Развитие этой области столь стремительно, что уже сейчас можно послать образец своей ткани (на- пример, соскоб со щеки) и получить генотип по многим маркёрам, найти родственников, которые уже есть в базе данных, узнать предрасположенность к некоторым заболеваниям. — Прим. ред.
110 Часть 1. Изучение геномов ДОНОР а) Конъюгация РЕЦИПИЕНТ Рис. 3.23. Три способа осуществления пе- реноса ДНК между бактериями, а) Конъ- югация может привести к передаче ДНК хромосомы или плазмиды от бактерии- донора реципиенту. Конъюгация предпо- лагает физический контакт между этими двумя бактериями, причем передача, как думают, происходит через узкую трубочку, называемую пилем. 6) Трансдукция — пе- редача реципиенту маленького сегмента ДНК клетки-донора через бактериофаг. в) Трансформация подобна трансдукции, но в данном случае передается «голая» ДНК. События, иллюстрированные на схе- мах бив, часто сопровождаются гибелью клетки-донора. В случае б происходит ги- бель клетки, когда бактериофаги выходят из клетки-донора. В ситуации в выход ДНК из клетки-донора обычно является след- ствием гибели клетки, вызванной есте- ственными причинами путем наблюдения за приобретением биохимиче- ской функции, определяемой изучаемым геном. Эта методика проиллюстрирована на рис. 3.24, а, где мы видим, как функционально активный ген биосинтеза триптофана передается от бактерии дикого типа (генотип, описанный как trp+] реци- пиенту, у которого отсутствует функционально активная копия этого гена (trp"). Реципиент назы- вается ауксотрофом по триптофану (слово, упо- требляемое для описания мутантной бактерии, которая может выжить, только если обеспечена пи- тательным веществом — в данном случае трипто- фаном, — не требуемым для бактерии дикого типа; см. раздел 16.1.2). После передачи необходимы два кроссинговера, чтобы встроить переданный ген в хромосому клетки-реципиента, что преобразует реципиента из trp~ в trp+. Особенности процедуры картирования зави- сят от выбранного способа передачи гена. Во время конъюгации ДНК передается от донора рецепиенту таким же образом, каким нить протягивается через трубку. Поэтому относительные позиции маркёров на молекуле ДНК могут быть нанесены на карту пу- тем определения промежутков времени, через ко- торые маркёры появляются в клетке-реципиенте. В примере, показанном на рис. 3.24, б, маркёры А, В и С передаются соответственно в течение 8, 20 и 30 минут после начала конъюгации. На передачу целой хромосомы Escherichia coli уходит прибли- зительно 100 минут. Напротив, картирование при помощи трансдукции и трансформации позволяет картировать гены, которые расположены отно- сительно близко друг к другу, потому что пере- даваемый сегмент ДНК короткий (<50 тыс.п.н.), так что вероятность того, что два гена будут пере- даны совместно, зависит от того, как близко друг к другу они находятся на хромосоме бактерии (рис. 3.24, в). 3.3. Составление физических карт Полученная исключительно генетическими методами карта едва ли будет достаточно точна, чтобы служить ориентиром для проекта секве- нирования на стадии расшифровки генома. Это обусловлено двумя причинами. • Разрешение генетической карты зависит от числа кроссинговеров, которые были набраны. Для
Глава 3. Картирование геномов 111 а) Перенос ДНК между бактерией- донором и бактерией-реципиентом б) Последовательная передача маркёров в ходе конъюгации ДОНОР РЕЦИПИЕНТ ДОНОР РЕЦИПИЕНТ А~ВС АВС' в) Совместный перенос тесно сцепленных маркёров во время трансдукции или трансформации ДОНОР РЕЦИПИЕНТ Время переноса, мин Частота, с которой происходит преобразование Д В -+А'В\ зависит от того, насколько близко друг к другу расположены маркёры Д и В на хромосоме Рис. 3.24. Основа картирования генов бактерий, а) Перенос функционально активного гена для био- синтеза триптофана от бактерии дикого типа (генотип, описываемый как trp+) реципиенту, у которого отсутствует функционально активная копия этого гена (trp-). б) Картирование при помощи конъюгации, в) Картирование путем трансдукции и трансформации микроорганизмов это не главная проблема, потому что они могут быть получены в огромных количествах, что позволяет йзучить много кроссинговеров и получить очень подробную генетическую карту, на которой маркёры будут расположены всего лишь на несколько тыс. п. н. друг от друга. Например, когда проект секвени- рования генома Escherichia coli был начат в 1990 г., последняя генетическая карта для этого организма включала более чем 1 400 маркёров, то есть в среднем 1 мар- кёр на 3,3 тыс.п.н. Она была достаточно подробна, чтобы направлять программу секвенирования без необходимости проводить физическое картирование в боль- ших объемах. Точно так же проект определения генома Saccharomyces cerevisiae поддерживался мелкомасштабной генетической картой (приблизительно 1 150 генетических маркёров, в среднем 1 на 10 тыс.п.н.). Проблема с людьми и боль- шинством других эукариотов состоит в том, что попросту невозможно получить большое число потомков, так что может быть изучено сравнительно мало мейозов, и разрешающая способность анализа сцепления генетических признаков неиз- бежно будет ограничена. Это означает, что гены, которые отстоят друг от друга на несколько десятков тыс. п. н., могут появиться на генетической карте в одной и той же позиции. • Генетические карты имеют ограниченную точность. Мы затрагивали этот момент в разделе 3.2.3, когда оценивали предположение Стёртеванта о том, что кроссинго- веры по всей длине хромосомы происходят случайным образом. Это предположение верно лишь отчасти, потому что наличие очагов рекомбинации означает, что в не- которых точках кроссинговеры будут происходить с большей вероятностью, чем в других. Влияние данного явления на точность генетической карты было показано
112 Часть 1. Изучение геномов Физическая карта Генетическая карта his4 SUP53 _ 1еи2 Центромера < н pgkl - pet18 - - cry1 - MAT - ABP1 Рис. 3.25. Сравнение между генетиче- ской и физической картами хромосомы III Saccharomyces cerevisiae. Сравнение пока- зывает несоответствия между генетической и физической картами, где последняя опреде- лена секвенированием ДНК. Обратите вни- мание, что порядок верхних двух маркёров (glkl и chai) на генетической карте неверен и есть также различия в относительном рас- положении других пар маркёров thr4 SUP61 ABP1 в 1992 г., когда была опубликована полная по- следовательность хромосомы III Saccharomyces cerevisiae, что позволило провести первое прямое сравнение между генетической картой и факти- ческими позициями маркёров, выявленными путем секвенирования ДНК (рис. 3.25). Были обнаружены значительные несоответствия, причем даже до такой степени, что на основа- нии результатов генетического анализа одна пара генов была расположена в неправильном порядке. Имейте в виду, что S. cerevisiae — один из двух эукариотов (второй — плодовая мушка), чьи геномы были подвергнуты интенсивному генетическому картированию. Если генетиче- ская карта дрожжей является неточной, то на- сколько же точными могут быть генетические карты организмов, подвергавшихся менее под- робному анализу?! Эти два ограничения генетического кар- тирования подразумевают, что в проектах опре- деления геномов большинства эукариотов их генетические карты следует проверять и до- полнять альтернативными методами картиро- вания, прежде чем начинать крупномасштабное секвенирование ДНК. С целью устранения этой проблемы было развито изобилие методов фи- зического картирования, из числа которых мы упомянем следующие, самые важные: • рестрикционное картирование, которое определяет местонахождение на молекуле ДНК относительных позиций сайтов узнава- ния для эндонуклеаз рестрикции; • флюоресцентная гибридизация in situ (FISH), в которой местоположения мар- кёра наносятся на карту путем гибридизации содержащего этот маркёр зонда с интактными хромосомами; • картирование меченых участков последовательности (STS), при котором на карту путем исследования коллекций фрагментов геномной ДНК при помощи ПЦР и (или) гибридизационного анализа наносятся позиции коротких последо- вательностей. 3.3.1. Составление рестрикционных карт Генетическое картирование, использующее в качестве ДНК-маркёров RFLP, позво- ляет определить в пределах генома местонахождение позиций полиморфных участков рестрикции (раздел 3.2.2), но лишь немногие участки рестрикции в геноме полиморфны, так что многие участки не могут быть картированы этим методом (рис. 3.26). Можно ли увеличить плотность маркёров на карте генома, используя альтернативный метод определения местонахождения позиций некоторых из неполиморфных участков ре-
Глава 3. Картирование геномов 113 стрикции? Именно этого и достигает рестрикционное картирование, хотя на практике данная методика имеет ограничения, в силу которых она применима только к сравни- тельно небольшим молекулам ДНК. Сначала мы рассмотрим сам метод, а затем оценим его уместность для картирования геномов. Основная методология составления рестрикционных карт Простейший способ построить рестрикционную карту состоит в сравнении разме- ров фрагментов, полученных в результате переваривания молекулы ДНК двумя разными ферментами рестрикции, которые опознают различные целевые последовательности. Пример с использованием ферментов рестрикции EcoRl и BamHI показан на рис. 3.27. Сначала молекула ДНК переваривается только одним из этих ферментов, и размеры по- лученных фрагментов измеряются посредством электрофореза в агарозном геле. Затем молекула переваривается вторым ферментом, и полученные фрагменты вновь измеря- ются в агарозном геле. Полученные на данный момент результаты позволяют установить число участков рестрикции для каждого фермента, но не позволяют определить их отно- сительные позиции. Поэтому добывается дополнительная информация по результатам совместного переваривания молекулы ДНК обоими ферментами. В представленном на рис. 3.27 примере такая двойная рестрикция позволяет нанести на карту три участка. Однако возникает проблема с большим фрагментом рестрикции EcoRI, потому что он содержит два участка рестрикции BamHI и есть две альтернативные возможности рас- положения на карте внешнего из них. Эта проблема решается возвращением к исходной молекуле ДНК и дополнительной ее обработкой ферментом Bam HI в отдельности, но на сей раз предотвращая протекание переваривания до конца, — например, путём выдер- живания реакционной смеси в течение малого промежутка времени или посредством выбора условно оптимальной температуры выдержки. Это называется частичной ре- стрикцией и ведет к более сложному набору продуктов, причем на этот раз продукты полной рестрикции дополнены частично рестриктированными фрагментами, которые по-прежнему содержат один или несколько неразрезанных участков рестрикции BamHI. В примере, показанном на рис. 3.27, размер одного из фрагментов частичной рестрик- ции является диагностическим фактором, и его определение позволяет распознать среди возможных карт единственно верную. Частичная рестрикция обычно дает информацию, необходимую для завершения карты, но если число участков рестрикции велико, то анализ такого типа становится громоздким потому лишь, что приходится рассматривать очень много различных фраг- ментов. Альтернативная стратегия более про- ста, потому что она позволяет игнорировать большинство фрагментов. Это достигается прикреплением маркёра радиоактивного или иного типа к каждому концу стартовой молекулы ДНК до начала частичного пере- варивания. В результате многие продукты частичной рестрикции становятся «невиди- мыми», потому что они не содержат концевой фрагмент и, таким образом, не обнаружива 1“ к R Полиморфный участок рестрикции □ R Неполиморфный - R участок рестрикции R R R Рис. 3.26. Не все участки рестрикции полиморфны
114 Часть 1. Изучение геномов 4,9 тыс. п. н. EcoRI у BamHI I \ EcoRI + BamHI 1,5 0,2 W 3,4 0,7 1,0 1,2 2,0 1,0 1,2 2,0 ИНТЕРПРЕТАЦИЯ ДВОЙНОЙ РЕСТРИКЦИИ Фрагменты Выводы 0,2 тыс. п. н., 0,5 тыс. п. н. 1,0 тыс. п. н. 1,0 тыс. п. н., 2,0 тыс. п. н. Они должны получаться из фрагмента BamHI 0,7 тыс. п. н., который поэтому имеет внутренний участок рестрикции EcoRI: В Ев oJc 2 Это должен быть фрагмент BamHI без внутреннего участка EcoRI. Мы можем объяснить фрагмент EcoR11,5 тыс. п. н., если мы поместим фрагмент 1,0 тыс. п. н. следующим образом: 1,5 Они также должны быть фрагментами BamHI без внутренних участков EcoRI. Они должны лежать в пределах фрагмента EcoRI 3,4 тыс. п. н. Есть две возможности: —У?—°— и™„—у? ° 0,7 1|2 2,0 0,7 2’° 1,2 ПРЕДСКАЗАННЫЕ РЕЗУЛЬТАТЫ ЧАСТИЧНОЙ РЕСТРИКЦИИ BamHI Если верна карта I, то продукты частичной рестрикции будут включать фрагмент 1,2 + 0,7 - 1,9 тыс. п. н. Если верна карта II, то продукты частичной рестрикции будут включать фрагмент 2,0 + 0,7 = 2,7 тыс. п. н. 4,9 тыс. п. н. I BamHI, условно * оптимальные условия 1,0 1,7 3,7 0.7 2,7 3,9 — — -------------------------------— 4'9__________________ 2,0 3,2 ~ ----------------------- ВЫВОД: — ВЕРНА КАРТА II Рис. 3.27. Рестрикционное картирование. Цель состоит в том, чтобы нанести на карту участки EcoRI (Е) и BamHI (В) в линейной молекуле ДНК размера 4,9 тыс. п. н. Результаты одинарной и двойной рестрикции показаны наверху. Размеры фрагментов, полученных после двойной рестрикции, позволяют построить две альтернативные карты, как объяснено в центральной области, нерешенная проблема — позиция одного из трех участков BamHI. Обе карты проверяются частичной рестрикцией BamHI (нижняя часть рисунка), что показывает, что карта II — правильная
Глава 3. Картирование геномов 115 ются, когда агарозный гель про- сматривается на наличие меченых продуктов (рис. 3.28). Размеры тех продуктов частичной рестрикции, которые являются видимыми, позволяют определять позиции ненанесенных на карту участков относительно концов исходной молекулы1). si Молекула ДНК с конечной меткой Видимые фрагменты частичной рестрикции Масштаб рестрикционных карт ограничен длиной ре- стриктов Если число участков разре- за для используемых ферментов относительно невелико, то по- строение карты рестрикции не вызывает особых затруднений. Рис. 3.28. Упрощение анализа частичной рестрикции путем прикрепления маркёров к концам молекулы ДНК перед пере- вариванием. Показан один конец помеченной на конце моле- кулы ДНК. После частичной рестрикции детектируют только те продукты, которые включают в себя концевой фрагмент. Это значительно упрощает анализ и позволяет определять позиции участков рестрикции непосредственно по длинам меченых продуктов Однако по мере увеличения числа участков разреза возрастает также и число продуктов одинарной, двойной и частичной рестрикции, размеры которых придется определять и сравнивать для построения карты. Конечно, может быть пущен в ход компьютерный анализ, но в конечном счете все равно возникают проблемы* 2). В какой-то момент бу- дет достигнута стадия переваривания, когда реакционная смесь содержит так много фрагментов рестрикции, что отдельные полосы сольются в агарозном геле и увеличат шансы того, что один или несколько фрагментов будут неправильно измерены или вообще пропущены. Если несколько фрагментов имеют подобные размеры, то, даже если все они могут быть идентифицированы, может оказаться невозможно собрать из них однозначную карту. Поэтому рестрикционное картирование более приемлемо для маленьких, а не боль- ших молекул, причем верхний предел этого метода зависит от частоты участков рестрик- ции в картируемой молекуле. Если выбрать ферменты с шестинуклеотидными сайтами узнавания, то на практике обычно удается построить однозначную рестрикционную карту для молекулы ДНК не более 50 тыс. п. н. в длину. Порог в пятьдесят тыс. п. н. ниже минимального размера хромосом бактерий или эукариотов, хотя он вполне покрывает геномы вирусов и органелл, и рестрикционные карты полного генома действительно сыграли немалую роль в ориентации проектов секвенирования таких малых молекул. Рестрикционные карты будут столь же полезны, если геномную ДНК бактерии или эукариота клонировать и клонированные фрагменты будут менее 50 тыс.п.н. в длину, потому что в таком случае можно создать подробную рестрикционную карту как пред- посылку к секвенированию клонированной области. Это важная сфера применения рестрикционного картирования в проектах секвенирования больших геномов, но есть На самом деле суть проблемы заключается в экспоненциальном росте числа вариантов. Даже карта с 10 сайтами рестрикции для каждой из двух рестриктаз не может быть однозначно восстановлена на прак- тике. — Прим.ред. 2> Описанные методы носят, скорее, исторический характер и сейчас не применяются (разве что при поиске новых рестриктаз). Подобное картирование рестриктных фрагментов возможно только, когда число сайтов расщепления невелико. Однако это означает, что и сама молекула ДНК невелика (несколько тыс. п. н.). В современных условиях проще ее попросту секвенировать! — Прим. ред.
116 Часть 1. Изучение геномов ли какая-нибудь возможность использования рестрикционного анализа для более общего картирования полных геномов размером более 50 тыс.п.н.? Компетентный специалист ответит «да», потому что ограничения рестрикционно- го картирования могут быть немного ослаблены за счет подбора ферментов, которые, как можно ожидать, имеют редкие участки разрезания в целевой молекуле ДНК. Такие «редкощепящие» рестриктазы подпадают под две категории. • несколько ферментов рестрикции разрезают в семи- или восьминуклеотидных сай- тах узнавания. Примеры — Sap\ (5’-GCTCTTC-3') uSgfl (5'-GCGATCGC-3'). Ферменты с семинуклеотидными сайтами узнавания, как ожидается, должны разрезать мо- лекулу ДНК с содержанием CG 50 % в среднем единожды на каждые 47 = 16 384 п. н. Ферменты с восьминуклеотидными сайтами узнавания должны разрезать один раз на каждые 48 =65536 п. н. Эти числа сравнимы с 46 = 4096 п. н. для ферментов с шестинуклеотидными сайтами узнавания, такими как Вап?Н1 и EcoRI. Рестрик- тазы с семи- и восьминуклеотидными сайтами узнавания часто используются в рестрикционном картировании больших молекул, но в целом данный подход не является столь распространенным, сколь он мог бы быть, попросту потому, что известно мало таких ферментов. • Можно использовать ферменты с сайтами узнавания, содержащими такие мотивы, которые встречались бы в целевой ДНК достаточно редко. Молекулы геномной ДНК не имеют случайных последовательностей, а у некоторых молекул крайний дефицит некоторых мотивов. Например, последовательность 5'-CG-3' редка в ге- номах позвоночных животных, потому что клетки позвоночных обладают фер- ментом, который добавляет метильную группу к 5-углероду нуклеотида С во всех таких последовательностях1). Дезаминирование полученного 5-метилцитозина дает тимин (рис. 3.29). Вследствие этого в ходе эволюции позвоночных многие из последовательностей 5'-CG-3', которые были первоначально в этих геномах, были преобразованы в 5'-TG-3'. Поэтому ферменты рестрикции, которые опозна- ют участок, содержащий мотив 5'-CG-3', разрезают ДНК позвоночного животного относительно нечасто. Примеры — Smai (5'-CCCGGG-3'), который разрезает ДНК человека в среднем один раз на каждые 78 тыс.п.н., и FssHII (5'-GCGCGC-3'), кото- рый разрезает единожды на каждые 390 тыс.п.н. Обратите внимание, что Not\ — рестриктаза с восьминуклеотидным сайтом узнавания — тоже нацеливается на последовательности 5'-CG-3' (сайт узнавания 5'-GCGGCCGC-3') и разрезает ДНК человека очень редко — приблизительно один раз на каждые 10 млнп.н. Таким образом, потенциал рестрикционного картирования увеличивается за счет использования редкощепящих рестриктаз. Строить рестрикционные карты геномов животных и растений пока что не удается, но уже вполне возможно использовать эту методику с большими клонированными фрагментами и с маленькими молекулами ДНК прокариотов и низших эукариотов наподобие дрожжей и грибов. Если используются редкощепящие рестриктазы, то для изучения получающихся фрагментов рестрикции может возникнуть необходимость применения специального типа электрофореза в агарозном геле. Это связано с тем, что зависимость между длиной молекулы ДНК и ее скоростью миграции в электрофоретическом геле не линейна, и с воз- растанием длины молекул разрешающая способность гель-электрофореза уменьшается Это утверждение неверно. Метилируется только часть цитозинов и это метилирование тканеспеци- фично и играет регуляторную роль. В зародышевой линии клеток (а только они передаются по наследству) уровень метилирования невысок. — Прим. ред.
Глава 3. Картирование геномов 117 (рис. 3.30, а). Это означает, что раз- делять молекулы более чем, скажем, 50 тыс. п. н. в длину, невозможно, по- тому что в стандартном агарозном геле все наиболее длинные моле- кулы перемещаются в виде единой медленно мигрирующей полосы. Для их разделения необходимо за- менить линейное электрическое поле, применяемое в обычном гель- электрофорезе, более сложным полем. Одним из примеров таких методов служит электрофорез в геле с ортогонально чередую- щимся полем — OFAGE [пульс- форез1) — Прим, ред.], при котором электрическое поле чередуется между двумя парами электродов, каждая из которых помещена под углом 45° к продольной линии геля (рис. 3.30,6). Молекулы ДНК движут- ся через гель, как и обычно, но каж- дое изменение в поле вынуждает молекулы перестраиваться. Более короткие молекулы перестраива- ются быстрее, чем более длинные, и, таким образом, мигрируют через гель быстрее. За счет такого приема могут быть разрешены молекулы намного большей длины, чем раз- CG Цитозин NH2 хсн о N NH2 5-Метилцитозин Тимин Рис. 3.29. Последовательность 5'-CG-3' является редкой в ДНК позвоночных из-за метилирования С, сопровождаемого деза- минированием и получением!. Неметилированный цитозин также может быть дезаминирован, но продукт — урацил — обнаруживается системой восстановления ДНК клеток по- звоночных (раздел 16.2.2) и преобразуется назад в цитозин. Напротив, тимин не опознается эффективно системой репа- рации, так что эти нуклеотиды сохраняются в геноме деляемые обычным гель-электрофорезом. К подобного рода методам относят также CHEF (электрофорез в геле с ограниченными контуром однородными электрическими полями) и FIGE (электрофорез в геле с обращением поля). Непосредственное наблюдение участков рестрикции в молекулах ДНК Помимо всего вышеописанного, для нанесения на карту участков рестрикции в молекулах ДНК можно использовать методы, не связанные с электрофорезом. Со- гласно методу, названному оптическим картированием, позиции участков рестрик- ции определяются путем непосредственного наблюдения разрезанных молекул ДНК в микроскоп. Сначала ДНК необходимо закрепить на предметном стекле таким способом, чтобы отдельные молекулы стали вытянутыми, а не слипшимися между собой в единую массу. Существуют различные способы осуществления этой процедуры, в том числе вытягивание гелем и расчесывание молекул. Для того чтобы приготовить вытянутые гелем волокна ДНК, хромосомную ДНК переводят во взвесь в расплавленной агарозе и помещают на предметное стекло микро- Всякий форез в переменном электрическом поле, когда катод и анод меняют свою полярность через определенные промежутки времени, называют пульс-форезом. Существует много схем проведения пульс- фореза, различающихся взаимным расположением полюсов, частотой «пульсации» и т. д. — Прим, перев.
118 Часть 1. Изучение геномов а) Стандартный электрофорез в агарозном геле Плохое разделение молекул ДНК длины > 50 тыс. п. н. б) Электрофорез в геле с ортогонально чередующимся полем (OFAGE) Рис. З.ЗО. Обычный и нестандартный электрофорез в агарозном геле, а) В стандартном электрофорезе в агарозном геле электроды помещают с обоих концов геля, и молекулы ДНК мигрируют по прямой линии к положительному электроду. Этот способ не позволяет разделять молекулы длиннее примерно 50 тыс. п. н. 6) В OFAGE электроды размещают по углам плиты геля, причем поле чередуется между парами электродов А и В. OFAGE позволяет разделять молекулы длины до 2 млн п. н. скопа. По мере того как гель охлаждается и затвердевает, молекулы ДНК вытягиваются (рис. 3.31, а). Согласно методике расчесывания молекул волокна ДНК приготовляют пу- тем погружения покрытого силиконом покровного стекла в раствор ДНК, выдерживания его в течение 5-ти минут (за это время молекулы ДНК прикрепляются к покровному стеклу своими концами) и последующего вынимания стекла из раствора с постоянной скоростью 0,3 мм в сек (рис. 3.31, б). Сила, необходимая для протягивания молекул ДНК через поверхностный мениск, заставляет каждую из них вытягиваться в линию. На от- крытом воздухе поверхность покровного стекла сразу же высыхает, при этом молекулы ДНК остаются на нем в виде массива параллельных волокон. После вытягивания или расчесывания закрепленные молекулы ДНК обрабатывают ферментом рестрикции и за- тем проявляют, добавляя флюоресцентный краситель, такой как DAPI (4,6-диамино-2- фенилиндолдигидрохлорид), который окрашивает ДНКтаким образом, чтобы ее волокна были видимы при наблюдении препарата во флюоресцентный микроскоп с большим увеличением. По мере стягивания волокон ДНК в силу их природной упругости, участки рестрикции в вытянутых молекулах постепенно превращаются в разрывы, что позволяет регистрировать относительные позиции разрезов. Поначалу оптическое картирование применялось к большим фрагментам ДНК, клонированным в векторах на YAC и ВАС (раздел 2.2.1). Позже применимость этой тех- нологии к картированию геномной ДНК была доказана в ходе исследований хромосомы длиной 1 млн п. н. малярийного паразита Plasmodium falciparum, а также двух хромосом и одиночной мегаплазмиды бактерии Deinococcus radiodurans (см. табл. 8.2).
Глава 3. Картирование геномов 119 а) Вытягивание гелем б) Расчесывание молекул Предметное стекло микроскопа, покрытое ферментом рестрикции Хромосомная ДНК У Расплавленная агароза Раствор ДНК Покровное стекло Молекулы ДНК прикрепляются к покровному стеклу одним концом I Агароза затвердевает, ДНК вытягивается участками рестрикции Рис. 3.31. Вытягивание гелем и расчесывание молекул, а) Чтобы выполнить вытягивание гелем, расплав- ленная агароза, содержащая молекулы хромосомной ДНК, наносится пипеткой на предметное стекло микроскопа, покрытое ферментом рестрикции. По мере затвердевания геля молекулы ДНК постепенно вытягиваются. Остается непонятным, почему это происходит, но думают, что этот процесс может быть обусловлен движением жидкости на стеклянной поверхности во время гелеобразования. Добавление хлорида магния активирует фермент рестрикции, который разрезает молекулы ДНК. По мере того как молекулы постепенно сворачиваются в спирали, разрывы, представляющие собой участки разрезания, ширятся и становятся видимыми. 6) При расчесывании молекул покровное стекло опускают в раствор ДНК. Молекулы ДНК прикрепляются к покровному стеклу своими концами, и стекло извлекается из рас- твора со скоростью 0,3 мм в сек, в результате чего получается «гребенка» параллельных молекул Молекулы ДНК расчесываются 3.3.2. Флюоресцентная гибридизация in situ Метод оптического картирования, описанный выше, прокладывает путь к процеду- ре физического картирования второго типа, которую мы сейчас и рассмотрим, — FISH. Как и при оптическом картировании, FISH позволяет непосредственно визуализиро- вать позицию маркёра на хромосоме или вытянутой молекуле ДНК. При оптическом картировании маркёром служит участок рестрикции, и он наблюдается в виде разрыва в вытянутом волокне ДНК. В методе FISH маркёром является последовательность ДНК, которая отображается путем гибридизации с флюоресцентным зондом.
120 Часть 1. Изучение геномов Делящиеся клетки с метафазными хромосомами Предметное ------ стекло микроскопа Формамид | Хромосомы денатурируются Добавление I зонда * Сигнал от зонда Рис. 3.32. Флюоресцентная гибридиза- ция in situ. Образец делящихся клеток высушивается на предметном стекле микроскопа и обрабатывается формами- дом таким образом, чтобы хромосомы денатурировались, но не потеряли свою характерную метафазную морфологию (см. раздел 7.1.2). Позиция, в которой зонд гибридизируется с хромосомной ДНК, визуализируется за счет детекти- рования флюоресцентного сигнала, ис- пускаемого меченой ДНК Гибридизация радиоактивными или флюорес- центными зондами in situ Гибридизация in situ — вариант гибридизаци- онного анализа (раздел 2.1.2), в котором ненарушен- ная хромосома исследуется путем ее зондирования меченой молекулой ДНК. Позиция на хромосоме, в которой происходит гибридизация, дает инфор- мацию о местоположении используемой в качестве зонда последовательности ДНК на карте (рис. 3.32). Для того чтобы этот метод работал, ДНК в хромосо- ме должна быть переведена в однонитевую форму («денатурирована») путем разрушения пар основа- ний, которые сплачивают нити в двойную спираль. Только после этого хромосомная ДНК будет способна гибридизироваться с зондом. Стандартный метод денатурирования хромосомной ДНК без наруше- ния морфологии хромосомы состоит в высушивании препарата на предметном стекле микроскопа и по- следующей обработке формамидом. В ранних версиях метода гибридизации in situ применялся зонд, меченный радиоактивной меткой, но эти процедуры были неудовлетворительны, по- тому что с радиоактивной меткой трудно добиться и чувствительности, и разрешения — двух опреде- ляющих факторов для успешной гибридизации in situ. Для получения высокой чувствительности не- обходимо, чтобы радиоактивная метка имела высо- кую энергию эмиссии (пример такой радиоактивной метки — 32Р), но если радиоактивная метка имеет высокую энергию эмиссии, то она рассеивает свой сигнал и, таким образом, дает низкое разрешение. Высокое разрешение возможно в том случае, если ис- пользуется радиоактивная метка с низкой энергией эмиссии типа 3Н, но такие радиоактивные метки имеют столь низкую чувствительность, что необходимы длительные экспозиции, которые приводят к появлению сильного фона и, как следствие, — трудностей в различении подлинного сигнала. Эти проблемы были решены в конце 1980-х гг. разработкой нерадиоактивных флюоресцентных меток ДНК. Эти метки сочетают в себе высокую чувствительность с высоким разрешением и потому идеальны для гибридизации in situ. Были разработаны флюоресцентные метки с эмиссией различных цветов, что позволило гибридизировать целый ряд различных зондов с одной хромосомой и различать их индивидуальные ги- бридизационные сигналы, благодаря чему появилась возможность наносить на карту относительные позиции последовательностей зондов (рис. 3.33). Чтобы максимально повысить чувствительность, необходимо метить зонды настолько интенсивно, на- сколько это возможно, что в прошлом подразумевало применение в качестве зондов весьма длинных молекул ДНК, как правило, клонированных фрагментов ДНК длины по крайней мере 40 тыс. п. н. Теперь, когда разработаны методы, позволяющие достигнуть
Глава 3. Картирование геномов 121 Рис. 3.33. Применение FISH в физическом картировании. 18 Различных космидных клонов были помечены различными флюоресцентными | И | маркёрами и гибридизированы содной парой гомологичных хромосом. |*1 Хромосомы выходят из метафазного ядра и, следовательно, соедине- f I ! ны своими центромерами. Относительные позиции флюоресцентных £ Д сигналов позволяют определять местоположения всех тех фрагментов . * || ДНК на карте, которые содержатся в космидах. Изображение любезно W и ТЛ ® | предоставлено Октавианом Хенегариу " I интенсивного мечения с более короткими молекулами, тре- I * i бованиекдлине зондов имеет меньшее значение. Поскольку । * мы заинтересованы построением физической карты, клони- | ЧI рованный фрагмент ДНК может рассматриваться всего лишь Ж как маркёр другого типа, хотя на практике использование * е Л клонов в качестве маркёров открывает для анализа второе | измерение, потому что клонированная ДНК — это материал, « ’ | по которому определяется последовательность ДНК. Поэтому f * I картирование позиций клонов обеспечивает прямую связь t сJi между картой генома и последовательностью его ДНК. ™ Если зонд представлен длинным фрагментом ДНК, -ж! то одна из возможных проблем, — по крайней мере в слу- чае высших эукариотов, — состоит в том, что такой зонд с большой вероятностью будет содержать примеры повторных последовательностей ДНК (глава 9) и, таким образом, может гибридизироваться со многими позициями хромосомы, а не только в определенной точке, к которой он абсолютно подходит. Дабы уменьшить такую неспецифическую гибридизацию, перед использованием зонд смешивают с непомеченной ДНК из изучаемого организма. В качестве такой ДНК может попросту быть взята полная ядерная ДНК (то есть представляющая пол- ный геном), но лучше, если будет использована фракция, обогащенная повторными последовательностями. Идея состоит в том, что непомеченная ДНК прогибридизи- руется с повторными последовательностями ДНК в зонде и тем самым блокирует их, с тем чтобы в последующей гибридизации in situ участие принимали исключи- тельно уникальные последовательности. Поэтому неспецифическая гибридизация уменьшается или полностью устраняется (рис. 3.34). FISH в действии Метод FISH первоначально использовался с метафазными хромосомами (раз- дел 7.1). Такие хромосомы, приготовленные из ядер, которые претерпевают деление, сильно сжаты, и каждая хромосома в наборе принимает узнаваемые черты, характери- зуемые позицией ее центромеры, и картину распределения дисков, которая проявляется после окрашивания хромосомного препарата (см. рис. 7.5). В случае метафазных хромосом флюоресцентный сигнал, полученный с помощью FISH, наносится на карту, при этом позиция на ней определяется путем измерения его расстояния от конца короткого плеча хромосомы (значение FLpter). Неудобство этого метода заключается в том, что сильная уплотненность метафазных хромосом означает, что возможна только картография с низ- кой разрешающей способностью, при этом два маркёра должны находиться по крайней мере на расстоянии 1 млн п. н. друг от друга, чтобы быть различимыми как отдельные гибридизационные сигналы. Такая степень разрешения недостаточна для построе-
122 Часть 1. Изучение геномов Повторная ДНК ...................... и 11 I 1..... Гибридизирующий зонд Добавление ДНК, обогащенной повторной ДНК Рис. 3.34. Метод блокирования повторных последовательностей ДНК в гибридизи- рующем зонде. В этом примере молекула зонда содержит две повторные последо- вательности (показаны красным цветом). Если эти последовательности не блокиро- ваны, то зонд неспецифично гибридизиру- ется с любыми копиями этих повторений в целевой ДНК. Чтобы блокировать по- вторные последовательности, зонд пред- варительно гибридизируется с фракцией ДНК, обогащенной повторной ДНК Теперь повторные последовательности в зонде блокированы 1 i 2_1 1 1 1 ^3 [д I I J I Т1 I Гибридизация зонда теперь протекает лишь с участием уникальных последовательностей ния полезных хромосомных карт, и основное назначение FISH в ме- тафазу заключалось в определении хромосомы, на которой расположен новый маркёр, и в обеспечении при- ближенного представления отно- сительно его позиции на карте, то есть в создании черновика для более крупномасштабного картирования при помощи других методов. На протяжении ряда лет в число этих «других методов» не входила ни одна форма FISH, но с 1995 г. был разработан ряд методов FISH более высокого разрешения. В этих методах более высокое разрешение достигается за счет изменения характера изучаемого хромосомного препарата. Если метафазные хромосомы слишком сжаты для крупномас- штабного картирования, то нам следует использовать хромосомы в более вытянутом виде. Есть два способа сделать это. • Механически вытянутые хромосомы могут быть получены за счет изменения метода приготовления препарата, применяемого для выделения хромосом из мета- фазных ядер. За счет включенной в него операции центрифугирования создаются сдвигающие усилия, которые могут привести к вытягиванию хромосом вплоть до 20-ти раз от их нормальной длины. Отдельные хромосомы являются по-прежнему распознаваемыми, и сигналы FISH могут быть нанесены на карту тем же самым способом, как и при работе с обычными метафазными хромосомами. Разрешение значительно улучшено и позволяет различать маркёры, которые отстоят друг от друга на 200-300 тыс.п.н. • Неметафазные хромосомы могут быть пущены вдело, потому что только во время метафазы хромосомы сильно сжаты: в других стадиях клеточного цикла хромосомы пребывают в естественном для них развернутом состоянии. Были сделаны попытки использовать профазные ядра (см. рис. 3.15), потому что в них хромосомы все еще достаточно уплотнены для опознавания отдельных хромосом. Однако на практике такие препараты не дают никакого преимущества над механически вытянутыми хромосомами. Интерфазные хромосомы более полезны, потому что эта стадия клеточного цикла (между делениями ядра) протекает как раз в тот момент, когда хромосомы наиболее развернуты. Возможно получить разрешение до 25 тыс. п. н., но при этом теряется морфология хромосомы и в силу этого не остается никаких
Глава 3. Картирование геномов 123 с обоими маркёрами с обоими маркёрами Рис. 3.35. Множество фрагментов, подходящее для STS-картирования. Фрагменты охватывают полную длину хромосомы, при этом каждая точка на хромосоме присутствует в среднем в пяти фрагментах. Два синих маркёра находятся близко друг к другу на хромосомной карте, и высока вероятность того, что они будут обнаружены на одном и том же фрагменте. Два зеленых маркёра более отдалены друг от друга и, таким образом, с меньшей вероятностью могут наблюдаться на одном и том же фрагменте внешних контрольных точек, относительно которых можно было бы наносить на карту позицию зонда. Поэтому этот метод используется после построения предва- рительной карты и обычно служит средством определения порядка расположения ряда маркёров в маленькой области хромосомы. В интерфазных хромосомах молекулы клеточной ДНК пребывают в наиболее раз- вернутом состоянии. Поэтому для того чтобы улучшить разрешение FISH до лучшего, чем 25 тыс. п. н., значения, необходимо отказаться от интактных хромосом и вместо этого использовать очищенную ДНК. Данный подход, названный волоконным FISH, основан на применении ДНК, приготовленной методом вытягивания гелем или расчесывания молекул (см. рис. 3.31), и позволяет различать маркёры, которые отстоят друг от друга менее чем на 10 тыс. п. н. 3.3.3. Картирование с помощью меченых участков последовательности Чтобы произвести подробную физическую карту большого генома, нам нужна, в идеале, такая методика картирования, которая обеспечивала бы высокое разрешение и вместе с тем была бы производительной и не требовательной с технической точки зрения. Ни один из двух методов, которые мы рассмотрели до этого, — рестрикционное картирование и FISH — не отвечает этим требованиям. Рестрикционное картирование проводится быстро, легко и обеспечивает подробную информацию, но оно не может быть применено к большим геномам. FISH, напротив, пригоден для работы с большими геномами, и такие его видоизмененные версии, как волоконный FISH, могут дать данные с высоким разрешением, но процедура FISH сложна, а сбор данных осуществляется мед- ленно, причем за один эксперимент позиции на карте определяются для не более чем трех или четырех маркёров. Если подробным физическим картам и суждено появиться на свет, то для этого необходим более действенный метод.
124 Часть 1. Изучение геномов мРНК Поли-А хвост АААААА Г- ТТТТТТ Добавление затравки олиго-дТ $ ТТТТТГм 11 Л i5 fFi'WPH'i i1 АААААА 3ЛТТТТТ у : Синтез первой нити при помощи обратной транскриптазы 5' ___________ ...... 3* I Рибонуклеаза Н расщепляет 4 большую часть РНК у П«.и нТЬ н мТТш н н > tttttt у : Синтез второй нити при помощи ДНК-полимеразы I Рис. 3.36. Один из методов приготовления кДНК. Боль- шинство молекул мРНК эукариотов несет на своем З'-конце поли-А хвост (раздел 12.2.1). Такой ряд нуклео- тидов (А) используется в качестве участка затравлива- ния для первой стадии синтеза кДНК, выполняемой об- ратной транскриптазой — ДНК-полимеразой, которая копирует матрицу РНК (раздел 2.1.1). Затравкой служит короткий синтетический олигонуклеотид ДНК (обычно 20 нуклеотидов в длину), состоящий полностью из ну- клеотидов Т («затравка олиго-дТ»). По завершении син- теза первой нити препарат обрабатывают рибонуклеа- зой Н, которая специфично расщепляет РНК-компонент гибрида РНК-ДНК. При выбранных условиях фермент расщепляет не всю РНК, а оставляет короткие сегменты, которые затравливают реакцию синтеза второй нити ДНК, катализируемую ДНК-полимеразой I * Шг1 ггттг i rtri ш,1111 5/ I Завершение синтеза 4 второй нити 5, у В настоящее время самый мощный метод 1 и 11ниш ш 1fun1ИШ ill физического картирования, благодаря которо- му уже были получены самые подробные кар- ты больших геномов, — это STS-картирование. Меченый участок последовательности, или STS, представляет из себя всего-навсего короткую последовательность ДНК, обычно от 100 до 500 п.н. в длину, которая легко опознается и лишь единожды встречается в хромосоме или изучаемом геноме. Чтобы нанести на карту набор STS, необходимо располагать множеством перекрывающихся фрагментов ДНК из отдельной хромосомы или полного генома. В примере, показанном на рис. 3.35, коллекция фрагментов была приготовлена из единственной хромосомы, при этом каждая точка на хромосоме представлена в коллекции в среднем пять раз. Данные, на основе которых будет построена карта, собирают путем определения того, какие фрагменты содержат какие STS. Это может быть выполнено посредством гибри- дизационного анализа, но обычно используют ПЦР, потому что она более быстрая и, как оказалось, более пригодна для автоматизации. Шансы на то, что два STS присутствуют в одном и том же фрагменте, будут, конечно, зависеть от того, насколько близко друг к другу они расположены в геноме. Если расстояние между ними мало, то высока веро- ятность того, что они всегда будут на одном и том же фрагменте; если же они отстоят дальше друг от друга, то иногда они будут на одном и том же фрагменте, а иногда — нет (рис. 3.35). Поэтому такие данные могут быть использованы для вычисления расстояния между двумя маркёрами, причём способ расчета аналогичен тому, которым определя- ются расстояния на карте в ходе анализа сцепления генетических признаков (раздел 3.2.3). Вспомним, что при анализе сцепления генетических признаков расстояние на карте рассчитывается по частоте, с которой между двумя маркёрами происходят пере- кресты. STS-картирование, по существу, заключается в том же, за исключением лишь того, что расстояние на карте базируется на частоте, с которой между двумя маркёрами встречаются разрывы. При описании STS-картирования, представленном выше, мы упустили из виду не- которые ключевые вопросы, как то: что именно представляет собой STS? Как получают коллекцию фрагментов ДНК?
Глава 3. Картирование геномов 125 Любая уникальная последовательность ДНК может быть использована в роли STS Чтобы быть квалифицированной как STS, последовательность ДНК должна удовлет- ворять двум критериям. Согласно первому ее поеледовательность должна быть известна, с тем чтобы мог быть поставлен анализ (посредством ПЦР) с целью проверки различных фрагментов ДНК на присутствие или отсутствие в них заданного STS. Согласно второму STS должен иметь уникальное местоположение на изучаемой хромосоме (или в геноме в целом, если набор фрагментов ДНК покрывает полный геном). Если последователь- ность STS наблюдается сразу в нескольких позициях, то данные картирования будут неоднозначны. Поэтому необходимо удостовериться в том, что в число предполагаемых STS не входят последовательности, встречающиеся в повторной ДНК. Эти критерии легко удовлетворить, и STS могут быть получены многими способами; самые распространенные их источники представлены ярлыками экспрессируемых последовательностей, SSLP и случайными геномными последовательностями. • Ярлыки экспрессируемой последовательности (expression sequence tag, EST). Это короткие последовательности, получаемые анализом клонов кДНК. Комплемен- тарная ДНК приготовляется путем преобразования препарата мРНК в двунитевую ДНК (рис. 3.36). Поскольку имеющаяся в клетке мРНК синтезируется из кодирую- щих белок генов, молекулы кДНК и EST, полученные из них, представляют гены, которые экспрессировались в клетке, из которой был приготовлен препарат мРНК. EST рассматриваются как быстрое средство получения доступа к последователь- ностям важных генов, и они ценны, даже если их последовательности неполные. EST может быть использован также и в качестве STS, при условии, что он будет получен из уникального гена, а не из члена семейства генов, в котором все гены имеют одинаковые или весьма подобные последовательности. • Полиморфизмы длины простой последовательности (SSLP). В разделе 3.2.2 мы постигали принципы использования микросателлитов и других SSLP в генетическом картировании. SSLP могут быть использованы также и в качестве STS при физическом картировании. SSLP, которые являются полиморфными и уже были нанесены на карту при помощи анализа сцепления генетических признаков, особенно ценны, поскольку они обеспечивают прямую связь между генетической и физической картами. • Случайные геномные последовательности. Их получают секвенированием слу- чайных частей клонированной геномной ДНК или же просто закачивают последо- вательности, которые были помещены в базы данных ранее. Фрагменты ДНК для картирования с помощью STS Второй насущный компонент для процедуры STS-картирования — коллекция фраг- ментов ДНК, покрывающих изучаемый объект, будь то хромосома или полный геном. Такую коллекцию иногда называют реактивом для картирования, и в настоящее время есть два способа, которыми она может быть собрана: в виде библиотеки клонов и в виде группы радиационных гибридов. Вначале мы рассмотрим радиационные гибриды. Радиационный гибрид — клетка грызуна, которая содержит фрагменты хромосом какого-либо иного организма. На первых порах данная технология была (в 1970-х гг.) разработана для хромосом человека, когда было обнаружено, что подвергание клеток человека дозам рентгеновских лучей 3000-8000 рад вызывает беспорядочное разбиение хромосомы на фрагменты, при этом большие дозы рентгеновского облучения дают более мелкие фрагменты (рис. 3.37, а). Такая обработка, конечно, смертельна для клетокчелове-
126 Часть 1. Изучение геномов а) Облучение хромосом Высокая доза Низкая доза Разбитые на фрагменты хромосомы б) Слияние клеток с целью получения лучевого гибрида Облученное ядро клетки человека Ядро клетки хомяка Гибридное ядро Рис. 3.37. Радиационные гибриды, а) Результат облучения клеток человека: хромосомы разрываются на фрагменты, при этом более высокие дозы рентгеновского облучения дают более мелкие фрагменты. 6) Радиационный гибрид получают путем слияния облученной клетки человека с необработан- ной клеткой хомяка. Из соображений наглядности показаны ка, но фрагменты хромосомы мо- гут быть размножены, если такие облученные клетки впоследствии слить с необлученными клетка- ми хомяка или другого грызуна. Слияние стимулируется или хими- чески (полиэтиленгликолем), или биологически — воздействием ви- руса Сендай (рис. 3.37, б). Не все клетки хомяка принимают фраг- менты хромосомы, так что необ- ходимо средство идентификации гибридов. Обычный процесс отбо- ра заключается в использовании линии клеток хомяка, которые неспособны синтезировать или тимидинкиназу (ТК), или гипок- сантинфосфорибозилтрансфера- зу (HPRT), ибо дефицит в любом из этих двух ферментов является смертельным для клеток, когда их выращивают в среде, содержащей смесь гипоксантина, аминоптери- на и тимидина (среда HAT). Итак, после слияния клет- ки помещают в среду НАТ. Те из них, что растут, суть гибридные клетки хомяка, которые приоб- рели фрагменты ДНК человека с генами ферментов ТК и HPRT человека; последние синтезиру- ются в гибридах и позволяют этим клеткам расти в селективной сре- де. В результате такой обработки выживают гибридные клетки, которые несут в себе случайную одборку фрагментов ДНК чело- только ядра клеток века, встроенных в хромосомы хомяка. Обычно фрагменты име- ют размер 5-10 млн п. н., при этом каждая клетка содержит фрагменты, эквивалентные 15-35 % генома человека. Такую коллекцию клеток называют группой радиационных гибридов и могут применять в качестве реактива для STS-картирования, но при условии, что анализ посредством ПЦР, применяемый для опознавания STS, не будет размножать эквивалентную область ДНК из генома хомяка. Может быть построена группа радиационных гибридов второго типа, содержа- щих ДНК только из одной хромосомы человека; с этой целью облучению подвергают клеточную линию не человека, а гибридов грызунов второго типа. Цитогенетики раз-
Глава 3. Картирование геномов 127 работали ряд клеточных линий грызунов, в кото- рых единственная хромосома человека устойчиво размножается в ядре клетки грызуна. Если кле- точная линия такого типа (например, клеточная линия мыши) будет облучена и слита с клетками хомяка, то гибридные клетки хомяка, получен- ные после отбора, будут содержать фрагменты хромосомы или человека, или мыши, или смесь обоих. Клетки, содержащие ДНК человека, могут быть идентифицированы путем их зондирования специфическим для человека повтором, таким как короткий рассеянный ядерный элемент (SINE) по имени Л/п (раздел 9.2.1), который имеет число ко- пий чуть более 1 миллиона (см. табл. 9.3) и, таким образом, встречается в геноме человека в среднем единожды на каждые 3 тыс.п.н. Только клетки, содержащие ДНК человека, будут гибридизиро- ваться с зондами А1и, что позволяет неинтересные гибриды мыши не принимать во внимание и на- правлять STS-картирование на клетки, содержа- щие фрагменты хромосомы человека. Картирование генома человека при помощи радиационных гибридов первоначально выпол- нялось со специфичными к хромосоме группами (панелями), а не с полногеномными панелями, потому что бытовало мнение, что для того, чтобы нанести на карту единственную хромосому, тре- буется меньше гибридов, чем для картирования полного генома. Оказывается, что карта с высо- ким разрешением для единственной хромосомы человека требует группы из 100-200 гибридов, что является наибольшим числом, которое может быть удобно обработано в программе визуали- зации результатов ПЦР. Но группы для целого генома и для единственной хромосомы строятся по-разному: первая предполагает облучение толь- ко ДНК человека, а последняя требует облучения клетки мыши, содержащей большую долю ДНК мыши и относительно мало ДНК человека. Это означает, что в группе для единственной хромо- сомы содержание ДНК человека на гибрид будет намного ниже, чем в группе для целого генома. Становится ясно, что подробное картирование полного генома человека возможно выполнить с менее чем 100 радиационными гибридами на весь геном, так что картирование целого генома не сложнее, чем картирование единственной хро- мосомы. Как только это было осознано, радиаци- Смесь хромосом - - Образец, содержащий хромосомы только одного типа Все остальные хромосомы Рис. 3.38. Разделение хромосом поточ- ной цитометрией. Смесь флюоресцентно окрашенных хромосом проходит сквозь маленькое отверстие, так что каждая вы- ходящая из него капля содержит только одну хромосому. Датчик флюоресценции идентифицирует сигнал от капель, содер- жащих нужную хромосому, и сообщает электрический заряд этим каплям. Когда капли достигают электрических пластин, заряженные капли отклоняются в отдель- ную мензурку. Все остальные капли падают мимо отклоняющих пластин прямо вниз и собираются в мензурке для отходов
128 Часть 1. Изучение геномов АВ CD EF G Н Применение библиотеки I клонов в качестве реактива *для картирования Секвенирование взаимно X перекрывающихся клонов АВ С DE F G Н I Карта STS !—TAGGCATCCATGCCCA—। Последовательность ДНК Рис. 3.39. Ценность библиотек клонов в проектах расшифровки геномов. Маленькая библиотека клонов, показанная в этом примере, содержит достаточную информацию для построения карты STS и может быть использована также как источник ДНК, которую предстоит секвенировать онные гибриды для полного генома стали основным компонентом стадии картирования в проекте «Геном человека» (раздел 4.3). Библиотеки полных геномов использовались также и для STS-картирования геномов других млекопитающих, а также полосатого данио и курицы. Библиотека клонов также может быть использована в качестве реактива картирования для анализа STS Необходимой предпосылкой стадии секвенирования проекта расшифровки генома является разрушение генома или выделенных хромосом на фрагменты и клонирование каждого из них в векторе высокой емкости, который способен принимать большие фраг- менты ДНК (раздел 2.2.1). В результате этого получают библиотеку клонов — коллекцию фрагментов ДНК, которые, в случае проекта расшифровки генома, имеют средний размер нескольких сот тыс.п.н. Наряду с поддержкой работ по секвенированию, библиотеки клонов могут быть использованы также и в STS-анализе как реактив картирования. Как и в случае групп радиационных гибридов, библиотека клонов может быть при- готовлена из геномной ДНК и, таким образом, представлять полный геном, или может быть создана библиотека, специфичная к хромосоме, если исходная ДНК получена только из хромосомы одного типа. Последнее возможно, потому что отдельные хромосомы могут быть разделены посредством поточной цитометрии. Дабы выполнить такое разделение, делящиеся клетки (с уплотненными хромосомами) аккуратно разрушают, с тем чтобы была получена смесь неповрежденных хромосом. Затем хромосомы окра- шивают флюоресцентным красителем. Количество красителя, связываемого хромо- сомой, зависит от ее размера, так что более крупные хромосомы связывают большие количества красителя и флюоресцируют более ярко, чем таковые меньшего размера. Далее хромосомный препарат растворяют и пропускают через маленькое отверстие, производя поток капелек, каждая из которых содержит по одной хромосоме. Капельки проходят через датчик, который измеряет количество флюоресценции и таким образом
Глава 3. Картирование геномов 129 распознает, какие капельки содержат определенную искомую хромосому. Электрический заряд сообщается этим каплям и никаким другим (рис. 3.38), что позволяет отклонять и отделять капельки, содержащие желательную хромосому, от всех остальных. Что если две различные хромосомы имеют подобные размеры, как это имеет место с хромосомами 21 и 22 человека? Обычно они могут быть разделены, если вместо неспецифического красителя использовать красители, имеющие предпочтение к областям, обогащенным АТ или GC. Примеры таких красителей — соответственно Hoechst 33258 и хромомицин А3. В двух хромосомах одного размера содержание GC редко бывает одинаковым и, таким образом, их можно различать по количествам АТ- или GC-специфичных красителей, которые они связывают. По сравнению с группами радиационных гибридов, библиотеки клонов имеют одно важное преимущество для картирования STS. Общеизвестен тот факт, что отдельные клоны могут последовательно представлять очередные отрезки ДНК, которая фактиче- ски секвенируется. Данные, следующие из анализа STS, на основании которых строится физическая карта, могут быть с неменьшим успехом использованы для определения того, какие клоны содержат перекрывающиеся фрагменты ДНК, что позволяет построить сборку контигов из клонов (рис. 3.39; прочие методы сборки контигов из клонов опи- саны в разделе 4.2.2). Такая сборка из перекрывающихся клонов может служить базовым материалом для репарации длинной, непрерывной последовательности ДНК, и позже, опираясь на данные анализа STS, можно закрепить эту последовательность в точной позиции на физической карте. Если в число STS были включены также и SSLP, которые были нанесены на карту при помощи анализа сцепления генетических признаков, то последовательность ДНК, физическая карта и генетическая карта — все эти сведения могут быть объединены воедино. Заключение Карты геномов служат опорной схемой для проектов секвенирования, потому что они указывают позиции генов и других опознаваемых особенностей генома и, следова- тельно, позволяют проверять точность собранной последовател ьности ДНК. Генетиче- ские карты строят по результатам экспериментов по скрещиванию и анализа родослов- ной, а физические карты — посредством прямого наблюдения молекул ДНК. В первых генетических картах маркёрами выступали гены, аллели которых можно было легко отличать, потому что они вызывали легко опознаваемые фенотипы, такие как разный цвет глаз, или же гены, аллели которых можно было отличать биохимическими тестами. Сегодня ДНК-маркёры также интенсивно используются, к ним относятся: полиморфизмы длины фрагмента рестрикции (RFLP), полиморфизмы длины простой последователь- ности (SSLP) и полиморфизмы отдельных нуклеотидов (SNP). Все они могут быть быстро и легко типизированы посредством ПЦР. Относительные позиции генов и ДНК-маркёров на хромосомах определяются при помощи анализа сцепления генетических признаков. Этот метод базируется на оригинальных генетических открытиях, сделанных Менделем, и был впервые разработан (для использования с плодовыми мушками) в самом начале двадцатого столетия. Анализ сцепления генетических признаков позволяет определять частоту рекомбинации между парой маркёров и обеспечивает данные, необходимые для установления относительных позиций маркёров на генетической карте. Для многих организмов анализ сцепления генетических признаков проводится путем прослежи- вания наследования маркёров в запланированных экспериментах по скрещиванию, но это невозможно с людьми. Вместо этого генетическое картирование генома человека
130 Часть 1. Изучение геномов опирается на данные наблюдений за наследованием маркёров в многолюдных семей- ствах, то есть на сведения, почерпнутые из анализа родословной. Генетические карты имеют относительно низкое разрешение и, как правило, являются неточными, а по- тому, если такую карту предстоит использовать в проекте секвенирования генома, ее необходимо уточнить физическим картированием. В маленькой молекуле ДНК позиции участков рестрикции могут быть определены путем рестрикционного картирования, но с хромосомами эукариотов этот способ имеет лишь ограниченную ценность. Больше пользы приносит флюоресцентная гибридизация in situ (FISH), в которой препарат из интактных хромосом, возможно, таких, которые были вытянуты посредством меха- нического вытягивания, зондируется маркёром, меченным флюоресцентной меткой. Позиция, в которой происходит гибридизация, определяется путем наблюдения пре- парата в конфокальный микроскоп. Наиболее подробные физические карты получают при помощи картирования содержания меченых участков последовательности (STS), при котором используется реактив для картирования — коллекция перекрывающихся фрагментов ДНК, которые покрывают полную хромосому или геном. Позиция маркёра на карте определяется путем определения того, какие именно фрагмены из коллекции содержат копии маркёра. Материалом для картирования может быть библиотека клонов или группа радиационных гибридов.
Глава 3. Картирование геномов 131 Задания для закрепления материала * Ответы к нечетным вопросам могут быть найдены в приложении Вопросы закрытого типа 3.1*. Главная проблема с вычислитель- ной сборкой последовательностей ДНК сложных геномов эукариотов заключается в присутствии: а. Многочисленных хромосом. Ь. Митохондриальной ДНК. с. Интронов в пределах генома. d. Повторов. 3.2. В первых генетических картах мар- кёрами служили гены, потому что: а. Местоположения генов на хро- мосомах можно было наблюдать при помощи окрашивания ДНК красителем. Ь. Определяемые генами фенотипы можно визуально опознавать и из- учать их схемы наследования. с. Отдельные гены, определяющие легко опознаваемые фенотипиче- ские признаки, могли быть легко клонированы. d. Полиморфизмы отдельных ну- клеотидов использовались для опознавания точечных мутаций, которые вызывали явно замет- ные фенотипические различия. 3.3 *. Какая из следующих причин НЕ обусловила общепринятое приме- нение биохимических фенотипов для создания генетических карт человека? а. Люди не имеют никаких визуаль- ных характеристик, пригодных для генетического картирова- ния. Ь. Есть биохимические фенотипы, которые легко визуализируются посредством определения групп крови. с. Некоторые легко характеризуе- мые биохимические фенотипы определяются генами с очень большим числом аллелей. d. Неэтично проводить запланиро- ванные эксперименты по скрещи- ванию над людьми. 3.4 . Геномы эукариотов картируют с ис- пользованием ДНК-маркёров в до- полнение к генам, потому что: а. ДНК-маркёры не требуют на- личия двух и более аллелей для картирования. Ь. Генетические карты могут не по- крывать большие области гено- ма. с. Большинство генов обладает мно- жественными аллелями, которые могут быть легко картированы. d. ДНК-маркёры менее изменчивы, чем генетические маркёры. 3.5 *. Как правило, в качестве ДНК-маркё- ров чаще используются микросател- литы, а не минисателлиты, потому что: а. Минисателлиты присутствуют в слишком многих местоположе- ниях в пределах генома. Ь. Ферменты рестрикции могут быть использованы для типиза- ции микросателлитов, но никак не минисателлитов. с. В геномах эукариотов находится очень немного микросателлитов, так что их легко опознавать и ана- лизировать. d. Микросателлиты присутствуют во всех областях генома эукарио- тов и легко размножаются с по- мощью ПЦР. 3.6 . Какие из следующих генетических маркёров наиболее многочисленны в геноме человека?
132 Часть 1. Изучение геномов a. RFLP. b. Минисателлиты. с. Микросателлиты. d. Полиморфизмы отдельных ну- клеотидов. 3.7 *. Принцип анализа сцепления генети- ческих признаков — это: а. Тот факт, что разные аллели одно- го и того же гена всегда располо- жены в одной и той же позиции хромосом. Ь. Открытие того факта, что за неко- торые признаки (такие как цвет глаз у мух) отвечают целые груп- пы генов. с. Наблюдение, что некоторые гены, если они расположены на одной и той же хромосоме, наследуются совместно. d. Наблюдение, что темно окраши- вающиеся области хромосом не содержат никаких генов. 3.8 . Различие между митозом и мейозом заключается в том, что митоз харак- теризуется следующим: а. Производством двух диплоидных клеток, которые являются гене- тически идентичными родитель- ской клетке. Ь. Обменом ДНК (кроссинговером) между гомологичными хромосо- мами. с. Производством двух диплоидных клеток, которые являются гене- тически отличными от родитель- ской клетки. d. Производством четырех гапло- идных клеток, которые являются генетически отличными от роди- тельской клетки. 3.9 *. Какое из следующих утверждений правильно описывает понятие ча- стоты рекомбинации между двумя генами? а. Чем ближе друг к другу два гена расположены на хромосоме, тем выше будет частота рекомбина- ции между ними. Ь. Чем дальше друг от друга два гена расположены на хромосоме, тем выше будет частота рекомбина- ции между ними. с. Если два гена расположены на одной и той же хромосоме, то меж- ду ними не могут произойти ни- какие события рекомбинации. d. Если два гена расположены на разных хромосомах, то частота рекомбинации между ними будет высокой. 3.10 . При анализе родословной человека с целью определения того, насколь- ко тесно сцеплены два гена, наилуч- шим будет: а. Заключить, что наиболее распро- страненные генотипы в потомстве суть родительские генотипы. Ь. Заключить, что самые распро- страненные генотипы в потом- стве — рекомбинанты. с. Провести анализирующее скре- щивание, с тем чтобы определить сцепление генов. d. Определить генотипы бабушки и дедушки. 3.11 *. Какой из следующих факторов НЕ ограничивает точность генетиче- ских карт людей и других сложных ядерных организмов? а. От многих ядерных организмов невозможно получить достаточно потомства. Ь. Очаги рекомбинации могут ме- шать генетическому картирова- нию. с. В генетическом картировании ис- пользуются только гены, а числа имеющихся генов недостаточно для картирования полных гено- мов. d. Гены или маркёры, которые в ге- номе отстоят друг от друга на де- сятки тысяч п. н., на генетической карте могут появиться в одной и той же позиции.
Глава 3. Картирование геномов 133 3.12 . Для флюоресцентной гибридизации in situ первоначально использова- ли метафазные хромосомы, но их возможности оказались несколько ограниченными в связи с тем, что: а. Многие области хромосомы сжа- ты и не могут гибридизироваться с зондами. Ь. Зонды предпочтительно скрещи- ваются с повторными последова- тельностями, присутствующими на множественных хромосомах. с. В сжатом состоянии хромосомы неустойчивы, а когда они развер- нуты, — сигнал рассеивается. d. Поскольку хромосомы уплотне- ны, картирование возможно лишь с низкой разрешающей способно- стью. 3.13 *. Интерфазные хромосомы полезны для крупномасштабного картиро- вания при помощи флюоресцент- ной гибридизации in situ, потому что они: а. Пребывают в наименее сжатом состоянии. Ь. Легко отличаются друг от друга своими структурами. с. Имеют транскрипционно актив- ные области хроматина, которые необходимы для этой технологии. d. Позволяют осуществлять физиче- ское картирование геномов с раз- решением вплоть до 1 тыс.п.н. 3.14 . Какими из следующих свойств об- ладают меченые участки последо- вательности (STS)? а. Они присутствуют только еди- ножды в пределах генома и об- ладают участком RFLP. Вопросы открытого типа 3.1*. Почему для секвенирования гено- мов необходимы карты? Если бы карта генома была недосягаема для исследователя, то какие глав- h. Они присутствуют только еди- ножды в пределах генома, и их последовательность известна. с. Их последовательность известна, и они должны содержать повтор- ные последовательности ДНК. d. Они должны содержать последо- вательность гена, и не допускают присутствия в них никаких по- вторных последовательностей ДНК. 3.15 *. Какая из следующих последователь- ностей не может быть использована в качестве меченого участка после- довательности? а. Ярлыки экспрессируемых после- довательностей. Ь. Случайные геномные последова- тельности. с. Полиморфизмы длины простых последовательностей. d. Полиморфизмы длины фрагмен- тов рестрикции. 3.16 . Группы радиационных гибридов обеспечивают хороший способ фи- зического картирования, потому что: а. В любой заданной гибридной клетке присутствует только часть генома человека. Ь. В клетках-хозяевах хомяка от- сутствуют последовательности, гомологичные генетическим мар- кёрам человека. с. Клетки-хозяева хомяка устойчи- вы к облучению. d. Известна полная физическая кар- та генома хомяка. ные затруднения в определении последовательности генома он бы испытывал?
134 Часть 1. Изучение геномов 3.2 . Четко объясните различия между генетической и физической картами генома. 3.3 *. Каким образом ПЦР сделала анализ RFLP намного более быстрым и лег- ко выполнимым? Что было необхо- димо для нанесения RFLP на карту до начала использования ПЦР с этой целью? 3.4 . Каким образом ферменты рестрик- ции используются для генетиче- ского и физического картирования генома? 3.5 *. Почему сцепление между генами представляет собой столь важный фактор для генетического карти- рования? Обсудите, как генетиче- ские маркёры могут быть сцепле- ны, чтобы по этим данным можно было строить карты отдельных хро- мосом. 3.6 . Сформулируйте два генетических закона Менделя. Какой компонент генетического картирования не охвачен законами Менделя? 3.7 *. Почему для анализирующих скре- щиваний в экспериментах анализа сцепления генетических признаков используется двойная гомозигота? Почему предпочтительно, чтобы ал- лели гомозиготы были рецессивны по проверяемым признакам? 3.8 . Рестрикционное картирование молекул ДНК часто ограничивает- ся молекулами размером не более 50 тыс. п. н. Почему для этой тех- нологии именно данная величина является пределом, и как такое огра- ничение может быть сглажено, что- бы можно было исследовать более крупные молекулы ДНК? 3.9 *. Методы генетического картирова- ния требуют наличия по крайней мере двух аллелей для заданного маркёра, тогда как методы физиче- ского картирования не полагают- ся на присутствие аллелей, чтобы картировать геномы. Обсудите, как технология флюоресцентной гибри- дизации in situ может быть исполь- зована для картирования позиций в геноме, даже если во всякой задан- ной позиции не наблюдается ника- кой генетической изменчивости. 3.10 . Почему для картирования геномов радиационные гибриды целого ге- нома предпочтительнее гибридов одинарной хромосомы? 3.11 *. * Как ученый может собрать библио- теку клонов ДНК, имея в своем рас- поряжении одну хромосому? Изыскательские задачи 3.1 *. Каковыми в идеале должны быть особенности ДНК-маркёра, исполь- зуемого для построения генетиче- ской карты? До какой степени RFLP, SSLP или SNP могут рассматриваться как «идеальные» ДНК-маркёры? 3.2 . Изучите и оцените возможности и сферы применения технологии чипов ДНК в биологических иссле- дованиях. 3.3 *. Какие особенности были бы жела- тел ьны для организма, который сле- дует использовать для всесторонних исследований наследственности? 3.4 . Какие проблемы могли бы возник- нуть, если бы была сделана попытка секвенировать геном до построения генетической или физической кар- ты? 3.5 *. Какая карта полезнее — генетиче- ская или физическая?
Глава 3. Картирование геномов 135 Тесты по рисункам 3.1*. Каким образом эксперимент с кра- 3.2. сителем-тушителем позволяет определить, гибридизировался ли олигонуклеотид к молекуле ДНК, со- держащей полиморфизм отдельного нуклеотида, или нет? б) Детектирование гибридизации с помощью гашения флюоресцентного красителя Все нижеприведенные гены рас- положены на одной хромосоме. Для перечисленных ниже частот реком- бинации постройте карту, показы- вающую относительные положения этих генов на хромосоме. Гены m v Ярко-красные глаза w Белые глаза У Желтое тело Частоты рекомбинации Миниатюрные крылья Флюоресцентный сигнал Между m и v Между m и у Между v и w Между w и у = 3,0 % = 33,7 % = 29,4 % = 1,3% 3.3*. * Метод электрофореза, показанный на этом рисунке, применяется для разделения относительно больших молекул ДНК (более 50 тыс. п. н.). На чем основана данная технология? 3.4. Эта пара хромосом была гибридизирована с клони- рованными молекулами, содержащими различные флюоресцентные метки. К какому типу относится этот метод и пример какого вида картирования он пред- ставляет: генетического или физического?
136 Часть 1. Изучение геномов Дополнительная литература Книги по истории генетики Orel,V. (1995) Gregor Mendel: The First Geneticist. Oxford University Press, Oxford. Shine,!, and Wrobel,S. (1976) Thomas Hunt Morgan: Pioneer of Genetics. University Press of Kentucky, Lexington, Kentucky. Sturtevant, A. H. (1965) A History of Genetics. Harper and Row, New York. Describes the early gene mapping work carried out by Morgan and his colleagues. Генетические и ДНК-маркёры Wang,D.G., Fan,J.-B., Siao,C.-J., et al. (1998) Large-scale identification, mapping, and genotyping of single-nucleotide polymorphisms in the human genome. Science 280: 1077- 1082. Yamamoto, F, Clausen, H., White,T., MarkenJ. and Hakamori,S. (1990) Molecular genetic basis of the histo-blood group ABO system. Nature 345: 229-233. Анализ сцепления генетических признаков Morton, N. E. (1955) Sequential tests for the detection of linkage. Am. J. Hum. Genet. 7: 277-318. The use of lod scores in human pedigree analysis. Strachan, T. and Read, A. P. (2004) Human Molecular Genetics, 3rd Ed. Garland, London. Chapter 13 covers human genetic mapping. Sturtevant, A. H. (1913) The linear arrangement of six sex-linked factors in Drosophila as shown by mode of association./. Exp. Zool. 14: 39-45. Construction of the first linkage map for the fruit fly. Рестрикционное картирование Hosoda, F., Arai, Y., Kitamura, E., etal. (1997) A complete Not\ restriction map covering the entire long arm of human chromosome 11. Genes Cells 2: 345-357. Ichikawa, H., Hosoda, R, Arai,Y., Shimizu, K., Ohira,M. and Ohki,M. (1993) Not\ restriction map of the entire long arm of human chromosome 21. Nat. Genet. 4: 361-366. JingJ.P., Lai,Z.W., Aston,C., etal. (1999) Optical mapping of Plasmodium falciparum chromosome 2. Genome Res. 9:175-181. Lin, J., Qi, R., Aston, C., et al. (1999) Whole-genome shotgun optical mapping of Deinococcus radiodurans. Science 285:1558-1562. Michalet,X., Ekong, R., Fougerousse, F., et al. (1997) Dynamic molecular combing: stretching the whole human genome for high-resolution studies. Science 277:1518-1523. Zhou, S. G., Kvikstad, E., Kile, A., etal. (2003) Whole-genome shotgun optical mapping of Rhodobactersphaeroides strain 2.4.1 and its use for whole-genome shotgun sequence assembly. Genome Res. 13: 2142-2151. FISH Heiskanen,M., Peltonen,L. and Palotie,A. (1996) Visual mapping by high resolution FISH. Trends Genet 12: 379-382. Lichter, P. (1997) Multicolor FISHing: what's the catch? Trends Genet. 13: 475-479. Romanov, M. N., Daniels, L. M., Dodgson, J. B. and Delany, M. E. (2005) Integration of the cytogenetic and physical maps of chicken chromosome 17. Chromosome Res. 13: 215-222. Describes an application of FISH carried out with ВАС probes.
Глава 3. Картирование геномов 137 Tsuchiya,D. and Taga,M. (2001) Application of fibre-FISH (fluorescence in situ hybridization) to filamentous fungi: visualization of the rRNA gene cluster of the ascomycete Cochliobolus heterostrophus. Microbiology 147:1183-1187. Zelenin, A. V. (2004) Fluorescence in situ hybridization in studying the human genome. Mol. Biol. 38:14-23. Радиационные гибриды Hudson, T.)., Church, D.M., Greenaway, S., et al. (2001) A radiation hybrid map of the mouse genome. Nat. Genet. 29: 201-205. Itoh, T., Watanabe, T., Ihara, N., Mariani, P., Beattie, C. W., Sugimoto, Y. and Takasuga, A. (2005) A comprehensive radiation hybrid map of the bovine genome comprising 5593 loci. Genomics 85: 413-424. McCarthy,L. (1996) Whole genome radiation hybrid mapping. Trends Genet. 12: 491- 493. Walter,M.A., Spillett,D.)., Thomas,P., Weissenbach,), and Goodfellow,P.N. (1994) A method for constructing radiation hybrid maps of whole genomes. Nat. Genet. 7: 22-28.
Глава 4 Секвенирование геномов По прочтении главы 4 вы сможете: • Приводить подробные описания методов секвенирования ДНК с обрывом цепи и в тепловом цикле. • Вкратце описывать методы секвенирования путем химической деградации и пиросеквенирования и обозначать возможности их применения. • Показывать сильные и слабые стороны методов секвенирования геномов, как то: дробовика, дробовика для полных геномов и сборки контигов из клонов. • Описывать, каким образом маленький геном бактерии может быть секвениро- ван методом дробовика (на примере проекта расшифровки генома Haemophilus influenzae). • Указывать различные способы построения сборки контигов из клонов. • Объяснять сущность метода дробовика для секвенирования полных геномов, ставя акцент на мерах, предпринимаемых с целью обеспечения точности по- лучаемой последовательности. • Давать сводку развития проектов расшифровки генома человека вплоть до пу- бликации расшифрованных последовательностей хромосом в 2004-2005 гг. • Обсуждать этические, юридические и социальные вопросы, поднятые в ходе развития проектов расшифровки генома человека. Конечная цель проекта секвенирования генома — полностью расшифрованная по- следовательность ДНК изучаемого организма, в идеале объединенная с генетическими и (или) физическими картами генома, с тем чтобы в пределах последовательности ДНК могли быть найдены гены и другие интересные особенности. Эта глава описывает ме- тоды и стратегии исследования, которые используются отцами проектов расшифровки генома на стадии секвенирования, когда они ставят перед собой именно эту оконча- тельную цель. Центральное место в этом контексте, несомненно, занимают методы секвенирования ДНК, и мы начнем эту главу с подробнейшего изучения методологии секвенирования. От этой методологии, однако, будет мало толку, если получаемые на выходе отдельных экспериментов секвенирования короткие последовательности мы не сможем объединить между собой в правильном порядке и таким образом восстано- вить полные последовательности хромосом, входящих в состав генома. Поэтому вторая часть этой главы описывает стратегии, применяемые с целью обеспечения правильной сборки основной последовательности хромосомы.
Глава 4. Секвенирование геномов 139 4.1. Методология секвенирования ДНК Существует несколько методов секвенирования ДНК, но несравненно более попу- лярный среди них — метод секвенирования с обрывом цепи, впервые изобретенный Фредом Сенгером и его группой в середине 1970-х гг. Секвенирование с обрывом цепи получило превосходство по нескольким причинам, не в последнюю очередь благодаря относительной простоте, с которой этот метод может быть автоматизирован. Как мы увидим далее в этой главе, проект расшифровки генома вовлекает огромное число от- дельных экспериментов секвенирования и на выполнение их всех вручную потребуются многие годы. Поэтому если проект необходимо осуществить за разумный промежуток времени, обязательно нужны автоматизированные методы секвенирования. 4.1.1. Секвенирование ДНК с обрывом цепи Секвенирование ДНК с обрывом цепи основано на том принципе, что молекулы однонитевой ДНК, которые отличаются друг от друга по длине только на один нуклеотид, могут быть разделены между собой посредством электрофореза в полиакриламидном геле (техническое примечание 4.1). Это означает, что возможно разрешать семейство молекул, представляющее весь диапазон длин от 10 до 1500 нуклеотидов, в виде ряда полос в плоском или капиллярном геле (рис. 4.1). Сущность секвенирования с обрывом цепи Исходным материалом для эксперимента секвенирования с обрывом цепи служит препарат из идентичных однонитевых молекул ДНК. Первый шаг — отжечь короткий олигонуклеотид к одной и той же позиции на каждой из этих молекул, причем этот олигонуклеотид после этого выступает затравкой для синтеза новой нити ДНК, кото- рая будет комплементарна матрице (рис. 4.2, а). Реакция синтеза нити, катализируемая ферментом ДНК-полимеразой (см. ниже) и требующая в качестве субстратов четырех дезоксирибонуклеотидтрифосфатов (дНТФ — дАТФ, дЦТФ, дГТФ и дТТФ), обычно про- должается до той стадии, пока не будут полимеризованы несколько тысяч нуклеотидов. В эксперименте секвенирования с обрывом цепи этого не происходит, потому что, наряду Рис. 4.1. Электрофорез в полиакриламидном геле позволяет разрешать молекулы однонитевой ДНК, которые отличаются по длине только на один ну- клеотид. На иллюстрации представлена картина полос, полученная после разделения молекул однонитевой ДНК при помощи электрофореза в денатурирующем плоском полиакриламидном геле. Молекулы были помечены радиоактивной меткой, и полосы были визуализированы посред- ством авторадиографии. В полиакриламидном геле разбег между отдельными молекулами ДНК по мере их миграции к положительному электроду увеличивается. Поэтому полосы, наблюдаемые на авторадиограмме, находятся все дальше друг от друга в сторону основания лесенки. На практике, если электрофорез продолжается достаточно долго, удается разделять молекулы приблизительно до 1500 нуклеотидов в длину (будь это плоский гель или капиллярная система) 50 нуклеотидов 10 нуклеотидов
140 Часть 1. Изучение геномов Техническое примечание 4.1: электрофорез в полиакриламидном геле Разделение молекул ДНК, отличающихся по длине всего лишь на один нуклеотид Электрофорез в полиакриламидном геле используется для исследования семейств молекул ДНК с оборванной цепью, полученных в ходе эксперимента секвенирования. Электрофорез в агарозном геле (техническое примечание 2.2) не может быть использо- ван для этой цели, потому что он не обладает разрешающей способностью, необходимой для разделения однонитевых молекул ДНК, отличающихся по длине только на один нуклеотид. Полиакриламидные гели имеют меньший размер пор, чем агарозные гели, и позволяют точно разделять молекулы длины от 10 до 1 500 п.н. Наряду с секвени- рованием ДНК, полиакриламидные гели используются также и для других целей, где требуется разделение ДНК в крупном масштабе, — например, при изучении размно- жения продуктов экспериментов ПЦР, направленных на локусы микросателлитов, где продукты различных аллелей могут отличаться по размеру только двумя или тремя парами оснований (см. рис. 3.6). Полиакриламидные гели могут быть приготовлены в виде листов между двумя стеклянными пластинами, удерживаемыми на определен- ном расстоянии распорками, или же в виде длинных, тонких колонок, подходящих для капиллярного электрофореза (рис. Т4.1). ПЛИТКА ГЕЛЯ Передняя пластина КАПИЛЛЯРНЫЙ ГЕЛЬ Гель, 0,1 мм в диаметре Капилляр, 50-80 см в длину Рис. Т4.1. Две конфигурации полиакриламидного геля для электрофореза Полиакриламидный гель состоит из линейных цепей мономеров акриламида (CH2=CH-CO-NH2), поперечно связанных единицами Ы,Н'-метиленбисакриламида (CH2=CH-CO-NH-CH2-NH-CO-CH=CH2), последние обычно называют «бис». Раз- мер пор геля определяется как общей концентрацией мономеров (акриламид + бис), так и отношением акриламида к бису. В плитках геля толщины 1 мм, упо- требляемых для секвенирования ДНК, обычно используется 6%-й гель с отно- шением акриламида к бису 19:1, потому что это позволяет получать разрешение однонитевых молекул ДНК в интервале длин от 100 до 750 нуклеотидов. Поэтому на одном листе геля могут быть прочитаны приблизительно 650 нуклеотидов по-
Глава 4. Секвенирование геномов 141 следовательности. Концентрация геля может быть увеличена до 8 %, с тем чтобы считывать последовательность ближе к затравке (разрешая молекулы 50-400 нуклеотидов в длину), или уменьшена до 4%, чтобы считывать более отдаленную последовательность (500-1500 нуклеотидов от затравки). Полимеризация раствора акриламид:бис инициируется персульфатом аммония и катализируется ТЕМЭДом (Ы,М,М',М’-тетраметилэтилендиамином). Гели для секвенирования содержат также мочевину, которая является денатурирующим агентом, который препятствует формированию внутримолекулярных пар оснований в молекулах с оборванной цепью. Это важно, потому что изменение конформации, следующее из спаривания оснований, изменяет скорость миграции однонитевой молекулы, так что теряется строгая зависимость между длиной молекулы и позицией ее полосы, являющаяся определяющим фактором для считывания последовательности ДНК. с четырьмя дезоксинуклеотидами, к реакции в небольших количествах добавляются четыре дидезоксинуклеотидтрифосфата (ддНТФ — ддАТФ, ддЦТФ, ддГТФ и ддТТФ). Каждый из этих дидезоксинуклеотидов бывает помечен отличной от других флюорес- центной меткой. а) Запуск синтеза нити б) Дидезоксинуклеотид О- ОСНОВАНИЕ Затравка 5' з' Матричная ДНК °' °“ i 1.41 и», "0-р—о—р—о з' т т т 5' R R о о 8 й н н * * Позиция, в которой группа -ОН того или иного дНТФ заменена на -Н е) Синтез нити обрывается при включении в нее ддНТФ 1111111'11111ТТТ?ГГГ?х т т т ДДА । ДДА 1 ДДА Семейство «А» Рис. 4.2. Секвенирование ДНК с обрывом цепи, а) Секвенирование с обрывом цепи состоит в синтезе новых нитей ДНК, которые являются комплементарными однонитевой матрице, б) Синтез нити не продолжается неопределенно долго, потому что реакционная смесь содержит маленькие количества каждого из четырех дидезоксинуклеотидов, которые блокируют дальнейшую элонгацию, потому что в них к З'-углероду присоединен водородный атом вместо гидроксильной группы, в) Включение в цепь ддАТФ дает цепи, которые оборваны напротив нуклеотидов Т в матрице. Это производит семейство «А» оборванных молекул. Включение других дидезоксинуклеотидов производит семейства «С», «G» и «Т»
142 Часть 1. Изучение геномов ддА • ддЦ • ддНТФы - каждый с отличной от ддТ ® дцГ • других флюоресцентной меткой Реакции секвенирования, * фракционирование продуктов 1- - - -пддте < -...ДДА< ------гв ....ддГ • I L Система формирования _____ддЦф [ изображения ““ДДЦ® Датчик =» ддГ • Флюоресцентные полосы проходят мимо датчика б) Рис. 4.3. Чтение последовательности, полученной в результате эксперимента с обрывом цепи, а) Каждый дидезоксину- клеотид помечен своим флюорофором. В ходе электрофореза меченые молекулы движутся мимо датчика флюоресценции, который опознает, какой дидезоксину- клеотид присутствует в каждой полосе. Далее информация передается в систему формирования изображения, б) Распе- чатка результатов секвенирования ДНК. Последовательность представлена рядом пиков, по одному для каждой нуклеотид- ной позиции. В этом примере зеленый пик соответствует «А», синий — «С», коричне- вый — «G» и красный — «Т» Фермент полимераза не делает различий между дезокси- и дидезоксинуклеотида- ми, и, будучи включен в цепь, дидезоксинуклеотид блокирует дальнейшую элонгацию нити, потому что у него отсутствует З'-гидроксильная группа, необходимая для обра- зования связи со следующим нуклеотидом (рис. 4.2, б). Поскольку в реакционной смеси присутствуют также и нормальные дезоксинуклеотиды, и притом в больших количе- ствах, чем дидезоксинуклеотиды, синтез нити не всегда заканчивается поблизости от затравки: фактически несколько сотен нуклеотидов могут полимеризоваться прежде, чем дидезоксинуклеотид будет наконец включен в цепь. В результате образуется набор новых молекул различной длины, и каждая из них заканчивается дидезоксинуклеотидом, Встройка ДНК Рекомбинантный вектор на фаге М13 (двунитевая ДНК) Трансфекция в Е. coli Белковая оболочка Сердцевина из ДНК Высвобождение новых фагов Рекомбинантный фаг М13 Однонитевая ДНК Рис. 4.4. Получение однонитевой ДНК путем клонирова- ния в векторе на бактериофаге М13. Векторы на фаге М13 могут быть получены в двух формах: двунитевой реплика- тивной молекулы и однонитевой версии, встречающейся в частицах бактериофага. Репликативной формой можно манипулировать таким же образом, что и плазмидным клонирующим вектором (раздел 2.2.1), притом что новая ДНК встраивается путем рестрикции, сопровождаемой лигированием. Рекомбинантный вектор вводят в клетки Escherichia coli посредством трансфекции. Как толь- ко двунитевой вектор окажется внутри клетки Е. coli, он реплицируется и направляет синтез однонитевых ко- пий, которые упаковываются в фаговые частицы и выде- ляются из клетки. Фаговые частицы могут быть собраны из среды культивирования после ее центрифугирования с целью осаждения бактерий. Белковые оболочки фагов удаляются обработкой фенолом, и однонитевая версия рекомбинантного вектора очищается для использования в секвенировании ДНК
Глава 4. Секвенирование геномов 143 тип которого указывает на нуклеотид — А, С, G или Т, — который присутствует в той же позиции в матричной ДНК (рис. 4.2, в). Чтобы определить поеледовательность ДНК, все, что нужно сделать, — это опознать дидезоксинуклеотид в конце каждой молекулы с оборванной цепью. Именно здесь в игру входит полиакриламидный гель. Смесь ДНК загружают в лунку полиакриламидного плоского геля или в трубку капиллярной гелевой системы и проводят электрофорез с целью разделения молекул по их длине. После разделения молекулы продвигаются мимо датчика флюоресценции, способного различать метки, прикрепленные к диде- зоксинуклеотидам (рис. 4.3, а). Таким образом, датчик определяет, каким нуклеотидом заканчивается каждая проходящая мимо него молекула: А, С, G или Т. Последователь- ность может быть распечатана для изучения оператором (рис. 4.3, б) или введена не- посредственно в запоминающее устройство для последующего анализа. Автоматиче- ские секвенаторы с многочисленными работающими параллельно капиллярами могут считывать до 96 различных последовательностей за двухчасовой период; это означает, что при среднем числе 750 п.н. за отдельный эксперимент 864 тыс. п. н. информации может быть получено на одну машину за один день. Для этого, конечно, требуется кру- глосуточная техническая поддержка, в идеале с помощью робототехнических устройств, применяемых для приготовления реакций секвенирования и загрузки продуктов ре- акции в секвенаторы. Если такой промышленный подход может быть поставлен «на конвейер» и поддерживаться в потоке, то данные, необходимые для секвенирования полного генома, могут быть собраны в течение нескольких недель. Для выполнения секвенирования с обрывом цепи необходима однонитевая ДНК-матрица Матрицей для эксперимента с обрывом цепи служит однонитевая версия молекулы ДНК, предназначенной для секвенирования. Она может быть получена несколькими способами: • ДНК может быть клонирована в плазмидном векторе (раздел 2.2.1). Получающаяся ДНК будет двунитевой и, таким образом, не может быть непосредственно использована в секвенировании. Для этого она должна быть преобразована в однонитевую ДНК по- средством денатурации щелочью или кипения. Этот метод получения матричной ДНК для секвенирования стал общепринятым — в значительной степени благодаря тому, что клонирование в плазмидном векторе является стандартной процедурой. Недоста- ток его состоит в сложности приготовления плазмидной ДНК, не загрязненной малыми количествами бактериальных ДНК и РНК, которые могут оказаться соответственно ложными матрицами или затравками в эксперименте по секвенированию ДНК. • ДНК может быть клонирована в векторе на бактериофаге Ml3. Векторы, основанные на бактериофаге М13, специально разработаны для производства однонитевых матриц для секвенирования ДНК. Бактериофаг М13 имеет геном из однонитевой ДНК, который после инфицирования бактерии Escherichia coli преобразуется в дву- нитевую репликативную форму. Репликативная форма копируется до тех пор, пока в клетке не будут присутствовать более 100 молекул, и когда клетка делится, число копий в новых клетках поддерживается за счет последующей репликации. В то же время зараженные клетки непрерывно выделяют новые частицы фага М13 — при- близительно 1000 за одно поколение, — причем эти фаги содержат однонитевую версию генома (рис. 4.4). Клонирующие векторы, основанные на векторах М13, представляют собой двунитевые молекулы ДНК, эквивалентные репликативной
144 Часть 1. Изучение геномов форме генома бактериофага М13. Ими можно манипулировать в точности таким же образом, что и плазмидным клонирующим вектором. Различие состоит в том, что клетки, которые были подвергнуты трансфекции рекомбинантным вектором М13, выделяют фаговые частицы, содержащие однонитевую ДНК, причем эта ДНК включает в себя векторную молекулу плюс любую дополнительную ДНК, которая была с ней лигирована. Таким образом, фаги поставляют матричную ДНК для секвенирования с обрывом цепи. Единственный недостаток при клонировании в векторе на фаге М13 заключается в том, что фрагменты ДНК длиннее прибли- зительно 3 тыс.п.н. претерпевают удаления и перестройки, так что такая схема может быть применима только с короткими частями ДНК. • ДНК может быть клонирована в фагмиде. Это плазмидный клонирующий вектор, который содержит в дополнение к своей плазмидной области инициации данную область от фага М13 или любого другого бактериофага с геномом из одноните- вой ДНК. Если клетка Е. coli содержит и фагмиду, и репликативную форму фага- помощника, причем последний несет гены ферментов репликации фага и белков капсида, то область инициации фага в фагмиде становится активированной, что приводит к синтезу фаговых частиц, содержащих однонитевую версию этой фаг- миды. Двунитевая плазмидная ДНК тем самым преобразуется в однонитевую матричную ДНК для секвенирования ДНК. Эта система избегает неустойчивости клонирования в векторе на фаге М13 и может быть использована с фрагментами длиной до 10 тыс.п.н. и более. ДНК-полимеразы для секвенирования с обрывом цепи Любая направляемая матрицей ДНК-полимераза способна продолжать затравку, отожженную к однонитевой молекуле ДНК, но не все полимеразы делают это таким об- разом, который был бы пригоден для секвенирования ДНК. Фермент для секвенирования должен удовлетворять в особенности трем следующим критериям. • Высокая обрабатывающая способность (процессивность). Эта характеристика относится к длине полинуклеотида, который синтезируется полимеразой прежде, чем она заканчивает синтез в силу естественных причин. Подходящая для секве- нирования полимераза должна иметь высокую процессивность, — так чтобы она не отделялась от матрицы до включения в новую нить дидезоксинуклеотида. • Незначительное или нулевое действие экзонуклеазы 5’->3'. Большинство ДНК- полимераз обладают также действием экзонуклеаз, сие же означает, что, наряду с синтезом полинуклеотидов ДНК, они могут также и расщеплять их (раздел 2.1.1; см. рис. 2.7). В секвенировании ДНК это недостаток, потому что удаление нуклео- тидов с 5'-концов новосинтезируемых нитей изменяет длины этих нитей, делая невозможным достоверное определение последовательности. • Пренебрежимо малое или нулевое действие экзонуклеазы 3'—>5’. Также желательно, чтобы полимераза не удаляла дидезоксинуклеотид на конце законченной нити. Если это случается, то такая нить может быть продолжена далее. В конечном ре- зультате в реакционной смеси будет содержаться небольшое число коротких нитей, и последовательность вблизи от затравки будет нечитабельна. Эти требования строгие и полностью не выполняются никакой встречающейся в природе ДНК-полимеразой. Вместо них обычно применяются искусственно видо- измененные ферменты. Первым из таких ферментов была разработана полимераза Клёнова, которая является версией ДНК-полимеразы I Escherichia coli, у которой было
Глава 4. Секвенирование геномов 145 устранено действие экзонуклеазы 5'—>3', присущее стандартному ферменту или пу- тем расщепления соответствующей части белка, или средствами генной инженерии (раздел 2.1.1). Полимераза Клёнова обладает относительно низкой процессивностью, что ограничивает длину последовательности, которая может быть получена в одном эксперименте, приблизительно до 250 п. н., и приводит к получению в реакции секвени- рования неспецифических продуктов — нитей, которые были оборваны естественным образом, а не из-за включения в них дидезоксинуклеотида. Поэтому фермент Клёнова был заменен видоизмененной версией ДНК-полимеразы, кодируемой бактериофагом Т7 (этот фермент известен под торговым названием «секвеназа»). Секвеназа имеет высокую процессивность, не проявляет действие экзонуклеазы и обладает прочими желательными свойствами, такими как высокая скорость протекания реакции. Затравка определяет область ДНК-матрицы, которая будет секвенирована Чтобы начать эксперимент по секвенированию с обрывом цепи, олигонуклеотидная затравка отжигается на ДНК-матрицу. Затравка необходима, потому что направляемые матрицей ДНК-полимеразы не могут начать синтез ДНК на молекуле, которая является полностью однонитевой: на ней должна быть короткая двунитевая область, могущая предоставить свой З'-конец, к которому фермент может добавлять новые нуклеотиды (раздел 2.1.1). Затравка играет ключевую роль также и в определении области матричной моле- кулы, которая будет секвенирована. Для большинства экспериментов секвенирования используется «универсальная» затравка, то есть такая, которая является комплемен- тарной части векторной ДНК, непосредственно смежной с точкой, к которой лигиро- вана новая ДНК (рис. 4.5, а). Поэтому одна и та же универсальная затравка может дать последовательность любой части ДНК, которая была лигирована в вектор. Конечно же, если такая встроенная ДНК будет длиннее 750 п.н. или около того, то только часть ее последовательности будет получена, но обычно такой проблемы не возникает, потому что проект в целом всего-навсего требует, чтобы было произведено большое число а) Универсальная затравка Затравка Векторная ДНК Вставка ДНК Векторная ДНК б) Внутренние затравки м Универсальная затравка Внутренняя затравка Рис. 4.5. Затравки разного типа для секвенирования с обрывом цепи, о) Универсальная затравка отжи- гается к векторной ДНК, прилегающей к позиции, в которой вставлена новая ДНК. Поэтому одиночная универсальная затравка может использоваться для секвенирования любой вставки ДНК, но обеспечи- вает только последовательность одного конца вставки, б) Один из способов получения более длинной последовательности — выполнить серию экспериментов с обрывом цепи, каждый с новой, отличной от других, внутренней затравкой, отжигаемой ко внутренним позициям вставки ДНК
146 Часть 1. Изучение геномов коротких последовательностей и впоследствии собрано в непрерывную основную по- следовательность. Неважно, будут ли эти короткие последовательности полными или только частичными последовательностями фрагментов ДНК, используемых в качестве матриц. Если в качестве матричного материала используется двунитевая ДНК плазми- ды, то при необходимости можно прочитать последовательности (в большем объеме) с противоположного конца вставки. В качестве альтернативы можно продолжить по- следовательность в одном направлении, синтезировав неуниверсальную внутреннюю затравку, предназначенную для отжига в позиции, находящейся внутри вставки ДНК (рис. 4.5, б). Эксперимент с такой затравкой даст вторую короткую последовател ьность, которая перекрывается с предыдущей. Секвенирование в тепловом цикле предлагает альтернативу традиционной методологии Открытие термостабильных ДНК-полимераз, которые привели к развитию ПЦР (разделы 2.1.1 и 2.3), дало также и новые методы секвенирования с обрывом цепи. В частности, новшество, называемое секвенированием в тепловом цикле, имеет два преимущества перед традиционным секвенированием с обрывом цепи. Во-первых, в нем в качестве исходного материала употребляется двунитевая, а не однонитевая ДНК. Во- вторых, требуется очень мало матричной ДНК, так что нет необходимости клонировать ДНК перед ее секвенированием. Секвенирование в тепловом цикле проводят подобным же образом, что и ПЦР, но используется только одна затравка и реакционная смесь включает четыре дидезокси- нуклеотида (рис. 4.6). Поскольку наличествует только одна затравка, копируется только одна из нитей исходной молекулы и продукт накопляется по линейному закону, а не по экспоненте, как это имеет место в настоящей ПЦР. Присутствие в реакционной смеси дидезоксинуклеотидов вызывает обрыв цепи, как и в стандартной процедуре, и семей- ство полученных нитей может быть проанализировано, а последовательность — считана обычным способом. 4.1.2. Альтернативные методы секвенирования ДНК Хотя по большей части секвенирование выполняют методом обрыва цепи, из- вестны и другие методы, приберегаемые для специальных случаев. Мы изучим два из таких альтернативных методов: метод химической деградации, который, подобно секвенированию с обрывом цепи, был изобретен в 1970-х гг., и пиросеквениро- вание, которое является более молодым изобретением. ДНК-матрица —ДДА Нити с обрывом цепи - их число эт при выполнении большего числа циклов ДДА ДДА ддАТФ ПЦР с одной-единственной затравкой Рис. 4.6. Секвенирование в тепловом цикле. ПЦР выполняется только с одной затравкой и с че- тырьмя дидезоксинуклеотидами, находящимися в реакционной смеси. В результате получается набор нитей с обрывом цепи — семейство «А» в части реакции, показанной здесь. Эти нити, на- ряду с продуктами реакций на С, G и Т, подвер- гаются электрофорезу посредством стандартной методологии (см. рис. 4.3)
Глава 4. Секвенирование геномов 147 Синтез нити заблокирован ДНК-матрица Стебле-петельная структура Рис. 4.7. Внутринитевое спаривание оснований может затруднять секвенирование с обрывом цепи. В этом примере ДНК-матрица мо- жет образовывать стебле-петельную структуру, потому что ее по- следовательность допускает образование ряда внутринитевых пар оснований. Такая стебле-петельная структура блокирует продвижение ДНК-полимеразы, что приводит к неспецифическому обрыву цепи Секвенирование путем химической деградации Одно из ограничений секвенирования с обрывом цепи заключается в том, что с его помощью может оказаться невозможным получить точную последовательность, если матричная ДНК способна образовывать внутринитевые пары оснований (рис. 4.7). Внутринитевые пары основа- ний могут блокировать продвижение ДНК-полимеразы, сокращая тем самым протяженность синтезируемой нити, и могут изменить также и подвижность молекул с обо- рванной цепью в ходе электрофореза, а это означает, что порядок прохождения молекул мимо датчика более не будет определяться исключи- тельно их длиной. Внутринитевые пары оснований не препятствуют секвенированию путем химической деградации, так что этот метод может быть использован в качестве альтернативы, когда возникают такие проблемы. Метод химической деградации подобен секвенированию с обрывом цепи в том, что последовательность определяется путем установления длины молекул, конечный нуклеотид которых известен. Однако эти молекулы производятся абсолютно иным об- разом — путем обработки химикалиями, которые специфично разрезают их в позиции заданного нуклеотида. Это означает, что необходимо выполнять по крайней мере четыре отдельные реакции секвенирования — по одной для каждого нуклеотида. Исходный материал представлен двунитевой ДНК, которая сначала метится при- креплением группы радиоактивного фосфора к 5’-концу каждой нити (рис. 4.8, а). После этого добавляется ДМСО (диметилсульфоксид) и ДНК нагревается до 90 °C. Это разрушает пары оснований, образованные между нитями и позволяет отделять их друг от друга при помощи гель-электрофореза; это возможно благодаря тому, что одна из нитей, вероятно, содержит больше пуриновых нуклеотидов, чем другая, и поэтому немного тяжелее и, следовательно, в ходе электрофореза перемещается медленнее. Одна нить очищается от геля и разделяется на четыре образца, каждый из которых обраба- тывают одним из расщепляющих реактивов. Чтобы иллюстрировать данную процедуру, мы проследим за ходом реакции «G» (рис. 4.8, б). Сначала молекул ы обрабатывают диме- тилсульфатом, в результате чего метильная группа прикрепляется к пуриновому кольцу нуклеотидов G. Добавляется только ограниченное количество диметил сульфата, чтобы изменить в среднем только один остаток G на один полинуклеотид. На этой стадии нити ДНК все еще целостны: расщепление не происходит до момента добавления второго химиката — пиперидина. Пиперидин удаляет видоизмененное пуриновое кольцо и раз- резает молекулу ДНК в фосфодиэфирной связи, находящейся непосредственно выше новосозданного участка без основания. В результате мы получаем набор расщепленных молекул ДНК, одни из которых помечены, а другие — нет. У всех помеченных молекул один конец одинаковый, а другой конец определяется участками разрезания, при этом последние указывают позиции нуклеотидов G в молекулах ДНК, которые были расще- плены. Подобные же подходы используются и для получения дополнительных семейств
148 Часть 1. Изучение геномов а) Мечение ДНК и разъединение нитей Тяжелая Легкая Т w Меченый 5 -конец | ДМСО, 90 °C I Электрофорез * в агарозном геле Очистка одной —' из нитей б) Реакция «G» Молекула для секвенирования (множество копий) | Диметилсульфат Me , ,7,, с Me *111111111 1г Me I Пиперидин •n i । ii 11 i 111* *? rrt. mW ^^тгтттттттт? * 11 ii 11111 m в) Считывание последовательности с авторадиограммы G A+G С C+T Рис. 4.8. Секвенирование путем химической деградации расщепленных молекул, хотя обычно это не просто семейства «А», «Т» и «С», так как при разработке способов химической обработки, позволяющей специфично разрезать цепи полинуклеотидов в позициях А или Т, возникли проблемы. Поэтому четыре выполняе- мых реакции обычно представлены набором «G», «А + G», «С» и «С + Т». Это усложняет процедуру, но не влияет на точность определяемой последовательности. Семейство молекул, произведенных в каждой реакции, загружается на дорожку полиакриламидного плоского геля и после электрофореза позиции полос в геле ви- зуализируются авторадиографией (см. техническое примечание 2.1). Полоса, которая продвинулась наиболее далеко, представляет наименьший кусок ДНК. В примере, пред- ставленном на рис. 4.8, в, эта полоса находится на дорожке «А + G». Поскольку на дорожке «G» не имеется полосы, соответствующей такому же размеру, первый нуклеотид в по- следовательности — «А». Следующая размерная позиция занята двумя полосами — одна на дорожке «С», а другая на дорожке «С + Т»; поэтому второй нуклеотид — «С» и последовательность на данный момент — «АС». Считывание последовательности может быть продолжено подобным же образом вплоть до области геля, где отдельные полосы не были разделены. Пиросеквенирование применяется для быстрого определения очень корот- ких последовательностей Пиросеквенирование не требует электрофореза или любой другой процедуры разделения фрагментов и, таким образом, работает быстрее и секвенирования с об- рывом цепи, и секвенирования путем химической деградации. Оно позволяет получить лишь несколько десятков п.н. за один эксперимент1), но становится важным методом в ситуациях, где требуется определить большое число коротких последовательностей как можно быстрее, например при типизации SNP (раздел 3.2.2). При пиросеквенировании матрица копируется прямым способом без добавленных дидезоксинуклеотидов. В то время как строится новая нить, порядок, в котором дезокси- Современные приборы позволяют читать порядка 400 нуклеотидов. Кроме того, в настоящее время активно используются другие приборы массового параллельного секвенирования, использующие иные принципы. В стадии разработки и испытаний находится ряд технологий, позволяющих секвенировать ин- дивидуальные молекулы. — Прим. ред.
Глава 4. Секвенирование геномов 149 нуклеотиды встраиваются в нее, устанавливается датчиком, так что последовательность может «считываться» прямо в ходе реакции. Добавление дезоксинуклеотида к концу растущей нити обнаружимо, потому что оно сопровождается высвобождением молекулы пирофосфата, каковое событие может быть преобразовано ферментом сульфурилазой во вспышку хемилюминесценции. Конечно, если бы все четыре дезоксинуклеотида добавлялись одновременно, то вспышки света были бы заметны все время и никакой полезной информации о последовательности не было бы получено. Поэтому каждый из дезоксинуклеотидов добавляется по отдельности, один за другим, причем в реакционной смеси присутствует также фермент нуклеотидаза, с тем чтобы быстро осуществлять деградацию введенного дезоксинуклеотида, если он не был включен в полинуклеотид прежде, чем будет добавлен следующий (рис. 4.9). Такая процедура позволяет отслежи- вать порядок, в котором дезоксинуклеотиды встраиваются в наращиваемую нить. Судя по описанию, этот метод представляется очень сложным, но для его осуществления всего лишь необходимо последовательно добавлять в реакционную смесь реагенты, то есть выполнять именно ту процедуру, которая легко может быть автоматизирована. Обнаружение хемилюминесценции очень чувствительно, так что каждая реакция мо- жет проводиться в очень малом объеме — возможно, только в одном пиколитре. Это означает, что на пластинке площадью 6,4 см2 параллельно может быть выполнено до 1,6 миллиона реакций, что позволяет получить за четыре часа 25 миллионов нуклеотидов последовательности, — такая скорость расшифровки последовательности приблизи- тельно в 100 раз быстрее, чем позволяет достичь метод обрыва цепи. Затравка IIIIIIIIIIIIIIII Матрица дАТФ деградирует дТТф —► деградирует дГТФ f хемилюминесценция + дЦТФ —► деградирует + дАТФ I хемилюминесценция + iGA IlliHillllllilfi Рис. 4.9. Пиросеквенирование. Реакция синтеза нити выполняется при отсутствии дидезокси нуклеоти- дов. Каждый дезоксинуклеотид добавляется индивидуально, совместно с ферментом нуклеотидазой, который деградирует дезоксинуклеотид, если он не встроен в синтезируемую нить. Встраивание обна- руживается вспышкой хемилюминесценции, вызванной пирофосфатом, высвобожденным из дезок- синуклеотида. Порядок, в котором дезокси нуклеотиды добавляются к наращиваемой нити, поэтому может быть отслежен
150 Часть 1. Изучение геномов 4.2. Сборка непрерывной последовательности ДНК Следующий вопрос, к которому необходимо обратиться, — как основная последо- вател ьность хромосомы, возможно, несколько десятков млн п. н. в длину, может быть со- брана из множества коротких последовательностей, полученных в ходе секвенирования с обрывом цепи. Мы обращались к этой проблеме в начале главы 3 и установили, что относительно короткие геномы прокариотов могут быть собраны методом дробовика, который состоит в разрушении молекулы ДНК на фрагменты, определении последо- вательности каждого из них и поиске (с использованием компьютера) перекрытий, по которым строится основная последовательность (см. рис. 3.1 и раздел 4.2.1). Этот подход к настоящему времени был успешно применен к более чем 200 геномам прокариотов, но если его применить к большим геномам эукариотов, он может привести к ошибкам, — главным образом из-за того, что присутствие повторных последовательностей в геномах эукариотов усложняет поиск перекрытий последовательности и может в результате дать неправильно собранные сегменты генома (см. рис. 3.2). Чтобы избежать таких ошибок, применяют подход, упоминаемый как метод дробовика для полных геномов, который опирается на карту как на вспомогательное средство сборки основной последователь- ности (см. рис. 3.3 и раздел 4.2.3). Секвенирование методом дробовика для полных геномов было продуктивно использовано с несколькими геномами эукариотов, в том числе с геномами плодовой мушки и человека, но, согласно оценкам многих специали- стов, наибольшая степень точности может быть достигнута методом сборки контигов из клонов. В этом подходе до начала секвенирования геном разбивается на сегменты с известными позициями на карте этого генома (см. рис. 3.3 и раздел 4.2.2). Для начала мы посмотрим, как метод дробовика применялся к геномам прокариотов. 4.2.1. Сборка последовательности методом дробовика Прямой подход к сборке последовательности состоит в том, чтобы создать полную последовательность непосредственно из коротких фрагментов, полученных в результате индивидуальных экспериментов секвенирования, — путем простого поиска возможных наложений этих фрагментов (см. рис. 3.1). Это называют методом дробовика. Метод не требует никакого предварительного знания генома, и сборка может быть выполнена при отсутствии генетической или физической карты. Перспективность метода дробовика была доказана успешной расшифров- кой последовательности Haemophilus influenzae В первой половине 1990-х гг. шли серьезные дебаты о том, будет ли метод дробовика работать на практике, при этом многие молекулярные биологи придерживались того мнения, что объем обработки данных, необходимый для сравнения всех минипоследо- вательностей и распознавания перекрытий, даже в случае наименьших геномов был бы за пределами возможностей существующих компьютерных систем. Этим сомнениям был положен конец в 1995 г., когда была опубликована последовательность генома бактерии Haemophilus influenzae размером 1 830 тыс. п. н. Геном Н. influenzae был секвенирован всецело методом дробовика, причем без обра- щения к какой-либо информации с генетической или физической карты. Стратегия, при- менявшаяся для получения этой последовательности, показана на рис. 4.10. Первый шаг состоял в раздроблении геномной ДНК на фрагменты путем разрушения ультразвуком — этот метод основан на использовании высокочастотных звуковых волн для произведения случайных разрезов в молекулах ДНК. Затем фрагменты были подвергнуты электрофорезу,
Глава 4. Секвенирование геномов 151 Рис. 4.10. Схема применения метода дробовика при определении последовательности ДНК гено- ма Haemophilus influenzae. ДНКН. influenzae была разрушена ультразвуком, и фрагменты размером от 1,6 до 2,0 тыс. п. н. были очищены от агарозного геля и лигированы в плазмидный вектор, чтобы произвести библиотеку клонов. Были получены конечные последовательности клонов, взятых из этой библиотеки, и с помощью компьютера распознаны перекрытия между этими последо- вательностями. В результате было получено 140 контигов, которые были собраны в полную после- довательность генома, как показано на рис. 4.11 и попавшие в размерный диапазон 1,6-2,0 тыс. п. н. были очищены от агарозного геля и лигированы в плазмидный вектор. Из по- лученной библиотеки были взяты наугад 19 687 клонов и было выполнено 28 643 экспериментов секвенирования; число экспериментов секвенирования превыша- Q Haemophilus influenzae | Извлечение ДНК ^^|Ргк5рушение ультразвуком .ZrZJTLTZ- Фрагменты ДНК “ZLZ" -ZTZ7 различных размеров 1 Электрофорез в агарозном геле ДОРОЖКА 1: Разрушенная ультразвуком ДНК Н. influenzae ДОРОЖКА 2: ДНК-маркёры 1 2 ’I Очистка ДНК от геля —3— — Фрагменты ДНК - 1,6-2,0 тыс. п. н. | Приготовление библиотеки клонов ет число плазмид, потому что у некоторых вставок были секвенированы оба конца. Из этих экспериментов секвенирования 16 % были сочтены неудачными, потому что они дали менее 400 п.н. последовательности. Оставшиеся 24304 последовательности в общей сложности дали 11631485 п.н., что соответствует шести длинам генома Н. influenzae; такая степень избыточности была сочтена необходимой для гарантии полного покрытия. Сборка последователь- ности потребовала 30 часов на компьютере I Получение конечных * последовательностей встроек ДНК 7 Конечные последовательности । Построение последовательности ♦ контига с объемом оперативной памяти (ОЗУ) 512 Мб и дала 140 длинных непрерывных последо- вательностей, при этом каждая из таких последовательностей1^ представляла отдельную неперекрывающуюся часть генома. Следующим шагом было соединение пар контигов, для чего надо было прочитать последовательности между контигами (рис. 4.11). Сначала была проверена библиоте- ка, с тем чтобы увидеть, имеются ли в ней какие-либо клоны, в которых две конечные последовательности были бы расположены в разных контигах. Если такой клон будет идентифицирован, то дополнительное секвенирование его вставки закроет «кодовый пропуск» между этими двумя контигами (рис. 4.11, а). Фактически было обнаружено 99 клонов этой категории, так что 99 из всех пропусков могли быть закрыты без особых затруднений. В конечном итоге осталось 42 зияющих пропуска, состоявших, по всей вероятно- сти, из последовательностей ДНК, которые были неустойчивы в клонирующем векторе ^Такая последовательность называется контигом. — Прим. ред.
152 Часть 1. Изучение геномов а) Заполнение «кодового пропуска» 1 2 м Клонированный фрагмент < ДНК (заполняет пропуск) контиги последовательности Завершение расшифровки I последовательности при помощи внутренних затравок б) Заполнение «физического пропуска» 1 2 3 И Т. Д. — олигонуклеотиды ВЫВОД: контиги 1 и 4 являются смежными Рис. 4.11. Сборка последовательности полного генома Haemophilus influenzae путем заполнения про- пусков между отдельными контигами последовательности, а) «Кодовые пропуски» таковы, что могут быть заполнены дальнейшим секвенированием клонов, уже имеющихся в библиотеке. В данном при- мере концы последовательностей контигов 1 и 2 лежат в пределах одного и того же плазмидного клона, так что дальнейшее секвенирование этой вставки ДНК со внутренними затравками (см. рис. 4.5, б) даст последовательность для заполнения этого пропуска, б) «Физические пропуски» — это отрезки последовательности, которые не присутствуют в библиотеке клонов, вероятно, потому, что эти области неустойчивы в используемом клонирующем векторе. Показаны две стратегии заполнения таких про- пусков. Слева вторая библиотека клонов, приготовленная с помощью вектора на бактериофаге X вместо плазмидного вектора, зондируется олигонуклеотидами, соответствующими концам контигов. Оба оли- гонуклеотида — 1 и 7 — гибридизируются к одному и тому же клону, вставка которого должна поэтому содержать ДНК, заполняющую пропуск между контигами 1 и 4. Справа эксперименты ПЦР выполнены с парами олигонуклеотидов. Только номера 1 и 7 дают продукт ПЦР, подтверждая, что концы контигов, представленные этими двумя олигонуклеотидами, находятся близко друг к другу в геноме. Для запол- нения пропуска между контигами 1 и 4 могут быть секвенированы продукт ПЦР или вставка из клона на бактериофаге X
Глава 4. Секвенирование геномов 153 и поэтому отсутствовали в библиотеке. Для того чтобы закрыть такие «физические пропуски», была приготовлена вторая библиотека клонов, причем на этот раз с примене- нием вектора иного типа. Вместо того чтобы использовать другую плазмиду, в которой неклонированные последовательности, скорее всего, по-прежнему будут неустойчивы, вторая библиотека была приготовлена в векторе на бактериофаге X (раздел 2.2.1). Эта новая библиотека была прозондирована 84-мя олигонуклеотидами, по одному, причем эти 84 олигонуклеотида имели последовательности, идентичные последовательностям на концах несцепленных контигов (рис. 4.11, б). Разумное объяснение таково: если два олигонуклеотида гибридизировались с одним и тем же Х-клоном, то концы контигов, из которых они были получены, должны лежать в пределах этого клона, и поэтому секвенирование ДНК Х-клона заполнит пропуск. Таким способом были заполнены 23 из 42 физических пропусков. Вторая стратегия закрытия пропусков состояла в том, чтобы использовать пары олигонуклеотидов из 84-олигонуклеотидного набора, описанного выше, в качестве затравок для экспериментов ПЦР геномной ДНК Н. influenzae. Некоторые олигону- клеотидные пары были отобраны наугад, и те, которые заполняют пропуск, были идентифицированы попросту на основании того, дают ли они продукт ПЦР или нет (см. рис. 4.11, б). Секвенирование этих продуктов ПЦР закрыло соответствующие пропуски. Другие пары затравок были выбраны на более рациональном основании. Например, олигонуклеотиды были использованы как зонды для гибридизации по Саузерну (см. рис. 2.11) с ДНК Н. influenzae, разрезанной разнообразными эндонуклеазами рестрик- ции, и были идентифицированы пары, которые гибридизировались после обработки подобными наборами фрагментов рестрикции. Два члена пары олигонуклеотидов, опознанных таким способом, должны содержаться в пределах одних и тех же фрагмен- тов рестрикции и, таким образом, с большой вероятностью лежат близко друг к другу в геноме. Это означает, что пара контигов, из которых получены олигонуклеотиды, смежна, и пропуск между этими контигами может быть заполнен по результатам ПЦР геномной ДНК, в которой в качестве затравок, обеспечивающих ДНК-матрицу для за- крытия пропуска, используются эти два олигонуклеотида. Демонстрация того факта, что маленький геном может быть секвенирован относи- тельно быстро методом дробовика, привела к внезапному изобилию расшифрованных геномов микробов. Эти проекты продемонстрировали, что секвенирование методом дробовика может быть поставлено по типу поточной линии, где каждый член команды имел бы свою индивидуальную задачу, состоящую, скажем, в приготовлении ДНК, в вы- полнении реакций секвенирования или в проведении анализа данных. Эта стратегия позволила секвенировать геном Micoplasmagenitalium из 580 тыс.п.н. с привлечением пяти сотрудников всего лишь за восемь недель, и теперь все признают, что несколько месяцев были бы вполне достаточным сроком, чтобы произвести полную последова- тельность любого генома размером не более 5 млнп.н., даже если ничего не известно о геноме до начала проекта. Итак, сильные стороны метода дробовика — его скорость и способность работать в отсутствие генетической или физической карты. 4.2.2. Сборка последовательностей методом сборки контигов из клонов Метод сборки контигов из клонов рассматривается как обычный метод получе- ния последовательности генома эукариотов, и он также применялся с теми геномами микробов, которые были до того картированы генетическими и (или) физическими средствами. Согласно методу сборки контигов из клонов геном разбивается на фраг-
154 Часть 1. Изучение геномов менты до 1,5 млн п. н. в длину обычно посредством неполной рестрикции (раздел 3.3.1), и эти фрагменты клонируются в векторе высокой емкости типа ВАС (раздел 2.2.1). Сборка контигов из клонов выстраивается путем опознавания клонов, содержащих пере- крывающиеся фрагменты, которые после того по отдельности секвенируют методом дробовика. В идеале клонированные фрагменты помещают на генетическую и (или) физическую карту генома, с тем чтобы данные последовательности контигов могли быть проверены и интерпретированы путем отыскания особенностей (например, STS, SSLP, гены), о которых известно, что они присутствуют в определенной области. Сборки контигов из клонов могут быть построены путем обхода хромосо- мы, но этот метод весьма трудоемок Простейший способ построить ряд перекрывающихся клонированных фрагментов ДНК состоит в том, чтобы начать с одного клона из библиотеки, засим опознать второй клон, вставка которого перекрывается со вставкой в первом клоне, затем опознать третий клон, вставка которого перекрывается с таковой во втором клоне, и так далее. Это основа метода обхода хромосомы, который был первым методом, изобретенным для сборки контигов из клонов. Первоначально обход хромосомы использовался, чтобы продвигаться по молекулам ДНК на относительно короткие расстояния, используя библиотеки клонов, приготов- ленные с помощью векторов на бактериофаге X или космидных векторов. Наиболее прямой подход состоит в том, чтобы использовать ДНК вставки из исходного клона в качестве гибридизирующего зонда, с тем чтобы перебрать все остальные клоны в библиотеке. Клоны, вставки которых перекрываются с зондом, дают положительные сигналы скрещивания, и их вставки могут быть использованы в качестве новых зондов, чтобы продолжить обход (рис. 4.12). Главная проблема, которая возникает при осуществлении этого подхода, состоит в том, что если зонд содержит повторную последовательность, то он будет гибриди- зироваться не только с перекрывающимися клонами, но также и с неперекрывающи- мися клонами, вставки которых содержат копии этого повторения. Степень такой не- специфической гибридизации может быть уменьшена путем блокирования повторных последовательностей предварительной гибридизацией с непомеченной геномной ДНК (см. рис. 3.34), но это полностью не решает проблему, особенно если обход выполняется с длинными вставками из вектора высокой емкости типа ВАС. По этой причине неповреж- денные вставки редко используются для обходов хромосом с ДНК человека и подобными ДНК, которые имеют высокую частотность повторных последовательностей. Вместо этого в качестве зонда используется фрагмент с конца вставки, ибо меньше шансов встретить повторение в коротком концевом фрагменте, чем во всей вставке в целом. Если требуется полная уверенность, то концевой фрагмент может быть секвенирован перед его использованием, с тем чтобы убедиться в том, что никакой повторной ДНК в нем не присутствует. Если концевой фрагмент был секвенирован, то обход может быть ускорен за счет применения для опознавания клонов с перекрывающимися вставками ПЦР, а не гибри- дизации. Затравки конструируют из последовательности конечного фрагмента и исполь- зуют в предпринятых экспериментах ПЦР со всеми другими клонами из библиотеки. Клон, который дает продукт ПЦР правильного размера, должен содержать перекры- вающуюся вставку (рис. 4.13). Чтобы ускорить процесс еще больше, вместо того чтобы выполнять ПЦР с каждым отдельным клоном, группы клонов смешивают вместе таким образом, чтобы однозначная идентификация перекрывающихся вставок могла быть
Глава 4. Секвенирование геномов 155 осуществлена наверняка. Данный метод иллюстрирован на рис. 4.14; в предложенном примере библиотека из 960 клонов была приготовлена в десяти лотках микротитра, где каждый лоток содержит 96 лунок в виде массива 8x12, по одному клону на лунку. Эксперименты ПЦР выполняют следующим образом. • Образцы каждого клона в ряду А первого лотка микротитра смешиваются вместе и выполняется одна ПЦР. Это повторяют для каждого ряда каждого лотка — всего 80 экспериментов ПЦР. • Образцы каждого клона в столбце 1 первого лотка микротитра смешиваются вместе и выполняется одна ПЦР. Это повторяют для каждого столбца каждого лотка — всего 120 экспериментов ПЦР. • Клоны из лунки А1 каждого из десяти лотков микротитра смешиваются вместе и выполняется одна ПЦР. Это повторяют для каждой лунки — всего 96 экспери- ментов ПЦР. Шаг 1 Шаг 2 1 J 3 4 5 в 7 I 9 10 11 12 Зонд: вставка из клона А1 Положительные сигналы: клоны А1, Е7 и F6 Зонд: вставка из клона F6 Положительные сигналы: клоны А1, В12 и F6 А1 Е7 F6 Рис. 4.12. Обход хромосомы. Библиотека включает 96 клонов, каждый из которых содержит свою, отличную от других, вставку. Чтобы начать обход, вставка из одного из клонов используется как ги- бридизирующий зонд относительно всех других клонов в библиотеке. В показанном примере зондом является клон А1; он гибридизируется сам с собой и с клонами Е7 и F6. Поэтому вставки из последних двух клонов должны перекрываться со вставкой из клона А1. Чтобы продолжить обход, зондирование повторяется, но на сей раз со вставкой из клона F6. Гибридизация клонов Al, F6 и В12 показывает, что вставка из клона В12 перекрывается со вставкой из клона F6 Вставка № 1 Олигонуклеотиды ВЫВОД: вставки 1 и 15 перекрываются Рис. 4.13. Обход хромосомы с помощью ПЦР. Два олигонуклеотида отжигаются в пределах конечной об- ласти вставки номер 1. Они используются в экспериментах ПЦР со всеми другими клонами из библиотеки. Только клон 15 дает продукт ПЦР, показывая, что вставки в клонах 1 и 15 перекрываются. Обход можно продолжить секвенированием фрагмента с другого конца клона 15, конструированием второй пары оли- гонуклеотидов и использованием их в новой серии экспериментов ПЦР со всеми прочими клонами
156 Часть 1. Изучение геномов Столбец , 2 3 4 5 6 7 8 9 10 11 12 Смешивание, Смешивание с лунками А1 из Смешивание, ПЦР Повтор по всем рядам на всех 10-ти лотках = 80 экспериментов ПЦР Повтор по всем столбцам на всех 10-ти лотках = 120 экспериментов ПЦР Повтор по всем лункам = 96 экспериментов ПЦР ОБЩЕЕ ЧИСЛО ЭКСПЕРИМЕНТОВ ПЦР = 296 Рис. 4.14. Комбинаторный отбор клонов на лотках микротитра. В этом примере библиотека из 960 клонов должна быть просмотрена с помощью ПЦР. Вместо того чтобы выполнять 960 отдельных экспериментов ПЦР, клоны группируют, как показано, и выполняется только 296 экспериментов ПЦР. В большинстве случаев результаты позволяют однозначно опознавать «положительные» клоны. Фактически, если положительных клонов немного, то иногда их можно опознать посредством всего лишь только экспе- риментов ПЦР «по ряду» и «по столбцу». Например, если положительные эксперименты ПЦР получены с рядом А лотка 2, рядом D лотка 6, столбцом 7 лотка 2 и столбцом 9 лотка 6, то можно заключить, что есть два положительных клона: один в лунке А7 лотка 2 и второй в лунке D9 лотка 6. Эксперименты ПЦР «по лункам» необходимы в том случае, если в одном и том же лотке обнаруживается два и более положительных клона Как объяснено в подписи к рис. 4.14, эти 296 экспериментов ПЦР обеспечивают достаточно информации, чтобы определить, которые из 960 клонов дают продукты, а которые — не дают. Неоднозначность возникает, только если число клонов, дающих положительный результат, велико. Более быстрые методы сборки контигов из клонов Даже когда шаг отбора выполняется при помощи комбинаторного подхода с при- влечением ПЦР, показанного на рис. 4.14, обход хромосомы оказывается медленным процессом и редко позволяет собрать контиги более чем из 15-20 клонов. Эта процедура была чрезвычайно ценна в позиционном клонировании, где цель состоит в том, чтобы пройти от нанесенного на карту участка до интересующего гена, о котором заранее из- вестно, что он расположен на расстоянии не более нескольких млн п. н. Он оказался менее ценен для сборки контигов из клонов по полным геномам, особенно в случае сложных геномов высших эукариотов. Так какие же альтернативные методы существуют? Главная альтернатива состоит в использовании метода дактилоскопии клонов. Снятие отпечатков пальцев у клонов дает информацию о физической структуре кло- нированного фрагмента ДНК; эта физическая информация, или «отпечаток пальцев»,
Глава 4. Секвенирование геномов 157 сравнивается с эквивалентными данными от других клонов, что позволяет опознавать клоны с подобиями — возможно, указывающими на перекрытия. Используется один из следующих методов (или их сочетание) (рис. 4.15). • Картины рестрикции могут быть получены путем переваривания клонов множе- ством разнообразных ферментов рестрикции и разделения продуктов в агарозном геле. Если два клона содержат перекрывающиеся вставки, то отпечатки пальцев их рестриктов будут иметь общие полосы, поскольку оба будут содержать фрагменты, полученные из области перекрытия. • Отпечатки пальцев повторной ДНК могут быть приготовлены в ходе анализа на- бора фрагментов рестрикции при помощи гибридизации по Саузерну (раздел 2.1.2) с зондами, специфичными к повторным последовательностям одного или несколь- ких типов. Как и в случае отпечатков пальцев рестриктов, перекрытия опознаются путем отыскания двух клонов, имеющих несколько общих полос гибридизации. • ПЦР с повторной ДНК, или ПЦР с рассеянными повторными элементами (РПЭ-ПЦР), предполагает использование затравок, которые отжигаются в пределах повторных последовательностей и таким образом размножают одну копию области ДНК, находящейся между двумя соседними повторениями. Поскольку повторные последовательности распределены по геному неравномерно, размеры продуктов, полученных после ПЦР с повторной ДНК, могут быть использованы как отпечаток пальцев при сравнениях с другими клонами, проводимыми с целью опознавания потенциальных перекрытий. В случае ДНК человека часто используются повто- рения, называемые элементами Alu (раздел 9.2.1), потому что они встречаются в среднем один раз на каждые 3 тыс. п. н. Д/и-ПЦР вставки человека в ВАС размером а) Отпечаток пальцев рестриктов б) Отпечаток пальцев повторных ДНК R R RRR R RR 2 Клонированные фрагменты ДНК | Рестрикция 1 2 .^у/общие фрагменты рестрикции R RRRR R RR / * 1 . Рассеянное по 2 । геному повторение I 1 2 ______Рестрикция, гибридизация по Саузерну с повторением-зондом в) ПЦР с повторной ДНК г) Картирование содержания STSob STS * — Последовательность Alu | ПЦР с затравками Alu 1 2 . Общие продукты ----------' ПЦР | STS-специфическая ПЦР Рис. 4.15. Четыре метода дактилоскопии клонов
158 Часть 1. Изучение геномов 150 тыс. п. н., как можно ожидать, даст приблизительно 50 продуктов ПЦР различ- ного размера, из которых можно получить подробный отпечаток пальцев. • Картирование содержания STS особенно полезно, потому что оно может дать сборку контигов из клонов, которая закреплена на физической карте местопо- ложений STS. Эксперименты ПЦР, направленные на отдельные STS (раздел 3.3.3), выполняются с каждым членом библиотеки клонов. При допущении о том, что STS есть единственная копия в геноме, можно считать, что все клоны, которые дают продукты ПЦР, должны содержать перекрывающиеся вставки. Как и в случае обхода хромосомы, эффективное применение этих методов снятия отпечатков пальцев требует комбинаторного отбора расположенных на координатной сетке клонов, в идеале с компьютеризированной методологией анализа полученных данных. 4.2.3. Секвенирование методом дробовика для полных геномов Метод дробовика для полных геномов был впервые предложен Крейгом Бентером и коллегами как относительно быстрое средство получения данных о непрерывной последовательности крупных геномов, таких как геном человека и других эукариотов. Опыт с секвенированием обычным методом дробовика (раздел 4.2.1) показал, что если полная длина фрагментов последовательности составляет от 6,5 до 8 длин изучаемого генома, то полученные контиги последовательности охватят более 99,8 % генома, с не- сколькими пропусками, которые могут быть закрыты такими методами, как развитые в ходе проекта расшифровки генома Haemophilus influenzae (см. рис. 4.11). Это под- разумевает, что 70-ти миллионов отдельных последовательностей (каждая по 500 п.н. или около того в длину), соответствующих общему количеству 35 000 млн п. н., было бы достаточно, если бы случайный подход был предпринят с геномом млекопитающего размером от 3 000 до 3 500 млнп.н. Семьдесят миллионов последовательностей — не есть нечто невозможное: фактически с 60-ю автоматическими секвенаторами, каждый из которых определяет 96 последовательностей за двухчасовой период, работающими все дни напролет, такая задача может быть выполнена за три года. Могут ли 70 миллионов последовательностей быть собраны правильно? Если с таким большим количеством фрагментов используется обычный метод дробовика и не делается никакого обращения к карте генома, то ответ — конечно нет. Огромное количество компьютерного времени, необходимого для опознавания перекрытий между этими последовательностями, и ошибки или в лучшем случае неопределенности, вызван- ные значительным содержанием повторной ДНК в большинстве геномов эукариотов (см. рис. 3.2), могут сделать такую задачу невыполнимой. Однако при условии ссылки на карту вполне можно правильно собирать минипоследовательности. Основные характеристики секвенирования методом дробовика для полных геномов Наиболее времязатратная часть проекта секвенирования методом дробовика — стадия, на которой отдельные контиги последовательности объединяются путем за- крытия кодовых пропусков и физических пропусков между ними (см. рис. 4.11). Чтобы минимизировать число пропусков, которые необходимо закрывать, метод дробовика для полных геномов использует по крайней мере две библиотеки клонов, приготовлен- ные на основе векторов различного типа. Необходимо использовать как минимум две библиотеки, потому что при любом клонирующем векторе ожидается, что некоторые
Глава 4. Секвенирование геномов 159 фрагменты не будут клонированы из-за проблем несовместимости, которые препятству- ют размножению векторов, содержащих такие фрагменты. Векторы различных типов страдают от разных проблем, так что фрагменты, которые не могут быть клонированы в одном векторе, нередко могут быть клонированы, если используется второй вектор. Поэтому восстановление последовательности из фрагментов, клонированных в двух различных векторах, должно улучшить полноту покрытия генома. Что можно сказать о проблемах, вызываемых при сборке последовательности повторными элементами? Мы освещали этот вопрос в главе 3 как главный аргумент против применения метода дробовика для секвенирования геномов эукариотов ввиду возможности потери частей повторной области из-за перескоков между повторными единицами и возможности неправильного соединения между двумя отдельными частя- ми одной и той же хромосомы или различных хромосом (см. рис. 3.2). Было предложено несколько возможных решений этой проблемы, но самая успешная стратегия состоит в том, чтобы гарантировать, что одна из библиотек клонов содержит фрагменты, кото- рые длиннее, чем самые длинные повторные последовательности в изучаемом геноме. Например, одна из плазмидных библиотек, использовавшаяся, когда этот метод был применен к геному Drosophila, содержала вставки со средним размером 10 тыс.п.н., потому что большинство повторных последовательностей Drosophila имеет размер 8 тыс.п.н. или меньше. Перескоки по последовательности генома, от одной повторной последовательности до другой, исключаются за счет гарантии того, что две конечные последовательности каждой вставки размером 10 тыс.п.н. находятся в своих соответ- ствующих позициях в основной последовательности (рис. 4.16). Первичный результат сборки последовательности — ряд каркасов (рис. 4.17, а), где каждый каркас состоит из набора контигов последовательности, разделенных кодовыми пропусками, которые лежат между считываниями спаренных концов — минипоследовательностями с двух концов отдельного клонированного фрагмента — и, таким образом, являются промежутками, которые могут быть закрыты дальнейшим секвенированием этого фрагмента (рис. 4.17, б). Сами каркасы разделены физически- Рис. 4.16. Избежание ошибок при исполь- зовании метода дробовика для полных ге- номов. На рис. 3.2, б мы видели, как легко можно «перескочить» между повторами при сборке основной последовательности стан- дартным методом дробовика. Результатом такой ошибки будет потеря всей последова- тельности между этими двумя повторения- ми, которые были ошибочно соединены вме- сте. Метод дробовика для полных геномов позволяет избежать ошибок такого типа за счет гарантии того, что обе конечные после- довательности клонированного фрагмента ДНК (размера 10 тыс.п.н. или около того) появляются на основной последовательности в своих ожидаемых позициях. Если одна из конечных последовательностей отсутствует, то, значит, при сборке основной последова- тельности была допущена ошибка а) Правильная сборка последовательности Рассеянные по 10 тыс. п. н. геному повторения Последовательность ДНК Обе конечные последовательности вставки размером 10 тыс. п. н. могут быть размещены на основной последовательности б) Неправильная сборка последовательности Последовательность между повторениями была пропущена -------------—-----------------Последовательность '------------------------------ДНК Лишь одна конечная последовательность встречается в основной последовательности
160 Часть 1. Изучение геномов а) Каркасы КАРКАС 1 КАРКАС 2 Контиг последовательности Физический пропуск Кодовые пропуски 15 тыс. п. н. Рис. 4.17. Первичный результат сборки последовательности при помощи метода дробовика для полных геномов, а) Каркасы — промежуточные звенья в сборке последовательности методом дробовика для полных геномов. Показано два каркаса. Каждый включает ряд контигов последовательности, разделен- ных кодовыми пропусками, при этом сами каркасы отделены друг от друга физическими пропусками. 6) Кодовые пропуски лежат между считываниями спаренных концов — парой минипоследовательностей с двух концов отдельного клонированного фрагмента — и поэтому могут быть закрыты дальнейшим секвенированием клонированной ДНК ми пропусками, которые гораздо труднее закрыть, потому что они представляют по- следовательности, отсутствующие в библиотеках клонов. Для того чтобы определить позицию каждого такого каркаса на карте генома, используется анализ содержания в нем маркёров. Например, если известны местоположения STS на карте генома, то каркас может быть помещен на нее, если будет установлено, какие STS он содержит. Если каркас содержит STS из двух несмежных частей генома, то, значит, в ходе сборки последовательности произошла ошибка. Точность сборки последовательности может быть далее проверена за счет получения концевых последовательностей из фрагментов длиной 100 тыс. п. н. или более, которые были клонированы в векторе большой емкости. Если пара таких концевых последовательностей, закрепленных в их ожидаемых пози- циях друг относительно друга, не попадает в пределы отдельного каркаса, то опять же это означает, что произошла ошибка в сборке. Осуществимость метода дробовика для полных геномов была продемонстриро- вана его применением к геномам плодовой мушки и человека. Но все еще остаются не- решенными вопросы о достоверности последовательностей генома, полученных этим методом. Сравнения между двумя версиями генома человека (раздел 4.3) показали, что последовательность, полученная методом дробовика для полных геномов, содержит значительное число недостающих сегментов, в общем 160 млн п. н., причем эти сегменты были утеряны из последовательности из-за проблем, вызванных повторной ДНК. В ре-
Глава 4. Секвенирование геномов 161 зультате этих ошибок 36 генов были полностью потеряны и еще 67 — потеряны частично. Возникли также предположения о том, что последовательность, полученная методом дробовика для полных геномов, может не иметь желательной степени точности, и даже в тех областях, которые были собраны правильно. Отчасти эта проблема связана с тем, что беспорядочный характер получения последовательности означает, что некоторые части генома покрыты несколькими полученными минипоследовательностями, тогда как другие части представлены только единожды или дважды (рис. 4.18). Общепринято, что каждая часть генома должна быть секвенирована по крайней мере четыре раза, что- бы гарантировать приемлемый уровень точности, и что такое покрытие должно быть увеличено в 8-10 раз, прежде чем последовательность можно рассматривать как полную. Последовательность, полученная методом дробовика для полных геномов, вероятно, превышает это требование во многих областях, но в других областях может не достигать этого уровня. Если в таких областях находятся гены, то недостаток точности может причинить серьезные проблемы при попытках определить местонахождение генов и понять их функции (см. главу 5). Во всей серьезности этих проблем помог убедиться анализ черновой последовательности Drosophila, полученной методом дробовика для полных геномов, на основании которого было предположено, что из 13 600 генов целых 6 500 могут содержать существенные ошибки кода последовательности. ii^=s==^^^^====ss==========ssi Последовательность генома а нм ям ав ш аав ав мв на ав на ав “ Минипоследовательности 1 тыс. п. н. Рис. 4.18. Беспорядочный характер получения последовательности методом дробовика для полных геномов означает, что одни части генома покрыты большим количеством минипоследовательностей, чем другие 4.3. Проекты расшифровки генома человека Дабы подвести итог нашему обзору картирования и секвенирования геномов, мы посмотрим, как эти методы были применены к геному человека. Хотя каждый проект расшифровки генома отличается ото всех остальных и имеет свои собственные труд- ности и свои собственные решения этих затруднений, проекты, связанные с человеком, иллюстрируют общие вопросы, к которым приходилось обращаться, чтобы секвениро- вать большой геном эукариота, и во многих случаях иллюстрируют процедуры, кото- рые в настоящее время расцениваются как передовые в этой области молекулярной биологии. 4.3.1. Стадия картирования в проекте «Геном человека» До начала 1980-х гг. полагали, что подробная карта генома человека является недо- сягаемой целью. Хотя к тому времени уже были построены полные генетические карты плодовых мушек и нескольких других организмов, проблемы, свойственные анализу человеческих родословных (раздел 3.2.4), и сравнительно малое число полиморфных генетических маркёров вызывало у большинства генетиков глубокие сомнения в том, что генетическая карта человека может когда-либо быть получена. Первая надежда на успешное генетическое картирование человека затеплилась с открытием RFLP, которые
162 Часть 1. Изучение геномов были первыми высокополиморфными ДНК-маркёрами, распознанными в геномах жи- вотных. В1987 г. была опубликована первая карта RFLP человека, включающая 393 RFLP и 10 дополнительных полиморфных маркёров. Эта карта, построенная по результатам анализа 21 семейства, имела среднюю плотность маркёров один на 10 млнп.н. В конце 1980-х гг. был учрежден проект «Геном человека» в форме самофинансируе- мого, но контролируемого государственными организациями совместного предприятия, в котором участвовали генетики со всего мира. Одна из целей, которые проект поста- вил сам по себе, была генетическая карта с плотностью один маркёр на 1 млн п. н., хотя думалось, что реальным пределом могла быть плотность один маркёр на 2-5 млнп.н. Фактически к 1994 г. международный консорциум достиг поставленной цели и даже превзошел ее благодаря использованию RFLP и образцовых семейств из обширной коллекции СЕРН (раздел 3.2.4). Карта 1994 г. содержала 5 800 маркёров, из которых бо- лее чем 4000 были представлены RFLP, и имела плотность один маркёр на 0,7 млнп.н. Последующая версия в еще большей степени уточнила карту 1994 г. за счет включения в нее дополнительных 1250 RFLP. Физическое картирование не отставало от генетического. В начале 1990-х гг. зна- чительные усилия были направлены на создание карт контигов из клонов при по- мощи отбора STS (раздел 3.3.3) наряду с другими методами дактилоскопии клонов (раздел 4.2.2). Главным достижением этой стадии проекта физического картирования была публикация карты сборки контигов из клонов полного генома, состоящей из 33 000 YAC, содержащих фрагменты со средним размером 0,9 млнп.н. Однако, когда стало понято, что клоны YAC могут содержать две или больше части несмежной ДНК, зародились сомнения о ценности карт контигов YAC (рис. 4.19). Использование таких химерных клонов при построении карт контигов может привести к тому, что сегменты ДНК, которые далеко отделены друг от друга в геноме, по ошибке будут нанесены на карту в соседних позициях. Исходя из этих проблем, был взят курс (главным образом Уайтхедовским институтом и Центром исследований генома при Массачусетском тех- нологическом институте) на картирование радиационных гибридов маркёров STS (раз- дел 3.3.3), который привел в конечном итоге к публикации в 1995 г. карты STS человека, содержащей 15086 маркёров, со средней плотностью один маркёр на 199 тыс.п.н. Эта карта была позже дополнена дополнительными 20104 STS, большинство из которых было представлено EST и, следовательно, показывало позиции кодирующих белок генов на физической карте. Достигнутая плотность карты приблизилась к пределу — один маркёр на 100 тыс.п.н., — поставленному в качестве цели физического картирования Объединенные карты STS включали пози- ции почти 7 000 полиморфных SSLP, которые были нанесены на карту генома также и гене- тическими средствами. В результате физиче- ская и генетическая карты могли быть непо- средственно сравнены, и карты сборки контигов из клонов, которые включали данные STS, могли быть позиционированы на обеих картах. Конеч- ным результатом была полная, объединенная карта, которая могла быть использована в каче- стве опорной схемы для стадии секвенирования ДНК в ходе проекта «Геном человека». в начале проекта «Геном человека». ДНК Клон YAC Рис. 4.19. Некоторые клоны YAC содержат сегменты ДНК из различных частей генома человека
Глава 4. Секвенирование геномов 163 4.3.2. Секвенирование генома человека Первоначальный план состоял в том, что стадия секвенирования проекта «Геном человека» будет основана на библиотеках YAC, потому что вектор этого типа может быть использован с более длинными фрагментами ДНК, чем могут вместить клонирующие системы любого другого типа. От этой стратегии пришлось отказаться, когда было открыто, что некоторые клоны YAC содержат несмежные фрагменты ДНК. Поэтому проект обратил свое внимание к ВАС (раздел 2.2.1). Была произведена библиотека из 300 000 клонов ВАС, и эти клоны были нанесены на карту генома, в результате чего по- лучилась карта «подручной последовательности», которая могла быть использована как первооснова для стадии проекта секвенирования, в ходе которой вставку из каждой ВАС будут полностью секвенировать методом дробовика. Приблизительно в то же время, когда проект «Геном человека» был готов к пере- ходу на стадию получения данных о последовательности, метод дробовика для полных геномов был впервые предложен в качестве альтернативы более трудоемкому методу сборки контигов из клонов, который к тому времени был общепринятым. Опасения организаторов проекта «Геном человека» в плане того, что полученная ими последова- тельность генома человека фактически не будет первой в своем роде, подтолкнула их перенести запланированные ими даты завершения рабочего проекта последователь- ности на более ранний срок. Первая черновая последовательность полной хромосомы человека (номер 22) была опубликована в декабре 1999 г., а несколько месяцев спустя появилась черновая последовательность хромосомы 21. Наконец, 26 июня 2000 г., в при- сутствии президента Соединенных Штатов Америки, Фрэнсис Коллинз и Крейг Бентер, руководители этих двух тем проекта, совместно объявили о завершении рабочих про- ектов последовательностей, которые появились в печати восемь месяцев спустя. Важно понимать, что две последовательности генома, опубликованные в 2001 г., были черновыми рабочими проектами, а не полными окончательными последователь- ностями. Например, версия, полученная методом сборки контигов из клонов, охватывала только 90 % генома, отсутствующие 320 млнп.н. лежали преимущественно в струк- турном гетерохроматине (раздел 10.1.2) — области хромосом, в которых ДНК очень сильно упакована и которые, как думают, если и содержат какие-либо гены, то очень мало. В пределах охваченных 90 % генома каждая часть последовательности была секвенирована по крайней мере четыре раза, что обеспечило «приемлемый» уровень точности, и лишь 25 % было секвенировано 8-10 раз, что может дать основания считать работу «готовой». Более того, эта черновая последовательность имела приблизительно 150 000 пропусков, и было признано, что некоторые сегменты, по всей вероятности, были упорядочены неправильно. Международный консорциум по секвенированию генома человека, управлявший заключительной стадией проекта, поставил его целью получе- ние готовой последовательности — то есть такой, у которой по крайней мере в 95 % эухроматина — части генома, в которой расположено большинство генов, — частота появления ошибок была бы менее одной на 104 нуклеотидов, и все пропуски, кроме наиболее трудноизлечимых, были бы заполнены. Достижение этой цели потребовало дальнейшего секвенирования 46 000 клонов на ВАС, РАС, YAC, фосмидах и космидах (раз- дел 2.2.1). Первые готовые последовательности хромосом начали появляться в 2004 г., при этом завершение расшифровки полной последовательности генома ожидали годом позже. Эта последовательность имела полную длину 2 850 млн п. н. и в ней недоставало лишь 28 млн п. н. эухроматина (последние приходятся на 308 пропусков, которые до сих пор не поддаются никаким попыткам закрытия).
164 Часть 1. Изучение геномов 4.3.3. Будущее проектов по изучению генома человека Полное завершение расшифровки последовательности — не единственная цель консорциумов, работающих с геномом человека. Грандиозная задача, в решение ко- торой вовлечены многие группы по всему миру, с привлечением различных методов и подходов, которые будут описаны в следующих двух главах, — постижение последо- вательности генома. Важный среди этих подходов — использование сравнительной геномики, в которой две полные последовательности генома сравниваются, с тем чтобы идентифицировать общие особенности, которые, будучи консервативными, по всей вероятности, очень важны (см. раздел 5.1.1). В отношении генома человека срав- нительная геномика сверх того предлагает ценную возможность, состоящую в том, что она позволяет обнаруживать гены животных, аналогичные генам болезней человека, и тем самым прокладывает путь к изучению генетической основы этих болезней с ис- пользованием генов животных в качестве моделей соответствующих генов человека. Схемы геномов мыши и крысы были опубликованы в 2002 г., а черновая карта шимпанзе была получена в 2005 г. Будут запущены дополнительные проекты расшифровки генома человека, нацеленные на создание каталога изменчивости последовательности в раз- личных популяциях; полученные результаты, возможно, позволят вывести древние истоки этих популяций (раздел 19.3.2). Такие проекты изучения разнообразия человека ведут нас к спорным моментам секвенирования генома. Большинство ученых ожидает, что данные о последовательно- сти из различных популяций подчеркнут единство человеческой расы, показывая, что схемы генетической изменчивости не отражают принадлежности людей к тем ил и иным географическим и геополитическим группам, сложившимся за несколько последних столетий. Но, несмотря на это, результаты этих проектов, несомненно, вызовут дебаты в ненаучных кругах. Кроме того, спорным является вопрос о том, кому (если это вообще возможно) должны принадлежать последовательности ДНК человека. Многие относят идею о праве собственности на последовательность ДНК исключительно к области юридических формулировок, но на информации, содержащейся в геноме человека, могут быть сделаны большие деньги, например, за счёт использования последовательности генов в качестве основы для разработки новых лекарственных препаратов и терапий против рака и других болезней. Фармацевтические компании, вовлеченные в секвени- рование генома, естественно, хотят защитить свои инвестиции, как они действовали бы в случае любого другого исследовательского проекта, и в настоящее время единственный способ добиться этого — патентование открытых ими последовательностей ДНК. К сожа- лению, в прошлом при проработке финансовых вопросов, относящихся к исследованиям с биологическим материалом человека, были сделаны ошибки; и в итоге индивидуум, от которого был получен материал, не всегда является стороной в разделении прибыли. Эти вопросы до сих пор не решены. Проблемы, касающиеся общественного использования последовательностей генома человека, оказались еще более трудноразрешимыми. Главное опасение связа- но с возможностью того, что как только последовательность генома человека будет интерпретирована, индивидуумы, последовательности которых будут по какой-либо причине сочтены «нестандартными», могут подвергнуться дискриминации. Прочие опасения простираются от увеличенных страховых взносов для индивидуумов, по- следовательности которых включают мутации, предрасполагающие их к той или иной генетической болезни, до возможности того, что расисты могли бы попытаться обозначить «хорошие» и «плохие» особенности последовательности с удручающе
Глава 4. Секвенирование геномов 165 предсказуемыми последствиями для индивидуумов, которым «посчастливится» попасть в категорию «плохих». Два проекта расшифровки генома человека, особенно в Соединенных Штатах, про- должают поддерживать исследовательские и обсуждать этические, юридические и со- циальные вопросы, поднятые секвенированием генома. В частности, большое внимание уделяется обеспечению гарантии того, что последовательности генома, полученные в ходе проектов, невозможно будет идентифицировать ни с каким отдельно взятым индивидуумом. ДНК, которая клонируется и секвенируется, берется только от индиви- дуумов, которые дали согласие на использование их материала таким способом и для кого можно гарантировать анонимность. Когда начали проводить такую политику, потре- бовался более или менее значительный пересмотр проекта научно-исследовательской работы, потому что более старые библиотеки клонов должны были быть разрушены и существующие физические карты проверены согласно новому материалу. Было при- знано, однако, что эта дополнительная работа была необходима, чтобы сохранить и приумножить доверие общества к этим проектам. Заключение Процедуры для быстрого секвенирования ДНК были впервые изобретены в 1970-х гг. Версия, которая сегодня используется наиболее часто, — метод обрыва цепи, который завоевал популярность благодаря возможности автоматизации, что позволяет выпол- нять большое число отдельных экспериментов за короткий период времени. Это важно, потому что один эксперимент дает не более 750 п.н. последовательности, так что для того, чтобы получить последовательность полного генома, должны быть выполнены тысячи, если не миллионы, отдельных экспериментов. Другие методы секвенирования ДНК, такие как метод химической деградации и пиросеквенирование, имеют более специализированные функции1^. При секвенировании генома главная трудность со- стоит в сборке всех минипоследовательностей, полученных в ходе многочисленных экспериментов секвенирования, в правильном порядке. С маленьким геномом бакте- рии сборка последовательности возможна методом дробовика, который состоит всего лишь в исследовании минипоследовательностей на предмет наличия перекрытий. Этот подход, который не требует никакого предварительного знания генома, был впервые использован в 1995 г. для генома Haemophilus influenzae размером 1830 тыс. п. н. и впо- следствии стал стандартным методом для секвенирования бактериальных геномов. Попытки применить этот подход к более крупным геномам эукариотов осложняются присутствием повторных последовательностей ДНК, каковые могут привести к не- правильной сборке сегментов генома. Метод сборки контигов из клонов избегает этих проблем за счет опознавания ряда клонов (в векторе большой емкости типа ВАС), кото- рые содержат перекрывающиеся фрагменты, уже позиционированные на физической и (или) генетической карте изучаемого генома. Короткие сборки контигов из клонов могут быть построены путем обхода хромосомы, но более длинные сборки, применяемые в проектах секвенирования, обычно собираются различными методами дактилоскопии клонов. Затем фрагменты, присутствующие в отдельных клонах, секвенируются методом дробовика. Именно этот подход был принят официальным проектом «Геном человека», но когда этот проект приблизился к концу стадии секвенирования, Крейг Вентер с кол- В настоящее время пиросеквенирование и другие платформы для массового параллельного секвени- рования становятся стандартом, в то время как секвенирование по Сенгеру (методом обрыва цепи) становится вспомогательным методом. — Прим. ред.
166 Часть 1. Изучение геномов легами показали, что геном человека и другие большие геномы могут быть секвениро- ваны намного быстрее методом дробовика для полных геномов, который основан на том же самом подходе, что и стандартный метод дробовика, но включает несколько мер безопасности, таких как твердая опора на физическую карту, чтобы гарантировать, что последовательности, смежные с областями повторной ДНК, будут собраны правильно. Сравнение двух черновых последовательностей человека позволило предположить, что метод сборки контигов из клонов обеспечивает более точную последовательность, но что метод дробовика для полных геномов, благодаря его быстроте, является лучшими средством для получения начальной черновой карты генома. Проекты генома человека теперь перешли к стадии, на которой были опубликованы законченные последователь- ности хромосом, покрывающие по крайней мере 95 % эухроматина каждой хромосомы, с коэффициентом ошибок не более одной на 104 нуклеотидов. Этические, юридические и социальные вопросы, поднятые к моменту завершения работы над последователь- ностью человека, включают вопросы относительно права собственности, патентного права и возможности дискриминации по генетическим признакам.
Глава 4. Секвенирование геномов 167 Задания для закрепления материала *Ответы к нечетным вопросам могут быть найдены в приложении Вопросы закрытого типа 4.1 *. Что случилось бы, если бы в реак- ции секвенирования с обрывом цепи была слишком высокая концентра- ция дидезоксинуклеотидов? а. Реакции дали бы очень длинные молекулы и было бы мало данных о последовательности вблизи от затравки. Ь. Реакции дали бы очень короткие молекулы. с. Реакции не продолжались бы, поскольку при высоких концен- трациях дидезоксинуклеотидов ингибируется ДНК-полимераза. d. Флюоресценция продуктов секве- нирования была бы слишком вы- сока и трудна для считывания. 4.2 . Как помечают различные нуклеоти- ды (А, С, G или Т) в реакции секвени- рования с обрывом цепи? а. Затравки для реакций метят флю- оресцентными красителями. Ь. Различные дезоксинуклеотиды метят разными флюоресцентны- ми красителями. с. Различныедидезоксинуклеотиды метят разными флюоресцентны- ми красителями. d. Различные продукты секвениро- вания окрашивают антителами, которые обнаруживают различ- ные дидезоксинуклеотиды. 4.3 *. Почему до секвенирования фрагмен- та ДНК с обрывом цепи выгодно его клонировать? а. Процесс секвенирования с обры- вом цепи требует однонитевые молекулы ДНК в качестве матриц. Ь. Процесс секвенирования с обры- вом цепи требует двунитевые мо- лекулы ДНК в качестве матрицы. с. Процесс секвенирования с обры- вом цепи требует вектор, чтобы стабилизировать ДНК-матрицу. d. Дидезоксинуклеотиды встраи- ваются только в клонированные фрагменты ДНК. 4.4 . Почему фермент Клёнова является плохим выбором для реакций секве- нирования с обрывом цепи? а. Фермент обладает сильным дей- ствием экзонуклеазы 5’->3' и из- меняет длину продуктов. Ь. Фермент имеет сильное действие экзонуклеазы 3'—>5' и удаляет З'-дидезоксинуклеотиды из про- дуктов. с. Фермент не включает дидезокси- нуклеотиды в матричную цепь. d. Фермент обладает низкой про- цессивностью, что ограничивает длину полученной последова- тельности. 4.5 *. Какая из перечисленных особен- ностей секвенирования с обрывом цепи является проблемой для спе- циалистов? а. Считывания последовательности менее 100 п.н. Ь. Последовательностичастосодер- жат ошибки. с. Внутринитевое соединение осно- ваний может блокировать продви- жение ДНК-полимеразы и, наряду с этим, затруднить перемещение молекул в ходе электрофореза. d. Невозможно секвенировать обе нити молекулы ДНК. 4.6 . Каково назначение нуклеотидазы в реакции пиросеквенирования? а. Она преобразует пирофосфат в люминесцентный продукт.
168 Часть 1. Изучение геномов Ь. Она деградирует молекулу ДНК, высвобождая нуклеотиды, кото- рые детектируются посредством хемилюминесценции. с. Она стабилизирует короткие про- дукты ДНК, полученные этим ме- тодом. d. Она деградирует н