Автор: Хедрик Ф.  

Теги: биология   генетика   эволюция  

ISBN: 5-94836-007-5

Год: 2003

Текст
                    и
р
и о л о г и и
Ф. ХЕДРИК
Г енетика
популяций
Перевод с английского
А.А. Лушниковой,
Н.В. Петровой
ТЕХНОСФЕРА
Москва
2003

Ф. Хедрик Генетика популяций Москва: Техносфера, 2003. - 592с. Монография рассчитана на специалистов-биологов различных областей, в том числе студентов. В книге доступно изложены основные принципы современной генетики и теории эволюции. Помимо известных фактов, приводятся и новые данные, полученные с помощью современных молекулярно-генетических методов. Расширен и диапазон объектов исследования - от классической дрозофилы до человека. Каждая глава завершается оригинальными задачами и упражнениями, помогающими усвоить материал и получить практические навыки постановки экспериментов. Приведенные примеры хорошо иллюстрированы графиками, таблицами, фотографиями. Во всех главах использован доступный любому студенту математический аппарат, что способствует развитию навыков статистической обработки наблюдений. Несомненно, книга заинтересует как профессионалов в области генетики, так и тех, кто только приступает к освоению азов этой науки. Genetics of Populations Second Edition Philip W. Hedrick AMZONASIATt VNTVEKSrrY ORIGINAL ENGLISH LANGUAGE EDITION PUBLISHED BY Jones and Bartlett Publishers, Inc. 40 Tall Pine Drive Sudbury, MA 01776 © 1999 All Rights Reserved. © 2003, ЗАО «РИЦ «Техносфера» перевод на русский язык, оригинал-макет, оформление. ISBN 5-94836-007-5
СОДЕРЖАНИЕ Предисловие.................................................9 Глава 1. Общий фон и многообразие генетической изменчивости..........12 I. Методы исследования в популяционной генетике............13 II. Понятие о генетических терминах........................16 а. Некоторые генетические термины.........................17 Ь. Генетический код......................................20 с. Структура генома и типичный эукариотический ген........21 III. Введение в количественные методы......................23 а. Модели.................................................23 d. Средние, вариансы и доверительные интервалы...........27 с. Вероятность............................................31 d. Матрицы...............................................34 IV. Генетическая изменчивость..............................36 а. Изменчивость аллоферментов.............................39 Ь. Нуклеотидная и аминокислотная изменчивость............44 с. Видимый полиморфизм....................................50 d. Мутации, летальные аллели и модификаторы приспособленности..........................53 е. Полигонные, или количественные, признаки...............58 Задачи.....................................................63 Глава 2. Количественная оценка генетической изменчивости............66 I. Закон Харди-Вайнберга...................................68 II. Межполовые различия по частоте аллелей.................76 а. Аутосомные гены........................................77 Ь. Х-сцепленные гены или гены гапло-диплоидов............79 III. Оценки аллельной частоты..............................83 IV. Проверка закона Харди-Вайнберга........................93 V Измерение генетической изменчивости.....................97 а. Гетерозиготность.......................................97 Ь. Доля полиморфных локусов и другие величины............102 VI. Оценка разнообразия нуклеотидного и аминокислотного состава..................................103 VII. Измерение генетического расстояния....................105 Задачи.....................................................109
4 Содержание Глава 3. Понятие об отборе.........................................112 I. Основная модель отбора................................ 116 а. Рецессивные летали...................................121 Ь. Отбор против рецессивов..............................125 с. Промежуточное доминирование (аддитивность) и отбор против гамет или против гаплоидов...............128 d . Отбор против доминант...............................132 е. Общее доминирование..................................133 f. Преимущество гетерозигот.............................137 g. Невыгодность гетерозигот.............................142 II. Развитие некоторых генетических положений.............145 а. Х-сцепленные гены или гены гапло-диплоидных организмов.145 Ь. Множественные аллели.................................150 Задачи....................................................155 Глава 4. Отбор: другие модели и оценки.............................158 I. Компоненты приспособленности...........................159 II. Отбор на жизнеспособность.............................161 а. Различия в жизнеспособности на разных стадиях жизненного цикла........................................161 Ь. Межполовые различия в жизнеспособности...............163 III. Половой отбор........................................165 а. Негативно-ассортативное скрещивание..................167 Ь. Преимущество скрещиваний с самцами редкого типа......169 IV. Отбор гамет...........................................172 а. Мейотический дрейф...................................173 Ь. Аллели самонесовместимости...........................176 V. Оценка отбора..........................................179 а. Отбор на жизнеспособность............................180 Ь. Совершенный отбор....................................185 с. Частоты генотипов....................................187 VI. Экологическая генетика и балансирующий отбор..........189 а. Пространственная изменчивость........................196 Ь. Изменчивость приспособленности во времени............202 с. Частотно-зависимый отбор.............................207 Задачи....................................................214
Содержание 5 Глава 5. Инбридинг и связанные с ним вопросы.......................216 I. Инбридинг..............................................217 а. Самооплодотворение....................................222 Ь. Частичное самооплодотворение.........................224 с. Оценки перекрестного оплодотворения и самооплодотворения.....................................229 d. Регулярные системы инбридинга........................234 е. Другие уровни частичного инбридинга...................237 f. Оценка инбридинга из родословных......................238 g. Метод расчета цепи...................................241 h. Инбридинг в природных популяциях животных............247 II. Инбридинг и отбор.....................................250 а. Инбредная депрессия...................................250 Ь. Изменение частот аллелей и условия для полиморфизма..256 с. Родственный отбор.....................................261 III. Бесполое, или апомиксное, размножение................262 IV. Положительная ассортативность скрещивания.............265 Задачи....................................................268 Глава 6. Генетический дрейф и эффективный размер популяции..........270 I. Генетический дрейф.....................................275 а. Метод матрицы вероятностей............................280 Ь. Эффект основателя и «бутылочного горлышка»...........287 II. Эффективный размер популяции..........................292 а. Раздельнополость......................................294 Ь. Вариация числа гамет.................................296 с. Инбридинг............................................299 d. Изменение численности популяции во времени..........300 е. Возрастная структура..................................304 f. Размер соседства......................................305 g. Гены митохондрий, хлоропластов и Y хромосом..........306 h. Генетические методы оценки эффективного размера популяции 306 III. Отбор в ограниченных популяциях......................308 а. Направленный отбор....................................308 Ь. Балансирующий отбор..................................310 Задачи....................................................313
6 Содержание Глава 7. Поток генов и структура популяций........................314 I. Структура популяций...................................316 а. Модель материк-остров................................316 Ь. Обобщенная модель...................................319 с. Эффект Воланда.......................................322 d. Гаметический и зиготический генные потоки...........324 II. Оценка генного потока и структура популяции..........326 а. Популяции гибридов...................................326 Ь. Прямое наблюдение потока генов......................329 с. F-коэффициенты и другие показатели дифференцированной популяции...............................................332 III. Структура популяции и генетический дрейф............340 а. Модель материк-остров, или островная модель..........340 Ь. Лестничная модель...................................344 с. Метапопуляция........................................345 IV. Генный поток и отбор.................................348 а. Модель материк-остров................................349 Ь. Дифференцирующий отбор и клинья в структурированной популяции...........................356 Задачи...................................................360 Глава 8. Мутации..................................................362 I. Изменение аллельной частоты под действием мутаций.....367 а. Прямые и обратные мутации............................368 Ь. Судьба единичных мутаций............................370 II. Баланс мутаций и отбора..............................372 а. Рецессивные мутации..................................372 Ь. Доминантные мутации.................................376 с. Промежуточное доминирование и груз мутаций.......377 III. Мутации в конечной популяции........................380 а. Нейтральность........................................381 Ь. Отбор...............................................386 IV. Оценка скорости мутирования..........................388 а. Доминантные и кодоминантные мутации..........388 Ь. Рецессивные мутации.................................391 с. Оценка накопления мутаций............................392 d. Факторы, влияющие на скорость мутирования...........394 Задачи...................................................398
Содержание 7 Глава 9. Молекулярная генетика популяций и эволюция...............314 I. Нейтральность и прогнозы молекулярной изменчивости....401 а. Балансирующий отбор..................................402 Ь. Теория нейтральности................................405 с. Молекулярные часы....................................411 d. Коалесценция и генные деревья.......................420 II. Доказательства отбора и проверка теории нейтральности.425 а. Использование кодонов................................426 Ь. Синонимичные и несинонимичные нуклеотидные замены...428 с. Тест Эвенса-Ваттерсона...............................432 d. Тесты Хадсона-Крайтмана-Агвейда и МакДональда-Крайтмана.................................435 е. Тест Таджимы.........................................438 III. Молекулярная филогенетика...........................439 а. Невзвешенный парно-групповой метод (НПГМ)............441 Ь. Метод объединения соседей...........................444 с. Максимальная экономия................................447 IV. Анализ отцовства и идентификация личности............450 а. Анализ отцовства.....................................451 Ь. Идентификация личности..............................457 Задачи...................................................460 Глава 10. Мультилокусные модели....................................462 I. Понятие о гаметическом неравновесии...................464 II. Гаметическое неравновесие и инбридинг, генетический дрейф, генный поток и мутации...................................474 а. Инбридинг или репродуктивная система.................474 Ь. Генетический дрейф..................................477 с. Поток генов..........................................481 d. Мутации.............................................482 III. Мультилокусный отбор................................485 а. Приспособительный эпистаз............................485 Ь. Направляющий отбор в двух локусах...................487 с. Основные двухлокусные полиморфизмы...................489 d. Некоторые выводы....................................497 IV. Генетический фон и генетический хичхайкинг...........499 V. Рекомбинация и генетическая изменчивость..............507 VI. Оценка гаметического неравновесия....................512 а. Прямая идентификация гамет...........................513
Содержание Ь. Два кодоминантных локуса.............................517 с. Множественные аллели.................................519 Задачи....................................................519 Глава 11. Количественные признаки и эволюция........................522 I. Природа количественных признаков.......................523 а. Общие характеристики..................................523 Ь. Гены, влияющие на количественные признаки............528 II. Количественная генетическая модель....................532 III. Оценка генетической вариансы и наследуемости.........543 а. Редукция или элиминация одной компоненты вариансы......543 Ь. Сходство между родственниками........................546 с. Реализованная наследуемость..........................554 d. Факторы, влияющие на генетическую вариансу...........557 IV. Отбор по количественным признакам.....................564 а. Отбор в природных популяциях..........................564 Ь. Ответ (реакция) на отбор.............................568 с. Оценка отбора в природных популяциях.................575 V. Идентификация локусов количественных признаков (ЛКП)....579 Задачи....................................................586
ПРЕДИСЛОВИЕ Эволюционный процесс невозможно понять без знания основ популяци- онной генетики. Генетическая природа популяций - предмет изучения таких родственных дисциплин, как популяционная экология и поведе- ние, а также прикладных наук: медицинской генетики, консервативной биологии, растениеводства и животноводства. Со времени выхода в свет первого издания Генетики популяций наши знания в области молекулярной генетики популяций, эволюционной ге- нетики и генетики количественных признаков заметно расширились. Это нашло отражение в недавно вышедших книгах: Molecular evolution, W.-H.Li и Molecular evolution and Phylogenetics, M.Nei, S.Kumar по моле- кулярной эволюции и Introduction to Quantitative Genetics, D.S.Falconer, T.F.C.Mackay, Quantative Genetics, M.Lynch, B.Walsh по генетике количе- ственных признаков. В настоящем издании каждой из этих областей по- священа отдельная глава. Эта книга была задумана для студентов, аспирантов и выпускников средних учебных заведений, знакомых с основами генетики, теории эво- люции и математической статистики. Я попытался совместить приклад- ную и экспериментальную популяционную генетику с теорией. В част- ности, я привожу математические методы оценки генетических параметров популяций и другие статистические методы, используемые в популяци- онной генетике. Как правило, для их понимания достаточно знать основы высшей алгебры, теории чисел и математической статистики. В книге даются примеры и математические выкладки, применимые как к живот- ным, так и к растениям. Хотя большинство исследований по генетике популяций выполнено на дрозофиле и человеке, для иллюстрации раз- личных закономерностей я рассматриваю и другие, в том числе класси- ческие модели. Структура данной книги отличается от структуры предыдущего изда- ния. Глава 1.1 начинается с введения в основы генетики и знакомит с ко- личественными методами, принятыми в популяционной генетике. В пер- вом издании этот материал был помещен в конце книги и в приложении. Новая редакция отражает фундаментальный характер количественной генетики. После введения в главе 1.1 подробно рассматривается генети- ческая изменчивость, начиная от внешних полиморфных признаков и кон- чая вариабельными нуклеотидными повторами. В главе 2 описаны мето- ды количественной оценки генетической изменчивости в популяциях. В
словие главах с 3 по 8 обсуждается степень и характер генетической изменчиво- сти: отбор, скрещивания, дрейф генов, поток(миграция) генов, мутации. Сначала все эти факторы рассматриваются в отдельности как с экспе- риментальной, так и с теоретической точек зрения. Затем описано совме- стное действие двух или более таких факторов в популяции. В главе 9 продемонстрировано использование данных популяционной генетики для понимания молекулярных механизмов генетической изменчивости. В главе 10 рассмотрены мультилокусные модели и их использование в популяци- онной генетике. Наконец, глава 11 содержит введение в генетику количе- ственных признаков. В этой главе показана важность учета популяцион- но-генетических факторов для оценки фенотипической изменчивости, обусловленной несколькими генами. Изменения коснулись и материала, помещенного в конце книги. Как и в первом издании, я ссылаюсь на работы, вышедшие в последнее время, и на классические труды. Но после библиографических ссылок теперь ука- заны страницы текста книги, которые цитируются в данной работе. Ука- затель цитированных работ вместо авторского указателя удобен для по- иска ссылок на соответствующие работы в тексте. Новым является и выделенный жирным шрифтом предметный указатель страниц, где дан- ный термин упоминается впервые. Он появился вместо словаря терми- нов и позволяет быстро найти в тексте значение того или иного термина. Отличительная черта данного издания в том, что оно содержит как клас- сические, так и современные данные, прекрасно иллюстрирующие рас- сматриваемые закономерности. Большинство используемых в популяци- онной генетике статистических методов можно найти на электронных сайтах, список которых дается в таблице 2.1. С их помощью выполняют- ся более сложные вычисления. Доступен и целый ряд сайтов, иллюстри- рующих вклад в генетическую изменчивость различных факторов эво- люции. В конце каждой главы приведены задачи, отражающие материал конкретной главы. Ответы на эти задачи даны в конце книги. Написание этой книги связано с моей многолетней преподавательс- кой и экспериментальной работой в популяционной генетике. Многие из научных идей я почерпнул из вопросов моих студентов. По мере ис- следования тех или иных проблем углублялось и мое понимание раз- личных областей популяционной генетики. Мною был написан ряд об- зоров по генетике популяций, что также расширило мои знания. В последнее время я использую популяционно-генетические методы для исследования малых популяций, в частности для популяций редких и исчезающих видов.
Предисловие Мое знакомство с концепциями популяционной генетики состоялось благодаря энтузиазму и педагогическому мастерству Ральфа Комстока, Ричарда Левонтина и Дэвида Мерила. За многолетнее тесное и плодотворное сотрудничество в области ге- нетики популяций я особенно признателен Дэнису Хеджикоку, Уильяму Клитцу, Оути Саволайнен и Глениз Томсон. В последние годы я плодо- творно сотрудничал со специалистами по генетике заповедных популя- ций и популяционной генетике Аризонского университета Густаво Гуть- еррес-Эспельта, Стивеном Калиновски, Филом Миллером, В.Л.Минклеем, Джоэль Паркер, Карен Паркер и Руби Шеффером. Хотелось бы выразить признательность тем, кто внес свои замечания и комментарии в рукопись: Список рецензентов: Fred Allendorf, University of Montana, Michael Blouin, Oregon State University, Ed Bryant, University of Houston, David Houle, Florida State University, Sudhir Kumar, Arizona State University, Michael Nachman, University of Arizona, Len Nunney, University of California at Riverside Kermit Ritland, University of British Columbia, Glenys Thomson, University of California at Berkley Michael Whitelock, University of British Columbia. Особая благодарность за помощь в подготовке книги сотрудникам Ари- зонского университета Брет Пайзер, Цинтии Риджинос и Мэтью Саун- дерсу. Октябрь 1999г. Фил Хедрик
ГЛАВА 1 ОБЩИЙ ФОН И МНОГООБРАЗИЕ ГЕНЕТИЧЕСКОЙ ИЗМЕНЧИВОСТИ В третьем издании словаря Уэбстера термин эволюция означает «серии измене- ний или ступеней, благодаря которым любой живой организм или группа таких организмов достигает морфологических и физиологических различий между со- бой». Это определение всецело соответствует временам Дарвина и первой поло- вине двадцатого века. Благодаря открытиям молекулярной биологии, которые не всегда заметны невооруженным глазом, это понятие существенно расширилось. Обсуждая в своей книге теорию нейтрального отбора, я понимаю под эволюцией все изменения - большие и малые, видимые и невидимые, адаптивные и неадап- тивные. Иногда эволюция происходит даже путем закрепления частично вредных мутаций. Коэффициент отбора таких мутаций сравним или немного превышает уровень мутаций в популяции. Моту Кимура ( Motoo Kimura, 1983) Премудрость Божья сотворила муху, Забыв сказать нам, для чего. Огден Нэш (Ogden Nash) В области популяционной генетики наблюдались как периоды подъема, так и периоды спада интереса. Так происходит с дисциплинами, которые развивают новые парадигмы, а затем совершенствуют и расширяют ис- следования в новом направлении (например, Kuhn, 1962). Большой вклад в становление популяционной генетики как науки внесли такие выдаю- щиеся ученые как Рональд А.Фишер, Ж.Б.С. Холден и С.Райт. В 1920— 1930 годах они заложили теоретические основы генетики популяций и сформулировали положения, не устаревшие и по сей день (Provine, 1971). Как посетовал Левонтин (Lewontin, 1963): «Они сказали все самое важ- ное и их теория генетических изменений в популяциях имеет истинно фундаментальное значение. Остальные из нас не попали в безработные только благодаря способности извлекать руду из пустой породы». Однако в конце 1960 годов появились первые молекулярно-биологи- ческие данные об изоферментах и аминокислотных последовательнос- тях в популяциях. Затем, в 1980 годах популяционные исследования пос-
1. Методы исследования в популяционной генетике ледовательностей ДНК поставили целый ряд новых вопросов и с новой энергией стимулировали работу по генетике популяций. Возникла необ- ходимость интерпретации полученных молекулярными биологами резуль- татов. Возможность такой интерпретации и была предоставлена популя- ционной генетикой. Сейчас имеется огромное количество молекулярно-биологических дан- ных о самых различных видах. Понимание эволюционного значения внут- ри- и межвидовой изменчивости на уровне белков и ДНК привело к глу- боким изменениям в популяционной генетике. Генетика популяций может внести весомый вклад в решение таких проблем, как роль молекулярной изменчивости в создании адаптивных морфологических, поведенческих и физиологических различий, а также роль неадаптивной изменчивости в наследственных заболеваниях. Популяционная генетика - это сплав различных дисциплин, с которы- ми мы познакомимся в первой части этой главы. Подготовленные читате- ли могут пропустить этот обзорный материал и перейти к другому. В зависимости от своих научных интересов, читатель может найти специа- лизированную литературу в библиографическом списке. В тексте дается обзор таких динамично развивающихся смежных дисциплин как молеку- лярно-популяционная генетика и эволюция (глава 9) и генетика количе- ственных признаков (глава 11). Самую последнюю и исчерпывающую информацию по молекулярной эволюции можно найти в монографиях Ли (Li, 1997), а также Nei, Kumar, 2000, по генетике количественных при- знаков см. Falconer, Mackay, 1996 и Lynch, Walsh, 1998. I. Методы исследования в популяционной генетике Методы изучения явлений в популяционной генетике и других биологи- ческих науках можно упрощенно разделить на три группы: эмпиричес- кие, экспериментальные и теоретические. При эмпирическом подходе проводят обширные исследования генетической изменчивости отдельно- го гена или генов в популяции (популяциях) в течение определенного времени. При этом учитывают такие факторы, как влияние среды на гене- тическую изменчивость. Эти данные могут отражать связь между уров- нем и характером генетической изменчивости и другими факторами, что затрудняет дальнейшие исследования. Генетическая изменчивость в та- ких эмпирических работах включает морфологическую изменчивость, по- лиморфизм по группам крови, хромосомные инверсии, а начиная с 1960 годов - изменчивость изоферментов. Примечательно, что некоторые клас- сические примеры генетического полиморфизма оказались ясными и по- нятными лишь на первый взгляд. На самом деле, они требуют дальней-
Глава 1. Общий фон и многообразие генетической изменчивости шего всестороннего анализа. Примером может служить меланизм у бере- зовой пяденицы (Sargeant, 1998; Majerus, 1998). В общем, гипотезы, вытекающие из эмпирических данных о влиянии определенных факторов на уровень и характер генетической изменчивос- ти, нуждаются в экспериментальной проверке. Обычно в таких экспери- ментах по изучению влияния среды на популяцию эту популяцию переме- щают в новую среду обитания и сравнивают ее с местной популяцией. В последнее время проводятся более широкие эволюционно-генетические исследования, включающие сравнение последовательностей ДНК в гено- мах разных организмов или последовательностей генов с различными функ- циями. Используя данные эмпирических и экспериментальных исследова- ний, можно построить обобщенную теоретическую модель, учитывающую все эти наблюдения. Такие теоретические модели служат основой при ис- следовании сходных явлений и способствуют пониманию влияния различ- ных факторов на уровень и характер генетической изменчивости. Взаимосвязи между этими тремя методами исследований в популяци- онной генетике иллюстрирует рисунок 1.1. Как правило, эмпирическая информация поступает первой. Затем развивается гипотеза, объясняю- щая полученные результаты. После этого проводятся эксперименты, под- тверждающие или опровергающие данную гипотезу. Другими словами, теоретическая модель разрабатывается для объяснения эмпирических на- блюдений, а затем накапливаются данные в пользу биологического соот- ветствия данной модели. Обратная связь между этими тремя методичес- кими подходами позволяет развивать и совершенствовать конкретную гипотезу. Рисунок 1.1. Взаимосвязи между эмпирическим, экспериментальным и теоретическим методами в популяционной генетике. Для расширения научных познаний необходимы альтернативные ги- потезы, объясняющие конкретные наблюдения, а затем - критические эксперименты. Такие продуманные и тщательно выполненные экспери- менты с альтернативными результатами позволят исключить одну или более из предлагаемых гипотез.
I. Методы исследования в популяционной генетике В качестве примера рассмотрим так называемый метод сильной интер- ференции (см. Platt, 1964). Этот метод приводит к исключению или опро- вержению некоторых гипотез. Затем оставшиеся гипотезы согласуют с экс- периментальными и/или эмпирическими данными. Из-за трудности построения критических экспериментов порой бывает сложно оставить только одну гипотезу. Действительно, во многих случаях отдельное явле- ние в популяционной генетике, по-видимому, обусловлено множеством при- чин, а это затрудняет планирование и выполнение экспериментов. При разработке и выполнении экспериментов полезно иметь в виду факторы, лежащие в основе экспериментальной работы. Во-первых, для чистоты эксперимента необходимо соответствующее количество незави- симых повторных экспериментов. Во-вторых, одновременно нужно про- вести подходящие контрольные эксперименты. Следует убедиться, что повторные эксперименты действительно независимые, а контрольные - подходят к данной задаче. В-третьих, количество наблюдений должно быть достаточным для того, чтобы вероятность статистических отклонений была мала. При определении числа повторных экспериментов и размеров выборки, нужных для обнаружения конкретного генетического эффекта, полезно вычислить уровень статистической силы - вероятности откло- нения нулевой гипотезы, если она ложная (см. стр. 19 и Sokal, Rohlf, 1995; Zar, 1999). Эти факторы следует учитывать даже при сравнении последо- вательностей ДНК у различных типов организмов. Например, родствен- ны или независимы исследуемые последовательности, только ли сравни- ваемые группы последовательностей имеют интересующие нас различия, какова статистическая сила полученных в результате такого сравнения данных? Несмотря на то, что философский подход к пониманию научных явле- ний выглядит притягательным, простым и, как показано, продуктивным для популяционной генетики, распространять его на любые другие ситу- ации следует с осторожностью. Например, многие фундаментальные генетические закономерности впервые были получены на модельных организмах в сериях контролиру- емых экспериментов. К ним относятся законы расщепления и независи- мого наследования, продемонстрированные Грегором Менделем на горо- хе, а также спонтанные мутации, впервые обнаруженные у фруктовой мушки Drosophila melanogaster X. Дж.Мёллером. С другой стороны, экс- периментальные данные, полученные на модельных организмах в лабо- раторных или тепличных условиях могут и не отражать сложных и важ- ных факторов, действующих в естественных природных системах. Например, как показано в главах 3 и 6, лабораторные опыты по изучению генетической изменчивости у Drosophila наглядно демонстрируют явле-
Глава 1. Общий фон и многообразие генетической изменчивости ния отбора и генетического дрейфа с эвристической точки зрения. Одна- ко при слишком строгом эксперименте со множеством ограничений мы получаем лишь теоретическую модель, которая подтверждает наши на- блюдения и не дает исчерпывающей информации о природных популя- циях. С другой стороны, при опытной проверке того или иного явления в естественных, не контролируемых условиях результаты бывают не дос- таточно четкими для выбора альтернативных гипотез. В 1970-х годах генетическая изменчивость была продемонстрирована с помощью электрофоретического разделения белков. Левонтин (Lewontin, 1974) назвал новый экспериментальный способ научным горизонтом для исследователя, «обнаружившего эксперимент, который срабатывает сно- ва и снова». Вариабельность последовательностей ДНК отдельных генов у определенных организмов и взаимосвязь этих последовательностей с другими последовательностями открывают новые перспективы для по- пуляционно-генетических экспериментов. Новая наука геномика, изуча- ющая информацию, записанную в последовательностях ДНК, пытается понять значение такой вариабельности. С другой стороны, при проведе- нии традиционных экспериментов действие отбора на молекулярную из- менчивость может быть слишком слабым. Поэтому такое действие мож- но обнаружить только используя обширные данные по кумулятивному действию отбора на протяжении нескольких поколений. Граница между эмпирическими и экспериментальными методами стала довольно рас- плывчатой. В параллельном эксперименте по секвенированию могут по- лучиться результаты как в пользу гипотезы, так и ее отвергающие. Благо- даря новым методам быстрого секвенирования появились огромные базы данных по геномным последовательностям Эти базы открывают широ- кие возможности для решения популяционно-генетических задач. Одна- ко они мало подходят для исследования конкретных эволюционных ги- потез, поскольку создаются с другой целью. II. Понятие о генетических терминах В популяционной генетике существуют специальные термины - свое- образный научный жаргон. Большинство из этих терминов уже знако- мы читателю, но во избежание неточностей мы отметим наиболее важ- ные. После терминологии мы кратко остановимся на некоторых вопросах молекулярной генетики, что будет полезно в дальнейшем. Для более под- робного знакомства с основами молекулярной генетики читатель может обратиться к многочисленным учебным пособиям по современной об- щей генетике.
II. Понятие о генетических терминах а. Некоторые генетические термины Наша терминология применима к популяционной генетике и, возможно, не вполне точна с точки зрения молекулярной генетики. Во-первых, ген можно считать единицей наследственности, которая передается от роди- телей к потомству. Место нахождения конкретного гена на хромосоме называется локусом (локусами). Зачастую термины ген и локус более или менее взаимозаменяемы. Гены - это единицы, кодирующие либо полипептиды, которые превращаются затем в белки и ферменты, либо РНК. Но существуют и другие, некодиру- ющие гены, которыми занимается популяционная генетика. Протяжен- ные некодирующие районы содержит, например, большинство Y-хромо- сом человека и других млекопитающих. Вариабельность различных Y-хромосом используется при исследовании происхождения и генетичес- кого родства между отдельными человеческими популяциями. Разные формы гена называются аллелями. Некоторые гены представлены в по- пуляции лишь немногими простыми вариантами. Другие гены - множе- ством аллелей, часть из которых сильно различается друг от друга за счет дивергенции. У большинства высших организмов каждая особь (индивид) имеет по две копии данного гена: одну от отца и одну от матери. Они представляют собой диплоидов. Поэтому количество копий каждого гена в популяции вдвое больше количества особей. Одна копия всех генов организма назы- вается геномом. Следовательно, диплоидная особь имеет два полных ге- нома. У диплоидной особи может быть две генетических конституции, или генотипа. Когда все аллели данного гена одинаковы, то особь - го- мозигота, когда копии генов различаются - гетерозигота. Более прими- тивные организмы, например бактерии, имеют только по одной копии каждого гена. Они гаплоидны, также как и половые клетки - гаметы у высших организмов. У многих растений и у некоторых животных имеет- ся по несколько копий гена или по несколько геномов, они полиплоид- ны. Пшеница, например, - это гексаплоид с шестью разными геномами, а лосось - тетраплоид с четырьмя геномами. Для обозначения различных аллелей данного гена мы будем пользо- ваться буквенными символами. Такие обозначения применимы и в слу- чае генетической изменчивости, в основе которой лежит множествен- ный аллелизм по определенным генам. Тогда аллели гена А можно обозначить как А , А , Ау... А, и т.д. По аналогии аллели гена В будут обозначены как В}, В2, By...Bj и т.д. Например, генотип организма, дип- лоидного по гену А может быть гомозиготным, допустим А.А^ или гете- розиготным А}А2.
Глава 1. Общий фон и многообразие генетической изменчивости Большинство генов у высших организмов находится в неполовых хро- мосомах, или в аутосомах. Небольшая часть генов находится в половых хромосомах, таких как X- и Y-хромосомы. Аутосомные гены диплоидны, гены в Х-хромосоме млекопитающих и некоторых других организмов гап- лоидны у самцов и диплоидны у самок. У Hymenoptera (Перепончато- крылых): муравьев, пчел и ос самцы гаплоидны по Х-хромосоме, а самки - диплоидны, такие организмы называются гапло-диплоидами. У сам- цов гены в Y-хромосоме находятся в гаплоидном состоянии, а у самок эти гены отсутствуют. Таким образом, Y-хромосомы передаются строго от отца мужскому потомству. Как митохондриальная ДНК (мтДНК), так и ДНК хлороплас- тов (хлДНК) также находится в гаплоидном состоянии и обычно переда- ется материнским организмом женскому потомству. В этих случаях на- блюдается материнское наследование. В отличие от Y-хромосомы, мтДНК и хлДНК передаются всему потомству, однако мужское потомство не пе- редает их в дальнейшем своему потомству. Протяженные участки ДНК входят в состав хромосом. Как правило, хромосомы наследуются независимо друг от друга. Гены могут находиться в разных или в одной и той же хромосоме, в этом случае наблюдается физическое сцепление генов. Когда гены находятся в разных хромосомах или далеко друг от друга на одной и той же хромосоме, они распределяются независимо. В этом случае хромосомы расходятся по гаметам независимо, от какого из роди- телей они были получены, и получается одинаковое количество гамет как родительских, так и неродительских типов. При тесном сцеплении генов почти все потомство получает гаметы родительских типов. Остальные гаметы содержат хромосомы с рекомбинациями в результате разрыва и воссоединения гомологичных хромосом во время мейоза. Число реком- бинаций между двумя генами - функция расстояния между этими гена- ми, которое обозначают на генетической карте в единицах карты. Для тесно сцепленных генов число единиц карты примерно соответствует частоте рекомбинаций, ожидаемой между двумя этими локусами. У различных организмов гены распределены по разным хромосомам. Разные виды имеют различное количество хромосом (см. O’Brien, 1993). У D.melanogaster, например, имеется только три хромосомы длиной 66, 103 и 108 единиц карты и с общей длиной 227 единиц карты. У человека - 23 хромосомы с общей длиной около 4000 единиц карты. Длина отдель- ных человеческих хромосом колеблется от 69 до 249 единиц карты. При тесном сцеплении генов на хромосоме частота рекомбинаций между ними низкая и родительские типы гамет сохраняются на протяжении поколе- ний. Аллели сцепленных генов на определенной хромосоме называются
II. Понятие о генетических терминах гаплотипом. Гаплотип можно представить в виде формулы, например: Л2 В{ C^D{.... Диплоидные особи содержат по два гаплотипа для каждого участка хромосомы. Иногда термин гаплотип используют для обозначе- ния гена и соседних с ним последовательностей ДНК. При описании генетической изменчивости, в основе которой вариа- бельность последовательностей ДНК, в терминологии часто учитывают географическое происхождение, название генов, число аллелей и другие критерии. Банк генов, или архив последовательностей ДНК депонирует описание этих аллелей под определенными номерами, например AF030867. Зная такой идентификационный номер, легко получить точ- ную последовательность требуемого гена. К настоящему времени Банк генов содержит более 4 миллионов последовательностей протяженнос- тью около 3 биллионов нуклеотидов. С каждым годом это количество за- метно возрастает. Иногда для обозначения аллелей дикого типа исполь- зуется знак +. Считается, что результатом действия аллелей дикого типа является нормальный фенотип (внешние признаки) особи. Несмотря на различия между аллелями дикого типа и вредными мутантными аллеля- ми, которые уменьшают приспособленность особей, порой трудно опре- делить какой из аллелей дикого типа. Это связано со сходством всех алле- лей на молекулярном уровне. В ряде особо оговоренных случаев аллели дикого типа могут различаться между собой. Например, аллели локуса групп крови АВО, доминантные М (меланиновые) и рецессивные т (ти- пичные) аллели меланинового гена у березовой пяденицы. Для обозначе- ния F (быстрого) и S (медленного) аллелей изоферментных локусов пользу- ются символами фракций этих изоферментов, которые мигрируют при электрофорезе в геле с различной скоростью. С точки зрения биохимии, ген - это участок ДНК (дезоксирибонукле- иновой кислоты), построенный из последовательности нуклеотидов. ДНК состоит из четырех различных типов нуклеотидов: аденина (А), тимиди- на (Т), гуанина (G) и цитозина (С). Молекула ДНК представляет собой двуцепочечную спираль, в которой А одной цепи спаривается с Т другой цепи и G одной цепи - с С другой. Аденин и гуанин относятся к пурино- вым, а тимидин и цитозин - к пиримидиновым основаниям. Длина моле- кул ДНК может быть очень большой. У человека ДНК в наиболее круп- ных хромосомах содержит более 200 миллионов нуклеотидов. Итак, расстояние между генами, количество нуклеотидов и число ре- комбинаций между этими генами находятся в зависимости. В человечес- ком геноме, например, два гена на расстоянии одной единицы карты с частотой рекомбинации между ними равной 0,01, разделены отрезком около 106 нуклеотидных пар, или 1 мегабазой. Однако в некоторых участ- ках хромосом частота рекомбинаций ниже средней. К таким участкам от-
Глава 1. Общий фон и многообразие генетической изменчивости носятся прицентромерные районы хромосом и теломерные концы. По- вышенная частота рекомбинаций указывает на так называемые горячие точки хромосом. Ь. Генетический код Для кодирования и синтеза полипептидов используется всего 4 типа нук- леотидов и 20 типов аминокислот. Чтобы упорядочить информацию, пе- редаваемую от ДНК к белкам требуется генетический код. В 1960-х годах было обнаружено, что различные аминокислоты кодируются нуклеотид- ными триплетами и были расшифрованы все 64 комбинации триплетно- го генетического кода (в молекулах РНК U - урацил- заменяет тимидин). Отдельные аминокислоты кодируются 61 кодоном, а оставшиеся три кодона служат стоп-сигналами терминации синтеза второй цепи ДНК (табл. 1.1). Поскольку 61-ым кодоном кодируется всего 20 аминокислот, генетический код является сильно избыточным и вырожденным. Действи- тельно, каждая из таких аминокислот, как лейцин (буквенное обозначе- ние этой аминокислоты L), аргинин (R) и серин (S) кодируются шестью разными нуклеотидными триплетами. Пять других аминокислот: валин (V), пролин (Р), треонин (Т), аланин (А) и глицин (G) кодируются 4 раз- личными нуклеотидными триплетами каждая. Однако такие аминокис- лоты как метионин (М) и триптофан (W) кодируются единственным ко- доном, причем кодон AUG не только кодирует метионин, но и служит инициирующим кодоном. Одна аминокислота - изолейцин (I) кодируется тремя различными триплетами, и по два разных триплета кодируют ос- тальные девять аминокислот: фенилаланин (F), тирозин (Y), гистидин (Н), глутамин (Q), аспарагин (N), лизин (К), аспарагиновую кислоту (D), глу- таминовую кислоту (Е) и цистеин (С). Если изменение одного нуклеотида в молекуле ДНК не приводит к замене аминокислоты, то такие изменения относятся к молчащим, сино- нимичным мутациям, или заменам. Эти молчащие однонуклеотидные замены есть во всех множественных кодонах, кодирующих одну и ту же аминокислоту и отличающихся только нуклеотидами в третьей позиции. В 8 из 16 комбинаций для первых двух нуклеотидов замена нуклеотида в третьей позиции не приводит к другой аминокислоте. Например, если два первых нуклеотида UC, то при всех четырех возможных нуклеотидах в конце триплета кодируется аминокислота серин. Изменения одного нук- леотида, приводящие к новой аминокислоте называются замещениями, или несинонимичными мутациями. К новым аминокислотам приводят почти все изменения нуклеотидов в первой и второй позициях кодона, за исключением триплетов, кодирующих аргинин и лейцин. Генетический код универсален для всех организмов. Исключением является генетичес-
II. Понятие о генетических терминах кий код митохондриальной ДНК (мтДНК), в котором есть несколько от- личий от универсального кода. У млекопитающих найдено четыре таких отличия, а у высших растений - два. ТАБЛИЦА 1.1. 64 нуклеотидных комбинации (кодона) генетического кода, отличающие- ся по нуклеотиду в третьей позиции и по кодируемым аминокислотам. Кодоны обозначе- ны тремя буквами, аминокислоты - одной. Вторая позиция и С А G UUU] Фен(Р) UCU UCC UAU UAC •Тир(У) UGU] UGC] Цис (C) U иис] C и UUA| Лей(Ь) UCA Cep(S) UAA • Стоп UGA Стоп A UUG j UCG UAG UGG Трип (W) G сии CCU CAU > Гис (Н) CGU U CUC ССС САС CGC c с CUA Лей(Ь) ССА Про (Р) САА * Глу (Q) CGA Apr(R) A CUG CCG CAG CGG G AUU Илей (I) ACU AAU > Асп(N) AGU Cep(S) U AUC АСС ААС AGC c А AUA. АСА Тре(Т) ААА ^Лиз(К) AGA Apr(R) A AUG Мет(М) ACG AAG AGG G GUU GCU GAU Аспк(Ц) GGU U GUC GCC GAC GGC Гли (G) c G GUA Вал (V) GCA Ала (А) GAA Глук(Е) GGA A gug] GCG GAG ggg] G с. Структура генома и типичный эукариотический ген В геноме имеются кодирующие и некодирующие участки. К первым от- носятся гены, кодирующие полипептиды и гены, кодирующие транспорт- ные и рибосомные РНК. Доля кодирующих генов в геноме колеблется от очень высокой у прокариот до относительно низкой у позвоночных жи- вотных и высших растений. Функция многих некодирующих участков генома пока не ясна, хотя некоторые из них играют роль в регуляции ге- нов и в структурной организации хромосом. Большая часть некодирую- щих участков представлена повторяющимися последовательностями. Некоторые из таких последовательностей короткие, например динуклео- тидный повтор GCGCGCGC..., другие могут быть очень длинными. На- пример, Alu -последовательности протяженностью около 300 пар нукле-
Глава 1. Общий фон и многообразие генетической изменчивости отидов повторены в геноме человека около 300 тысяч раз, занимая около 5% всего генома. Такие повторяющиеся последовательности с различной копийностью служат для исследования индивидуальной изменчивости в популяциях. Микросателлитные последовательности, например, из-за небольшой длины (2-6 нуклеотидов) называемые иногда короткими тан- демными повторами (STR - short tandem repeats), используются при кар- тировании геномов, для медико-судебной экспертизы и при работе с ред- кими видами. У человека изучено 5264 вариабельных динуклеотидных микросателлитных последовательности, которые рассеяны по всему ге- ному (Dib et al., 1996). Родственные повторяющиеся последовательности встречаются и в ко- дирующих участках генома. Считается, что такие мультигенные семей- ства повторов - результат удвоения (дупликации) определенных участ- ков генома с последующей дивергенцией путем мутаций и отбора. У некоторых членов мультигенного семейства повторов в результате мута- ций, делеций или вставок может измениться рамка считывания и появля- ются стоп-кодоны. Такие не кодирующие никаких функциональных про- дуктов гены называются псевдогенами. Семейство генов главного комплекса гистосовместимости (МНС) человека, например, состоит из более 100 тесно сцепленных генов. Многие из них, по-видимому, про- изошли от какого-то предкового гена (генов) и в результате эволюции приобрели разные функции или стали псевдогенами. Одно из неожиданных открытий молекулярной генетики заключается в том, что во многих эукариотических генах есть внутренние транскри- бируемые участки, которые затем не транслируются с молекул РНК. Дру- гими словами, такие гены имеют прерывистую структуру: кодирующие участки чередуются с некодирующими. На рисунке 1.2. показано, что нук- леотидная последовательность гена включает промоторный участок, ко- дирующие участки, или экзоны и некодирующие - интроны, а также фланкирующие последовательности, важные для работы гена. В некото- рых эукариотических генах содержится множество экзонов и интронов, однако в генах прокариот интроны отсутствуют. С последовательности ДНК сначала транскрибируется молекула РНК, которая модифицируется с обоих концов. Обычно транскрипция происходит от 5' к З'-концу. При созревании (процессинге) транскрипта интроны удаляются ферментами сплайсинга и получается молекула информационной РНК, или m (messenger) РНК. Такая молекула содержит белок-кодирующие участки - экзоны и готова к трансляции полипептидной последовательности. Пред- полагается, что экзоны как функциональные единицы соответствуют до- менам белка. Однако такая корреляция обнаруживается не всегда.
III. Введение в количественные методы Единица транскрипции I I Транскрипция Кэп (Добавление «кэпа» и поли (А)-конца) ^оли <*)- конец Зрелая тРНК Процессинг РНК Трансляция Полипептид, транслируемый с кодирующих участков Рисунок 1.2. Схематическая модель гена с тремя экзонами и двумя интронами, соответ- ствующего РНК-транскрипта и зрелой тРНК. III. Введение в количественные методы Для проверки и оценки действия различных эволюционных факторов в популяционной генетике используются соответствующие обозначения. Как правило, мы будем придерживаться традиционных символов, в кото- рых первая буква обозначает название эффекта, например: s - коэффици- ент отбора против гомозигот, т - скорость потока (миграции) генов. Про- исхождение других обозначений не столь очевидно, например: w - показатель относительной приспособленности генотипа,/- коэффици- ент инбридинга у особи. а. Модели Для описания концепций популяционной генетики используются различ- ные модели. Они представляют собой словесное (вербальное), графичес- кое или математическое описание реальных событий. Мы воспользуемся простыми математическими и графическими иллюстрациями закономер- ностей. Преимущество модели перед простым описанием в том, что она охватывает как сам процесс, так и его составные части. Модель должна соответствовать описанию природных процессов и согласовываться с
Глава 1. Общий фон и многообразие генетической изменчивости реальными наблюдениями. Однако приближенные математические вы- числения нередко дают неточную картину биологических явлений. Простой пример математической модели - личный или домашний бюджет, включающий множество важных деталей. Допустим, баланс на- личных денег в следующем месяце (время /+1) равен В1+1. Этот баланс - функция баланса текущего месяца, или Bt и двух величин: месячных по- ступлений I минус месячные расходы Е. В результате имеем: B^rB+1-E. Значения I и Е называются параметрами и являются действительными величинами этих двух количественных значений. Хотя данное выраже- ние описывает ситуацию в целом, оно не достаточно для детального по- нимания процесса. Например, параметры IviE могут состоять из несколь- ких количественных величин: Е включает расходы на питание (F), домашнее хозяйство (И), расходы на медицинские услуги (М). Тогда мо- дель принимает вид: Вм = Bt+I - (F+H+M). Более полное описание всех входящих в баланс факторов и расширение модели способствует более точному пониманию того, как регулируются наличные деньги. Степень детальности модели отчасти зависит от инте- ресов исследователей: интересуют их общие принципы или же точное описание частных случаев. Часто приходится выбирать между получени- ем общей модели с несколькими важными параметрами, которые можно обобщить для использования в аналогичных ситуациях и детальными моделями, разработанными для специальных целей. Представленная выше модель является детерминистической: при оп- ределенном начальном балансе вводятся определенные значения парамет- ров и четко определяется будущий баланс средств. Во многих случаях эти модели могут быть стохастическими, или случайными. В модель можно ввести факторы, которые происходят с некоторой вероятностью или имеют переменную величину. В результате введения изменчивых параметров нет возможности точно прогнозировать будущий баланс, как это можно сде- лать при точно заданных параметрах. Кроме того, могут возникнуть и не- стандартные или уникальные факторы, которые не описаны в основной модели. Например, человек может потерять работу, понести непредвиден- ные расходы по хозяйству или затраты на медицинские услуги. В качестве простого примера модельной популяции рассмотрим мо- дель для прогноза ее численности. Допустим, Nt и N/+l - численность по- пуляции в поколениях t и t + 1 соответственно. Пусть R - отношение численности популяции в поколении t + 1 к ее численности в поколении Z:
III. Введение в количественные методы R = ^-. Если это соотношение (так называемая скорость замещения или среднее число потомства для одного родителя) равно 2, то в каждом следующем поколении численность популяции удваивается. Данное выражение мож- но преобразовать для подсчета численности популяции в последующих поколениях. Если количество поколений равно Z+1, то: ^+1 = 7Wt. Другими словами, численность последующего поколения зависит от чис- ленности предыдущего поколения и скорости замещения. Если допустить, что такая же зависимость справедлива и для других поколений, например: то, подставляя значение из верхнего выражения, получим: Таким образом, первоначальная численность популяции No связана с чис- ленностью популяции в поколении t соотношением: N = R‘N0. Это очень удобная формула для проверки действия многих генетических факторов и для прогноза численности популяции в следующих поколе- ниях. Допустим, первоначальная численность популяции равна 100 осо- бям (7V0=100), а скорость замещения равна 2. Тогда предполагаемая чис- ленность популяции через пять поколений составит: N = 25 (100)=3200 M = Ni+i-Nt, где греческая буква А обозначает разницу Подставляя значение N/+r по- лучим: ^N=RNi-N = Ni(R-l). С помощью этого уравнения разницы можно вычислить предполагае- мые изменения численности популяции в разные отрезки времени. Мы воспользуемся этим уравнением для описания изменений частоты ал- лелей, происходящих под влиянием отбора, дрейфа генов и других фак- торов. • Если наблюдается непрерывный рост численности популяции (времен- ной интервал становится очень малым), то изменения ее численности лучше описываются с помощью дифференциального уравнения:
Глава 1. Общий фон и многообразие генетической изменчивости dN --= rN dT где г - величина, характеризующая рост численности популяции, называ- емая мгновенная скорость роста. Дифференциальные уравнения, в отли- чие от уравнений разницы, помогают получить общие уравнения, описы- вающие изменения в популяциях, но мы будем обращаться к их помощи лишь изредка. Математические модели имеют несколько преимуществ, важных для популяционной генетики. Во-первых, они способствуют пониманию ос- нов явления и позволяют обратить внимание на факторы, действительно важные для данного процесса. Это особенно полезно при постановке экс- периментов для выяснения роли различных факторов, а также при изуче- нии нового материала или темы. Во-вторых, такие модели точно описы- вают явление или процесс. Наконец, эти модели можно использовать для прогнозирования дальнейших событий. Например, имея модель и необ- ходимую информацию, можно вычислить численность популяции в бу- дущем, как это было показано ниже. Следует сказать, что точность опи- сательных (вербальных) и даже ряда математических моделей недостаточна для оценки их соответствия данному явлению. Более того, обычно с помощью вербальных моделей нельзя прогнозировать резуль- таты, расходящиеся с теорией, как это делают математические модели. Модели, о которых мы говорили, относятся к детерминистическим. Однако зачастую большую роль в популяционной генетике играют стохас- тические, случайные события. Для определения вероятности таких собы- тий иногда пользуются распределением вероятностей. Если модель слож- ная, для вычислений прибегают к компьютерным базам данных на основе случайных чисел или к методу Монте-Карло. Этот метод особенно полезен для оценки генетического дрейфа - изменения частоты аллелей в ряду по- колений, вызванного случайными причинами, например малочисленнос- тью популяции. Для оценки генетического дрейфа используют случайные величины с нормальным распределением между нулем и единицей. На- пример, двухаллельный локус дает гаметы А{, если такая случайная вели- чина будет между нулем и частотой аллелей у родителей. Если случайная величина находится между частотой аллелей у родителей и единицей, то образуются гаметы Аг Этот процесс можно продолжать до 2N гамет - то есть до количества гамет в популяции диплоидов с численностью N. Тогда частота аллелей в потомстве вычисляется, исходя из частот аллелей Л1 и Л2. В следующем поколении частота аллелей будет равна частоте аллелей у родителей, затем процесс начинается с нового набора случайных чисел, дающих новое случайное распределение в следующем поколении.
III. Введение в количественные методы d. Средние, вариансы и доверительные интервалы Для оценки различных популяционно-генетических признаков, например величины и характера генетической изменчивости, нужно использовать статистические методы (для более детального знакомства см. Sokal, Rohlf, 1995; Zar, 1999 и другие пособия по основам статистики). Как правило, популяции довольно большие, поэтому для оценки признаков использу- ют выборки - небольшие группы особей, представляющие целую попу- ляцию Такие выборки широко распространены в политических опросах, когда для интервью берутся случайные люди. Если выборка сделана слу- чайным образом, то подсчеты среди выборки отражают параметры вели- чин в самой популяции. Например, в выборке из 100 человек можно оце- нить частоту аллеля А . Если случайная выборка произведена из популяции, насчитывающей многие тысячи особей, то при условии дей- ствительно случайной выборки, вычисленная частота аллелей будет очень близка к истинной, которую можно установить при исследовании всех особей данной популяции. Допустим, в выборке, состоящей из п особей надо измерить какой- нибудь признак: вес или рост. Обозначим величину признака у особи i как х. Тогда можно вычислить среднюю - усредненное значение величин признака в выборке из п особей: 1 п х = — V х. где черта над х указывает на среднюю величину, а греческая буква Е - на сумму величин признаков у всех особей. В данном примере распределение величин вокруг средней может быть различным. Например, если все особи одинакового роста или веса, то изменчивость отсутствует. Если в выборке равные количества высоких и низких особей, то получаются крайние варианты изменчивости. Вариан- са (варианта), или дисперсия служит мерой отклонения от средней и вычисляется следующим образом: и,=-Ц-£(х,-х)2. п -1 “Г Другими словами, варианса х - средняя суммы квадратов отклонений от- дельных величин от средней (выражение п - 1 в знаменателе использует- ся вместо п, поскольку вычисленная таким образом варианса является несмещенной оценкой, это будет более правильной оценкой при осредне- нии параметров выборки любого размера).
Глава 1. Общий фон и многообразие генетической изменчивости Другая употребительная мера распределения величин вокруг средней - это стандартное отклонение. Стандартное отклонение представляет со- бой квадратный корень из вариансы и измеряется по той же шкале, что и средняя. Стандартное отклонение можно применять при нормальном рас- пределении для подсчета доли (пропорции) величин в данной области рас- пределения значений. Математически нормальное распределение является симметричным, со средней и вариансой, определяемыми стандартным от- клонением. На рисунке 1.3 показано теоретическое нормальное распреде- ление величин со средней по выборке, отмеченной тонкой вертикальной черточкой в центре графика. Выборка занимает площадь под кривой; тем- ноокрашенная область в пределах одного стандартного отклонения зани- мает 68% всей этой площади. Заштрихованные по обе стороны области с разными стандартными отклонениями от средней занимают 95% площади. Для удобства в статистике часто принимают величину стандартного откло- нения, близкую к нормальному распределению. Выборки из природных популяций на самом деле близки по распределению величин признаков к нормальному распределению. Для иллюстрации рассмотрим распределе- ние по росту среди студентов сельскохозяйственного колледжа (ныне - Университет) в штате Коннектикут. Измерения были сделаны в 1914 г. и показаны на рисунке 1.4. Заметьте, что среди 175 студентов только пятеро - очень низкорослые и столько же - очень высокие. Основная масса студен- тов имеет средний рост 67,3 дюйма, или 170,9 см (таблица 1.2). Эта вели- чина получается при делении суммы величин роста всех студентов (пер- вые две колонки таблицы) на их число (175): 1 х = — [58(1)+61(1)+62(5)....+72(4)+73(4)+74(1)] = 67,3. х величины Рисунок 13. Нормальное распределение величин со средней х (см. объяснение в тексте).
III. Введение в количественные методы Рисунок 1.4. Распределение по росту (в дюймах) у студентов сельскохозяйственного кол- леджа штата Коннектикут (по Crow, 1997а). Используя аналогичным образом величины во второй и третьей колонках таблицы 1.2, можно получить вариансу: 1 И = — = [86,7(1) + 39,8(1) +.........+32,4(4) + 44,8(1) ] = 7,3 и стандартное отклонение, равное 2,7. При нормальном распределении около 68% студентов в этой выборке имеют рост между 164,1 см (64,6 дюйма) и 177,8 см (70,0 дюйма), а 95% студентов - между 157,2 см (69,1 дюйма) и 183,4 см (72,2 дюйма). На самом деле, у семи студентов рост ниже 156,3 см (62 дюймов) или выше 182,9 см (72 дюймов). Они состав- ляют 4% выборки, что очень близко к теоретическим 5%. ТАБЛИЦА 1.2. Распределение по росту 175 студентов колледжа Рост (дюймы) Количество 2(х. - х)2 58 1 86,7 61 1 39,8 62 5 28,2 63 7 18,6 64 7 11,0 65 22 5,3 66 25 1,7 67 26 0,1 68 27 0,5 69 17 2,9 70 11 7,2 71 17 13,6 72 4 22,0 73 4 32,4 74 1 44,8
Глава 1. Общий фон и многообразие генетической изменчивости В статистике часто используются две близкие величины. Коэффици- ент вариации (СЕ) -это стандартное отклонение, деленное на среднюю и выраженное в процентах: сг100(Гг)12 х Как правило, варианса растет как средняя в квадрате, поэтому коэффици- ент вариации позволяет сравнивать изменчивость в различных выборках с разными значениями средней. Стандартное отклонение статистически средней величины называется стандартной ошибкой. Стандартная ошиб- ка средней - se равна: Эту величину можно применять для достоверности оценки средней. На- пример, при нормальном распределении переменной величины приблизи- тельно 95% средних из выборок размером п попадут в интервал ± l,96.ve вокруг истинной средней. Поэтому доверительный интервал 95% озна- чает, что истинное значение средней величины с 95% вероятностью ле- жит в пределах расчетного интервала х ± 1,96.ve. Часто распределение величин не является нормальным или его нельзя рассматривать как нормальное. В таких случаях полезно оценивать дове- рительный интервал вокруг средней с помощью других методов, так что уровни значимости по обе стороны от средней могут различаться. В дан- ном случае используют рэндом-тест, допуская, что вероятность исхода, или изучаемого эффекта, выше, чем на самом деле. Точность вычислений мож- но улучшить с помощью специальных компьютерных программ. Кроме того, доверительные интервалы и значения вероятностей фактически для любой выборки можно получить с помощью методов повторных выборок, напри- мер метода «обувной пряжки» или бутстрепного (см. главу 11) или метода «складного ножа» (jackknife), (Efron, Tibshirani, 1993). Мы коснулись только одной переменной, но в различных популяцион- но-генетических аспектах. Теперь рассмотрим одновременное (симуль- тантное) изменение двух переменных. Если можно выразить одну пере- менную как функцию другой (например рост потомства - как функцию роста родителей), то мерой взаимосвязи между двумя такими перемен- ными может быть регрессия. Оценки ковариансы также дают функцио- нальную зависимость, близкую к регрессионному анализу. С другой сто- роны, оценка корреляции показывает только степень различия двух переменных, но не их функциональную зависимость. Если между двумя переменными нет ассоциации, то и коварианса- наклон их линейной per-
III. Введение в количественные методы рессии - и коэффициент корреляции будут равны нулю. Положительная и отрицательная ассоциации между двумя переменными выражаются по- ложительными и отрицательными величинами, соответственно. В дальнейшем мы будем использовать три вида средних. Средняя ве- личина, вычисляемая как показано ниже, называется арифметической средней. Допустим, что две относительных приспособленности равны 1,0 и 0,25. Тогда их арифметическая средняя составит 0,625. В некоторых случаях принято вычислять геометрическую среднюю. Это нужно, на- пример, при определении условий, необходимых для поддержания поли- морфизма популяции, когда изменяется ее приспособленность (см. глава 4). Геометрическая средняя N величин равна: *g =(VA”-x,-”^)l/'v= ( N \"N = гь , \ ,=1 / где заглавная греческая буква П (пи) указывает на умножение всех от- дельно взятых величин. Для двух приспособленностей со значениями 1,0 и 0,25 геометрическая средняя равна 0,5, т.е. ниже, чем арифметическая средняя этих величин. Иногда, например при определении эффективного размера популяции, численность которой меняется в разных поколениях, более подходяще вычислить гармоническую среднюю (см. главу 6). Гармоническая сред- няя связана с эквивалентами отдельных величин: - _ N Xh ~ 1 1 1 1 — +------------- х{ х2 X- xN N Для двух приспособленностей 1,0 и 0,25 гармоническая средняя составит 0,4, т.е. меньше, чем арифметическая и геометрическая средние. В об- щем, X > Xg > xh. с. Вероятность При постановке экспериментов для измерения различных эффектов в популяционной генетике важно знать элементы вероятности - Рг. Рас- смотрим простейший пример двух событий со взаимно исключаемыми
Глава 1. Общий фон и многообразие генетической изменчивости исходами - подбрасывание монетки. Оно может закончиться падением монетки на орла или на решку. Поэтому сумма вероятностей первого исхо- да Рг(1) =0,5, и второго исхода Рг(2) =0,5 должна составить: Рг(1)+Рг(2) =1. Конечно, в другой ситуации, например при определении вероятности за- разиться инфекцией, вероятности получить и не получить инфекцию не равные. Допустим, Pr (1) =0,14, тогда Рг (2)=0,86. Если исходов несколь- ко, то сумма их вероятностей должна быть равна 1. Правило сложения вероятностей гласит, что сумма вероятностей взаимно исключаемых со- бытий равна вероятности любых событий. Когда известно число попы- ток, например бросаний монетки, тогда ожидаемое число исходов одного типа равно вероятности исходов при N попытках. Для первого исхода ожидаемое число исходов первого вида - Е(1)=Рг(1)М Например, мо- нетку подбрасывают 20 раз, тогда ожидаемое число падений решкой (исход 1): Е(1)=0,5(20)=10. В действительности наблюдаемое число оп- ределенных исходов часто не соответствует ожидаемому. Например, на- блюдаемое число падений монетки решкой может составить 8 вместо ожидаемых 10. Рассмотрим вероятность определенных исходов двух или более неза- висимых событий. Допустим, надо выяснить вероятность первого исхода двух различных событий. Если допустить, что эти события независимы друг от друга, то исход первого события никак не связан с исходом второ- го, и наоборот. Тогда общая вероятность первого исхода в этих двух собы- тиях равна произведению вероятностей в каждом из них: Рг(1,1)= Рг(1) Рг(1). Это правило умножения вероятностей справедливо для любого числа независимых событий. Например, общая вероятность падения решкой при четырех подбрасываниях монетки составит: Рг(1,1,1,1)= Рг(1) Рг(1) Рг(1) Рг(1) = (0,5) (0,5) (0,5) (0,5) = = 0,0625. При двух возможных исходах события, например при падении на орла или решку, при попадании в гаметы аллелей или А2, в выборке разме- ром N возможно i исходов первого типа и j исходов второго типа (z +j = N). Если вероятность первого исхода равна р, а вероятность второго равна q, то q(p + q)= 1. Биномиальная вероятность того, что в N независимых попытках случится i исходов первого типа составит: ДЛ Pr(0 =—p‘qJ. z!y! Значок ! указывает на умножение всех целых значений данной величины, например, 4! = (4) (3) (2) (1), и по определению 0! = 1. Биномиальный коэффициент N\ /(/!/!) показывает число различных последовательных
III. Введение в количественные методы событий (пермутаций), в которых может наблюдаться данное сочетание исходов. Напомним, что нам нужно определить число исходов одного типа, поскольку оставшиеся исходы относятся к другому типу. Например, вероятность двух падений решкой при пяти подбрасывани- ях монетки (p=q=Q,5) составит: 51 Рг(2) = —о,52 0,53 = 10(0,03125)=0,3125. В этом случае в пяти подбрасываниях монетки две решки и три орла мо- гут выпадать десятью различными способами: РРООО, РОРОО, РООРО и т.д. Ожидаемое число исходов первого типа равно произведению числа попыток и вероятности события р: Np. Варианса количества наблюдений этого исхода в выборке размером N составит Npq. Когда число возможных исходов больше двух, то вероятность сочета- ния различных исходов можно вычислить, исходя из распределения муль- тиномиальной вероятности. Например, имеется три типа генотипов (исходов): ЛД , ЛД2 и А^А,. Тогда вероятность i числа генотипов Л числа генотипов Л Д, и к чис- ла генотипов А^А, (i +j + к = N) составит: JV' -I. Pr(z,y) = —— P‘HJQ\ где P, H и Q - вероятности трех различных генотипов в популяции, из которой взята выборка (Р + Н + Q =1). Биноминальное распределение, в котором величина р пренебрежимо мала, а величина N становится очень большой (произведение Np остается средней величиной) приближается к распределению Пуассона. В этом случае вероятность i числа событий составит: где среднее число событий, Np, равно р . Допустим, что выживаемость N различных групп в популяции зависит от численности каждой их этих групп. Если вероятность принадлежности особи к данной группе р = 0,01, a N= 100 (р = 1), то вероятность группы с 0 особями составит: е-|ц° Рг(0) = ——= 0,368. 0! Аналогично, Рг(1)=0,368, Рг(2)=0,184 и т.д. Варианса распределения Пу- ассона равна средней (Д). 3 — 7660
Глава 1. Общий фон и многообразие генетической изменчивости Важно, что с помощью вероятностей можно оценивать эксперимен- тальные результаты (см. Sokal, Rohlf, 1995; Zar, 1999). В эксперименте принимается нулевая гипотеза, которая подлежит проверке. При этом желательно свести к минимуму вероятности отклонения истинной нуле- вой гипотезы - ошибки первого типа, а также принятия ложной гипоте- зы - ошибки второго типа. Во-первых, перед началом эксперимента сле- дует выбрать уровень величины ошибки первого типа - а или Р, который означает вероятность такой ошибки. Например, если а = 0,05, то при уров- не значимости 5% Р < 0,05. Если нулевая гипотеза не отброшена, то важ- но определить статистическую силу данного эксперимента - вероятность отказа от нулевой гипотезы, как от ложной. При вероятности ошибки вто- рого типа, равной р, статистическая сила равна 1-Д. Когда проделано множество экспериментов и произведены сравнения результатов, нужно определить уровень а. Допустим, выполнено 20 экспериментов, тогда хотя бы в одном из них можно ожидать уровень значимости Р < 0,05. Затем нужно подобрать более низкий уровень значимости, пользуясь поправка- ми Бонферрони и Данн-Сидака. d. Матрицы Мы будем пользоваться матрицами при описании генетического дрейфа (глава 6) и потока (миграции) генов (глава 7). Матрица X представляет собой совокупность величин, называемых элементами, которые записа- ны в виде прямоугольника, как, например, квадратная матрица из трех рядов и трех колонок: Х|2 х13 %22 ^23 ’ *32 Х33 где первый индекс означает номер ряда, а второй - номер колонки. Мат- рица с одной колонкой называется вектором, например: Уз Матрицы можно умножать как векторы, получая новые векторы У' = ХУ Такое умножение - сумма произведений соответствующих элементов в рядах матрицы и вектора, так что
111. Введение в количественные методы 1=1 3 1=1 3 1=1 Например, матрица и вектор содержат элементы: 1,0 .¥=0,0 0,0 0,25 0,5 0,25 0,0 0,0 1,0 0,2 0,3 0,5 Y = тогда (1,0)(0,2) + (0,25)(0,3) + (0,0)(0,5) Y' = (0,0)(0,2) + (0,5)(0,3) + (0,0)(0,5) (0,0)(0,2) + (0,25)(0,3) + (1,0)(0,5) 0,275 0,15 0,575 В некоторых случаях нужно умножить квадратную матрицу саму на себя. В результате получается новая матрица такого же размера. Элемен- ты этой новой матрицы представляют собой сумму произведений эле- ментов данного ряда и соответствующей колонки. Пример умножения квадратной матрицы 3x3: 3 : 1 3 3 X2 = 1 = 1 3 X2iXll 1 = 1 3 У, X2iXi2 1=1 3 Хх2,¥-з 1=1 3 /=1 3 ^X3iXi2 1=1 3 Z-31-13 1=1 1=1 1=1 Используя верхнюю матрицу, получим 2 1,0 0,375 0,0 0,0 0,25 0,0 0,0 0,375 1,0 Умножение можно повторять до любой степени t, получив матрицу Х‘. 3»
рб Глава 1. Общий фон и многообразие генетической изменчивости IV. Генетическая изменчивость Перед тем, как познакомиться с количественным и качественным описания- ми изменчивости, а также с факторами, влияющими на изменчивость при- знаков, остановимся на общей характеристике генетической изменчивости в природных популяциях. Долгое время люди догадывались о существовании индивидуальной изменчивости в человеческом обществе. Ее относили к раз- ряду так называемого семейного сходства. Считалось также, что различия между сортами или линиями домашних животных и растений передаются по наследству. Только с открытием законов Менделя и с появлением теории естественного отбора Дарвина в 1930 годы сложилась неодарвиновская тео- рия эволюции, которая попыталась количественно измерить генетическую изменчивость внутри и между природными популяциями. Первые исследования генетической изменчивости в природных популя- циях сконцентрировались на изучении легко обнаруживаемой изменчивос- ти количественных признаков, таких как цвет или морфология (Ford, 1940), хромосомные инверсии (Dobzhansky, 1941) и группы крови (Landsteiner, Weiner 1940). Несмотря на важность этих исследований, они не позволяют оценить долю генетической изменчивости в генофонде популяций. Действи- тельно, все исследованные варианты признаков нетипичны: обычно в попу- ляциях присутствуют только несколько вариантов окраски или морфологи- чески полиморфных типов. В районе инверсий находится большое число разных генов, а группы крови были открыты в результате возникших про- блем с переливанием крови. В 1960 году еще отсутствовали точные знания о степени генетической изменчивости в популяциях. Поэтому считалось, что не менее половины всех генетических локу- сов у конкретных особей в популяции находится в гетерозиготном состо- янии, и лишь от 12 до 20 изменчивых локусов вносят вклад в изменчи- вость внутри популяции (Маут, 1963). ФЕОДОСИЙ ДОБЖАНСКИЙ (1900 - 1975) Добжанский внес большой и разносторонний вклад в биологию (Ayala, 1977; Glass, 1980; Lewontin et al., 1981; Levine, 1995). Наиболее важной является его работа Генетика и проис- хождение видов (1941), в которой были отражены современные эволюционные идеи. В 1927 году он эмигрировал из России в США. Здесь в 1933г. он продолжил обширные исследова- ния по генетической (хромосомной) изменчивости в популяциях плодовых мушек, особен- но Drosophila psevdoobscura. Эти исследования были продолжены учениками и коллегами Добжанского (например, Anderson et al., 1991). Научные интересы Добжанского касались также эволюции человека, генетики поведения, философии науки и других областей, кото- рые он существенно обогатил. Добжанский создал целую школу молодых генетиков, его учениками были Брюс Уоллес, Ричард Левонтин, Тимоти Праут, Франсиско Айала. Предан- ность Добжанского эволюционным идеям иллюстрирует знаменитая фраза: «Все в биоло- гии имеет смысл лишь в свете эволюционного учения» (Dobzhansky, 1973).
IV. Генетическая изменчивость Такие несопоставимые взгляды на генетическую изменчивость (нали- чие множества полиморфных локусов и то, что из множества полиморф- ных локусов в популяции поддерживается лишь часть) были изложены Добжанским в 1955 г. в виде балансовой и классической моделей гене- тической структуры природных популяций. Согласно балансовой моде- ли составляющие популяцию особи гетерозиготны по различным алле- лям большинства локусов. Другими словами, типичный диплоидный геном можно представить в виде: Л в2 с3 ... Хх у, z3 А с7 ... у, z2 где локусы А, С и Z гетерозиготны. Согласно балансовой модели, различ- ные аллели каждого из локусов сохраняются в популяции благодаря ба- лансирующему отбору, дающему преимущество гетерозиготным особям (см. главы 3 и 4). В отличие от балансовой модели, классическая считает генетическую изменчивость популяций незначительной. Тогда тот же самый геном мож- но представить в виде: + + т + ...+ + + + + + + ...+ + + где + и т обозначают аллели дикого типа и мутантные аллели, соответ- ственно. Гетерозиготна лишь малая часть локусов, причем гетерозиготна по рецессивным, вредным мутациям, которые поддерживаются в популя- ции с очень низкой частотой. Эволюция происходит благодаря тому, что время от времени в результате мутации появляется удачный аллель, час- тота которого под действием отбора постепенно увеличивается. Этот но- вый аллель постепенно становится аллелем дикого типа, вытесняя ста- рый аллель дикого типа. Эти две различные модели совпадали только в оценке влияния изменчивости на приспособленность. Существуют два количественных подхода к определению уровня и ха- рактера генетической изменчивости в популяции. Во-первых, несмещен- ная оценка генетической изменчивости. Во-вторых, оценка действия от- бора на различные генотипы, например на гетерозигот и гомозигот. Степень генетической изменчивости можно оценить при сравнении про- тяженных гомологичных последовательностей ДНК. Однако возможность секвенировать такие последовательности появилась сравнительно недав-
Глава 1. Общий фон и многообразие генетической изменчивости но. Пока мы лишь остановимся на этих результатах, а подробно обсудим их в главе 9. Желательно также знать и степень селективно значимой ге- нетической изменчивости. Правда, маловероятно, что существенная из- менчивость последовательностей ДНК связана с большими различиями в приспособленности особей внутри популяции (см. главу 9). Степень генетической изменчивости определяют для того, чтобы выяснить влия- ние такой изменчивости на селективные различия фенотипов - так назы- ваемый материал эволюции (Lewontin, 1974). Пытаясь точно оценить генетическую изменчивость в популяции, Ле- вонтин и Хабби (Lewontin, Hubby, 1966), а также Харрис (Harris, 1966) ис- следовали изменчивость серии локусов, кодирующих аллоферменты (ало- зимы). Они изучали электрофоретическую подвижность продуктов этих генов, допуская, что оценка изменчивости не зависит от функции генов (краткое описание электрофоретического анализа приводится в следующем разделе этой главы). Эти, а затем и множество других исследователей пока- зали высокую степень изменчивости по аллоферментным локусам. Такая изменчивость присуща фактически всем видам, за исключением тех, у ко- торых изменчивость ограничена генетическим дрейфом. В результате ста- ло ясно, что изменчивость аллоферментных локусов более точно описыва- ется с помощью балансовой модели. Но такое описание сильно упрощено, поскольку связь между генетической изменчивостью и поддерживающи- ми ее факторами по-видимому более сложна и полностью не соответствует ни одной из рассмотренных выше моделей. Величина и характер генетической изменчивости в популяции потен- циально определяются несколькими факторами: отбором, инбридингом, генетическим дрейфом, генным потоком, мутациями (подробнее см. со- ответствующие главы). Эти факторы могут оказывать общий эффект. Мутации, например, все- гда усиливают изменчивость, а также генетический дрейф, а инбридинг всегда уменьшает размах изменчивости. Такие факторы как отбор и ген- ный поток могут как увеличивать, так и уменьшать генетическую измен- чивость. Сочетания этих факторов обусловливают самые разнообразные картины генетической изменчивости в популяциях. Итак, балансовая мо- дель очень упрощенно по сравнению с реальными механизмами, действу- ющими в природных популяциях, объясняет наличие высокой генетичес- кой изменчивости действием балансирующего отбора. На самом деле, есть и отличающиеся от этой модели объяснения, например эффект нейтраль- ного отбора (см. главу 9). Согласно этой точке зрения, межаллельные раз- личия нейтральны в отношении отбора, и обеспечивают изменчивость в сочетании с мутациями и генетическим дрейфом. Безусловно, эти факто- ры могут влиять на генетическую изменчивость, их значение в усилении,
IV. Генетическая изменчивость поддержании и ограничении такой изменчивости мы обсудим в дальней- шем. Поскольку наша основная цель - продемонстрировать разнообра- зие генетической изменчивости, мы не будем детально рассматривать ее количественные характеристики. В главе 2 мы обсудим, как вычисляется меж- и внутрипопуляционная генетическая изменчивость. Величины, рас- считанные для единичных генов пропорциональны величинам для поли- морфных локусов, Р, а а доля гетерозигот по всем локусам в конкретной популяции соответствует средней Н. Под полиморфными понимаются различные генетические состояния одного локуса в данной популяции, например формы А, В, Он АВ для локуса АВО групп крови человека. Если 50 таких локусов представлены 10 различными формами, тогда доля полиморфных локусов составит Р = 10/50 = 0,2. Доля гетерозигот в популяции - это доля диплоидных генотипов, пред- ставленных двумя аллелями данного локуса. Возьмем другой полиморф- ный локус группы крови MN. По этому локусу возможны три генотипа: два гомозиготных - ММ и NN и один гетерозиготный - MN. Допустим, что в популяции 200 человек и 90 из них - гетерозиготы. Тогда в этой популяции будет наблюдаться следующая доля гетерозигот по данному локусу: Н = 90/200 = 0,45. Когда известно несколько гетерозиготных локусов, то получается среднее значение доли гетерозигот по разным локусам - Н Это во многом подходит и для описания двух основных количествен- ных мер изменчивости ДНК, которые подробно рассматриваются в главе 2. Допустим, имеются протяженные гомологичные последовательности ДНК с определенным числом нуклеотидов. Сначала можно вычислить долю ва- риабельных нуклеотидов - ps - во всех имеющихся последовательностях. Затем можно узнать долю нуклеотидов, которые различаются при случай- ном сравнении двух из этих последовательностей - д (греческая строчная буква пи). Эта величина эквивалентна средней гетерозиготности или раз- нообразию нуклеотидного состава. В качестве примера возьмем две после- довательности гена алкогольдегидрогеназы - Adh (Kreitman, 1983). После- довательности Ja-S и F1-F различаются по 5 из 2379 нуклеотидов, т.е. ps = 5/2379 = 0,0021. Допустим, имеется три последовательности: две Ja-S, назовем их Ja-S(l) и Ja-S(2) и одна F1-F. Гетерозиготность при сравнении последовательностей Ja-S(l)-Ja-S(2) равна 0, а при сравнении Ja-S(l) - F1-F равна 5/2379 = 0,0021. При сравнении Ja-S(2) - F1-F она также равна 0,0021. Поэтому средняя гетерозиготность по одному сайту в выборке из трех последовательностей составит 0,0042/3 = 0,0014. а. Изменчивость аллоферментов В популяционной генетике изменчивость белков служит мерой изменчи- вости последовательностей ДНК, кодирующих аминокислоты для соот-
Глава 1. Общий фон и многообразие генетической изменчивости ветствующих белков. Использование электрофоретического анализа бел- ков для решения проблем популяционной генетики стало вехой для всей эволюционной генетики (Lewontin, Hubby, 1966), (Harris, 1966). Подроб- но такой эволюционный анализ можно найти в других работах (Avise, 1994; Hills et al., 1996; Hoetzel, 1998). Остановимся на некоторых момен- тах. С помощью электрофореза можно разделять различные белки, полу- ченные из крови, тканей и целых организмов. Обычно белки разделяют в крахмальном или полиакриламидном гелях под действием электрическо- го поля. Через некоторое время гель окрашивают специальными красите- лями, специфичными для различных белков. Затем определяют относи- тельную подвижность того или иного белка, которая зависит от размера, заряда и конфигурации белковой молекулы. Если два белка различаются по аминокислотному составу, то они, как правило, имеют разную элект- рофоретическую подвижность, поскольку замена аминокислот ведет к изменению массы и (или) заряда молекулы. Однако с помощью электрофореза можно обнаружить только те ами- нокислотные замены, которые сопровождаются изменением массы и за- ряда молекул белка (Lewontin, Hubby, 1966). Остается так называемая скрытая изменчивость, которую удается обнаружить с помощью специ- альных электрофоретических процедур, используя разные концентрации гелей и различные уровни pH (Coyne, 1976). С помощью такого последо- вательного электрофореза были выявлены варианты человеческого гемо- глобина, которые имеют одинаковую электрофоретическую подвижность (Ramshaw et al., 1979). К тому времени было известно 85% аминокислот- ного состава этих вариантов. Затем, с помощью секвенирования ДНК было показано, что во многих случаях изменчивость аминокислотного состава белков нельзя установить даже с помощью специальных методов элект- рофореза (Veuille, King, 1995). Для характеристики действительного уров- ня изменчивости аминокислотного состава белков не подходят даже са- мые тонкие методы электрофоретического анализа (Barbadilla et al., 1995). Для отслеживания различий в электрофоретической подвижности бел- ки, полученные от различных особей, одновременно разгоняют в одном и том же геле. Пример такого электрофореза девяти образцов, обнаружива- ющего изменчивость двух аллоферментных локусов, кодирующих лей- цинаминопептидазу (LAP), показан на рисунке 1.5 (Selander, 1976). По- скольку молекула LAP состоит из одной субъединицы (мономер), то у гомозигот окрашивается одна полоса, а у гетерозигот - две. Верхний ал- лоферментный локус (Lap-\) полиморфен по двум электрофоретическим полосам, а нижний - (Lap-2) - по трем. На рисунке белки мигрировали в геле снизу вверх с неодинаковой скоростью, поэтому фенотипы (предпо- лагаемые генотипы) обозначены F, М и S (от англ, fast - быстрый, medium -
IV. Генетическая изменчивость Рисунок 1.5. Изменчивость фермента лейцинаминопептидазы у девяти особей коричне- вой улитки - Helix aspersa (Selander, 1976). Верхние полосы, соответствуют локусу Lap-\, полиморфному по двум аллелям (F и 5), а нижние - локусу Lap-2, полиморфному по трем аллелям (.S', М, F). средний и slow - медленный). Например, крайний левый образец на ри- сунке 1.5. гетерозиготен по FS полиморфам (аллелям) локуса Lap-\ и го- мозиготен по полиморфам SS локуса Lap-2. Считается, что каждая поло- са на геле представляет собой тот или иной аллель данного локуса. Однако, как будет сказано ниже, некоторые аминокислотные замены не приводят к появлению других электрофоретических полос. Разработка методов электрофоретического анализа белков для нужд популяционной генетики в 1970 годы открыла новые перспективы. Эти доступные методы позволяют исследовать генетическую изменчивость практически у любого вида. Аллоферментную изменчивость в разных популяциях одного или близких видов изучает целый ряд специализи- рованных лабораторий. Оказалось, что некоторые аллельные варианты широко распространены у близко родственных видов. С другой сторо- ны, виды или популяции могут отличаться друг от друга по частоте раз- личных аллельных вариантов белка. Кроме того, популяции могут раз- личаться и по уровню гетерозиготности некоторых аллоферментных локусов. Например, в двух городских кварталах Брайана (штат Техас) было со- брано 2218 коричневых улиток - Helix aspersa, населявших 43 колонии (Selander, Kaufman, 1975). Этот вид улиток попал в Брайан в начале 30 годов прошлого века и сейчас широко распространен в садах и парках. На рисунке 1.6 показаны частоты различных аллелей для локуса малатде- гидрогеназы Mdh -1 и локуса Lap-2. Частота локуса Mdh-\120 варьирует в разных колониях от 0,75 до почти 0,30. Гетерозиготность по локусам Mdh- 1 и Lap-2 в этих двух кварталах была сходной, но резко различалась по другим локусам. Например, гетерозиготность по локусу Got-i равна 0,306 в одном квартале и только 0,002 - в другом.
Глава 1. Общий фон и многообразие генетической изменчивости Рисунок 1.6. Частота аллелей по локусу Mdh-1 (а) и локусу Lap-2 (b) в колониях коричне- вой улитки из двух отдельных городских кварталов. Диаметр кружка пропорционален размеру колонии, внутри кружков схематично показана частота аллелей (по Selander, Kauftnan, 1975). В популяции краснобрюхой полевки Microtus ochrogaste,r в течение 30 месяцев исследовали 5 полиморфных локусов (Gaines et al., 1978). У этих небольших грызунов наблюдается трехлетний цикл изменчивости плот- ности популяции. Средняя продолжительность жизни одного поколения грызунов составляет от 6 до 8 недель, поэтому за период наблюдений было исследовано 20 поколений полевок. На рисунке 1.7 показаны ре- зультаты исследования аллеля F локуса Lap у полевок, пойманных в Лоу- ренсе (штат Канзас). Места обитания грызунов А, В и D расположены в радиусе 1,2 км друг от друга, а место С - на расстоянии 3,6 км от других мест обитания. Оказалось, что частота аллеля в различных местах отлова и в разное время сильно различается, варьируя от 0 в начале исследова- ния до 0,5 в другое время. Частично это объясняется разными размерами выборок. При проверке изменчивости по другим локусам - Tf и G6pd - аллельная частота оказалась значительно ниже. По одному из сайтов ге-
IV. Генетическая изменчивость Рисунок 1.7. Изменение со временем частоты аллеля F локуса Lap у краснобрюхой по- левки Microtus ochrogaster в четырех местах обитания. (Gaines et al., 1978). терозиготность варьировала в разное время от 0,10 до 0,35, а по другим трем сайтам была очень низкой. Одно из основных открытий, сделанных с помощью электрофоретичес- кого анализа, состоит в обнаружении широкой изменчивости числа генов, кодирующих аллоферменты у разных организмов. Наибольшая изменчи- вость наблюдается у беспозвоночных и растений, наименьшая - у позво- ночных животных, хотя внутри каждой из этих групп встречаются замет- ные колебания изменчивости. У большинства видов исследовано примерно по 30 различных локусов, а у человека и некоторых других видов - значи- тельно больше. В таблице 1.3 показана гетерозиготность по 71 аллофер- ментному локусу у человека (Harris, Hopkinson, 1972) Пятьдесят один из этих локусов мономорфен, а 20 - полиморфны с гетерозиготностью от 0,02 до 0,53. Исходя из этих данных, доля полиморфных локусов - Р, составляет 0,282, а средняя гетерозиготность по всем локусам Н = 0,067. ТАБЛИЦА 1.3. Гетерозиготность по 71 аллоферментному локусу у человека (по Harris, Hopkinson, 1972) Локус Гетерозиготность (Н) 51 мономорфный локус 0,00 Пептидаза С 0,02 Пептидаза D 0,02 Глутамат-оксиацетат трансаминаза 0,03 Лейкоцитарная гексокиназа 0,05 6-Фосфоглюконатдегидрогеназа 0,05
Глава 1. Общий фон и многообразие генетической изменчивости ТАБЛИЦА 1.3. Продолжение Локус Гетерозиготность (Н) Алкогольдегидрогеназа-2 0,07 Аденилаткиназа 0,09 Панкреатическая амилаза 0,09 Аденозиндезаминаза 0,11 Галактазо-1 -фосфатуридилтрансфераза 0,11 Ацетилхолинэстераза 0,23 Митохондриальный фермент 0,30 Фосфоглюкомутаза-1 0,36 Пептидаза А 0,37 Фосфоглюкомутаза -3 0,38 Пепсиноген 0,47 Алкогольдегидрогеназа-3 0,48 Глутамат-пируват трансаминаза 0,50 Кислая фосфатаза из эритроцитов 0,52 Щелочная фосфатаза из плаценты 0,53 Ь. Нуклеотидная и аминокислотная изменчивость За последние десять лет методы секвенирования ДНК стали более совер- шенными и автоматизированными. В результате стало возможным иссле- довать изменчивость множества генов различных организмов. Эти дан- ные можно использовать для изучения изменчивости аминокислотного состава белков у отдельных особей, в популяциях и у вида в целом. Но- вые методы секвенирования обязаны своим появлением грандиозному проекту по секвенированию генома человека, который близок к своему завершению. Уже полностью закончено секвенирование генома у целого ряда прокариот, одноклеточных эукариот, дрожжей Saccharomyces cerevisiae (Goffeau et al., 1996). Недавно был полностью просеквениро- ван геном многоклеточной нематоды (круглого червя) Caenorhabditis elegans {C.elegans Sequencing Consortium, 1998). У дрожжей просеквени- ровано более 12 мегабаз (Mb), точнее 12,068 килобаз (КЬ) геномной ДНК, кодирующей 6340 генов. Геном нематоды почти в три раза больше дрож- жевого генома и состоит из 97 мегабаз ДНК, что соответствует 19 100 генам. Человеческий геном содержит примерно 3700 мегабаз ДНК, но лишь в четыре раза больше генов, чем геном нематоды (около 80 000). Очевидно, что количество генов у этих и других видов растет не столь быстро, как количество ДНК. Этот факт связан с тем, что геном высших организмов содержит больше некодирующей ДНК, чем геном низших.
IV. Генетическая изменчивость Для детального знакомства с методами определения изменчивости ДНК читатель может обратиться к специальной литературе (Avise, 1994; Hills et al., 1996; Hoelzel, 1998). Один из таких широко используемых методов основан на расщеплении ДНК бактериальными ферментами - эндонук- леазами рестрикции, узнающими специфические сайты в молекуле ДНК. С помощью этих ферментов бактерии расщепляют чужеродную ДНК бак- териофагов, в то время как их собственный геном защищен от действия этих ферментов с помощью метилирования нуклеотидов. Фермент EcoRI, например, впервые обнаруженный у кишечной палочки Escherichia coli, узнает следующие последовательности в двойной цепи ДНК: GAATTC/ CTTAAG, расщепляя их таким образом, что остаются неспаренные кон- цы ААТТ. Ферменты рестрикции используются для идентификации митохонд- риальной ДНК (мт ДНК). Эта ДНК представляет собой небольшие коль- цевые молекулы (у человека это молекулы размером 16 569 нуклеоти- дов), которые содержат около 16 генов, наследующихся по материнскому типу. Количество фрагментов, полученных после расщепления кольце- вой мтДНК ферментами рестрикции равно количеству сайтов узнавания для этих ферментов. Молекулы мтДНК достаточно велики, и также вели- ка вероятность появления различающихся сайтов рестрикции у особей одного и того же вида и у разных видов. У человека, например, EcoRI узнает в мтДНК три сайта рестрикции, а в мтДНК медоносной пчелы - пять сайтов (Hillis et al., 1996). Отдельные особи и целые популяции мо- гут различаться по разным сайтам рестрикции ДНК, а это приводит к полиморфизму длин рестрикционных фрагментов, или ЦДРФ. Ана- лиз сайтов рестрикции важен для оценки взаимосвязей между близко род- ственными группами, поскольку накопление новых сайтов рестрикции происходит довольно быстро. Кроме того, считается, что четырех- или шестичленные последовательности, узнаваемые ферментами рестрикции, вероятно не подвержены отбору. Поэтому каждый из таких сайтов уника- лен и появляется в популяции только однажды. У 87 особей сумчатой крысы Geomys pinetis, обитающей на юго-вос- токе США, было исследовано 6 различных сайтов рестрикции в мтДНК и обнаружено 23 различных гаплотипа (рисунок 1.8), (Avise et al., 1979). Число различий между сайтами рестрикции в разных гаплотипах отмече- но поперечными черточками: например, гаплотип р отличается от гапло- типа q по одному сайту, а гаплотип р от г - по двум. Очевидно, что суще- ствует строгое соответствие между близостью гаплотипов и их географической локализацией, т.е. в соседних популяциях обнаружива- ются сходные гаплотипы. Исключением является распределение сайтов рестрикции между западными и восточными популяциями.
Глава 1. Общий фон и многообразие генетической изменчивости Рисунок 1.8. Взаимосвязь между 23 различными гаплотипами мтДНК у 87 сумчатых крыс (по Avise et al., 1979). Диаграмма, связывающая наиболее близкие гаплотипы, наложена на карту географического расселения животных. Вертикальные черточки указывают на число возможных различий между гаплотипами. В 1977 году появился метод секвенирования ДНК. При секвенирова- нии ДНК вручную реакционную смесь помещают в 4 пробирки, в каждой из которой определяют порядок расположения в молекуле ДНК только одного из нуклеотидов. На рисунке 1.9 показан пример секвенирования последовательности размером 59 нуклеотидных пар (аллель МНС у пиг- меев племени Джила (Gila); Hedrick, Parker, 1998а) с помощью авторади- ографии по методу Сэнджера (Sanger et al., \9ТТ). Данная последователь- ность читается снизу вверх как TACGCCCGGT....С помощью таблицы 1.1 и замещения Т на U можно получить соответствующую аминокислот-
IV Генетическая изменчивость Рисунок 1.9. Радиоавтограф секвенирующего геля. На разных дорожках показано наличие каждого из четырех нуклеотидов. Просеквенирована последовательность аллеля Роос-6 МНС, полученного от пигмеев Джила (Hedrick, Parker, 1998а), которая читается снизу вверх. иую последовательность в виде: YARFDS. В последнее время широко ис- пользуется метод автоматического секвенирования, а секвенирование вруч- ную применяется все реже. Графическое изображение той же последовательности размером 59 нуклеотидных пар (н.п.), полученное при автоматическом секвенирова- нии показано на рисунке 1.10. Все четыре реакции секвенирования про- текают в одном геле и представлены в виде пиков. Эти пики разного цве- та соответствуют разным нуклеотидам, а самый высокий пик в каждой из позиции указывает на локализацию данного нуклеотида в определенном сайте последовательности. Последние достижения ДНК-технологии по- зволяют получать с помощью специальных чипов одновременно 500 од- нонуклеотидных полиморфизмов, или SNPs (single nucleotide polymorphisms), (Wang et al., 1998). Показано, что примерно один из ты-
Глава 1. Общий фон и многообразие генетической изменчивости т acqcccg а т т та а са а с а а сс т а а а а а а ат а та т та а а т а с а с а а а в т т т а а а ат а а а ЛГ. Sn ЙО 70 SO Рисунок 1.10. Электрофореграмма автоматического секвенирования. Пики в разных по- зициях обозначают наличие разных нуклеотидов в оригинале, отмеченных различными цветами. Просеквенирована та же последовательность, что и на рисунке 1.9. сячи сайтов ДНК различается по нуклеотидам в паре оснований. Скоростной скрининг последовательностей позволяет отслеживать тыся- чи полиморфных сайтов. Одной из первых была исследована количественная изменчивость гена алкогольдегидрогеназы (Adh) у D.melanogaster (Kreitman, 1983) В табли- це 1.4 приведено 49 вариабельных сайтов, полученных при секвенирова- нии 11 полных последовательностей этого гена: 43 сайта различаются по составу нуклеотидов, 6 содержат инсерции (вставки) или делеции. Без учета инсерций и делеций просеквенированный участок содержит 2379 нуклеотидов. Поэтому доля вариабельных сайтов - ps, составит: 43/2379 = 0,018. Поскольку мы имеем 11 разных последовательностей, то число сравнений между ними равно: (11 )(10)/2 = 55. Результаты этих срав- нений будут приведены позже (таблица 2.15), средняя гетерозиготность по нуклеотидам равна в этом случае: л = 0,0065. Для большинства генов, кодирующих белки, вариабельность невысока. Например, в аминокислотной последовательности, соответствующей после- довательности гена Adh, приведенной в таблице 1.4, идентичны все амино- кислотные остатки, за исключением одной позиции с заменой аллеля F на S (шесть верхних последовательностей несут аллель S, а пять нижних - F). Если аналогичным способом подсчитать долю полиморфных аминокислот, то, то полиморфным будет только 1 аминокислотный остаток из 255, те. ра = = 1/255 = 0,0039. Можно вычислить также и среднюю гетерозиготность ами- нокислотного состава. Для этого число сравнений по вариабельным амино- кислотным остаткам нужно разделить на их общее число в сравниваемых последовательностях: = 30/(255)(55) = 0,0021, где число сравнений раз- личных последовательностей по вариабельному сайту равно 30. Наиболее вариабельными локусами у большинства позвоночных жи- вотных считаются гены класса I и II большого комплекса гистосовмести- мости (МНС) (см. Edwards, Hedrick, 1998). Вариабельность генов МНС у человека, называемых HLA -генами, интенсивно изучается на протяжении многих лет, поскольку роль этих генов при отторжении пересаженных
IV. Генетическая изменчивость органов, при аутоиммунных заболеваниях и при распознавании патоге- нов чрезвычайно важна. В результате секвенирования этих генов оказа- лось, что HLA-A, HLA-B и HLA-DR имеют по 67, 149 и 179 аллелей соот- ветственно (Parham, Ohta, 1996). Но, в отличие от гена Adh и большинства других генов, вариабельность нуклеотидного состава генов этого комп- лекса приводит к изменчивости аминокислотных последовательностей в кодируемых ими белках. ТАБЛИЦА 1.4. Вариабельные нуклеотиды в 11 последовательностях локуса алкогольде- гидрогеназы (Adh) у D.melanogaster (по Kreitman, 1983). Прочерки указывают на иден- тичность нуклеотидов с консенсусной последовательностью, треугольниками обозначе- ны инсерции и делеции, звездочка в экзоне 4 указывает на различия кодируемых аминокислот между аллелями F (Fast) и 5 (Slow) Последова- Интрон тельность Экзон Интрон Экзон Интрон Экзон тельность 5' 1 у личинок 2 2 3 3 4 3’ Лидерная последова- Consensus CCG CAATATGGGTCTG c T AC cccc GGAAT CTCCACTAG A T C AGCTC T TA Wa-S — - - _ - -AT - - TT-A CA-TA AC - _ _ A F1-1S - -c - - _ ---------- - - TT-A CA-TA AC - _ . A SlowAf-S — - - . - - - - - - - - - - - A - . . --TT- 1 A- Fr-S - - GT ----- A --1- TA F1-2S - - - AG- --A-TC - G GT C 3 - Ja-S - -c - - - - - G - - - - - --T-T-CA C 4 - т - - - Fl-F - -c — - G . - . . --GTCTCC- C 4 - .. Fr-F TGC AG- --A-TCTGT- - G - - - - - - ----- --GTCTCC- C 4 G _---. - -_ FastWa-F TGC AG- --A-TCTGT- - G - - - - --GTCTCC- C 4 G ----- _ __ Af-F TGC AG- --A-TCTGT- - G .. . . ----- --GTCTCC- C 5 G ----- _ Ja-F TGC AGGGGA---T - G - - - - - -G- - --GTCTCC- C 4 - -1-- На рисунке 1.11. показана гетерозиготность по 366 (локус HLA-A} и 363 (локус HLA-B) аминокислотам в геноме человека (Hedrick et al., 1991). Большинство этих сайтов полиморфно: для локуса HLA-A раа = 69/ 366 = = 0,189, а для локуса HLA-B ра = 58/363 = 0, 160. Гетерозиготность по аминокислотному составу для локуса HLA-A равна 0,064, а для локуса HLA-B - 0,058. Примечательно, что гетерозиготность по некоторым аминокислотным остаткам у обоих локусов выше, чем 0,5. Судя по трех- мерной структуре молекулы HLA, большинство таких изменчивых ами- нокислотных сайтов вовлечено во взаимодействие с белком, презентиру- ющим Т-лимфоциты, для инициации иммунного ответа. Действительно, гетерозиготность у 29 аминокислотных остатков, взаимодействующих с этим пептидом, равна для локусов HLA-A и HLA-B 0,264 и 0,337, соответ- ственно. Аминокислотные остатки, не вовлеченные во взаимодействие с Т-клеточным рецептором, имеют гетерозиготность на порядок ниже: для локуса HLA-A - 0,036, а для локуса HLA-B - 0,031. 4 — 7660
Глава 1. Общий фон и многообразие генетической изменчивости Il III ПНИ L «1 «з TM+CYT Рисунок 1.11. Средняя гетерозиготность по 366 (локус HLA-A) и по 363 (локус HLA-B) позициям аминокислот. Гетерозиготность локуса HLA-A отмечена вертикальными линия- ми выше оси, а гетерозиготность локуса HLA-B - вертикальными линиями ниже оси (по Hedrick et al., 1991). Внизу показана схема 54 аминокислот, вероятно вовлеченных во вза- имодействие с Т-клеточным рецептором и домены этого рецептора: ТМ - трансмембран- ный домен, CYT - цитоплазматический «хвост», L - лидерный пептид. с. Видимый полиморфизм Как известно, видимый полиморфизм таких морфологических признаков как окраска, форма и размер характерен для любых организмов. Вспом- ним, например, изменчивость окраски цветков у растений, окраску и фор- му раковины у улиток, разнообразие окрасок крыльев у бабочек (Ford, 1971). Разумеется, что не все эти признаки обусловлены генетической изменчивостью, однако вклад наследственной изменчивости в такой по- лиморфизм (например, число вовлеченных генов) до конца не ясен. По- этому мы сосредоточим внимание на нескольких хорошо изученных при- мерах, по возможности рассматривая и пространственно-временное распределение полиморфных вариантов. Широко исследован полиморфизм по цвету и форме раковин у некото- рых представителей улиток, в частности у Сераеа nemoralis (см. раздел 4.10). Полиморфизм окраски и формы раковины характерен и для целого
IV. Генетическая изменчивость ряда видов африканских сухопутных улиток рода Limicolaria (Owen, 1966). Соседние популяции этого рода, также как и рода Сераеа, могут сильно различаться по частоте встречаемости различных форм окраски и формы раковины. В вулканических породах на западе Уганды были найдены ис- копаемые остатки, вероятно, относящиеся к L.martensiana, которые жили 8000 - 10000 лет тому назад. По окраске и форме раковины этих улиток очень похожи на раковины современных улиток, живущих на данной тер- ритории. Действительно, частота встречаемости определенных типов ра- ковины у ископаемых и у некоторых современных популяций весьма сход- ные (см. таблицу 1.5). Три из сравниваемых выборок были взяты на расстоянии менее 30 км от места находки ископаемых остатков. Таким об- разом, полиморфизм может быть очень стабильным по частоте и постоян- ным во времени. ТАБЛИЦА 1.5. Частота встречаемости вариантов окраски раковин в ископаемой и в со- временных популяциях африканской сухопутной улитки. Размер выборок во всех случа- ях превышает 800 особей (по Owen, 1966) Окраска раковины Ископаемые Современные 1 2 3 Полосы 0,610 0,546 0,406 0,337 Прерывистые 0,052 0,089 0,042 0,098 ПОЛОСЫ Бледная 1 0,039 0,240 0,070 0,019 Бледная 2 0,283 0,119 0,432 0,373 Бледная 3 0,016 0,006 0,050 0,173 Частота полиморфных вариантов хорошо исследована также у березо- вой пяденицы, Biston betularia, (см. разд. 2.5 и 3.3). Частота темноокра- шенных форм в английских популяциях этой бабочки изучалась на про- тяжении более ста лет. Первоначально меланизм был относительно редким, однако со временем в некоторых городских популяциях он дос- тиг почти 100%. Различия по частоте встречаемости темноокрашенных бабочек в городских и сельских популяциях очень велики. Как показано на рисунке 1.12, в Ливерпуле таких особей около 100%, а в сельских рай- онах Уэльса, расположенных на расстоянии 50-60 км, - уже менее 10%. Удачный пример полиморфизма у растений - окраска цветочных че- шуй у дикорастущего овса, A vena fatua (Jain, 1976). Этот однолетний злак, когда-то привезенный в США из Испании, занимает большие площади в
Глава 1. Общий фон и многообразие генетической изменчивости (а) Рисунок 1.12. (а) Процент темноокрашенных форм Biston betularia в различных популя- циях района реки Мерси и в Северном Уэльсе (Ъ). Частота встречаемости темноокрашен- ных форм между Ливерпулем и Северным Уэльсом. Данные получены из точек, располо- женных на расстоянии не более 5 км от линии на карте вверху (по Bishop, 1973). Калифорнии (см. разд. 5.2) Исследовали частоту встречаемости цветоч- ных чешуй серого цвета (рецессивный ген bb) в шести поколениях в кли- вальных срезах калифорнийской популяции овса в Мэрисвилле. На от- резке длиной 30 м выбрали 10 пунктов, расположенных в 3 м друг от друга. Как показано на рисунке 1.13, между разными поколениями на- блюдается заметная изменчивость этого признака: частота встречаемос- ти серых чешуй в пункте 5 варьирует от менее 0,2 до более 0,8.
IV. Генетическая изменчивость Рисунок 1.13. Изменчивость по частоте встречаемости серой окраски цветочных чешуй у овса Avena fatua в шести поколениях вдоль клина выборок (по Jain, 1976). Пространственные различия по частоте генотипов также велики: от 0,8 в пункте 2 до 0,4 в пункте 10. Причем эти различия встречаются во всех поколениях, т.е. постоянны во времени. d. Мутации, летальные аллели и модификаторы приспособленности Другой класс генетической изменчивости включает видимые в фенотипе мутации или же вредные мутации, которые отражаются на приспособ- ленности. Летали, или вредные варианты, могут не отражать всей генети- ческой изменчивости в популяции, поскольку они приводят к экстремаль- ным фенотипическим проявлениям, а также вследствие их негативного влияния на приспособленность. С другой стороны, влияющие на приспо- собленность полиморфные (многовариантные) локусы, особенно с пози- тивным действием, служат «материалом для эволюции», даже если о них ничего больше не известно. В достаточно большой выборке, взятой фактически из любой популя- ции, с низкой частотой представлены довольно вредные морфологичес- кие варианты: например, альбинизм у человека, грызунов, лягушек и дру- гих организмов, а также хлорофилльные мутанты у растений. Зачастую такие мутации рецессивны и проявляются только в результате тесного инбридинга или при анализе огромных выборок. О распространенности этого класса вариантов можно судить по некоторым данным, получен-
Глава 1. Общий фон и многообразие генетической изменчивости ным для небольшого числа видов. Обширная информация по таким вари- антам у человека обусловлена наличием наследственных заболеваний (McKusick, 1998). Большинство из них встречается довольно редко, так что частота аллелей не превышает 1%. Однако они служат важным источ- ником генетической изменчивости. Различные человеческие популяции довольно сильно отличаются по частоте наследственных болезней и со- ответствующих аллелей. В Великобритании, например, наблюдается бо- лее высокая частота муковисцидоза, а в Западной Африке и в области Тэй-Сахс Израиля - более высокая частота аллеля серповидноклеточной анемии (см., например, Cavalli-Sforza, Bodmer, 1971; Vogel, Moltulsky, 1997). Подсчитано, что средний человек гетерозиготен по 4—6 локусам, вызывающим наследственные болезни, а примерно 1% новорожденных гомозиготен по одному из таких генов. Для подсчета числа рецессивных мутаций в популяциях Drosophila было проведено несколько обширных исследований (фенотипическое описание более 4000 локусов D. melanogaster дано в работе Lindsley, Zimm, 1992). После скрещиваний самки дикого типа помещались для откладки яиц в отдельные контейнеры (полученное от таких самок потомство на- звали изосамочными линиями). В поколении F мухи скрещивались сво- бодно (скрещивания брат-сестра, или истинные сибсы), и в их потомстве учитывались фенотипические отклонения. Если самка дикого типа или скрещенный с нею самец были гетерозиготными по видимой мутации, то гетерозиготными по этой мутации должны быть 50% потомства от дан- ного скрещивания. Кроме того, в первом поколении (Ft) 25% скрещива- ний должно происходить между гетерозиготами, поэтому при менделев- ском расщеплении, равном 0,0625 во втором поколении (F2) следует ожидать видимых мутаций. При проверке 736 изосамочных линий D.mulleri, например, Спенсер (Spenser, 1957) обнаруживал большое раз- нообразие мутаций глаз, щетинок, тела и т.д. Такое разнообразие наблю- далось несмотря на то, что, судя по экспериментам с другими видами, можно идентифицировать лишь около 1/6 видимых рецессивных мута- ций. В общей сложности Спенсер обнаружил 263 видимые мутации и, следовательно, около 0,48 мутаций на геном. Последняя цифра - полови- на мутации на геном означает около одной мутации на одну особь. У дру- гих видов Drosophila были обнаружены величины такого же порядка (Lewontin, 1974). С помощью специальных методов у D.melanogaster, D.psevdoobscura и у некоторых других видов дрозофилы можно обнаружить летальные гены. Для этого конструируют мух, гомозиготных по всем генам, а затем тестируют их на присутствие леталей. Такой подход был впервые исполь- зован для исследования мутаций Мёллером. Для анализа леталей требу-
IV. Генетическая изменчивость ется, чтобы используемые в работе линии мух имели два различных мар- керных гена - Мх и М2, которые обычно детальны в гомозиготном состоя- нии и расположены в разных хромосомах, а также инверсии на этих хро- мосомах, «запирающие» кроссинговер между ними. Поскольку у самцов дрозофилы кроссинговера, как правило, не происходит, то всегда соблю- дается необходимое условие сохранения интактности хромосом дикого типа. Основные принципы метода Мёллера показаны на рис. 1.14. Сначала скрещивают самцов, несущих ген single дикого типа и самок, несущих доминантные мутации и инверсию (инверсии). Из-за отсутствия кроссин- говера у самцов хромосомы дикого типа, отмеченные как +] и + переда- ются первому поколению (F^ без изменений. В Fj самцы, несущие ген single и гетерозиготные по соответствующей хромосоме дикого типа, а также по хромосоме, полученной от линейной самки, вновь скрещивают- ся с линейными самками. В поколении F2 хромосому дикого типа несут уже как самцы, так и самки. Из-за инверсии в хромосоме с маркером М кроссинговера между хромосомой дикого типа и мутантной хромосомой не происходит. В результате скрещивания между гетерозиготами в F2 по- лучаются зиготы трех типов +,/+,, +/Л/] и MJM в соотношении 0,25 : 0,5 : 0,25 (табл. 1.6). Поскольку зиготы MJM гибнут, то доля взрослых осо- Поколение Р F1 F2 F3 99 (из лабораторной линии) Ген Single (из > природной О популяции) X 99 (из лабораторной линии) 9 9 +/W1 X +/Ч х MJM2 М^/М^ Рисунок 1.14. Принцип скрещиваний для получения гомозиготных по всем генам хро- мосом у Drosophila. М и М2 обозначают хромосомы, несущие различные доминантные маркерные гены и инверсию. Символы +t и +2 обозначают две разные хромосомы дико- го типа, полученные от мух из выборочной популяции. В данном примере гомозиготна хромосома +г
Глава 1. Общий фон и многообразие генетической изменчивости Таблица 1.6. Доли фенотипов у зигот и взрослых при наличии и отсутствии деталей на хромосомах в гомозиготном состоянии +1 /+i +,/м, м, /м, Зиготы Доли 0,25 0,5 0,25 Взрослые (без леталей) Фенотипы дикий тип мутант леталь Доли 0,333 0,667 0,0 Взрослые (с деталями) Фенотипы деталь мутант леталь Доли 0,0 1,0 0,0 бей дикого типа (при отсутствии деталей в хромосоме дикого типа) со- ставит 0,333. Если хромосома + несет летали, то мухи с генотипом +]/ + гибнут, и доля зигот дикого типа равна 0,0. Таким способом можно отнести каждую отдельную хромосому к несущим или не несущим ле- тальную аллель. Невозможно установить, несет данная хромосома больше одной лета- ли или нет. Однако принято считать, что летали в различных локусах рас- пределяются независимо. Тогда количество летальных генов будет соот- ветствовать распределению Пуассона (см. стр. 33). Допустим, частота хромосом, несущих летали, равна X, тогда доля хромосом без деталей составит 1-Х. Согласно распределению Пуассона для деталей, доля хро- мосом, не несущих летали равна первому периоду распределения Пуас- сона: 1-Х=е~х, где х - среднее число леталей на хромосому. Это уравнение решается для х и позволяет оценивать среднее число леталей на хромосому: х = —ln( 1 - X). В таблице 1.7. приводятся результаты подсчета леталей и полулеталей на второй хромосоме и предполагаемого числа леталей на хромосому в нескольких популяциях D.melanogaster (из Dobzhansky, 1970). От сайта к сайту обнаруживается значительная изменчивость по числу леталей. Мак- симальное число выявлено в популяции из Флориды, где на каждую хро- мосому приходится не менее одной летали или полулетали. Минималь- ное число леталей обнаружено в корейской популяции, где их несут лишь 11,2% хромосом. Вторая хромосома занимает около 40% единиц карты всех хромосом D.melanogaster, поэтому ожидаемое число леталей на ге- ном варьирует от 0,31 до 2,38. Несмотря на такую большую вариабель-
IV. Генетическая изменчивость ность, среднее число леталей в популяции составляет около 1,0 (таблица 1.7). Эта величина почти вдвое превышает число видимых леталей, но все же довольно низкая. ТАБЛИЦА 1.7. Процент леталей или полулеталей и ожидаемое число леталей на второй хромосоме D.melanogaster в различных популяциях (Dobzhansky, 1970) Популяция Число хромосом Процент леталей х-ожидаемое число леталей или полулеталей на хромосому США Флорида 468 61,3 0,95 Массачусетс 2352 35,8 0,44 Огайо 177 49,7 0,69 Висконсин 231 34,2 0,42 СССР Кавказ 2971 15,6 0,17 Крым 1630 24,8 0,29 Умань 2700 24,3 0,28 Корея 611 Н,2 0,12 Япония 2ТП 21,5 0,24 Египет 301 29,4 0,35 Италия 215 34,1 0,42 Израиль 1222 34,7 0,43 Как видимые мутации, так и летали по-видимому редки и существен- но не влияют на изменчивость и приспособленность различных особей. Поэтому должны существовать аллельные варианты, которые затрагива- ют приспособленность отдельных особей и служат основой для эволю- ционных изменений. Такие варианты, называемые модификаторами при- способленности, можно исследовать у Drosophila аналогично деталям. Напомним, что доля особей дикого типа, обнаруженная с помощью метода, показанного на рисунке 1.14, была равна 0,0 при наличии леталей и равна 0,333 при отсутствии леталей. Несмотря на то, что основная доля особей дикого типа сгруппирована вокруг этих величин, наблюдаются и другие пропорции, в основном между 0,0 и 0,333, а иногда и выше 0,333. Эти величины указывают на присут- ствие аллелей с жизнеспособностью либо ниже, чем у неполовозрелых мух, либо выше, чем у мутантов генотипа Т/Л/). Однако доминантные маркеры сами по себе могут влиять на жизнеспособность особей. Таким образом стандарт, основанный на сравнении с генотипом +Х/М}, теряет силу.
Глава 1. Общий фон и многообразие генетической изменчивости Необходимо оценить жизнеспособность особей с генотипом +}/М} по сравнению со средней жизнеспособностью особей в популяции. Эти осо- би должны быть гетерозиготными по хромосомам дикого типа: скажем, +. / +.. Для получения таких мух скрещивание во втором поколении F2 показанное на рисунке 1.14 можно изменить, как это показано на рисунке 1.15. Доля мух дикого типа, в данном случае гетерозигот, сравнима с до- лей мутантов +JMX и +7^. Жизнеспособность гомозигот дикого типа стандартизована путем деления на среднее значение доли выживших ге- терозигот. Поэтому относительная жизнеспособность величиной 1,0 ука- зывает, что определенная хромосома в гомозиготном состоянии дает ту же жизнеспособность, что и средняя гетерозиготная комбинация. Поколение ? f2 +!М. X +./М / 1 J 1 F3 +./М1,+./М1,М1/М1 Рисунок 1.15. Модификация схемы скрещивания в поколении F2, приведенной на рисун- ке 1.14, таким образом, что в поколении F3 получаются гетерозиготы + / +.. Обозначения + и + указывают на различные хромосомы дикого типа. Жизнеспособность, стандартизированную для ряда гомозигот, можно изобразить графически. Как показано сплошной линией на рисунке 1.16 для хромосом 2 и 3, распределение бывает обычно бимодальным (Mukai, Nagano, 1983). В работе Мукаи и Нагано было показано, что 37 и 55% особей с леталями во второй и третьей хромосомами, соответственно, были летальными, а относительная жизнеспособность остальных особей ши- роко варьировала от 0,50 до 1,0. С другой стороны, жизнеспособность гетерозигот по обеим этим хромосомам была одномодальной с гораздо более узким распределением. Эти исследования с уверенностью указы- вают на существование значительной генетической изменчивости, кото- рая модифицирует жизнеспособность. е. Полигенные, или количественные, признаки Многие из эволюционно значимых признаков, например, размер, приспо- собленность, скорость роста не контролируются единичными локусами в соответствии с законами Менделя. Другими словами, нет строгого соответ- ствия между фенотипами и генотипами, как это наблюдалось для описанных ниже генетических вариантов. Более подробно о таких признаках, называе- мых полигонными, говорится в главе 11. На такие количественные признаки влияют многие гены и обычно они оцениваются по численной шкале.
IV. Генетическая изменчивость Рисунок 1.16. Распределение жизнеспособности (выживаемости) гомо- и гетерозигот по 475 вторым хромосомам и 450 третьим хромосомам в популяции из Флориды (по Mukai, Nagano, 1983). Существует немало данных, указывающих на важность генетических факторов в определении полигенных, или количественных признаков. Во- первых, когда на протяжении нескольких поколений проводится искусст- венный отбор, то средние значения количественных признаков могут из- мениться. Такой ответ на направленное действие отбора говорит о генетической детерминации этих признаков. Во-вторых, родственные индивиды обычно имеют более похожий фенотип, чем неродственные. Этот факт можно использовать для оценки генетической изменчивости интересующих количественных признаков. Локализация генов, опреде- ляющих количественные признаки на отдельных хромосомах также слу- жит доказательством важности генетических факторов. С появлением детальных генетических карт ряда организмов стало возможным локали- зовать гены, определяющие большое разнообразие количественных при- знаков. Левонтин описал количественные признаки у Drosophila, которые ус- пешно подвергаются отбору (Lewontin, 1974). К таким признакам отно- сятся: размер, количество щетинок, скорость развития, плодовитость, по- веденческие признаки, экспрессия мутаций, чувствительность к факторам среды, устойчивость к инсектицидам. Левонтин пришел к выводу, что у дрозофилы, вероятно, нет морфогенетических, поведенческих, физиоло- гических или цитологических характеристик, которые не могут быть под- вержены отбору. Более того, по-видимому в любой популяции имеется достаточно вариантов для отбора по любому признаку. Очевидно, отбор по одним признакам происходит быстрее, чем по другим. Эти различия
Глава 1. Общий фон и многообразие генетической изменчивости обычно количественно отражают генетическую изменчивость по опреде- ленному признаку. Признаки, тесно связанные с приспособленностью, по-видимому реагируют на давление отбора быстрее, чем не связанные с приспособленностью. Множество экспериментов по искусственному отбору говорит о том, что на протяжении 10-40 поколений происходят изменения фенотипа, часто достигающие максимальных величин или плато еще до окончания эксперимента. Сейчас доказано, что при подходящем размере первона- чальной выборки, достаточном размере популяции, находящейся под дав- лением отбора и при эффективности самого отбора изменение признаков может продолжаться в течение многих поколений. В последние годы ста- ло ясно, что вклад новых мутаций в длительное изменение признаков в ответ на селекцию также значителен. Один из продолжительных экспериментов по направленному отбору был проведен в Университете штата Иллинойс. Отбор проводили по низ- кому и высокому содержанию масла и белка в зернах кукурузы на протя- жении 76 поколений (Dudley, 1977). Этот процесс продолжается и по сей день, хотя уже были достигнуты большие изменения по сравнению с на- чальным уровнем (данные по содержанию масла и белка приводятся на рисунке 1.17). На верхнем графике содержание масла в зернах выросло почти в четыре раза, а на нижнем графике - упало ниже 1% (очень близко к нижней селективной границе 0%). В 48-ом поколении обнаружилось противоположное действие отбора, как при селекции высокого содержа- ния масла и белка, так и при селекции низкого содержания. Эти, а также и другие оценки генетической изменчивости указывают на присутствие такой изменчивости даже после 76 поколений, прошедших отбор. Это очень важно, поскольку общепринято, что у большинства видов культур- ных растений генетическое разнообразие минимально. Считалось также, что наилучший способ увеличения урожайности кукурузы состоит не в направленном внутрипопуляционном отборе по нужным признакам, а в создании новых гибридных форм. Сходство средней пары родственных особей между собой выше сход- ства пары неродственных особей фактически по любому фенотипическо- му признаку. Очевидно, часть такого сходства обусловлена существова- нием в одинаковой окружающей среде, но в основном это результат действия общих наследственных факторов. Обычно трудно оценить относительное значение средовых и наслед- ственных факторов в детерминации изменчивости каких-то определен- ных количественных признаков. Однако генетическую детерминанту мож- но оценить при статистическом анализе величины признаков у особей разной степени родства. Для определения вклада генетических факторов
IV. Генетическая изменчивость 61 Рисунок 1.17. Процентное содержание масла в популяциях кукурузы при отборе на вы- сокое и низкое содержание масла (по Dudley, 1977). Показана также противоположная селекция (прерывистые линии) как при первом, так и при втором направлениях отбора. широко используется наследуемость - количественная мера доли фено- типической изменчивости, которая детерминирована генетически. Насле- дуемость варьирует от 0,0, когда все фенотипические варианты обуслов- лены влиянием среды, до 1,0, когда такие варианты - результат действия генетических факторов. Интересно, что доля фенотипического разнооб- разия, представляющего собой результат аддитивного (совместного) дей- ствия генетических факторов - это доля того генетического разнообра- зия, которое в большой мере определяет потенциал и скорость ответа на действие отбора (подробнее см. главу 11). Коснемся наследуемости, которая зависит от аддитивного действия генетических компонентов, т.е. наследуемости в узком смысле. Наследу- емость - мера относительных вкладов генетических и средовых разли- чий в формирование фенотипической изменчивости. Для развития раз- ных признаков, вероятно, важны разные гены, но и одинаковые признаки
Глава 1. Общий фон и многообразие генетической изменчивости могут определяться различными генами. Величина средовой изменчиво- сти - это функция среды, а величина генетической изменчивости - функ- ция популяции. У многих организмов наследуемость оценивается по са- мым различным признакам и варьирует от 1,0 (жизнеспособность цыплят) до 0,70 (высота растений у кукурузы). По-видимому, здесь сказывается генетическая изменчивость практически всех количественных признаков, хотя низкие оценки наследуемости могут лишь незначительно отличать- ся от нулевых значений. Моссе и Рофф (Mosseau, Roff, 1987) суммировали оценки наследуемости в 1120 аутбредных популяциях животных и полу- чили кумулятивную частоту распределения четырех типов признаков, касающихся образа жизни, поведения, физиологии и морфологии, дан- ные по популяциям дрозофилы были суммированы отдельно (рисунок 1.18.) Эти результаты, а также данные по Drosophila, показывают, что признаки, связанные с образом жизни, имеют наименьшую величину на- следуемости, а признаки, связанные с морфологией - наибольшую. Эти результаты совпадают с выводами из фундаментальной теоремы Фишера о естественном отборе (глава 3). Согласно этой теореме, признаки, кото- рые находятся под сильным давлением отбора, имеют более низкую на- следуемость. С появлением новых молекулярных методов локализации полиморф- ных маркеров в геноме стало возможным картировать гены, определяю- щие специфические количественные признаки - так называемые локусы количественных признаков, или ЛКП. В настоящее время у большин- ства организмов идентифицированы лишь некоторые из таких локусов. Например, Нуждин и соавторы локализовали четыре ЛКП, влияющих на количество стерноплевральных щетинок у D.melanogaster (рисунок 1.19), (Nuzhdin et al., 1998). Оказалось, что ЛКП на Х-хромосоме в позиции 24 Рисунок 1.18. Совокупная частота распределения оценок наследуемости для четырех категорий признаков (по Mosseau, Roff, 1987).
Задачи единиц карты оказывали наибольший эффект - около 1,3- Другие ЛКП (2 ед.карты на хромосоме II, 66 и 94 ед. карты на хромосоме III) оказывали меньший эффект - около 0,6 - 0,7 щетинок. В этом случае имелись гены - кандидаты, мутации в которых вероятно влияют на количество щетинок у мух. Однако не вполне ясно, обусловлены ли наблюдаемые различия в количестве щетинок изменчивостью каких-либо из этих генов. Рисунок 1.19. Логарифмические кривые коэффициентов вероятности, указывающие на зна- чимость ЛКП, расположенных на трех хромосомах D. melanogaster, в формировании коли- чества стерноплевральных щетинок у мух (по Nuzhdin et al., 1998). Сплошные и точечные линии относятся к разным маркерам, треугольниками обозначены гены-кандидаты. Задачи 1. Какова доля нуклеотидных замен в третьей позиции кодона CGC, приводящих к новой аминокислоте? Какова доля нуклеотидных за- мен в первой позиции кодона AGG, приводящих к новой аминокис- лоте? Какова доля нуклеотидных замен в третьей позиции кодона UUG, приводящих к новой аминокислоте? 2. Используя модель роста численности популяции из текста, рассчи- тайте величину R для заданной популяции, если в моменты времени t и 1+1 ее численность составила 60 и 90, соответственно. Какова предположительная численность популяции в момент времени 1+3? 3. Предположим, что в группе соек измерена длина тела птиц: у 1, 12, 16, 27, 9 и 4 соек. Она оказалось равной 25, 27, 28, 29, 30 и 32 см, соответственно. Какова средняя длина тела? Каковы варианса, стан- дартное отклонение, коэффициент вариации и стандартная ошибка вычисленной величины?
Глава 1. Общий фон и многообразие генетической изменчивости 4. Допустим, что в течение пяти лет численность леопардовой лягуш- ки в реке составляла 105, 117, 266, 183 и 145 особей. Рассчитайте арифметическую, геометрическую и гармоническую средние для этих величин. 5. Предположим, что вероятность рождения ребенка мужского пола рав- на 0,52. Какова вероятность, что в семье родятся друг за другом три девочки? Какова вероятность, что в семье будет два мальчика и две девочки? 6. Вероятность взрыва бомбы в данной местности равна 0,001. Какова вероятность, что в эту местность не попадут ни одна из 500 сбро- шенных бомб? Какова вероятность взрыва в этом районе двух бомб? 7. Возьмем в качестве примера матрицу на стр. 20, пусть вектор имеет элементы у j = 0, уг = 1,0, у3 = 0. Каким будет результирующий вектор, если матрицу умножить на заданный вектор? Каким будет новый вектор, если матрицу умножить на полученный в первом задании результирующий вектор? 8. Сравните балансовую и классическую модели организации генома. Объясните, насколько соответствуют эти модели пониманию коли- чественной изменчивости ДНК. 9. Допустим, Вы хотите определить величину генетической изменчи- вости у видов и можете протестировать изменчивость как аллофер- ментов, так и ДНК. Предпочтете ли Вы оценку одного типа генети- ческой изменчивости другому и почему? 10. Какие эксперименты можно предложить для исследования разли- чий между двумя аллоферментами у коричневой улитки (см. рису- нок 1.6) при условии, что у Вас имеются выборки из предыдущих поколений и Вы можете манипулировать популяциями по своему усмотрению, прослеживая их в будущем? 11. Из данных, приведенных в таблице 1.4 по локусу Adh, определите долю сайтов, за исключением инсерций и делеций, которые вариа- бельны по аллелям S (шесть верхних строк) и по аллелям F. 12. Придумайте пример видимого генетического полиморфизма, кото- рый отличается от примеров в тексте. Изменяется ли частота поли- морфизма в пространстве и во времени? Как можно определить при- чину любых пространственных или временных изменений частоты полиморфизма? 13. Судя по данным молекулярной изменчивости, генетическая измен- чивость у одних организмов выше, чем у других. Считаете ли Вы важным такое явление? Если да, то объясните почему и предложите эксперимент в поддержку или опровержение Вашей гипотезы.
Задачи 14. С помощью метода скрещиваний, показанного на рисунке 1.14, оп- ределите ожидаемую долю потомства дикого типа при условии го- мозиготности хромосомы с летальным аллелем. Проследите на ди- аграмме путь этой летали от исходного самца дикого типа до тестируемого потомства. 15. Постройте таблицу, в которой отражены преимущества и возмож- ные проблемы использования аллоферментов, вариантов ДНК, ви- димых полиморфизмов, леталей и полигонных признаков для харак- теристики величины генетической изменчивости в популяции. 5 — 7660
ГЛАВА 2 КОЛИЧЕСТВЕННАЯ ОЦЕНКА ГЕНЕТИЧЕСКОЙ ИЗМЕНЧИВОСТИ Частота проявления различных генотипов определяет характерное для популяции соотношение генов. Поэтому зачастую удобнее рассматривать популяцию не в виде совокупности живущих в ней особей, а в виде комплекса соотношений генов. Такая точка зрения напоминает теорию строения газообразных веществ, где гораздо удоб- нее дать характеристику популяции скоростей, чем популяции частиц. Рональд Фишер (1953) Математические модели, используемые в популяционной генетике, не всегда дос- таточно удачны. Они не способны отразить всю сложность того или иного явления. Однако чем ближе созданная модель к природе, тем менее она выполнима с мате- матической точки зрения. Когда модель соответствует истинному явлению, то это уже не модель. Нам придется искать компромисс между столь грубыми, нереаль- ными или обманчивыми моделями и моделями, которые не вполне понятны или слиш- ком сложны для применения. Джеймс Ф. Кроу и Моту Кимура (1971) Для того, чтобы понять как влияют на популяцию отбор, инбридинг, ге- нетический дрейф, поток генов и мутации, прежде всего, нужно научиться описывать величины генетической изменчивости в самой популяции и между популяциями. Различные примеры внутрипопуляционной генети- ческой изменчивости, которая проявляется в аллелизме, количественной изменчивости ДНК или в фенотипе, обсуждаются в главе 1. В этой главе мы остановимся на межаллельном взаимодействии и на частоте геноти- пов. Затем обсудим, как можно измерить изменчивость по нуклеотидно- му и аминокислотному составу и как сравнивать частоту аллелей с пос- ледовательностями ДНК особей из различных популяций. В последнее время появилось много вспомогательных компьютерных программ, по- зволяющих оценивать важнейшие параметры, принятые в популяцион- ной генетике и в смежных областях (общие замечания по этому вопросу можно найти у Stephens, Slattery, 1998, а адреса сайтов - в таблице 2.1). Величины генетической изменчивости количественных признаков (напри- мер, наследуемости) обсуждаются в главе 11. Сначала уточним термин популяция в эволюционном и генетическом смысле. Идеальная популяция - это группа скрещивающихся между
I. Закон Харди-Вайнберга собой особей, живущих на одной территории. Часто допускается, что популяция имеет четкие географические границы, хотя это не всегда так. Такая обобщенная и простая формулировка весьма удобна для популяци- онной генетики. Позже, в главе 6, мы рассмотрим концепцию эффектив- ного размера популяции, которая позволяет дать более подробное и точ- ное определение. ТАБЛИЦА 2Л. Список пакетов программ и адресов некоторых электронных сайтов, кото- рые можно использовать в популяционной генетике и в смежных областях (по Stephens, Slattery, 1998) Пакет программ Адреса электронных сайтов AMOVA( Analysis of Molecular Variance) http://anthropologie.unige.ch/flp/comp/win/amova/ Arlequin http://anthropologie.unige.ch/arlequin GDA (Genetic Data Analysis) http://biology.unm.edu/~lewisp/gda.html GENEPOP ftp.cefe.cnrs~mop.fr MEGA(Molecular Evolutionary Genetic Analysis) http://evolgen.biol.metro-u.ac.jp/MEGA PAUP ftp from onyx.si.edu/pub PHYLIP (Phylogeny Inference Package) http://evolution.genetics.washington.edu/phylip Продолжим рассмотрение идеальной популяции. Допустим, что она со- стоит из половозрелых особей двух типов. Если вероятности всевозмож- ных скрещиваний между самцами и самками равны (независимо от интер- валов скрещиваний, генотипов, возраста особей и т.д.), то такая популяция называется случайно скрещивающейся популяцией. Если известны ге- нотипы или фенотипы особей, то такая популяция представляет собой группу, в которой вероятность скрещиваний между особями с определен- ным генотипом или фенотипом равна произведению частот этих особей в популяции. Иногда свободно скрещивающуюся популяцию относят к так называемым панмиксным популяциям, о чем будет сказано позже. Многие теоретические модели в популяционной генетике предполага- ют наличие свободно скрещивающейся популяции большого размера, образующей пул (общий фонд) генов. Из этого пула выпадают женские и мужские гаметы. Такая модель довольно близко соответствует плот- ным популяциям насекомых или перекрестно опыляемых растений, одна- ко она весьма приближенно описывает другие природные популяции, например, небольшие или изолированные популяции вымирающих и ред- ких видов. У самоопыляющихся растений и партеногенетических насе- комых случайного скрещивания также не происходит. В таких случаях в 5*
Глава 2. Количественная оценка генетической изменчивости данную теоретическую модель необходимо внести изменения. Сначала мы рассмотрим идеальную модель большой, свободно скрещивающейся популяции, а затем разберем эффект неслучайности скрещиваний, моде- ли небольших по размеру и неоднородных популяций. I. Закон Харди-Вайнберга Популяционная генетика как самостоятельная область знаний, получила развитие в первой декаде прошлого века, хотя изучение действия отбора на популяцию проводилось и раньше. В 1908 г., вскоре после повторного открытия законов Грегора Менделя, английский математик Дж.Г.Харди и немецкий врач В.Вайнберг сформулировали широко известный закон Харди-Вайнберга (Crow, 1998). [На самом деле, некоторые аспекты этого закона были сформулированы ранее, но не полностью (см. Yule (1902), Castle (1903), Pearson (1904)]. Этот закон чрезвычайно важен для популя- ционной генетики, поскольку он позволяет описывать частоту аллелей в популяции диплоидных особей. Его важность еще более возросла с появ- лением точной информации о локусах, аллелях или генах (генных участ- ках), а также гаплотипах. Закон Харди-Вайнберга утверждает, что после одного поколения случайных скрещиваний частота одного локуса с двумя аллелями или частота множественных аллелей представляет собой биномиальную или мультиномиальную функцию. Другими словами, наследственная преем- ственность не приводит к изменению частот аллелей и частот генотипов (при случайном скрещивании) по определенному локусу (локусам). Бла- годаря этому закону, можно сильно упростить описание популяционно- генетических процессов, уменьшив число необходимых параметров. За- кон Харди-Вайнберга позволяет рассматривать вместо п(п+1)/2 различных диплоидных генотипов, содержащих п аллелей, всего лишь п аллелей. Это особенно важно для двухаллельных локусов, поскольку можно про- следить частоту одного из аллелей комплемента вместо частот двух гено- типов. Поскольку частоты этих двух генотипов независимы, то частота трех и более генотипов определяется простым сложением отдельных час- тот. При отсутствии изменяющих частоту аллелей факторов (отбора, ге- нетического дрейфа, потока генов, мутаций) и при постоянном случай- ном скрещивании закон Харди-Вайнберга не зависит от времени. В дальнейшем мы будем определять частоту аллелей и генотипов по одно- му локусу. При этом считается, что генетический фон не влияет ни на частоту аллелей, ни на частоту генотипов. Подробнее это условие и свя- занные с ним вопросы обсуждаются в главе 10. Допустим, что в популяции имеются два аллеля - At и Я,. которые относятся к аутосомному локусу А и встречаются с частотами р и q,
I. Закон Харди-Вайнберга (p+q = 1). Предположим, что самцы и самки продуцируют гаметы, обра- зующие затем зиготы, случайным образом. В природе случайное сочета- ние гамет, несущих родительские генотипы, встречается довольно редко, например у некоторых морских животных. В результате частота геноти- пов зигот равна произведению частот генотипов соответствующих гамет, как это показано графически на рисунке 2.1. Сторона квадрата на этом рисунке разделена на отрезки p\iq, означаюшие частоты женских гамет и Аг На другой стороне этого квадрата отложены частоты мужских гамет. Поэтому области внутри квадрата означают доли различных гено- типов в потомстве. В верхнем левом углу, например, показана частота генотипоа AtAt, равнаяр2. Три типа зигот в поколении (А}А}, А}А2 и А^') образуются в соотношении р2, 2pq, q2. Женские гаметы (частота) -«------------Ai(p)--------—А>(ч) Ai(p) AM -MlfP2) A^Cpq) -Мг(РФ Рисунок 2.1. Геометрическая иллюстрация закона Харди-Вайнберга при условии случай- ного сочетания гамет. У большинства организмов случайного сочетания гамет не происхо- дит. Рассмотрим случай, когда особи скрещиваются случайным образом. В популяции диплоиды имеют три возможных генотипа: AtA , А{А2 и А^А2, представленных с частотой Р, HvlQ, соответственно (P+H+Q =1). Поскольку имеется всего два аллеля (Л] и А2) и половина аллелей нахо- дится в гетерозиготном состоянии, то частота генотипов составит:
Глава 2. Количественная оценка генетической изменчивости р=р+ \н, q= Q+ \н. (2-1) Допустим, что при случайности скрещиваний в популяции возможно девять типов комбинаций генотипов самцов и самок (таблица 2.2). Раз- личаются только шесть из этих комбинаций, поскольку реципрокные скре- щивания (А1А1 х А{А2 и А,А2 х А^) дают в потомстве одинаковые гено- типы. При условии случайности скрещиваний частота определенных скрещиваний равна произведению частот соответствующих родительс- ких генотипов, например, частота AAt х A At равна Р2. ТАБЛИЦА 2.2. Частота различных типов случайных скрещиваний по двум аллелям ауто- сомного локуса. Мужские генотипы (частота) Женские генотипы (частота) А,А\Р) а,а2(Н) АЛ (2) А^Р) Р2 PH PQ ЯД2(Н) PH н2 HQ A^Q) PQ HQ Q2 Частоты этих шести типов скрещиваний и ожидаемые частоты гено- типов в потомстве при условии независимого распределения аллелей по закону Менделя показаны в таблице 2.3. При скрещиваниях ЛЛ хЛЛ1; например, получается потомство только с генотипом А^, при скрещи- ваниях Л]Л] х Л[Л2 получается |Л]Л1 и ^А.А2ит.д. Если сложить частоты потомства с генотипом А{А , полученные от всех скрещиваний, то общая частота такого потомства составит (Р+ уН)2. Из выражения 2.1 известно, что р=Р+ -Н, поэтому частота потомства с генотипом АуА равна р2. Аналогично, частоты потомства с генотипами Л]Л2и Л^ равны 2(Р+ (Q+ = 2pq и (Q+ ±H)2=q2, соответствен- но. Важно то, что при любых исходных частотах генотипов (Р, Н, Q) гено- типы следующего поколения от случайных скрещиваний распределяют- ся в соотношении р2,2pq, q2. Допустим, исходная частота генотипов равна 0,2, 0,4 и 0,4. Из выражения 2.1 имеем р = 0,4, q = 0,6. В следующем поколении частоты генотипов составят [(0,4)2, 2(0,4)(0,6), (0,6)2] = (0,16, 0,48, 0,36). При случайном скрещивании эти частоты в ряду поколений остаются неизменными. Итак, при случайном сочетании гамет и при слу-
I. Закон Харди-Вайнберга чайных скрещиваниях в следующем поколении получаются одинаковые соотношения частот генотипов. Как будет сказано в дальнейшем, частоты генотипов могут отличаться от ожидаемых по закону Харди-Вайнберга по нескольким причинам. Дело в том, что соотношения Харди-Вайнберга возможны лишь при отсут- ствии таких важнейших эволюционных факторов как отбор, неслучай- ные скрещивания и поток генов. В действительности небольшое влия- ние любого из этих факторов лишь немного изменяет указанные соотношения (см. главу 5). Однако эти факторы могут действовать в по- пуляции и не нарушая закона Харди-Вайнберга (см. главу 4). Нужно иметь ввиду, что отклонения от закона Харди-Вайнберга могут быть связаны с такими проблемами, как вариабельность микросателлитных и других ло- кусов, которую определяют молекулярными методами, дающими некото- рую ошибку. Некоторые, например невыразительные нуль-аллели, труд- но идентифицировать. Поэтому возникают трудности в определении аллельных последовательностей ДНК, как в случае с мультигенными се- мействами последовательностей. ТАБЛИЦА 2.3. Демонстрация закона Харди-Вайнберга при условии случайного скрещи- вания между родителями и независимого распределения аллелей по закону Менделя Частота Потомство Тип скрещивания А.А. АХА2 AlAl х А,А, Р2 Р2 - - AtAt х ЛД, 2РН PH PH - AtAt х А2А2 2PQ - 2PQ - А,А2 х А,А2 Н2 'АН2 УЛ2 УЛ2 А'А2 х А2А2 2HQ - HQ HQ А2А2 х А2А2 Q1 - - Q1 Всего 1 (Р+ УЛ) 2 = р2 2(Р+ '/iH)(Q+ УЛ)=2рд (Q+ УЛ)2=д2 Соотношения Харди-Вайнберга считают также равновесными часто- тами генотипов. Это особый тип равновесия, называемый иногда нейт- ральным равновесием. Если соотношения генотипов смещены без изме- нения частот аллелей, то в следующем поколении от случайных скрещиваний вновь установится равновесие Харди-Вайнберга. Если же в популяции изменились частоты аллелей, то соотношения генотипов будут зависеть от новых аллельных частот и станут отличаться от равно- весных.
Глава 2. Количественная оценка генетической изменчивости Очевидно, что частота аллелей в разных популяциях различна. На ри- сунке 2.2 показано распределение частот трех различных генотипов в соответствии с законом Харди-Вайнберга. Обратите внимание, что при среднестатистической частоте аллелей наиболее распространенными будут гетерозиготы. Если частота аллелей отличается от среднестатисти- ческой, то чаще встречается один из типов гомозигот. Гетерозиготы наи- более распространены фактически лишь 1/3 времени, когда значения q лежат между 1/3 и 2/3. При значениях между 0 и 1/3 самым распростра- ненным станет генотип А Ар а при значениях q между 2/3 и 1 - генотип А?А2. Поскольку р = 1 - q, то на горизонтальной оси графика отложена также и частота аллеля А . Максимальная частота гетерозигот наблю- дается при q = 0,5 ( р = 0,5). Это можно продемонстрировать, подставив в уравнение производную гетерозиготности, 2pq = 2q(l - q), равную нулю и решив его относительно q\ Wl^)] = 2_4. = 0, dq в результате чего получим q = 0,5. Допустим, что поколения не перекрываются, т.е. родители, оставив потомство, сразу же умирают, а потомство становится следующим роди- тельским поколением. Эта модель описывает динамику развития таких организмов, как однолетние растения или насекомые, дающие одно поко- ление в год. У многолетних, например у человека и деревьев или у неко- Рисунок 2.2. Взаимосвязь между частотой аллелей и частотой трех генотипов в популя- ции, соответствующей закону Харди-Вайнберга.
I. Закон Харди-Вайнберга торых короткоживущих организмов, где рождение и смерть разделены промежутком времени больше года, поколения не дискретные, а пере- крывающиеся. При этом отклонение от соотношений Харди-Вайнберга составляет всего около 0,4 и 0,1 от первоначального отклонения соотно- шений генотипов в первом и втором поколениях, соответственно (Moran, 1962). Популяционные частоты генотипов и аллелей определенного локуса обычно определяют в расчете на взрослых особей. Во многих случаях предпочтительнее иметь дело не с особями, а с зиготами, на которых не влияет отбор, генетический дрейф и поток генов, изменяющие частоту генотипов, однако это возможно далеко не всегда. Предположим, что определенная выборка состоит из N особей, Nn из которых имеет генотип АХАХ, N - генотип А}А2, a N22- генотип А^А2 (Nn+Ni2 + N22 = N). Если выборка сделана из очень большой популяции, то ожидаемые частоты трех генотипов: А^, А{А2 и А?А2 составят: N ' Н = (2.2) (оценки указаны «шапочкой» над соответствующей величиной). Н- оцен- ка наблюдаемой гетерозиготности, HQ, в популяции (позже мы скоррек- тируем это выражение для малых выборок). Ожидаемую частоту аллелей можно оценить следующим способом: - ^и+1^2 Р =------ N (2-3) ~_-2n}2+n22 4 N (Для иллюстрации см. пример 2.1 по локусу группы крови системы MNу человека). Пример 2.1. Закон Харди-Вайнберга можно проиллюстрировать на при- мере локуса группы крови MN. Три генотипа - ММ, MN и NN отличаются друг от друга иммунологически. В таблице 2.4. приведено число типов MN в выборке, состоящей из 1000 английских доноров. По этим данным ожидаемая частота аллеля М равна р =0,542, а ожидаемая частота алле-
74 Глава 2. Количественная оценка генетической изменчивости ля N равна q = 1 - р = 0,458. По закону Харди-Вайнберга можно подсчи- тать ожидаемые частоты соответствующих генотипов. Они составят для гетерозигот 2pq= 0,496 - величину, очень близкую к реальной частоте гетерозигот, равной 489/1000 = 0, 489. Как видно из таблицы 2.4, ожидае- мые и наблюдаемые частоты очень похожи. Позже мы познакомимся со статистическим методом оценки соответствия конкретной популяции за- кону Харди-Вайнберга. ТАБЛИЦА 2.4. Наблюдаемые и ожидаемые по закону Харди-Вайнберга количества раз- личных типов по локусу группы крови MN среди 1000 английских доноров (по Cleghorn, 1960) Фенотипы Генотипы Наблюдаемое количество Ожидаемое количество М ММ 298 pW=294,3 MN MN 489 2 pqN=A9f>A N NN 213 q2N=2O9,3 Всего 1000 1000 Это наилучший способ оценки частот аллелей с максимальной вероят- ностью, который часто называют методом подсчета генов (см. метод мак- симального правдоподобия на стр. 83). Судя по сказанному о величинах р и q, можно подумать, что именно в популяционной генетике родилось пре- достережение: «Запомните ваши p’s и q’s». Но, скорее всего, такую фразу придумали британские бармены, которые обращались к задолжавшим по счету клиентам: «Запомните ваши пинты и кварты» - сокращенно p’s (pints) и q’s (quarts). Возможно, это изречение появилось у наборщиков, которым приходилось различать литеры p’s и q’s, ведь при ручном наборе легко перепутать прописные p’s и q’s (перевернутую букву р). Закон Харди-Вайнберга применим и к большему числу аллелей. Это очень важно, поскольку известно, что многие локусы, особенно микроса- теллиты или гены, идентифицируемые по аллельной частоте, содержат более двух аллелей. В такой расширенной двухаллельной модели частота аллеля мультилокусного гена равна сумме частот гомозигот по этому ал- лелю и половины частот гетерозигот, несущих данный аллель. Это пра- вило справедливо для любого числа аллелей. Допустим, генотип А А. встречается с частотой Р.., а генотип АА} - с частотой Р Тогда частота аллелей Ар. составит: Л =|(^+^+--- + 2Д+• + /),+"- + Д„) =
I. Закон Харди-Вайнберга где j ^i, an- число аллелей локуса А. Закон Харди-Вайнберга справедлив для множественных аллелей при условиях случайности сочетаний гамет и скрещиваний. При соблюдении этих условий расширенная частота гомозиготных генотипов равна р2, а гетерозиготных - 2р.р.. Тогда частоту всех гетерозигот (гетерозиготность Харди-Вайнберга, или ожидаемую гетерозиготность) можно выразить формулой: я,=1-£а2. »=1 (2.5а) В случае с двумя аллелями максимальная ожидаемая гетерозиготность наблюдается тогда, когда эти аллели встречаются с одинаковой частотой, т.е. р = 1/п, я£=1-Х(1/«)2=^ ,=1 П (2.5b) Например, при равной частоте трех аллелей (р} = р2 =р3 = 1/3) гетерози- готность равна 2/3. При других частотах этих аллелей гетерозиготность будет ниже. Например, при pt = 0,5, р2 = 0,3, р3 = 0,2 величина Н уже несколько меньше: Н = 0,62. Если число аллелей велико, то гетерозигота- ми будут почти все особи популяции. Если, например, десять аллелей встречаются с одинаковой частотой (все р. = 0,1), то по закону Харди- Вайнберга 9/10 всех генотипов будут гетерозиготными и только 1/10 — гомозиготными. Как и для двух аллелей, частота генотипов и аллелей при множествен- ном аллелизме оценивается при помощи выборок. Допустим, выборка содержит N особей, а особи N.. и А/ имеют генотипы АА.иА.А., соответ- ственно. Тогда ожидаемая частота аллеля А. составит: Pi =-------------— (2.5с) N где j Ф i (для иллюстрации см. пример 2.2. с трехаллельным аллофермент- ным локусом у рачка Daphnia). Частоты генотипов можно оценить, пользу- ясь выражением 2.2, а наблюдаемую гетерозиготность - по формуле: н -^N> н°-~ (2.5d) где i
Глава 2. Количественная оценка генетической изменчивости Пример 2.2. Герберт (Herbert, 1974) исследовал несколько полиморфных ферментных локусов у пресноводного рачка Daphnia magna из водоемов около Кембриджа (Англия). В таблице 2.5 показаны некоторые данные по локусу малатдегидрогеназы (Mdh) с аллелями S, М и F. Если предполо- жить, что аллели S, М и F встречаются с частотами р}, р2 и ру соответ- ственно, то с помощью выражения 2.5с можно оценить эти частоты: р} =0,145, р2 = 0,329, р3 = 0,526. По формуле Харди-Вайнберга можно вычислить ожидаемую частоту и количество особей всех шести генотипов. Как видно из таблицы, ожида- емые значения очень близки к наблюдаемым. Из выражения 2.5а нахо- дим, что ожидаемая гетерозиготность равна 0,594, а наблюдаемая в этой популяции - лишь немного ниже значения 0,561. ТАБЛИЦА 2.5. Наблюдаемые и ожидаемые по закону Харди -Вайнберга соотношения фенотипов и генотипов по локусу Mdh в популяции Daphnia (по Herbert, 1974). Фенотип Генотип Наблюдаемое количество Ожидаемое количество S SS 3 2,4 SM SM 8 10,9 SF SF 19 17,4 М ММ 15 123 MF MF 37 39,5 F FF 32 31,5 Всего 114 114 II. Межполовые различия по частоте аллелей Закон Харди-Вайнберга подразумевает, что у родителей как одного, так и другого пола частоты аллелей (генотипов) одинаковы. Однако в при- родных или искусственных популяциях из-за дифференциального отбора, потока генов или ошибок выборки частоты генотипов у самцов и самок могут быть разными. Такие ситуации, когда самки относятся к одной линии (штамму) популяции, а самцы - к другой, особенно важны, когда мы имеем дело с Х-сцепленными генами или с гапло-диплоидными орга- низмами (например, с Перепончатокрылыми - Hymenoptera). В этих слу- чаях самцы несут одну копию гена, а самки - две.
II. Межполовые различия по частоте аллелей а. Аутосомные гены Сначала рассмотрим как влияют межполовые различия по частоте алле- лей на аутосомные гены. Допустим, что аллель Л] представлен с частотой р у самок и с частотой рт - у самцов, а аллель Л2 - с частотами дуй qm соответственно. При случайном сочетании гамет частоты зигот каждого типа составят: р=Р/Рт H=pfqm+pmqf (2.6а) Q = 4f4m- Геометрическое изображение этих соотношений показано на рисунке 2.3. В отличие от рисунка 2.1, частоты гомозигот представлены прямоуголь- никами, а не квадратами. Женские гаметы (частота) AAPt)------------ A2(Qt> А1А1 (Pfim) А1А2 (PmQf) А1Аг(РгЯт) АгАг (qfqm) Рисунок 2.3. Соотношения генотипов зигот, образующихся при случайном сочетании га- мет с различной аллельной частотой. При межполовых различиях по частоте аллелей количество наблюдае- мых гетерозигот превышает количество ожидаемых по закону Харди-Вай- нберга. Если средние частоты двух аллелей равны р = lA.(pf + pm) и q = Vi (qf + qj, поскольку половина генов получена от самцов и полови- на - от самок, то получим отклонение частоты аллеля А{А} от частоты, ожидаемой по закону Харди-Вайнберга (Robertson, 1965; Purser, 1966).
Глава 2. Количественная оценка генетической изменчивости Р-р2 =PfPm-[L2(Pf + Pj]2 = = -14(p2f-2pfpm+p2m) = = -14(pf-pmy- Для этого и для других генотипов отклонение равно: P-p2=--4(pf-p„)\ H-2pq =-2(pf-Pm)2, (2.6b) Q- q2 =-L4(Pf-P„)2- При небольших межполовых различиях по частоте аллелей увеличение гетерозиготности минимально. Когда межполовые различия по частоте аллелей велики, то величина отклонения уже существенна. На рисунке 2.4 показано отношение частот наблюдаемой гетерозиготности и частот ожидаемой по закону Харди-Вайнберга (Н/2 pq) при разных комбинаци- ях р и рт. При множественном аллелизме и межполовых различиях по частоте аллелей частоты всех типов гетерозигот возрастают, а частоты гомозигот - падают. Рисунок 2.4. Отношение частот наблюдаемой гетерозиготности и частот гетерозиготнос- ти, ожидаемой по закону Харди-Вайнберга при различных комбинациях частот аллелей у самцов и самок.
II. Межполовые различия по частоте аллелей 79 Найдем отклонение частот генотипов от ожидаемых по закону Харди- Вайнберга в одном поколении, поскольку у потомства частоты геноти- пов самцов и самок не изменяются. Частота аллеля А у потомства (р') обоих полов составит: Р' = Р + ^Н = =pmpf+-2(pm4f + pfqm) = = i<pf+Pj Поскольку р' = р’т= p’f, при случайных сочетаниях гамет и случайных скрещиваниях частоты генотипов в следующем поколении будут соот- ветствовать соотношениям Харди-Вайнберга. Ь. Х-сцепленные гены или гены гапло-диплоидов Гены в Х-хромосомах млекопитающих и других организмов наследуются таким же образом, как и Х-хромосомные гены гапло-диплоидов, напри- мер Перепончатокрылых (Hymenoptera). При межполовых различиях по частоте аллелей равновесные частоты достигаются только спустя несколько поколений после скрещивания. Со временем у диплоидных самок умень- шается отклонение их гетерозиготности от гетерозиготности, ожидаемой по закону Харди-Вайнберга. Здесь и далее мы будем считать самок гомо- гаметным полом (XX), а самцов - гетерогаметным (XY), хотя у некото- рых организмов, например у птиц и бабочек, гомогаметны самцы, а гете- рогаметны - самки. Самцы гаплоидны (гемизиготны) по аллелям Х-хромосомы, поэтому гетерозиготны по этим аллелям только самки. Для гапло-диплоидов, например Перепончатокрылых, где самцы гаплоидны, а самки диплоидны, гетерозиготность по всем локусам относится только к самкам. Как показано в таблице 2.6, для генов, полиморфных по двум алле- лям существует шесть типов скрещиваний и пять разных типов потом- ства. Самцы получают все хромосомы от матери, а самки - половину хромосом от матери и половину - от отца. Допустим, частоты генотипов ЛДр Ау12 и АхА2 у самок равны, соответственно, Pf, Hf и Q .У самцов частоты гаплоидных генотипов Ах и Л2 равны Рт и Q . Тогда частота аллеля Л, у двух полов составит: 4f~ Qf + я = Q • 1т (2.7а)
Глава 2. Количественная оценка генетической изменчивости ТАБЛИЦА 2.6. Частоты генотипов по Х-сцепленным локусам в потомстве от случайных скрещиваний или в потомстве у гапло-диплоидов Тип скрещивания Женское потомство Мужское потомство Самки Самцы Частота A,A, AA AA A. A2 АА хЛ> pfp f т pp f m - - pfp J m - AtAt хА2 P.Q - PfQ. - P.Q J - А,А. хА, HfP 1 -H fP ^HrP '~H,P 1 f m 2 f ' n 2 f m 2 f . 2 f ™ ХА2 HfQ - \h.Q 2 f 2HfQ. \lLQ 2 А2А2 х Af Qfp. - QfP - - QfP. Ayf2 х А2 QfQ. - - QfQ. - QfQ. Всего i pfp p.q + p qr Pf‘m * m "f Qt Q 1 j 1 m Pf 4f Поскольку к следующему поколению попадает две трети аллелей от самок и одна треть - от самцов, то средняя частота аллелей у потомства будет равна Q= (2.7b) Частоты генотипов в потомстве женского пола можно рассчитать также, как и частоты аутосомных локусов (таблица 2.6) Поэтому частота алле- ля А2 у потомства женского пола составит: 4'f=Q'f+ = qfqm + i(pfqm+pmqf) = (2.8а) = }qf(pm + <7m) + (pf+ = = 4 (4f+ q ) 2 х 1 т 7 Но частота аллелей у мужского потомства будет равна частоте аллелей у самок в родительском поколении, поскольку все гены самцов в потом- стве получены ими от матерей. Поэтому частота аллеля А2 в следующем поколении самцов составит: q'm = qr (2.8.b) Посмотрим, как изменяется частота аллелей у двух полов во време- ни. Выражение 2.7b можно преобразовать как qm= 3q - 2qf. Подставив это значение в уравнение 2.8а, получим, что частота аллелей у самок в
11. межполовые различия по частоте аллелей потомстве равна q'f = j(3 q - qf). Преобразуя это выражение, получим отклонение частоты аллелей у самок в потомстве от средней частоты аллелей в следующем поколении. Это отклонение равно половине такого отклонения в предыдущем поколении: Q'f~ Ч Я)- (2-9а) Отклонение частоты аллелей у самцов также уменьшится вдвое, поскольку q'm = q , но с опозданием на одно поколение. Как показано на рисунке 2.5, частоты аллелей у самцов и самок распределяются вокруг средней частоты аллелей таким образом, что межполовые различия в каждое пос- ледующее поколение уменьшаются вдвое. Со временем отклонения от средней уменьшаются все быстрее, приближаясь к q. Допустим, что отклонения частот аллелей от средней частоты у самок в нулевом (родительском) и первом поколениях равны d(. и с/,, соответ- ственно. Тогда выражение 2.9а примет вид: ^.=-Не- когда речь идет о многих поколениях, тогда зависимость между отклоне- нием частот аллелей в поколении t и отклонением в первом поколении примет вид: d=(-^d0. (2.9b) Рисунок 2.5. Частота аллелей у самок (qz), самцов (qj и средняя частота аллелей (q) для Х-сцепленных генов в популяции гаплоидов. В первом поколении д = 1,0, дт =0,0. 6 - 7660
Глава 2. Количественная оценка генетической изменчивости Очевидно, что от поколения к поколению это отклонение быстро умень- шается, поскольку величина (- |)' уже через несколько поколений при- ближается к нулю. Так как частоты аллелей у самцов и самок приближаются к средней частоте, то соответствующие частоты генотипов также приближаются к соотношениям Харди-Вайнберга. Однако при межполовых различиях по частоте аллелей у самок наблюдается отклонение этой величины от ожи- даемой частоты: Pr г2=- -5(4-^) tif-Vn)' нг 2ря =1 (Ч " (af~ Я Л Qf-q2=- \ Эти отклонения могут быть существенными из-за межполовых различий в частотах аллелей Х-сцепленных генов или у гапло-диплоидных орга- низмов. Частоты аллелей у двух полов можно оценить, исходя из числа геноти- пов, как это было показано для аутосомных локусов. Частота аллеля А, составит у самок и самцов, соответственно: (2.9с) qf = ~------- f Nf (2.9d) . N2 где Nl2 N22 и N - число особей с генотипом А^А2, А2А2 и общее число самок, соответственно, a N2 и Nm - число самцов с генотипом А2А2 и общее самцов в выборке (популяции). Оценка частот аллелей Х-сцеп- ленного гена черепаховой окраски у кошек дана в примере 2.3. Пример 2.3. Интересный пример Х-сцепленного наследования у кошек касается гена yellow, определяющего окраску шерсти. Гетерозиготные по этому гену кошки имеют черепаховую окраску, или окраску набивного ситца(саНсо). Гомозиготные по аллелю yellow кошки и гемизиготные сам- цы имеют желтую окраску. Данные по этому локусу, полученные в лон- донских ветеринарных лечебницах, где усыпляли бродячих животных, представлены в таблице 2.7. Частота аллеля yellow у кошек и котов ока- залась сходной: qf = 0,101, qm = 0,119.
III. Оценки аллельной частоты ТАБЛИЦА 2.7. Наблюдаемые и ожидаемые по закону Харди-Вайнберга соотношения фенотипов и генотипов по локусу yellow среди лондонских кошек и котов, + означает дикий тип, у - мутантные аллели (по Searle, 1949) Количество Фенотип Генотип Наблюдаемое Ожидаемое Кошки Дикий тип ++ 277 273,2 Черепаховая +у 54 61,4 Желтая УУ 7 3,4 Коты Дикий тип + 311 - Желтый У 42 - Однако частота гетерозигот у кошек (0,160) несколько меньше ожидае- мой (0,182). Вероятно, это связано с тем, что кошки с черепаховой окрас- кой реже попадали в разряд бродячих из-за красивой шерсти. III. Оценки аллельной частоты Мы рассмотрели примеры оценки аллельной частоты в тех случаях, когда аллели можно идентифицировать у каждой особи в выборке. Но даже в этих случаях, в малых выборках расчеты могут не соответствовать в точ- ности частотам аллелей в реальной популяции. Чем больше размер вы- борки, тем точнее оценки частот аллелей в популяции. О точности таких оценок можно судить по величине вариансы. Стандартная ошибка сред- ней величины оценок представляет собой корень квадратный из вариан- сы, потому что оцениваемая частота аллелей сама по себе усредненная величина. При достаточно больших размерах выборки (см. Weir, 1996) доверительный интервал с надежностью в 95 % примерно вдвое больше или меньше стандартной ошибки средней величины. Эти величины и варианса дают максимально вероятные оценки параметров. Метод максимального правдоподобия широко используется для оцен- ки параметров популяции, так как позволяет свести вероятность наблю- дений к максимуму (Fisher, 1958; Li, 1976). Ранее мы рассматривали при- мер мультиномиальной вероятности нахождения в выборке трех генотипов (см. стр. 33), однако этот метод используется и для других целей. Допу- стим, нужно оценить наибольшую вероятность и вариансу частоты алле- ля Л, кодоминантного аутосомного локуса. Предположим, как в предыду- щем примере, что N - это число особей с генотипом А А, тогда вероятность (L) нахождения этого аллеля среди особей выборки зависит от р-. 6*
Глава 2. Количественная оценка генетической изменчивости Величина р, максимизирующая вероятность, максимизирует и логарифм этой вероятности, который вычисляется следующим образом: log (£)=(2УИ+ Nl2) logp + (Nn + 2N22) log (1 -p) + K, где К - постоянная (константа). Можно найти величину р, максимизиру- ющую это выражение, через производную log(Z), равную нулю: d\o^L)_2Nll+2Nl2 N[2 + 2N22_Q dp p 1-p тогда: ’ _ ^11 + 2 ^12 P N (2.10b) как и в выражении 2.3. Отрицательная обратная величина теоретической вариансы оценивается по формуле: 1 =t/2log(Z) V(p) dp2 (2.10с) т.е. получается вторая производная логарифма функции правдоподобия, или: d2 log(L) _ _ 2Nlt + Ni2 _ + 2N22 dp2 ~ P2 (1-p)2 • Подставляя вместо N величину p2N, вместо N - 2p(l - p), а вместо N22 - q2N получим: d2 log(L) _ _ 2N_ _ 2N dp2 P (1 - P) и биномиальную вариансу: 1Л(Р) = £^^. (2.10d) При оценке частоты аллелей мы предполагали, что у гетерозигот экс- прессируются все эти аллели, или они кодоминантны, т.е. в потомстве F
III. Оценки аллельной частоты проявляются признаки обоих родителей. Однако во многих случаях, на- пример при болезнях, связанных с нарушением обмена веществ у чело- века или при полиморфизмах окраски у разных организмов, гетерозиготы обычно неотличимы от гомозигот. В таких случаях для оценки частот аллелей вводится допущение, что в популяции сохраняются соотношения аллелей, соответствующие закону Харди-Вайнберга. В таблицах 2.8 и 2.9 даны оценки частот аллелей и соответствующих варианс для систем с двумя аллелями и для случаев множественного ал- лелизма. Мы рассмотрим здесь только случаи с кодоминированием алле- лей, получение большинства других оценок подробно рассмотрено у Ли (Li, 1976). В таблицах 2.8 (2) и 2.9 (2) показаны методы оценки частоты аллелей для аутосомных кодоминантных локусов, состоящих из двух и многих (и) аллелей. Оценки частот аллелей при кодоминировании Х-сцеп- ленных генов у самок или у гапло-диплоидов даны в таблице 2.8 (4). Оценки частот аллелей у гаплоидов приведены на первых строках (1) обеих таблиц. Эти оценки применимы и для подсчета частот аллелей генов в митохондриальной ДНК (мтДНК) и ДНК хлоропластов (хлДНК), а также Y-хромосомы. Размер выборки особей соответствующего пола обозначен буквой N. ТАБЛИЦА 2.8. Оценки частот аллелей и соответствующих варианс для двухаллельных генетических систем. Гаплоидная оценка подходит для аллелей в ДНК клеточных органелл и в Y- хромосоме, N - размер выборки особей соответствующего пола (1) Гаплоид . n2 «= N ZHAV * 5^12 + ^22 (2) Кодоминирование q = -——-- (3) Доминирование Ч (4) Х-сцепленное кодоминирование (5) Х-сцепленное доминирование 1N12+N22 ?/ = 2~д--- Nf - _ N2 Чт~ N |N,2 + Y22+N2 4 2Nf+N„ Ч/ - _ N2 4m~N„ - -N, + [N2 + 4(W„ + 2Ny)(N2 + 2N22)]1/2 4~ 2(Nm + 2Nf) ve-fcS = —-------- Vfti X фи(1—Фи) v(q) —-----———-------- 4 Nm(l + q) + 4Nfq
Глава 2. Количественная оценка генетической изменчивости ТАБЛИЦА 2.9. Оценки частоты аллелей и соответствующих варианс при множественном аллелизме (1) Гаплоид, п аллелей (2) Кодоминирование, п аллелей (3) Доминирование, три аллеля + ^23 + N33 N (4) 2 аллеля кодоми- нантных, 1 аллель рецессивный N22 + + N33 N У 4N(1 - J>,) ИРз) = V(p1)=^(Lzi-) + £ 2N 4N v(h)=P^..^+PL W 2N 4N Г ’ 2N 4N Оценки частот аллелей в других системах, показанных в таблицах 2.8 и 2.9, зависят от того, насколько они близки частотам, ожидаемым по закону Харди-Вайнберга. Например, при наличии двух доминантных ал- лелей [таблица 2.8 (3)] предполагается, что пропорция генотипов А~А2 в популяции равна: ^22 2 ~^ = q N Поэтому оценка частоты аллеля А2 равна: (2.11а) Для иллюстрации этого уравнения рассмотрим пример с леопардовыми лягушками. Пример 2.4. У леопардовых лягушек (Rana pipiens) из природных попу- ляций существуют варианты окраски. Лягушки с нормальным феноти- пом (pipiens) - пятнистые, а с фенотипом bumsi - без пятен (рисунок 2.6). Наследование этих двух форм окраски контролируется двумя аллелями, причем аллель burnsi - доминантный по отношению к аллелю дикого типа (+) pipiens. В течение ряда лет в озерах штата Миннесота было собрано около 2000 особей (Merrell, Rodell, 1968). Затем сравнили часто- ты этих аллелей у живых и мертвых особей (таблица 2.10). Оказалось,
III. Оценки аллельной частоты Рисунок 2.6. Варианты окраски у леопардовой лягушки, Rana pipiens-. слева - дикий тип (pipiens), справа - bumsi (по Merrell, 1965). ТАБЛИЦА 2.10. Наблюдаемое число фенотипов bumsi и pipiens и частоты соответствую- щих аллелей у живых и мертвых леопардовых лягушек, Rana pipiens из озер штата Минне- сота (по Merrell, Rodell, 1968) Фенотип Генотип Наблюдаемое количество Оценка частоты аллелей Живые Bumsi вв,в+ 53 0,028 ±0,006 Pipiens ++ 834 0,970 ±0,006 Мертвые Bumsi вв,в+ 39 0,018 ±0,004 Pipiens ++ 1050 0,982 ±0,004 что частота аллеля дикого типа довольно высока: 0,970 и 0,982 у живых и мертвых лягушек, соответственно. Позже мы рассмотрим статистичес- кие методы оценки достоверности таких различий. Варианса оценки частоты аллеля выше, чем ожидается. Это видно, если преобразовать выражение следующим образом: 1-(1-р2-2рд) _ 4N _g(l-g) ! (1-g)2 2N 4W
Глава 2. Количественная оценка генетической изменчивости Первое слагаемое в нижнем ряду равно биномиальной вариансе при ко- доминантном наследовании двух аллелей. Поэтому в случаях, когда гетеро- зиготы неотличимы по фенотипу, варианса увеличивается на величину, рав- ную второму слагаемому. Очевидно, это слагаемое наибольшее тогда, когда частота аллеля А2 мала, а при q< 1 /3 первое слагаемое больше второго. В случае болезней, связанных с нарушением обмена веществ у человека важно знать долю гетерозигот - носителей дефектного аллеля. Сейчас таких носителей легко идентифицировать с помощью молекулярных методов. Если это невозможно, то долю гетерозиготных носителей находят по формуле: H = 2pq, (2.11b) где q - средняя из выражения 2.Паи p=\-q. Далекие от генетики люди часто удивляются, узнав о существовании множества носителей рецес- сивных дефектных аллелей. Предположим, например, что 1 из 10 000 индивидов несет особенно редкий рецессивный аллель альбинизма. Тог- да q =0,01 и Н = 0,0198. Другими словами, носителями аллеля альби- низма являются почти 2% людей. ТАБЛИЦА 2.11. Примеры трехаллельных генетических систем (ST = стандарт, AR = аллель Arrowhead, СН= аллель Chiricahua, F= быстрый (Fast), М= средний (Medium), S= медленный (Slow), him.= гималайская (himalayan), ins.= аллель insularia, carb.= аллель carbonaria, typ.= ал- лель typical, null - отсутствие белкового продукта, обнаруживаемого при электрофорезе Генотип 71,712 Т12Т12 Число ^з ^3 ^3 Частота Р" 2Р,Р 2 2Р,Рз Рг 2Р1Рз Рз Харди-Вайнберга Кодоминирование (1) D.psevdoobscura ST/ST ST/AR ST/CH AR/AR AR/CH сн/сн инверсии (2) Электрофоретические FF FM FS ММ MS SS аллели Доминирование (1) Окраска шерсти сплошная сплошная сплошная him. him. альбинос у кролика (2) Biston betularia carb. carb. carb. ins. ins. typ. Два аллеля кодоми- нантных, один рецес- сивный (1) АВО А АВ А В В О (2) Электроморфы F FS F S S null
III. Оценки аллельной частоты Большинство из известных систем множественного аллелизма пред- ставлено в таблице 2.9. В таблице 2.11 рассмотрены примеры с трехал- лельным наследованием. Оценку частоты аллелей в двух последних при- мерах таблицы 2.9 можно сделать, пользуясь законом Харди-Вайнберга. Допустим, при доминантном наследовании (строка 3 таблицы) один ал- лель доминирует над двумя другими, а второй аллель доминирует над третьим. Тогда пропорция генотипов Лу43 в популяции равна: ^3 _ 2 N Pi’ где N3} - число индивидов с генотипом А3А}, р3 - частота аллеля А . По- этому (2.12а) По закону Харди-Вайнберга частота генотипов А2А2 и А,А3 равна: ^22 N23 + N33 N = Pl + 2р2Рз + Pl =(Р2+Рз)2, и оценка частоты аллеля А, составляет: Гу22+у23+а^ [ N ) (2.12b) Тогда частота аллеля А} равна: Z х!/? (N +N + 7V \ А=1- -22 33 =1-(р2 + Р3) (2.12с) Для иллюстрации обратимся к примеру наследования меланизма у бере- зовой пяденицы. Пример 2.5. У березовой пяденицы, Biston betularia, встречается три вари- анта окраски. На рисунке 2.7 показаны два из них: carbonaria (вверху, на покрытом лишайниками дереве) и typical (внизу, на темном стволе). На ли- шайниках вариант typical почти незаметен, также как вариант carbonaria на темном фоне (см. пример 3.3 как иллюстрацию отбора данного полимор- физма). Эти фенотипы контролируются тремя аллелями: аллель carbonaria доминирует над остальными двумя аллелями, а аллель insularia - над алле- лем typical. В выборке из Манчестера (Англия) было 521 особь carbonaria, 4 insularia и 13 - typical (Cook, 1971). Как видно из таблицы 2.9, частоты аллелей carbonaria, insularia и typical (рх,р2,р3, соответственно) равны:
Глава 2. Количественная оценка генетической изменчивости Рисунок 2.7. Варианты окраски (морфы) березовой пяденицы на дереве, покрытом лишай- никами (вверху) и на темном стволе дерева (внизу). (По Kettlewell, 1973). р, = 0.823 ±0.021, р2 = 0.022 + 0.011, р3 =0.155±0.021. Смешанное доминантно-кодоминантное наследование (строка 4 таб- лицы 2.9) приводит к появлению заметного числа гомозигот по рецес- сивному аллелю (например, по локусу группы крови АВО) или же к сни- жению частоты рецессивного аллеля, так что гомозиготы по этому аллелю практически не встречаются (например аллоферментные или микроса- теллитные локусы с двумя и более кодоминантными аллелями и одним нуль-аллелем, который не продуцирует белкового продукта, обнаружива- емого в электрофоретическом геле). В случае локуса АВО частота
III. Оценки аллельной частоты аллелей А, и та же, что и при полном доминировании. Однако частота аллеля А оценивается с помощью закона Харди-Вайнберга: -----= А + 2PiP3 + р3 =(pt+p3) . Поэтому частоту аллеля А2 можно оценить по формуле: гм.+Мз+^зУ2 N (2.13а) Однако этот метод вычислений предполагает наличие трех парамет- ров вместо двух. В результате, сумма оценок частоты трех аллелей не равна единице, если частоты генотипов далеки от соотношений Харди- Вайнберга. Приближенные оценки можно вычислить, введя отклонение от единицы, равное ^ = 1-(А+Л+Рз)- Тогда получим новые оценки частот аллелей, равные: A' = (l + f^)A, Д'=(1 + |б?)Д, (2.13b) Д,'=(1 + |б/)(Д+^</), (Bernstein, 1930). Эти величины практически равны величинам, вычис- ленным по принципу максимального правдоподобия результатов (Li, 1970). В качестве иллюстрации рассмотрим пример с локусом группы крови АВО. Пример 2.6. У человека аллели А и В локуса АВО кодоминантны и оба - доминируют над аллелем О. В выборке, взятой из популяции африканс- ких пигмеев, 7 индивидов имели генотип АВ, 44 - генотип А, 27 - гено- тип В и 88 - генотип О (Cavalli-Sforza, Bodmer, 1971). Из выражений в таблице 2.9 находим оценки частот аллелей А, В и О, а также стандарт- ные ошибки: Д =0.168 ±0.022, р2 = 0.108± 0.018, р3 =0.728 ± 0.027. Поскольку сумма частот не равна единице, с помощью выражения 2.13b находим новые оценки частот аллелей:
ft2 Глава 2. Количественная оценка генетической изменчивости Д'= 0.168 ±0.021, р2’ = 0.108±0.018, р3'= 0.724 ±0.025. Стандартные ошибки для скорректированных оценок соответствуют оцен- кам максимального правдоподобия (Li, 1970). В случаях, когда гомозиготы по рецессивному аллелю не определяют- ся, частоту нуль-аллеля можно вычислить по формуле: (2Л4) где HQ - наблюдаемая гетерозиготность (выражение 2.5d), а Н - ожида- емая гетерозиготность (выражение 2.5а) для всех кодоминантных алле- лей (Brookfield, 1996). Затем частоты других аллелей умножают на вели- чину (1 - рп), это дает оценки, близкие к оценкам максимального правдоподобия. Для иллюстрации рассмотрим пример наследования ал- лелей в составе главного комплекса гистосовместимости (МНС) у рыб. Пример 2.7. Хедрик и Паркер (Hedrick, Parker, 1998а) исследовали из- менчивость локуса главного комплекса гистосовместимости (МНС) клас- са II у рыб Poeciliopsis o.occidentalis. Судя по полиморфизму одноцепо- чечной ДНК (SSCP), у некоторых видов Poeciliopsis последовательности этого локуса сегрегируют в строгом соответствии с законами Менделя (рисунок 2.8). Однако в выборке из Шарп Спринг содержалось пять различных аллелей и наблюдалась нехватка гетерозигот: Но = 0,475 и НЕ = 0,729. Соотношения микросателлитных локусов в выборке из 40 рыб соответствовали ожидаемым по закону Харди-Вайнберга (Parker et al., 1999). Исходя из выражения 2.14, частота нуль-аллеля равна 0,147 (Hedrick, Parker, 1998b). Ожидаемое число гомозигот по нуль-аллелю равно p2N, так что их ожидаемая частота равна всего 0,86 (наблюдае- мая была равна 0). Принимая во внимание частоту нуль-аллеля, оценки частот аллелей Роос-2, -3, -6, -8 и -9 составят, соответственно 0,277, 0,149, 0,043, 0,299 и 0,085. Аллели Роос -8 и -9, обнаруженные только в популяции из Шарп Спринг, наиболее выделялись среди других алле- лей. Кодируемые ими белки отличались от продуктов других аллелей по 4 (Роос-8) и 5 (Роос-9) аминокислотным остаткам. Вероятно, в дан- ной популяции присутствуют дополнительные аллели, которые не амп- лифицировались в полимеразной цепной реакции (ПЦР) и поэтому про- являлись как нуль-аллели.
IV. Проверка закона Харди-Вайнберга Скрещивание 1 Скрещивание 2 Родители Потомство Родители Потомство Рисунок 2.8. Сегрегация аллелей локуса МНС, обнаруженная методом ПЦР, в потомстве от двух скрещиваний рыб Poeciliopsis o.occidentalis (по Hedrick, Parker, 1998а), F и М - самки и самцы. В первом скрещивании между гомозиготами Роос-5/Роос-5 и Роос-\/Роос- 1 все потомство было гетерозиготным: Роос-1 /Роос-5. Во втором скрещивании между двумя гетерозиготами Роос-1 /Роос-5 показаны все три возможных генотипа. IV. Проверка закона Харди-Вайнберга В рассмотренных ранее примерах с кодоминантным наследованием мы предполагали, что наблюдаемые соотношения генотипов очень близки к ожидаемым по закону Харди-Вайнберга. Для того, чтобы определить, удовлетворяет ли этому условию реальная популяция, необходима стати- стическая проверка. Из-за простоты мы воспользуемся критерием (хи- квадрат). В случаях, когда имеется множественный аллелизм и количе- ство генотипов невелико, желательно использовать вероятностный тест (Guo, Thompson, 1992; Rousset, Raymond, 1995, 1997; Weir, 1996). Для определения соответствия наблюдаемых результатов закону Хар- ди-Вайнберга можно вычислить функцию /2: z2 = Z (О-£)2 Е где О и Е - наблюдаемые и ожидаемые количества генотипов опреде- ленного типа, а к - число генотипических классов. Исходя из вычислен- ной величины /2 и знания другой величины - степени свободы - которую можно определить по специальной таблице, вероятность того, что на- блюдаемые результаты будут отклоняться от ожидаемых более или менее случайна. Степень свободы определяет значимость величины /2 и равна числу фенотипических классов к минус единица и минус число оценива- емых параметров. Одна степень свободы всегда утрачивается, поскольку число независимых генотипических классов - только к - 1. Это значит, что количества генотипов во всех классах нужно суммировать до размера
Глава 2. Количественная оценка генетической изменчивости всей выборки N и вычесть из полученной величины единицу, тогда мы получим количество генотипов в последнем из классов. В таблице 2.12 даны степени свободы для нескольких различных ге- нетических систем. При доминировании не остается степеней свободы, то есть оценка значимости не производится. Для ожидаемых по закону Харди-Вайнберга частот двух кодоминант- ных аллелей выражение %2 принимает вид: 2 _(Nn-p2N)2 । (Ni2-2pqN)2 । (Х22-^2Х)2 Z p2N 2pqN q2 N (2.15a) где три выражения представляют собой отклонение от ожидаемых вели- чин для генотипов А{А{, А,А2 и А^А2, соответственно. ТАБЛИЦА 2.12. Вычисление степеней свободы для ряда генетических систем Системы Число фенотипических Число параметров Степени свободы классов Два аллеля Кодоминирование 3 1 1 Доминирование 2 1 0 Три аллеля Кодоминирование 6 2 3 Доминирование 3 2 0 АВО, нуль-аллель 4 2* 1 п аллелей Кодоминирование п(п +1) 2 п—\ и(и~1) 2 Доминирование п п-1 0 *Р\ нужно оценивать по формуле, приведенной в тексте, т.к. р=\-(р.+р3). Для числа аллелей больше двух ..2 у(М, -А2< |У(^ -2АЛ< Г P-N % 2ptp}N (2.15b) Рассмотрим несколько важных комментариев относительно теста /2, иллюстрирующих предпочтительность точной оценки величины %2. Во- первых, результаты для выборок размером менее 50 следует интерпрети- ровать случайным образом, хотя тест %2 достаточно консервативен в оп- ределении статистической значимости результатов. Как правило, ожидаемые величины во всех классах должны быть больше пяти. Если
IV. Проверка закона Харди-Вайнберга ожидаемая величина в данном классе меньше пяти, тогда ожидаемые и наблюдаемые величины для этого класса следует объединить с сосед- ним классом (для вычисления величин /2 для данных из таблиц 2.4 и 2.5 см. пример 2.8) Пример 2.8. Для вычисления величины %2 воспользуемся данными из предыдущего примера. Величину /2 можно вычислить, исходя из значе- ний MN, приведенных в таблице 2.4. Для этих данных величина %2 соста- вит 0,22 с одной степенью свободы, что соответствует ожидаемым соот- ношениям Харди-Вайнберга. Когда в некоторых классах ожидаемые значения низкие, то с вычислением критерия /2 могут возникнуть про- блемы. Из таблицы 2.5 видно, что ожидаемое значение в классе S равно всего 2.4, поэтому в этом случае его нужно объединить с другим классом - SM. Тогда будет 5 классов и 2 оцениваемых параметра, и поэтому две степени свободы. Величина %2 равна 1,23, что также соотносится с вели- чинами, ожидаемыми по закону Харди-Вайнберга. Более того, в малых выборках ожидаемое число гетерозигот слегка растет, а ожидаемое число гомозигот слегка падает. Более точные выра- жения ожидаемых значений гомозиготных и гетерозиготных генотипов равны (Levene, 1949): ХД.(2ХД-1) 4Х2Д.ру 2N -1 И 2N -1 (2-16) Этот результат обычно небольшой, но может быть важным для популя- ций редких и вымирающих видов с размером выборки менее Х=50. Другой способ определения отклонений от ожидаемых величин состо- ит в вычислении стандартного отклонения наблюдаемой частоты от ожи- даемой по закону Харди-Вайнберга частоты гетерозигот, т.е. индекса фиксации, или F, который мы рассмотрим в главе 5. Эта величина вы- числяется по формуле: r_2pq-H_i Н 2pq 2pq' (2.17а) Можно показать, что X2 = F2N. (2.17b) Затем можно вычислить величины %2 для разных значений F в выборках, показанных на рисунке 2.9, где р = q = 0,5. Если Н = 0,45, то величина F равна 0,1.
Глава 2. Количественная оценка генетической изменчивости Рисунок 2.9. Значения ожидаемые для выборок разных размеров и отклонения от ожи- даемых по закону Харди-Вайнберга частот. При таком отклонении от ожидаемой величины для определения ре- зультата на уровне 5%-ной значимости требуется выборка порядка 400 особей, независимо от того, обусловлено отклонение инбридингом или другими причинами. Горизонтальные линии на рисунке 2.9 соответству- ют значениям /2, равным 3,84 и 6,64 для уровней значимости 0,05 и 0,01 и одной степени свободы. Для того, чтобы определить F = 0,05 при уров- не значимости 0,05 требуется выборка размером более 1500 особей. С другой стороны, когда размер выборки достаточно велик, то можно выя- вить даже очень малые систематические отклонения от соотношений Харди-Вайнберга, хотя эти отклонения могут и не иметь биологических последствий. В некоторых случаях могут учитываться систематически действующие факторы, но это не обязательно приводит к отклонениям от соотноше- ний Харди-Вайнберга. Например, эти соотношения могут сохраниться в популяции и после строгого отбора (глава 4). О том, как влияние различ- ных сил на частоту генотипов в популяции может нейтрализовать другие эффекты и привести к сохранению соотношений Харди-Вайнберга, го- ворится в работе Воркмана (Workman, 1969).
V. Измерение генетической изменчивости V. Измерение генетической изменчивости Для стандартизированной количественной оценки генетической измен- чивости необходимы количественные меры. Наиболее употребительной мерой изменчивости является гетерозиготность. Кроме того, для описа- ния генетической изменчивости одного или нескольких сходных локусов используются и другие величины. а. Гетерозиготность Самая распространенная мера генетической изменчивости в популяции - гетерозиготность. Это биологически полезная количественная характе- ристика, поскольку у диплоидных видов все особи либо гетерозиготны, либо гомозиготны. Теоретически гетерозиготность распределяется в по- пуляции довольно сложным образом, а величины гетерозиготности не слишком зависят от количества аллелей, поскольку верхний предел - еди- ница - одинаков для любого числа аллелей. Этот предел затрудняет диф- ференцирование популяций по высоковариабельным локусам, например микросателлитной ДНК, где гетерозиготность может составлять 0,8 и выше. Как уже говорилось, гетерозиготность популяции по определенному локусу с п аллелями равна: ^;=1-Ха , <=1 т.е. единица минус гомозиготность по Харди-Вайнбергу. Ней (Nei, 1987) назвал эту величину генным разнообразием. Он полагал, что эта мера будет особенно употребительной, поскольку она описывает гены у орга- низмов с различной плоидностью и у организмов с разными репродуктив- ными системами. Используя аллельные частоты из выражения 2.5с, находим, что несме- щенная оценка ожидаемой гетерозиготности в локусе равна: - 2А? v J <2л8а> (Nei, Roychoudhury, 1974). Очевидно, что при N > 50 смещение оценки гетерозиготности без поправки для малой выборки будет небольшим. В большинстве свободно скрещивающихся (аутбредных) популяций наблюдаемая гетерозиготность довольно близка к теоретической гетеро- зиготности. Однако для популяций, в которых частоты генотипов замет- но отличаются от соотношений Харди-Вайнберга (например, при само- оплодотворении или партеногенезе) наблюдаемая гетерозиготность равна: 7 — 7660
Глава 2. Количественная оценка генетической изменчивости но = Ц\, (2.18b) /=1 где А - оценочная частота генотипа ij, aH - сумма частот всех гетерози- гот. Для популяций с очень высокой однородностью - гаплотипов мито- хондриальной и хлоропластной ДНК или для Y-хромосом несмещенная оценка генного разнообразия составит: п н = ^— n-i 1-ХА2 , (2.18с) где N - число особей в популяции с очень высокой однородностью или число особей определенного пола при оценке гаплотипов (Nei, 1987). Для вычисления изменчивости этих оценок генного разнообразия и для оценки значимости различий между популяциями можно обратиться к работе Нея (Nei, 1987). Для аллоферментных, микросателлитных или других диплоидных ло- кусов, выявляемых молекулярными методами, можно одновременно по- лучить данные о гетерозиготности ряда локусов у многих особей в попу- ляции. Определенный локус у конкретной особи может быть как в гетерозиготном, так и в гомозиготном состоянии. Наблюдаемые гетеро- зиготности можно представить в виде матрицы (таблица 2.13), где Н представляет собой значение для особи z и локуса J. Значения такой мат- рицы равны либо нулю (гомозиготы), либо единице (гетерозиготы), а оце- ночные гетерозиготности для каждого локуса представляют собой вели- чины в крайней нижней строке таблицы. Средние величины в крайней правой колонке таблицы - это гетерозиготности по всем исследуемым локусам для отдельных особей. Оценочная средняя гетерозиготность по всем локусам в популяции равна: (2.19а) а выборочная варианса составляет: А(1-А) Г(Я) = —4-----(2.19b) Nm Выборочная варианса имеет две составляющих, обусловленных вари- абельностью гетерозиготности между особями и вариабельностью гете- розиготности между локусами. Эти значения могут отличаться друг от друга. Для аллоферментов индивидуальная гетерозиготность дает факти- чески нормальное распределение, а гетерозиготные локусы - обратное
V. Измерение генетической изменчивости ТАБЛИЦА 2.13. Наблюдаемая гетерозиготность по отдельным локусам для отдельных особей Особь Локус 1 2 3 j .. т 1 н. 1 т 2 3 ^3, • i Нч н. N нт • Н, н3 н J н т н распределение J- вида. На рисунке 2.10 показаны эти распределения для 71 аллоферментного локуса человека (Hams, Hopkinson, 1972). Область, выделенная темным цветом, показывает наблюдаемое распределение ге- терозиготности по 71 локусу с 51 мономорфным локусом, имеющим ге- терозиготность 0,0, как приведено в таблице 1.3. Для сравнения рассмат- ривается 71 локус у 71 гипотетического индивида, выбранного случайным образом с помощью метода Монте-Карло. Распределение гетерозигот- ных локусов среди этих индивидов показано на рисунке 2.10 сплошной линией. Очевидно, что гетерозиготности почти у всех индивидов нахо- дятся между 0,05 и 0,10. Средняя гетерозиготность для этих двух распре- делений одинакова: 0,067, но варианса межиндивидуальной гетерозигот- ности составляет примерно 3% от вариансы гетерозиготных локусов. Если нужно оценить вариабельность гетерозиготных локусов, чтобы определить достоверность оценки гетерозиготности по этим локусам в выборке из всех аллоферментных локусов, то для этого подходят значения вариансы величин из крайних горизонтальных строк таблицы 2.13. Если же нужно оценить вариабельность межиндивидуальной гетерозиготности, чтобы определить оценку гетерозиготности этих индивидов в выборке из всей популяции, то используются значения вариансы в крайнем верти- 7*
2. Количественная оценка генетической изменчивости Гетерозиготность Рисунок 2.10. Распределение гетерозиготности по 71 аллоферментному локусу у челове- ка (по Harris,Hopkinson, 1972) и распределение гетерозиготности у 71 индивида, определен- ное по методу Монте-Карло. кальном ряду. Ней (Nei, 1987) привел значения варианс для этих составля- ющих и предложил исследовать как можно больше локусов у возможно большего числа особей, поскольку вариабельность локусов,как правило, высока. На самом деле, если доступно для исследования лишь ограничен- ное число особей, как например у редких видов, можно получить доволь- но хорошую оценку гетерозиготности, изучив ряд локусов у нескольких индивидов. Однако сомнительно, чтобы межлокусная изменчивость все- гда сильно уменьшалась из-за реальных различий гетерозиготности локу- сов (не только в результате выборки), что приведет к высокому полимор- физму по одним локусам и к мономорфизму - по другим. Сходные, но не столь крайние результаты можно наблюдать и в случае высоковариабельных диплоидных локусов, например микросателлитных. Следует помнить, что при исследовании микросателлитных локусов час- то не учитываются инвариантные локусы или локусы с низкой вариа- бельностью. Для удобства могут выбираться локусы с высокой гетерози- готностью (Paetkau et al., 1997) или со специфическим диапазоном гетерозиготности (Dib et al., 1996). В качестве примера рассмотрим дан- ные по микросателлитным локусам у медведей. Пример 2.9. В Северной Америке встречается три вида медведей: чер- ный (Ursus americanus), бурый (U.arctos, включая медведя гризли) и по- лярный (U. maritimus).
V. Измерение генетической изменчивости ТАБЛИЦА 2.14. Частоты аллелей микросателлитного локуса G10B у трех видов медведя из восьми популяций (Paetkau et al., 1997). N - размер выборки из каждой популяции. Цифры в левой колонке обозначают различные аллели и их размер в нуклеотидах. Внизу показано количество аллелей и ожидаемая гетерозиготность по данному локусу, а также средние значения по восьми микросателлитным локусам (СА)п Виды Популяция (N) Черный медведь Бурый медведь Полярный медведь LM (32) WS (Н6) NI (32) II (24) FR (40) KI (34) NB (30) WH (30) Аллели 140 - - - 0,104 - - - - 142 - - - - - - 0,083 - 148 - - - 0,167 - - - - 150 - - - 0,062 - 0,017 0,067 152 - - 0,078 0,104 0,112 - 0,150 - 154 0,062 - 0,641 0,125 0,038 0,985 0,417 0,140 156 0,344 0,147 - - 0,025 - 0,150 0,717 158 0,031 0,190 - 0,042 0262 0,015 0,183 0,067 160 0,156 0,263 - 0,354 0,150 - - - 162 0,016 0,216 - - 0,413 - - - 164 0,391 0,181 0,281 0,042 - - - - 166 - 0,004 - - - - - - п 6 6 3 8 6 2 6 4 НЕ 0,729 0,801 0,520 0,837 0,742 0,030 0,766 0,470 п 8,75 9,50 3,00 6,63 6,50 2,13 6,38 5,38 нЕ 0,820 0,806 0,414 0,764 0,694 0265 0,643 0,626 В популяционной генетике этих видов используются восемь высоко- вариабельных микросателлитных локусов - (СА)п. В таблице 2.14 пока- заны аллельные частоты по одному из этих локусов в нескольких популя- циях каждого из видов (по Paetkau et al., 1997). В двух наиболее изолированных популяциях: черного медведя с острова Ньюфаундленд (NI) и бурого медведя с острова Кодьяк (KI) было меньше всего аллелей и самая низкая гетерозиготность по данному локусу. Ни одна из наблюдае- мых гетерозиготностей по данному локусу не отличалась от ожидаемых по закону Харди-Вайнберга (Paetkau et al., 1997). Среднее число аллелей и средние ожидаемые гетерозиготности по всем 8 локусам указаны внизу таблицы. В популяциях с островов Ньюфаундленд и Кодьяк имелось наи- меньшее число аллелей: 3,00 и 2,13 и наименьшая гетерозиготность: 0,414 и 0,265. В двух континентальных популяциях черного медведя изменчи- вость была самой высокой: всего 8,75 и 9,50 аллелей с гетерозиготностью 0,820 и 0,806.
b. Доля полиморфных локусов и другие величины По Форду (Ford, 1940) генетический полиморфизм - это «совместное нахождение в одной и той же среде обитания двух или более перемежаю- щихся форм в таком соотношении, что самая редкая из них не может под держиваться путем периодических мутаций». Несмотря на неточность, эта формулировка достаточно привлекательна, поскольку основана на популяционно-генетической теории. Но с появлением гипотезы нейтраль- ности, в которой мутации (в сочетании с генетическим дрейфом) рас- сматриваются как основная сила, влияющая на генетическую изменчи- вость, и с открытием высоковариабельных локусов (например микросателлитных) с очень высокой скоростью мутирования, это опре- деление устарело. Более употребительная формулировка гласит, что «ге- нетический полиморфизм - это нахождение в одной и той же популяции двух или более аллелей одного локуса с частотой, поддающейся оценке» (Cavalli-Sforza, Bodmer, 1971). На практике необходимо определить, что представляет собой такая частота. Для самых обычных аллелей произвольно выбираются крайние частоты. Полиморфными считаются локусы, по которым частота обыч- ных аллелей меньше 0,99 или меньше 0,95. Используются обе произволь- ные границы, но величина 0,99 чаще употребляется для репрезентатив- ных выборок с размером около 100 особей и больше. Для оценки доли полиморфных локусов (Р) в популяции с известным числом локусов сна- чала вычисляют количество полиморфных локусов, а затем их долю сре- ди всех проверенных локусов. Другими словами, Р = —, (2.20) т где х - число полиморфных локусов в выборке из т локусов. Эта величи- на наиболее подходит для аллоферментных локусов и менее всего - для высоковариабельных локусов с высоким полиморфизмом. Иногда используется и другая величина - число действительных алле- лей, п, т.е. количество аллелей данного локуса, наблюдаемых в опреде- ленной популяции. Однако эта величина сильно зависит от размера вы- борки, поэтому сравнение популяций по выборкам разного размера следует проводить с осторожностью. В главе 9 мы рассмотрим на нейтральной модели, как зависит число аллелей от размеров выборки. Иногда исполь- зуется также число эффективных аллелей, пе - величина, противополож- ная ожидаемой гетерозиготности. Левонтин, (Lewontin, 1972), применив- ший в популяционной генетике методы информационной теории, предложил определять различия'между аллелями следующим образом:
VI. Оценка разнообразия нуклеотидного и аминокислотного состава 103 #'=-£А1пА. (2-21) В отличие от верхней границы гетерозиготности, равной для любого чис- ла аллелей единице, максимальная величина Н' равна 1п(и). Хотя биоло- гическое значение этой величины не вполне понятно, она может приго- диться для измерения изменчивости высоковариабельных локусов. VI. Оценка разнообразия нуклеотидного и аминокислотного состава В последние годы стали известны нуклеотидные и аминокислотные пос- ледовательности большинства генов особей в пределах популяций. Из- менчивость этих последовательностей внутри и между популяциями ис- следуется в молекулярной генетике популяций (см. главу 9). Здесь мы рассмотрим две величины изменчивости нуклеотидного состава; долю вариабельных нуклеотидных сайтов и разнообразие (ожидаемую гетеро- зиготность) на уровне нуклеотидов. Сходные величины можно использо- вать для определения изменчивости аминокислотного состава. В даль- нейшем, при обсуждении молекулярно-генетических вопросов мы проверим, согласуется ли такая изменчивость с нейтральной моделью и другими факторами, которые могут вносить вклад в вариабельность пос- ледовательностей ДНК и белков. Самый простой путь измерения изменчивости нуклеотидного состава состоит в определении количества различающихся нуклеотидных сайтов (5) по сравнению с общим числом сайтов (7V). Доля различающихся нук- леотидных сайтов равна: S Рп-~ (2.22а) и . (2.22b) Эта величина означает генетическое расстояние между нуклеотидными последовательностями, равное р (Nei, Kumar, 2000). Другой способ количественной оценки нуклеотидной изменчивости в популяции состоит в определении доли нуклеотидных различий между парами последовательностей с последующим взвешиванием этих разли- чий с частотой последовательностей. Суммируя все возможные пары пос- ледовательностей, получим величину нуклеотидного разнообразия:
» N „ 7Г =----/ P.PF 7’ ^^PiPj^y, (2.23a) V где p. - частота последовательности i, 7C - доля нуклеотидов, различаю- щихся между последовательностями ДНК i и j. Нуклеотидное разнообра- зие можно оценить по формуле: (2.23b) где N - число исследуемых последовательностей, а Д - доля /-той пос- ледовательности в выборке. (Для иллюстрации см. пример с данными по локусу Adh у D.melanogaster). Ней (Nei, 1987) приводит формулы для оценки вариансы величины нуклеотидного разнообразия, а Ней и Кумар (Nei, Kumar, 2000) предлагают использовать для оценки такой вариансы повторные выборки с помощью бутстрепного метода (см. ниже). Пример 2.10. Одним из первых оценили нуклеотидное разнообразие по гену Adh у D.melanogaster (Kreitman, 1983). Было описано 11 последова- тельностей гена Adh из выборок со всего мира. Локус Adh полиморфен по двум аллелям F и S. Было просеквенировано шесть медленных и пять быстрых образцов ДНК (кодирующих медленные и быстрые аллофермен- ты), (Kreitman, 1983). Оказалось, что три F- последовательности длиной 2379 нуклеотидов: Fr-F, Wa-F, Af-F не различаются по нуклеотидному составу (Af-F отличается только по инсерции в 3' - районе.) В результате д для этой последовательности равно 0,273 и 0,091 для других восьми последовательностей. Удивительно, что три образца ДНК одинакового нуклеотидного состава были получены из географически удаленных по- пуляций во Франции, США (Вашингтон) и в Африке (Бурунди). Нуклео- тидное разнообразие во всей выборке составило 0,0065. Если эту выбор- ку разделить на две аллоферментных категории, среднее разнообразие для аллеля S составит 0,0056, а для аллеля F - 0,0029, при том, что три аллеля идентичны. Величина среднего разнообразия при сравнении меж- ду разными аллоферментными аллелями гораздо выше и равна 0,0084. Аналогично можно оценить долю различающихся аминокислотных сайтов: S Раа ~ n •> (2.24а) где S - число аминокислотных сайтов, различных для сравниваемых пос- ледовательностей. При заданной частоте аминокислотных последователь-
VII. Измерение генетического расстояния ТАБЛИЦА 2.15. Процент нуклеотидных различий {л.. х 102) между 2379 нуклеотидами в 11 последовательностях локуса Adh у D.melanogaster (по Kreitman, 1983) 5 F Wa-S Fl-lS Af-S Fr-S FI-2S Ja-S Fl-F (Fr-F, Wa-F, Af-F) F1-1S 0,13 Af-S 0,59 0,55 Fr-S 0,67 0,63 0,25 5 F1-2S 0,80 0,84 0,55 0,46 Ja-S 0,80 0,67 0,38 0,46 0,59 Fl-F 0,84 0,71 0,50 0,59 0,63 0,21 F (Fr,Wa,Af) 1,13 1,10 0,88 0,97 0,59 0,59 0,38 Ja-F 1,12 1,18 0,97 1,05 0,84 0,67 0,46 0,42 ностей для определенного гена, аминокислотное разнообразие вычисля- ется по формуле: =£аЛ7Г</', (2.24b) и где л1.. - доля различных аминокислот между z-той и у'-той последователь- ностями. При случайных скрещиваниях эта величина равна аминокислот- ной гетерозиготности. Для большинства генов уровень разнообразия коди- руемых ими аминокислотных последовательностей, по-видимому, низкий. В локусе Adh D.melanogaster, например, из 255 кодируемых им аминокис- лот обнаружены различия только по одной. Но, как упоминается в главе 1 и в главе 9, в локусе МНС большинство нуклеотидных изменений приво- дит к изменчивости аминокислотного состава генных продуктов. VII. Измерение генетического расстояния В крупных исследованиях по генетической изменчивости часто рассмат- ривается множество популяций или видов и целый ряд локусов. Для изме- рения изменчивости среди исследуемых групп используются величины ге- нетического сходства и генетического расстояния. Такие измерения помогают получить подходящие соотношения и выявляют взаимосвязи меж- ду группами. При преобразовании данных по частоте в одну величину часть информации утрачивается. Но с помощью величин генетического расстояния проясняются межпопуляционные взаимоотношения, скрытые под массой цифр. Генетическое расстояние аналогично геометрическому, т.е. нуль означает отсутствие различий между группами. Сходства или различия по типу, количеству и характеру генетической изменчивости между популяциями могут быть результатом многих факто-
106 Глава 2. Количественная оценка генетической изменчивости ров. Например, генетическое сходство двух популяций может быть обус- ловлено тем, что (1) они недавно дивергировали или (2) между ними суще- ствует поток генов, или (3) они представляли собой крупные популяции с небольшим генетическим дрейфом, или (4) сходный тип отбора действо- вал на сходные локусы обеих популяций. Различия между популяциями могут быть связаны с (1) с их долговременной изоляцией и отсутствием потока генов между популяциями, или (2) с тем, что генетический дрейф порождает большие различия между популяциями, или (3) на популяции действует отбор разной силы. На практике действуют несколько или даже все эти факторы. Если они играли важную роль в прошлом, то бывает сложно проследить относительный вклад каждого фактора в историю по- пуляции. Позже мы рассмотрим относительное значение этих факторов в формировании сходства или различий между популяции. Прежде рассмотрения методов измерения генетического расстояния между популяциями, следует определить достоверность межпопуляцион- ных различий по частоте аллелей. Это можно сделать с помощью метода /2 применительно к гетерозиготности по двум аллелям: 2_2NV\p) Л/ __ pq (2.25а) где N- общий размер выборки, а р и q - оценки средних (взвешенных) частот для аллелей Ах и Л;в этой выборке (Workman, Niswander, 1970). Величина К( р) - это взвешенная варианса, которая вычисляется по фор- муле: ~,N э , V^ = Y^Pj -Р > где N и р,- размер выборки и частота аллеля Ах в популяции j. Для п аллелей величина /2 равна: X ,=| Pi ’ (2.25b) где Pi и Р(Р/)- оценочная средняя и варианса частоты аллеля i. Величи- на /2 для т локусов представляет собой сумму отдельных значений для каждого локуса и имеет (т - 1)(и - 1) степеней свободы. В последние десятилетия был предложен целый ряд величин для из- мерения генетического расстояния. Многие из этих величин хорошо кор- релируют друг с другом, в особенности при небольших различиях между популяциями, хотя они часто опираются на разные биологические и ма- тематические предположения. Однако при значительных межпопуляци-
VII. Измерение генетического расстояния 107 онных различиях часто наблюдаются существенные расхождения между значениями генетического расстояния, полученными разными способа- ми. Это особенно относится к сравнению генетических расстояний по микросателлитным локусам, когда допускаются определенные виды му- таций и генетические расстояния взвешиваются по квадрату различий в количестве повторов разных аллелей (Takezaki, Nei, 1996; Goldstein, Pollock, 1997; Paetkau et al., 1997). Мы не приводим здесь этих измерений, кото- рые следует интерпретировать с осторожностью, и полагаем, что более приемлема стандартизированная величина (Goodman, 1997). Рассмотрим наиболее широко используемую величину генетического расстояния - стандартное генетическое расстояние (Nei, 1972). Эта величина обладает выгодным свойством: при нейтральности (отсутствии дифференцирован- ного отбора) и когда все новые мутации приводят к новым аллелям (мо- дель бесконечного числа аллелей) она увеличивается во времени в ли- нейной зависимости. Для вычисления стандартного генетического расстояния Нея по одно- му локусу с п аллелями сначала определим генетическую идентичность: J 1 =----(2.26а) (ЛЛ) где /=1 (=1 1=1 ар.х и р - частоты z-того аллеля в популяциях х и у. Тогда генетическое расстояние между популяциями равно: D = - ln(7) = - In Jiy + In Jy + j- In Jx. (2,26b) Для множественных локусов Jx и J эти величины вычисляют путем сложения отдельных значений по всем аллелям всех исследуемых локу- сов. Среднее значение для локуса находят путем деления полученной сум- мы на количество локусов. Эти средние значения J' J'x и J'y использу- ются в формуле генетической идентичности для вычисления средней идентичности Г, а среднее генетическое расстояние равно:
108 Глава 2. Количественная оценка генетической изменчивости £)' = -1п(Г) (2.26с) Значения I и Г варьируют от нуля, когда между популяциями нет общих аллелей, и до единицы, когда обе популяции имеют одинаковые частоты аллелей. Значения D и D’ варьируют от нуля, для популяций с одинако- выми частотами аллелей, до бесконечности, для популяций, не имеющих общих аллелей. Вариансы величин DviD' можно вычислить по формуле Нея (Nei, 1987.) Для вычисления несмещенной оценки величины D рекомендуется де- лать поправки на оценки гомозиготности J и J. По-видимому, такие поправки нужны только тогда, когда размер одной из выборок не превы- шает 50. В таком случае несмещенная оценка J равна: } = 2Nx^pf-l х 2^-1 ’ где Nx и р- размер выборки и частота z-того аллеля в популяции х (несме- щенная оценка J находится аналогичным способом) (Nei, 1987). Однако при низкой гомозиготности (например, микросателлитные локусы) и ма- лой выборке эта поправка может давать искаженные результаты. В ка- честве иллюстрации рассмотрим вычисление значений /2 и генетическо- го расстояния на примере. Пример 2.11. Множество популяций в генетике человека и в антрополо- гии исследуется на генетическую изменчивость локусов групп крови, аллоферментов и других полиморфных вариантов (Nei, Roychoudhury, 1993). В таблице 2.16 показаны такие данные для двухаллельных локусов групп крови Secretor и Lewis у европейцев и африканцев. При данных размерах выборок можно определить значение /2 для гетерогенных попу- ляций. По локусу Secretor гетерогенность незначительна, но для локуса Lewis и для комбинации двух локусов значения /2 >3,84 при уровне зна- чимости 0,05 и одной степени свободы. Используя стандартное генети- ческое расстояние Нея, данное в тексте, можно также вычислить генети- ческое расстояние между этими локусами. В соответствии со значениями /2, генетическое расстояние для локуса Secretor мало, в то время как для локуса Lewis - довольно велико. Среднее генетическое расстояние между этими двумя локусами также велико и существенно больше нуля (Nei, 1987).
Задачи ТАБЛИЦА 2.16. Частота аллелей двух локусов групп крови у европейцев и африканцев (по Cavalli-Sforza, Bodmer, 1971). Показаны значения %2 для гетерогенных популяций и зна- чения генетических расстояний Аллели Европейцы (N= 1059) Африканцы (N= 120) Secretor Se 0,523 0,573 se 0,477 0,427 Lewis Le 0,816 0,319 le 0,184 0,681 X2 Secretor /=1,89 Lewis /=136 Всего /=138 Генетическое расстояние DAI A Secretor 0,004(0,996) Lewis 0,491(0,612) Средняя 0,243 (0,784) Задачи 1. При исследовании сайта SNP, сегрегирующего в популяции шим- панзе на нуклеотиды С и G, обнаружены следующие количества обезьян с разными генотипами: С/С C/G G/G 11 42 64 Какова частота нуклеотида G и ожидаемая численность особей с указанными генотипами? 2. В результате популяционных исследований микросателлитного ло- куса у Drosophila обнаружены следующие генотипы: AtAt AtA2 AtA} А2А2 А2А} А}А} 8 38 121 27 252 401 Вычислите частоты всех аллелей и проверьте, отличаются ли они от соотношений Харди-Вайнберга.
Глава 2. Количественная оценка генетической изменчивости 3. Допустим, что частоты аллеля А, аутосомного локуса равны 0,8 у самцов и 0,4 - у самок. Вычислите частоты генотипов для последу- ющих двух поколений, воспользуйтесь двумя последними уравне- ниями выражения 2.6b. 4. Предположим, что частоты аллеля Л, одного из локусов гапло-дип- лоида равны 0,0 у самцов и 0,3 у самок. Какова частота аллеля у этих двух полов в последующих четырех поколениях? Изобразите результаты в виде графика. Через сколько поколений частота аллеля у самок будет отличаться от средней частоты аллеля менее чем на 0,001? 5. Исследование аллоферментных локусов у самоопыляемых видов ра- стений выявило следующие соотношения: F FS S 25 14 21 Используя выражение 2.15а, вычислите для этих данных значение /2. Найдите /2, используя ожидаемые величины из выражения 2.16. 6. Исследование микросателлитного локуса в популяции змей выяви- ло следующие соотношения: Фенотип 120 120/122 122 Количество 17 18 14 Какова оценочная частота нуль-аллеля? 7. Частота новорожденных американцев европейского происхождения с аутосомно-рецессивным заболеванием муковисцидоз равна при- мерно 1 на 2500. Какова оценочная частота рецессивного аллеля и доля индивидов, гетерозиготных по этому аллелю? Какова доля бра- ков между двумя носителями этого аллеля в свободно скрещиваю- щейся популяции? 8. В популяции пятнистой совы обнаружено семь гаплотипов мтДНК в количестве 1, 4, 3, 21, 4, 1 и 7. Каковы оценочные частоты этих гаплотипов? Каково оценочное значение разнообразия мтДНК при поправке на малую выборку? 9. В выборке из английской популяции березовой пяденицы было 307 особей с темным фенотипом melanic, 5 - с фенотипом insularia и 448 - с фенотипом typical. Каковы оценочные частоты этих трех аллелей? 10. Допустим, что частота аллеля двухаллельного локуса равна 0,3. При какой наблюдаемой гетерозиготности величина F составит - 0,05? Какой размер выборки требуется для обнаружения данной ве- личины?
Задачи 11. В выборках из двух человеческих популяций (х = 25 индивидов, у = 50 индивидов) обнаружены следующие частоты аллелей двух сайтов SNP: Сайт 1 Сайт 2 С G Т G X 0,22 0,78 0,04 0,96 У 0,37 0,63 0,03 0,97 Для того,чтобы определить, достоверны ли различия между популя- циями, вычислите величину %2. Определите значение D для каждо- го из локусов и для двух локусов вместе. 12. Предположим, что у пяти различных индивидов обнаружены следу- ющие последовательности мт ДНК: AATCGAGACTTTAGC ATTCCAGAATTTAAGC AATCGAGACTTTAGC TATCGAGACTATCCC Каковы оценки величин рпа л? 13. С помощью одного из программных пакетов, перечисленных в таб- лице 2.1, решите одно из перечисленных выше заданий. 14. У индейцев гавасупаи найдены следующие ожидаемые и наблюдае- мые значения гомозигот и гетерозигот по локусу HLA-A: Гетерозиготы Гомозиготы Наблюдаемые 84 38 Ожидаемые 73,6 48,4 Какова вероятность наблюдения различий такой степени? Представь- те, что вы проводите одностороннее тестирование, чтобы опреде- лить вероятность наблюдения данного или большего числа гетеро- зигот. Воспользуйтесь биномиальной формулой с ожидаемыми соотношениями двух классов, которые вычислены, исходя из ожида- емых количеств гетеро- и гомозигот в нижней строке. 15. Четыре последовательности длиной 900 п.н. различаются между со- бой по следующему числу пар нуклеотидов: 1,4, 2, 5, 6, 10. Какова оценка нуклеотидного разнообразия этих последовательностей?
ГЛАВА 3 ПОНЯТИЕ ОБ ОТБОРЕ Важность великого принципа Отбора заключается в возможности отбора едва заметных различий.... которые могут аккумулироваться до тех пор, пока ре- зультат не станет очевидным для любого. Чарльз Дарвин (1859) Отбор - это своего рода корзина для бумаг, которая содержит все направлен- ные изменения частоты генов, не затрагивающие мутации или интродукцию извне. Сьюэл Райт (1955) Естественный отбор представляет собой сложное явление, которое трудно оценить количественно, хотя он и считается основной движу- щей силой эволюции. Большинство фенотипических признаков, на- пример форма тела и окраска у насекомых, размеры и физиологичес- кие параметры у млекопитающих, появились в результате естествен- ного отбора. Эти признаки используются для классификации и ассо- циированы с определенными видами. Другими словами, эти феноти- пы были адаптивными для конкретной популяции, поэтому их часто- та увеличивалась и они стали характерными для данного вида. Счита- ется, что такие фенотипические признаки отражают генетический со- став популяции или вида. Эта «адаптационная» точка зрения сильно упрощает механизм эволюции фенотипов, поскольку некоторые при- знаки обусловлены историческими, не адаптивными причинами (Lewontin, 1978). Представим процесс естественного отбора в виде простой схемы (рисунок 3.1). Допустим, особи в данной популяции имеют опреде- ленную генетическую изменчивость. Эта изменчивость в сочетании с влиянием среды определяет фенотипическую изменчивость совокуп- ности признаков каждой конкретной особи в популяции. Величина и характер фенотипической изменчивости определяют степень выжи- ваемости, плодовитость и способность к скрещиванию, а также дру- гие факторы, от которых зависит, попадут ли данные аллели в после- дующие поколения. Эффект всех этих факторов называется относи- тельной приспособленностью различных особей в популяции, то есть относительной способностью разных генотипов передавать свои ал-
Глава 3. Понятие об отборе Генотипическая изменчивость Средовая изменчивость Фенотипическая Приспособительная изменчивость ► изменчивость Рисунок 3.1. Схема связей между генотипической (генетической), средовой, фенотипи- ческой и приспособительной изменчивостью. лели потомству. В следующей главе мы рассмотрим влияющие на от- носительную приспособленность факторы более детально. Сама по себе эволюция - это конечный результат различного вклада разнооб- разных генотипов в последующие поколения. В главе 1 мы говорили о степени генетической изменчивости среди особей в популяции. Экологи, климатологи, почвоведы и другие спе- циалисты детально исследуют средовые факторы. Однако многое ос- тается неясным, например, относительный вклад генетических и сре- довых компонентов в фенотипическую изменчивость в популяции. Мало известно и о связи фенотипических вариантов с приспособлен- ностью. Предполагается, что эти важные для естественного отбора факторы независимы и аддитивны. Однако, как мы увидим в дальней- шем, это условие соблюдается не всегда. При исследовании процесса отбора обычно вводится ряд упроще- ний. Такой редукционистский подход, разработанный Фишером, Хол- деном и Райтом, не позволяет судить о значимости естественного от- бора в популяции. Для того, чтобы модели отбора стали более реаль- ными, в них нужно ввести множество биологически важных компо- нентов. Таков наш подход к исследованию отбора. Мы рассмотрим простые модели и свойства этих модельных систем. Для понимания действия тех или иных факторов мы воспользуемся некоторыми до- пущениями. Мы остановимся на модели отбора по одному гену, по- скольку такие модели важны для понимания отбора по двум или мно- гим важным локусам. Мы рассмотрим также динамику генетических изменений в результате отбора (скорость изменения частот аллелей или генотипов) и стабильную генетическую изменчивость, когда вслед- ствие отбора изменчивость остается на прежнем уровне. По ряду причин понимание и документирование адаптивных фе- нотипических изменений затруднено. Во-первых, такие изменения обычно постепенны, т.е. происходят на протяжении нескольких поко- лений. У долго живущих организмов такие изменения выявляются спустя столетия, хотя это и быстрее, чем изменчивость, наблюдаемая в палеонтологических исследованиях. Имеются примеры и быстрых эволюционных изменений в ответ на сильное давление факторов сре- ды (Lenski, Travisano, 1994; Thompson, 1998; Wichman et al., 1999).
I 14 Глава 3. Понятие об отборе Кроме того, известно о быстрых изменениях, например об эволюции устойчивости к пестицидам, в ответ на человеческую деятельность (Mallet, 1989) (см. пример 3.1 по исследованию растений, насекомых и грызунов). Быстро эволюционирует и устойчивость микроорганиз- мов к антибиотикам (Baquero, Blazquez, 1997). Во-вторых, определе- ние многих фенотипических признаков затруднено из-за полигенного наследования и комплексного влияния факторов среды. В последнее время были идентифицированы гены (локусы) количественых призна- ков, или ЛКП. Это упростило понимание генетического вклада в адап- тивные признаки (см. главу Ии Lynch, Walsh, 1998). В большинстве случаев понимание процесса естественного отбора затруднено. Одна- ко, благодаря последним достижениям науки, появилась возможность определить компоненты эволюционного ответа. Пример 3.1. Применениие химикалий для борьбы с вредителями было успешным лишь в течение короткого времени, пока эти вредители не приобрели генетическую устойчивость к химическим веществам (McKenzie, 1996). После Второй Мировой войны для этой цели стали использовать множество синтетических органических пестицидов. По- началу их применение резко повысило урожайность сельскохозяйствен- ных культур и снизило заболеваемость населения от инфекций. Однако в 1970-х годах появился ряд видов комара анофлес - переносчика маля- рии - которые были устойчивы к яду ДДТ, а также домовые мухи, ус- тойчивые к различным инсектицидам. Было обнаружено несколько ви- дов грызунов, устойчивых к химическим препаратам, и выявлен ряд растений, устойчивых к гербицидам. С тех пор количество устойчивых к пестицидам видов и число неэффективных против них препаратов продолжает неуклонно расти. В результате появились новые пестици- ды, например токсин, полученный из распространенной почвенной бак- терии Bacillus thuringiensis (Bt), который не опасен для человека и дру- гих организмов, кроме насекомых. Однако уже появились устойчивые к этому токсину виды (Tabashnik et al., 1997; Gould et al., 1997). Таким образом, устойчивость к новым инсектицидам этого типа скоро станет широко распространенной. Развитие устойчивости к пестицидам слу- жит примером быстрых селективных изменений, такие изменения прак- тически невозможны при естественном отборе. Генетическая основа устойчивости к пестицидам иллюстрируется на примере лабораторных линий (см. пример 1.11) или мутантов по одному или нескольким генам (Taylor, Feyereisen, 1996). Например, устойчивость к распространенному гербициду атразину наследуется
Глава 3. Понятие об отборе I 15 Дорожка 1 23456789 в 1 ► 11И| Фактор разведения 1 1 16 32 64 128 256 512 1024 Рисунок 3.2. Количество фермента эстеразы В1 у чувствительных ( дорожка 1) и устой- чивых к пестицидам ( дорожка 2) комаров. На дорожках 3-9 показаны серийные разведе- ния экстракта эстеразы В1 из устойчивых к пестицидам насекомых. по материнскому типу. Гены хлоропластной ДНК кодируют белок pbs-A, который важен для возникновения устойчивости. Аминокис- лотная последовательность pbs-A у амарантуса — Amaranthus hybridus отличается от чувствительных к атразину разновидностей этого рас- тения по кодону AGT в 238 позиции, который изменен на GGT, что приводит к синтезу вместо серина аминокислоты глицина (Hirschberg, McIntosh, 1983). В результате молекула pbs-A теряет аффинность к молекулам гербицида, и формируется устойчивость. Устойчивость к органическим фосфатам у некоторых насекомых связана с продукцией больших количеств ферментов, разрушающих эти вещества. Чаще всего такая гиперпродукция обусловлена ампли- фикацией последовательностей, кодирующих ферменты. С помощью иммуноферментного анализа у чувствительных и устойчивых к ин- сектицидам комаров были определены количества фермента эстеразы (Mouches et al., 1987). На первой дорожке рисунка 3.2 показано количе- ство эстеразы Bly чувствительной линии комара, а на дорожках со 2-й по 9-ю — различные разведения этого фермента, выделенного из ус- тойчивых к инсектициду линий. Оказалось, что у последних наблю- дается 500-кратное увеличение уровня эстеразы, т.е. разведение от 1 до 512 дает то же количество фермента, что и у чувствительных ли- ний комара. Анализ нуклеотидных последовательностей, кодирующих эстеразу, показал, что эта устойчивость связана с их уникальной амп- лификацией и с последующим распространением амплифицирован- ных последовательностей в популяции (Guillemaud et al., 1996). Широко распространенного вредителя - норвежскую, или корич- невую крысу, Rattus norvegicus, в течение 15 лет уничтожали с помо- щью антикоагулянта варфарина. Однако в Европе и США устойчи-
I 16 Глава 3. Понятие об отборе вость крыс к варфарину быстро растет. По-видимому, она связана с доминантным аллелем R аутосомного локуса. Большинство устойчи- вых к варфарину животных гетерозиготны по этому аллелю и по ал- лелю дикого типа S. Низкая жизнеспособность гомозигот RR связана с 20-кратным увеличением потребности в витамине К. При воздей- ствии варфарином преимущество получают гетерозиготы, и относи- тельная выживаемость генотипов RR, RS и 55 составляет 0,37, 1,0 и 0,68, соответственно (Greaves et al., 1977). В одной из популяций крыс частота аллеля устойчивости в течение примерно десяти лет была ста- бильной. Однако после непродолжительного воздействия варфарином на другую популяцию, частота этого аллеля резко уменьшилась - та- кова цена за поддержание аллеля устойчивости в популяции. Р.А. ФИШЕР (1890-1962) Сэр Рональд Фишер более всего известен своими трудами в математической статис- тике. На протяжении всей жизни он увлекался эволюционной генетикой. Его первая книга Генетическая теория и естественный отбор (1930) представляет собой ос- новательный синтез дарвиновской теории отбора и генетики. Фишер внес большой теоретический и практический вклад в генетику. Он выдвинул концепцию прогрес- сивного отбора и инбридинга, вывел формулы для оценки частоты аллелей и интен- сивности отбора, или коэффициентов инбридинга. Фишер разработал так называе- мую основную теорему естественного отбора - попытку унифицировать учение об эволюции. Р.Фишер родился и жил в Англии, большую часть своей жизни он оста- вался приверженцем евгеники. Издан сборник его научных трудов (Bennett, 1971- 1973). Более подробно о биографии Фишера и о его вкладе в генетику можно узнать в специальной литературе (см. Box, 1978; Crow, 1990). I. Основная модель отбора Сначала сделаем ряд важных допущений. Эти допущения касаются генетических систем, метода отбора и других факторов: инбридинга, генетического дрейфа, потока генов (см. таблицу 3.1). Затем в этой и последующих главах мы расширим эти допущения и оценим их по- тенциальный эффект. Сначала рассмотрим три возможных генотипа А}Аг, А}А2 и А2А2 с относительной приспособленностью и w,,, соответственно. В данном случае под относительной приспособленностью мы будем по- нимать относительную вероятность выживания. Для наглядности пред- положим, что генотипы AtAlf А}А2и А?А2 образуют 100, 200 и 100 зи- гот соответственно. Из-за смертности до взрослого состояния дожи-
I. Основная модель отбора I I 7 вет 80, 160 и 50 особей каждого генотипа. Доли выживаемости трех генотипов составят 0,8, 0,8 и 0,5. Удобнее стандартизировать эти ве- личины, получив относительную выживаемость (приспособленность), максимальная величина которой равна 1,0. Поэтому величины отно- сительной приспособленности для генотипов АХАХ, АХА2 и А^А2 будут равны 0,8/0,8=1, 0,8/0,8=1, 0,5/0,8=0,625. В данном случае давление отбора на гомозиготы А2А2 и два других генотипа : АХАХ и АХА2 будет приводить к одинаковой относительной приспособленности. Величи- ны относительной приспособленности постоянны. Однако, как гово- рится в следующей главе, они могут изменяться в ответ на действие факторов среды, на изменение частоты различных генотипов и другие факторы. Частоты генотипов до отбора соответствуют закону Харди-Вайн- берга (таблица 3.2), где р0 и q0 - частоты аллелей А и А2 в нулевом поколении (иногда мы не будем указывать поколение). Относитель- ный вклад каждого из трех генотипов в следующее поколение опреде- ляется произведением величин относительной приспособленности и частоты генотипа до отбора этого генотипа. Средняя приспособлен- ность популяции, или w — это сумма относительных вкладов различ- ных генотипов. При данных соотношениях Харди-Вайнберга средняя приспособленность до отбора равна: w=po2wxx + 2poqowx2 + qo2w22. (3.1) ТАБЛИЦА 3.1. Список допущений к основной модели отбора Генетическая система (1) Одиночный, двухаллельный, аутосомный локус (2) Диплоидия (3) Случайные скрещивания между особями Отбор (1) Одинаковый отбор по двум полам (2) Отбор по разной жизнеспособности (3) Отбор постоянен для каждого генотипа Другие факторы (1) Неперекрывающиеся поколения (2) Безграничная популяция (3) Отсутствие потока генов (4) Отсутствие мутаций
Глава 3. Понятие об отборе ТАБЛИЦА 3.2. Частоты генотипов до и после отбора, с соблюдением до отбора соотно- шений Харди-Вайнберга Генотип Всего AiA] AjA2 а2а2 Относит, приспособленность и-и w12 *22 — Частота до отбора Ро 2роф> 1 Взвешенный вклад Pown 2ро^оВ'и Яо*22 W Частота после отбора 2ро^оИ'12 ^*22 1 W W Если стандартизировать относительные вклады с помощью значе- ний средней приспособленности, то частоты генотипов после отбора будут соответствовать величинам в нижней строке таблицы 3.2. Час- тота аллеля А2 после селекции (qx) равна половине от частоты гетеро- зигот А{А2 (поскольку только половина гетерозигот несет аллели А2) плюс частота гомозигот А?А2, или: „ _ 1 ('ZpcfaWn Y ?о W22 _ ад(1«12 + 4>22 Ч\ ~ ~ г _ . (3.2) w J w w ' Это выражение мы будем использовать при рассмотрении действия разных видов отбора. Из него следует, что частота аллеля А2 после от- бора представляет собой функцию частот аллелей до отбора и отно- сительных приспособленностей генотипов. Если величину изменчи- вости аллельных частот обозначить как М = - Яо, где q0 и qx - частоты аллеля А2 до и после отбора (или частоты в нуле- вом и первом поколениях), то, подставляяя q} из выражения 3.2 полу- чим: \q = 2 MW!2 +?0^22 = p0?0w12 +?02w22 w Если подставить значение w из выражения 3.1, (причем q=\- р), то формула примет вид: Aq = pqwn + q2w22 ~q(p2wu + 2pqwl2 + q2w22) w
I. Основная модель отбора q{pqwn -pqwl2-p2w}l + pqwl2) w _ ЯР1я(™22 - w,2) - p(wu - w12)] --------------—------------. (3.3 a) w Эту очень важную формулу мы будем использовать для демонстра- ции действия разных видов отбора. Другой подход к изучению изменений аллельной частоты состоит в анализе изменений относительной приспособленности и влияния этих изменений на частоту аллелей. Используя выражение 3.1, нахо- дим, что производная по q равна: (/w d , 2 „ 2 ч = (р W11+2Wu-l2+7 w22) = dq dq = ~2(lwn +Qlw\x +^n-2q2wl2 + q2w22) = dq = 2[-pw,, + (1 - 2^)w12 + 2qw22] = = 2[?(w22 -wi2)-p{wu- wn)]. Выражение в скобках - это функция различий в приспособленности между генотипами, взвешенная по аллельной частоте. Его величина равна выражению в скобках в уравнении 3.3а. В результате, предыду- щую формулу можно записать в виде А pq dw = (3.3b) 2w dq 4 ’ Поэтому можно рассматривать изменение частоты аллелей как функ- цию аллельных частот, средней приспособленности и изменения сред- ней приспособленности по отношению к аллельной частоте. Разуме- ется, если р=0, <7=0, или dw!dq=Q), то частота аллелей остается неиз- менной. Рассмотрим, как различные значения приспособленности могут вли- ять на генетические изменения или на стабильность. Допустим, что относительная приспособленность гетерозигот равна 1. Другими сло- вами, стандартизуем приспособленность двух разных гомозиготных генотипов против приспособленности гетерозигот: w , 1 и и^для ге- нотипов А}А{, А{А2и А?А2, соответственно. Предположим, что значе- ния w и w22 различны по величине, тогда возможны четыре вида от- бора (см. рисунок 3.3.). Темные области означают два вида направ-
2.0 Преимущество гетерозигот (стабильное равновесие) ^1.оР Невыгодность гетерозигот (нестабильное равновесие) 0.0 й— 0.0 1.0 ИГц 2.0 Рисунок 3.3. Различные исходы отбора генотипов Л Л , Л Л2 и Ayl, с приспособленнос- тью wn, 1 и w22, соответственно. Темные зоны указывают на величины приспособленнос- ти, приводящие к направленному отбору. Светлые области указывают на величины при- способленности, дающие стабильное равновесие (преимущество гетерозигот) или неста- бильное равновесие (невыгодность гетерозигот). ленного отбора, когда при > 1,0 > w22 растет частота аллеля Л, а при wn < 1,0 < w,2 растет частота аллеля Л2 Два других вида отбора приводят к стабильному (устойчивому) равновесию частоты гетеро- зигот с максимальной приспособленностью, когда wn< 1,0 >w , и к нестабильному (неустойчивому) равновесию частоты гетерозигот с ми- нимальной приспособленностью, когда > 1,0 < w22. Преимущество гетерозигот и невыгодность гетерозигот часто относятся к сверхдо- минированию и к неполному доминированию, соответственно, при- меняемых в селекции растений и животных. Единственная область приспособленности, приводящей к долговременному полиморфизму, - это область преимущества гетерозигот. В других зонах, показанных на рисунке 3.3, происходит случайная фиксация либо аллеля Ах, либо аллеля Л2. Однако даже в этих зонах могут происходить медленные изменения частот аллелей и значений приспособленности. На практи- ке это затрудняет дифференциацию стабильного и переходного (тран- зиентного) полиморфизма. В центральной точке пересечения двух линий приспособленность всех генотипов равна единице. Из главы 9
I. Основная модель отбора мы узнаем, что наличие или отсутствие селективных различий между генотипами менее важно, чем влияние генетического дрейфа (усло- вие так называемой селективной нейтральности). Генетический дрейф играет ключевую роль в молекулярной эволюции. Проанализируем свойства и взаимоотношения некоторых видов приспособленности, приведенных в таблице 3.3. Для этого введем два новых параметра: количественную величину отбора против гомози- гот, или 5 и уровень доминирования, h, при умножении на 5 он пока- зывает величину отбора против гетерозигот. Сначала рассмотрим мо- дели направленного отбора, который приводит к случайной фиксации одного или другого аллеля. Затем рассмотрим действие отбора, при- водящего либо к стабильному равновесию, т.е. к поддержанию в популяции двух аллелей, либо к нестабильному равновесию, при ко- тором утрачивается один из аллелей, имеющий меньшую частоту. ТАБЛИЦА 3.3. Величины приспособленности генотипов для различных систем Генотип •А-А А]А2 A2A2 Общая приспособленность w12 w22 (1) Рецессивные летали 1 1 0 (2) Вредные аллели (а) рецессивные 1 1 1-s (в) аддитивные 1 1 -s/2 1-s (с) доминантные 1 1-s 1-s (3) Общее доминирование (а) Очищающий отбор 1 1 — hs 1-s (в) Прогрессивный отбор 1 +з 1 -1- hs 1 (4) Преимущество гетерозигот 1-3! 1 1 — s2 (5) Невыгодность гетерозигот 1 + 31 1 1+S2 а. Рецессивные летали Некоторые аллели, обусловливающие заболевания у людей, например синдром Тея-Сакса или муковисцидоз, вероятно, поражают, в первую оче- редь, гомозиготы по рецессивным аллелям. При отсутствии специализи- рованной медицинской помощи такие больные умирают, не достигнув репродуктивного возраста. Аналогично погибают и многие хлорофиль- ные мутанты у растений, а также гомозиготы по леталям у дрозофилы. Относительная приспособленность рецессивного летального аллеля выражается в величинах, представленных во второй строке вверху таб- лицы 3.3. Приспособленности гомозигот Л] и гетерозигот одинако-
П22 Глава 3. Понятие об отборе вы, но гомозиготы Лу42 несут летальный аллель с приспособленнос- тью, равной нулю. Используя выражение 3.2 и подставляя эти вели- чины приспособленности, находим частоту аллелей после отбора: п _РйЧ№ + Ч2№) Ч\ ~ — w Поскольку W =рД1)+ 2/^(1 )+^о2(О) = = Р02+2р0Ч0 = Р0('[+Ч0) и аллельная частота равна: „ _ РйЧй _ ч* а,(1 + <70) 1 + <7о’ (3'4а) то изменение аллельной частоты равно: 2 Л Чо Чо ^4 = 4i~40=—-------^=—г—. (3.4b) 1 + <70 1 + <70 v > Для совокупности значений приспособленности как средняя приспо- собленность, так и изменение аллельной частоты - функции только исходной частоты аллелей. Из выражения для средней приспособлен- ности видно, что ее величина достигает максимума, равного 1, когда в популяции фиксирован аллель А{ (#=0). Из формулы 3.4b ясно, что изменение частоты аллеля максимально при значениях q, близких к единице и очень мало - при значениях q, близких к нулю. Для нагляд- ности рассмотрим пример 3.2 с летальными аллелями у Drosophila. Исследования на Drosophila, как на модельном организме, имели боль- шое значение для понимания принципов эволюционной генетики и движущих сил эволюции. Пример 3.2. При высокой частоте леталей частота аллелей стреми- тельно падает. На рисунке 3.4 показана частота летального аллеля Glued у D.melanogaster. У мутантных мух и у гетерозигот по этому аллелю в разной степени уменьшен размер глаз (Clegg et al., 1976). Две популяции, показанные на данном рисунке, были получены от скрещивания только гетерозиготных мух, поэтому q= 0,5. Заметьте, что наблюдаемые изменения частоты в поздних поколениях близки к ожидаемым. Дальнейшее исследование показало, что отбор против гетерозигот приводит к резкому падению частоты аллеля.
I. Основная модель отбора 123 Рисунок 3.4. Ожидаемое падение частоты летального аллеля Glued (пустые кружки) и наблюдаемые изменения частоты этого аллеля (темные кружки) в двух параллельных опытах. Выражение 3.4а указывает на обратную связь значений, т.е. в лю- бой момент времени t + 1 аллельная частота представляет собой функ- цию частоты в момент времени t: Я 1 + <7, Поэтому частота аллеля во втором поколении - это функция частоты аллеля в первом поколении: Яг Я1 l + ?i ’ Подставляя значение qx из выражения 3.4а, получим: Яг Яо 1 + 2^о ’ Это выражение можно обобщить, принимая частоту аллеля в поколе- нии t, как функцию частоты аллеля в нулевом поколении: q> 1 + ^0 ' (3.5а) Заметим, что максимально возможная частота аллеля равна 1/2 (все особи - гетерозиготы), а значения частот аллеля в поколениях 0,1,2,3,4,.... располагаются в прогрессии 1/2, 1/3, 1/4, 1/5, 1/6,.
Глава 3. Понятие об отборе Решение данного уравнения для t: (3.5b) 1 1 t =------ Я, Яо Два последних выражения позволяют ответить на два разных вопроса о динамике изменений частоты летального рецессивного аллеля: ка- кова величина аллельных изменений на протяжении t поколений и через сколько поколений такие изменения достигнут определенной величины? В таблице 3.4 приводятся значения величин, вычисленные по фор- муле 3.5b, для нескольких аллелей. При высокой частоте летального аллеля, его частота падает очень быстро, например через 8 поколений с 0,5 до 0,1. Однако при низкой исходной частоте летали, уменьшение частоты этого аллеля в популяции происходит медленно, например через сотню поколений - от 0,01 до 0,005, т.е. наполовину. Такое мед- ленное падение частоты связано с тем, что большинство летальных аллелей «скрыты» в гетерозиготном состоянии и не подвержены от- бору. Для иллюстрации этого явления вычислим долю аллеля Аг у ге- терозигот по отношению к гомозиготам (аллель А2 несет только поло- вина всех гетерозигот): РЯ_=Р_ я2 Я' ТАБЛИЦА 3.4. Число поколений (/), необходимое для того, чтобы частота рецессивного летального аллеля снизилась от величины qQ до qt Ф <?> t 0.5 0.25 2 0.1 8 0.01 98 0.1 0.05 10 0.01 90 0.001 990 0.01 0.005 100 0.001 900 0.0001 9900 При низкой частоте аллеля Л2 отношение этих величин становится очень большим (при q = 0,01, например, оно составит 99). Это означа- ет, что на один аллель А2, подверженный отбору, приходится 99 алле- лей, замаскированных в гетерозиготном состоянии доминантным ал-
I. Основная модель отбора 125^) лелем. Очевидно, что полностью элиминировать рецессивные летали из популяции весьма сложно и уменьшение частоты рецессивных ал- лелей, если они не идентифицируются в гетерозиготном состоянии, будет неэффективным. Ь. Отбор против рецессивов Во многих случаях происходит лишь частичный отбор против гомо- зигот. Поэтому относительная приспособленность гомозигот по срав- нению с другими генотипами уменьшается лишь отчасти. При мно- гих генетических болезнях человека, например при альбинизме или серповидноклеточной анемии, гомозиготы по рецессивному аллелю могут выжить и дать потомство, хотя и с меньшей вероятностью, чем здоровые индивиды. У дрозофилы, мыши, кукурузы и других генети- чески исследованных организмов существует множество рецессивных мутаций, которые снижают приспособленность, но не приводят к смер- тельному исходу. Для определения относительной приспособленности при отборе вредных рецессивов воспользуемся строкой 2а в таблице 3.3. Относи- тельные приспособленности генотипов А}АХ и А ,А2 одинаковы, а при- способленность генотипа А^А2 меньше значения s, селективной невы- годы, или коэффициента отбора гомозигот. Максимальное значение этого коэффициента равно единице, в этом случае имеются рецессив- ные летали, а минимальное - нулю, в этом случае отбор нейтрален. (Фе- одосий Добжанский в шутку заметил, что значение 5 больше 1, когда «судьба хуже смерти».) Подставляя эти значения приспособленности в уравнение 3.2, получаем частоту аллеля А2 после отбора: „ _ ?о(1~^о) 1 2 1-^0 Значение выражения в знаменателе этого и подобных ему уравнений равно w . По формуле 3.3а изменение частоты аллеля А2 равно: l-.s-<72 Как средняя приспособленность, так и изменение аллельной час- тоты - это функции аллельной частоты и коэффициента отбора. На рисунке 3.5 показано изменение этих величин в зависимости от ал- лельной частоты при коэффициенте отбора против рецессивов, рав- ном 0,2 (сплошные линии). Как и в случае с рецессивными деталями, средняя приспособленность (в верхней половине рисунка 3.5) дости- (3.6а) (3.6b)
Рисунок 3.5. Средняя приспособленность (а) и изменение аллельной частоты (Ь) при от- боре против рецессивных, аддитивных (промежуточное доминирование) или доминант- ных аллелей с величиной s=0,2. гает максимума, равного 1, при фиксации в популяции аллеля А}, а минимума - при фиксации аллеля А2. Однако наибольшие изменения аллельной частоты наблюдаются при средних ее значениях. При ко- эффициенте отбора 0,2 максимальные изменения частоты происходят при ее значениях около 0,69. При малых значениях коэффициента отбора максимальные изме- нения аллельной частоты происходят при q = 2/3. Это можно проде- монстрировать с помощью производной выражения 3.6b, представив его значение в виде нуля и решая уравнение для q. Допустим, что ве- личина s близка к нулю, так что w = 1 - sq 2 = 1. Тогда Ag ~ -sq2 + sq2 и ^ = -2« + V=0.
I. Основная модель отбора I При аллельной частоте q = 2/3, значение Aq максимально (в нашем случае оно минимально). Максимум значения Aq при 5 = 0,2 на рисун- ке 3.5 как раз близок к такой аллельной частоте. Как и для рецессив- ных леталей, изменение частоты рецессивных аллелей мало, когда зна- чения q приближаются к нулю. Это результат защиты аллелей А2 в гетерозиготном состоянии, когда они не идентифицируются и не под- лежат отбору. Точного обратного решения выражения 3.6а нет. Чтобы определить число поколений, необходимых для изменения аллельной частоты до определенной величины, предположим, что производная q по отно- шению ко времени равна Aq, или: dq А — ~ A q dt Дифференцируя это уравнение по частям, получим: Интегрируя обе части уравнения от нуля до t, имеем: и Рисунок Гарри Ларсона «Естественный отбор за работой»
<=Г J«o Д<у Такое же допущение можно сделать и для значения Nq, так что A? ^-sql(\-q0), тогда, и решение этого уравнения: Z = 1 Qo~Q, , ln?oO-gJ 4 ад, (3.6с) Используя это выражение, можно вычислить, через сколько поко- лений будет достигнуто данное изменение аллельной частоты. Напри- мер, для уменьшения частоты с 0,1 до 0,05 при 5=0,2 понадобится 58 поколений. Эти результаты очень близки к величинам, полученным из выражения 3.6а при небольших значениях 5. Изменение частоты вредных рецессивных аллелей во времени сходно с изменением час- тоты рецессивных леталей, хотя скорость изменений больше значе- ния 1/5. Заметим, что первое выражение в скобках из уравнения 3.6с равно выражению 3.5b. Кроме того, из выражения 3.6с следует, что время, за которое появляется данное число аллельных изменений, это обратная функция величины отбора. с. Промежуточное доминирование (аддитивность) и отбор против гамет или против гаплоидов Исследование количественных признаков показало, что значения при- знаков у гетерозигот часто занимают промежуточное положение меж- ду гомозиготами (Falconer, MacKay, 1996; Lynch, Walsh, 1998). Когда величины признаков у гетерозигот наполовину отличаются от вели- чин признаков у гомозигот, речь идет об аддитивности, или об адди- тивном действии генов. Этот термин означает, что каждый из алле- лей определенного типа добавляется к другому и происходит увели- чение величины того или иного признака в фенотипе. Это можно про- иллюстрировать на примере величины относительной приспособлен- ности в строке 2Ь таблицы 3.3. Приспособленность гомозигот АХА{ и А^А2 равна 1 и 1-5, а приспособленность гетерозигот Л,Л2 равна 1-5/2. Из выражения 3.2 следует, что аллельная частота после отбора равна:
I. Основная модель отбора 1"(1 + <7о) (3.7а) Чх = 1-^0 а изменение частоты аллеля Л, равно: 5^(1 - q) = ----7- (3.7b) 2(1 - sq) v ’ Как и в случае вредных рецессивных аллелей, средняя приспособлен- ность - это функция коэффициента отбора и аллельной частоты с мак- симумом при фиксации аллеля А и отсутствии аллеля А2 и с мини- мальным значением при фиксации аллеля А2 (рисунок 3.5 (кривые с длинными черточками). Максимальные изменения аллельной часто- ты наблюдаются при равной частоте двух аллелей, т.е. при р = q- 0,5. Графически это показано на рисунке 3.5. Допустим, что величина s мала, так что А? “|?(1 ~Ч). (3.7с) Принимая производную этого выражения за нуль, получим решение с максимальным изменением аллельной частоты при q = 0,5. Для получения обратного решения уравнения 3.7а, воспользуемся подходом, который мы применили для вычисления изменения часто- ты вредных рецессивных аллелей во времени. Допустим, что эти из- менения соответствуют указанным выше, тогда dt х ^7 = Ыч \Ч -sqo(\-qoy Интегрируя обе части уравнения, получим: 4 ч.^-чУ), (3-8) В таблице 3.5 приведено число поколений, необходимых для изме- нения частоты аллелей до определенных значений при 5=0,1. При q0 = 0,9, например, аллельная частота упадет до 0,1 примерно через 89 поколений. Заметьте, что выражение в скобках в уравнении 3.8 равно второму слагаемому в скобках из уравнения 3.6с. При низкой началь- ной частоте аллелей падение их частоты в ряду поколений происхо- дит быстрее, чем изменение частоты рецессивных леталей, даже при
ТАБЛИЦА 3.5. Количество поколений (/), за которые частота аллелей при промежуточ- ном наследовании (аддитивности) уменьшится от начального значения д0цо </,при J = 0.1 ф Ф t 0.9 0.5 44 0.1 89 0.01 136 0.5 0.25 22 0.1 44 0.01 92 0.1 0.05 15 0.01 48 0.001 194 значениях s на порядок ниже, чем значение в таблице 3.5. Например, падение частоты аллелей от 0,1 до 0,001 происходит за 194 поколе- ния, а такое уменьшение частоты аддитивных или летальных аллелей произойдет лишь через 990 поколений. Динамика изменения частоты аллелей при отборе гамет, или гап- лоидов примерно соответствует модели отбора при аддитивном дей- ствии генов. Если приспособленность гамет (или генотипов) А и А2 при частоте аллелей pwq равна 1 и 1- s, то после отбора (таблица 3.6) частота гамет, несущих аллель А2, равна: п __?о(1-з) TZ1 « 9 1-5^0 а изменение частоты аллеля А2 равно: 1 -sq (3.9а) (3.9b) ТАБЛИЦА 3.6. Частота гаплоидных генотипов (гамет) до и после отбора Генотип Всего •41 Аг Приспособленность 1 1-3 — Частота до отбора Ро Ф 1 Взвешенный вклад Ро ф(1 ~ з) 1 -Зф Частота после отбора Ро ф(1 - з) 1 1 -зф 1 -sq0
I. Основная модель отбора 13jJ) Числитель в этом выражении равен числителю в выражении 3.7b, а знаменатель - вдвое меньше. В данном случае соотношение между средней приспособленностью и изменение аллельной частоты то же, что и при аддитивном действии генов. Поэтому выражение 3.8 можно использовать для подсчета количества поколений, за которые частота определенного аллеля изменится при отборе гамет наполовину. Модель отбора гаплоидов - самая простая среди всех моделей отбо- ра, поэтому она очень подходит для иллюстрации основной теоремы естественного отбора. Во-первых, для различных типов отбора, дей- ствующих в популяции, должны быть свои уровни генетической измен- чивости приспособленности. И наоборот, без генетической изменчиво- сти приспособленности значительные эволюционные изменения невоз- можны. Фишер (Fisher, 1930) показал, что «скорость увеличения при- способленности любого организма во времени равна генетической ва- риансе приспособленности за это время». Эту концепцию он назвал основной, или фундаментальной теоремой естественного отбора. Строго говоря, слово теорема применимо только к простым генетическим мо- делям (Frank, Slatkin, 1992; Burt, 1995), но в эвристическом смысле его можно использовать для оценки величины отбора (глава 11). Возьмем самую простую форму наследования - бесполое размно- жение, при котором потомство идентично родителям. Предположим, что частота и относительная приспособленность z-ro генотипа равна р и w., соответственно. Поэтому средняя приспособленность равна: * W = ^PjWj ф /=1 После отбора частота генотипа z составляет: , рм Pi =-zr-, w где р.' указывает на частоту после отбора (в следующеем поколении). Средняя приспособленность в следующем поколении равна: к 1 w' = 2-jPi'Wi -—PiW^ Допустим, относительное приращение (увеличение) приспособленно- сти в поколении составляет (3.10a)
или его величина равна вариансе приспособленности в родительском поколении, деленной на квадрат величины средней приспособленно- сти. При стандартизации приспособленности так, что w = 1, получим: /=К. (3.106) Другими словами, изменение (приращение) приспособленности рав- но генетической изменчивости приспособленности, как это и утверж- дается Фишером в основной теореме естественного отбора. Этот вы- вод означает, что все различия в приспособленности генетически де- терминированы и в данной генетической модели служат мерой скоро- сти эволюции. d. Отбор против доминант В ряде случаев отбор может действовать и против доминантных фе- нотипов. Доминантная морфа окраски, например, не обеспечивает за- щиты в некоторых средах обитания, а рецессивная дает в определен- ных условиях реальные преимущества. В таких случаях можно вос- пользоваться величинами относительной приспособленности, которые приведены во второй строке (2с) таблицы 3.3. Тогда аллельная часто- та после отбора равна: (3.11а) а изменение частоты аллеля А2 составит: Д^ =—Sq(^ (3.11b) 1 - sq(2 - q) Значения средней приспособленности и изменений аллельной часто- ты при отборе против доминант с s = 0,2 показаны на рисунке 3.5 в виде линий с короткими черточками. Наибольшее измененение частоты аллелей при таком типе отбора наблюдается при значениях q = 1/3, если величина 5 мала. Приблизи- тельное время, за которое происходят определенные изменения час- тоты аллелей вычисляется, как описано выше, по формуле: 1 t = - s (3.11с)
I. Основная модель отбора 133 е. Общее доминирование Теоретически, существуют локусы с любыми возможными уровнями доминирования, при этом признаки гетерозигот занимают промежу- точное положение между величинами признаков гомозигот. Рассмот- рим различные уровни доминирования, пользуясь значениями общей приспособленности, приведенными в строке За таблицы 3.3. Введем величину уровня доминирования h. В случае приспособленности вред- ных рецессивных аллелей h = 0, а в случае аддитивного действия ге- нов h = 0,5. В общем случае аллельная частота после отбора равна: go[l--y(fy?o+9o)] \-2hspaq0-sql ’ а изменение частоты аллеля А2 составит: spq[h - (2h - l)g] 1 - hspq - sq2 (3.12а) (3.12b) При значениях 0 < h < 1 наибольшая приспособленность наблюда- ется, когда фиксирован аллель А . Однако, как следует из рассмотре- ния предыдущих моделей отбора, максимальное изменение частоты аллеля - это функция уровня доминирования. Число поколений, тре- бующееся для изменения частоты аллелей до определенных значений, при небольших величинах 5 вычисляется по формуле: t=\4' J«o Aq’ где значение q взято из выражения 3.12b. Предположим, что отбор велся против генотипов с аллелем А2, по- этому частота этого аллеля уменьшилась. Такое происходит при очи- щающем отборе, когда в популяции сокращается частота вредных аллелей (Lewontin, 1974). Часто вредными оказываются новые мута- ции и очищающий отбор поддерживает частоту таких мутаций на низ- ком уровне. Однако, некоторые мутации или аллели, внесенные в популяцию генным потоком, могут иметь адаптивное значение. В этом случае направленные генетические изменения позволяют популяции непре- рывно адаптироваться к условиям обитания, а новые, более адаптив- ные аллели постоянно заменяют старые. Отбор по имеющим преиму- щества в данной среде обитания аллелям называется прогрессивным отбором (такой отбор называют также дарвиновским отбором). Для рассмотрения динамики изменения частот аллелей при этих формах
е отбора удобно пользоваться значениями относительной приспособлен- ности, приведенными в строке ЗЬ таблицы 3.3, когда гомозиготы по новому аллелю получают преимущество в приспособленности, рав- ное величине 5. Как и в предыдущей модели, величина h указывает на уровень доминирования, но при h = 0 в строке За этой таблицы при- способленность гетерозигот такая же, как у гомозигот А ХА (. При h = О в строке ЗЬ приспособленность гетерозигот одинакова с приспособ- ленностью гомозигот А^АГ Динамика прогрессивного, равно как и очищающего отбора, изме- няется как функция доминирования. При прогрессивном отборе важ- но увеличение частоты аллеля А ( от некоего низкого уровня в момент его интродукции путем мутации или потока генов до высокого конеч- ного уровня.При очищающем отборе происходит падение частоты вредного аллеля А2 с низкого на еще более низкие уровни. Для оценки действия прогрессивного отбора значения приспособ- ленности из строки ЗЬ подставим в выражение 3.3а, тогда изменение аллельной частоты составит: (3.13, 1 + 2hspq + sp где в знаменателе представлена средняя приспособленность. Для ил- люстрации влияния разных уровней доминирования на скорость уве- личения частоты предпочтительного аллеля, проанализируем измене- ние частоты одного из аллелей от первоначально низкого уровня. На рисунке 3.6 показано изменение аллельной частоты при р = 0,01 и 5 = 0,1. Сначала скорость изменений наибольшая, если рассматриваемый ал- лель - доминантный (рисунок 3.6Ь), хотя при аддитивном действии генов скорость изменения аллельной частоты тоже довольно большая. При значении частоты аллеля около 0,85 (примерно 70 поколений) частота аллелей аддитивных генов превосходит частоту доминантных. Если предпочтительным является рецессивный аллель с довольно низкой исходной частотой, то для увеличения его частоты до 0,1 по- требуется более 500 поколений. Изменение величины средней при- способленности для этих трех уровней доминирования сходно с изме- нением аллельной частоты. При полном доминировании средняя при- способленность быстро увеличивается, при аддитивности ее рост не- сколько запаздывает, а в случае рецессивных генов она начинает рас- ти лишь спустя продолжительное время. В случае доминантных ге- нов быстрый рост приспособленности обусловлен тем, что максималь- но возможную приспособленность имеют гетерозиготные генотипы только с одной дозой аллеля Ах. Из этого примера видно, что при вы-
I. Основная модель отбора Рисунок 3.6. Изменение во времени средней приспособленности (а) и аллельной частоты (Ь) при селекционном преимуществе рецессивного, аддитивного и доминантного алле- лей, р = 0,01; 5=0,1. сокой степени доминирования предпочтительного аллеля прогрессив- ный отбор увеличивает аллельную частоту гораздо быстрее. Если пред- почтительный аллель рецессивен, то такое увеличение идет намного медленнее (для наглядности см. пример 3.3 об увеличении и сниже- нии степени меланизма у березовой пяденицы.) Пример 3.3. Пример генетического полиморфизма, подверженного на- правленному отбору, - индустриальный меланизм у березовой пядени- цы, Biston betularia. Индустриальный меланизм относится, в основном, к черным и темноокрашенным формам в норме светлоокрашенных ба- бочек и других насекомых, которые распространены в зоне промыш- ленных загрязнений. Впервые это явление было обнаружено в Англии в середине девятнадцатого века. Первоначально частота меланизма была низкой, но быстро увеличилась к середине двадцатого века, когда боль- шинство популяций пяденицы почти на 100% состояли из темных осо- бей. В некоторых районах увеличение частоты меланизма более чем на
136 Глава 3. Понятие об отборе 90% произошло всего за несколько десятилетий (см. Berry, 1990). По- скольку меланизм представляет собой поразительный пример морфо- логического полиморфизма и быстрых эволюционных изменений, то он досконально изучен (Kettlewell, 1973; Majerus, 1998). Индустриальный меланизм контролируется одним геном. Аллель темной окраски, melanic, доминирует над аллелем бледной окраски, или typical. Распространение и поддержание этого полиморфизма обус- ловлено, в основном, преимуществом темноокрашенных форм в ус- ловиях, когда кора деревьев темнеет от сажи, а светлые лишайники на коре разрушаются. В незагрязненных промышленными выбросами районах меланизм невыгоден (см. рисунок 2.7 и пример 4.6) Факто- ром отбора в данном случае считалась различная поедаемость бабо- чек птицами. Однако недавние исследования показали, что такое объяс- нение слишком упрощенное. На самом деле, помимо селективного действия птиц на частоту темной окраски влияет поток генов, локаль- ный отбор и другие факторы. С принятием в Англии в 1960-х годах законов о чистоте воздуха, уровень содержания окислов и частиц распыленной серы в воздухе снизился. Примерно за это же время произошло снижение частоты темной окраски. Например, в районе Колди Коммон частота темноок- рашенных бабочек уменьшилась с более, чем 90% в 1960 г. до менее, чем 20% в 1995г. (рисунок 3.7), (Grant et al., 1996). Когда в девятнад- цатом - начале двадцатого века частота темноокрашенных бабочек рос- ла, доминантный аллель melanic получил селективное преимущество, но с улучшением качества воздуха такие преимущества приобрел ал- лель typical. В результате, частота фенотипа melanic стала медленно, а затем все быстрее падать, в то время как частота фенотипа typical растет. На рисунке 3.7 показано ожидаемое падение частоты феноти- па melanic при условии, что приспособленность генотипов ММ (melanic), Mm (melanic) и mm (typical) равна, соответственно, 0,847, 0,847 и 1 (Grant et al., 1996). Очевидно, что такие селективные разли- чия очень близки к наблюдаемым в районе Колди Коммон. B.betularia была обнаружена также и в Северной Америке. В неко- торых районах частота темноокрашенных пядениц довольно высока. В местечке Джордж Резерв в штате Мичиган, например, частота фе- нотипа в 1960г. была около 90%. Принятый в 1960-е годы закон о чис- тоте воздуха дал свои результаты. С улучшением качества воздуха ча- стота фенотипа в местечке Джордж Резерв упала почти до 20%, т.е. наблюдается поразительное совпадение динамики популяций на раз- ных континентах. Вероятно, такое параллельное падение частоты тем- ных фенотипов вызвано сходной переменой давления отбора в попу-
Рисунок 3.7. Наблюдаемое в течение 26 лет уменьшение частоты темноокрашенных бабочек в популяции Колди Коммон (черные кружки). Светлыми кружками обозначено ожидаемое падение частоты при отборе против темных фенотипов (х = 0,153) (по Grant et al., 1996). ляциях пядениц на разных континентах. Единственное различие меж- ду двумя популяциями состоит в том, что в английской популяции пяденицы дают одно поколение в год, а в мичиганской - два. Другими словами, для уменьшения частоты темных фенотипов на ту же вели- чину, что в английской популяции, в мичиганской требуется вдвое меньше поколений. Поэтому давление отбора в штате Мичиган долж- но быть наполовину слабее, чем в Англии. f Преимущество гетерозигот Во всех рассмотренных нами моделях отбора происходит случайная фиксация того или иного аллеля. В результате, в популяции уменьша- ется генетическая изменчивость. С другой стороны, когда приспособ- ленность гетерозигот выше, чем приспособленность гомозигот, то в популяции могут поддерживаться оба аллеля. Примером преимуще- ства гетерозигот могут служить серповидноклеточная анемия (см. пример 3.7), устойчивость к пестициду варфарину у норвежской кры- сы (стр 92; Greaves et al., 1977), трансфериновые генотипы у голубей (стр. 175; Frelinger, 1972), хотя соотношения аллелей с высокой при- способленностью не совпадают (см. главу 9). В следующей главе мы рассмотрим некоторые другие типы отбора, которые также приводят к поддержанию генетического полиморфизма в популяции. При рассмотрении модели преимущества гетерозигот воспользу- емся строкой 4 таблицы 3.3, где максимальная относительная приспо-
(3.14а) 138 Глава 3. Понятие об отборе собленность гетерозигот А}А2 равна 1, а приспособленность гомози- гот равна 1-5] и 1- s2 (5] иs2- селективные невыгоды гомозигот с гено- типом АХАХ и А^, соответственно). Подставляя эти величины при- способленности в уравнение 3.2, получим частоту аллеля А2 после отбора: _ яр — s2^p 41 . 2 2 1 sxp0 s2q0 а изменение частоты аллеля А2 равно: . pq(s,p- s2q) А? = ---24/. (3.14Ь) 1—51/2 - s2q Для поддержания в популяции двух аллелей величина Ад должна быть равна нулю при значениях q между 0 и 1. При отсутствии изме- нений аллельной частоты речь идет о равновесной частоте аллеля Аг Тогда в предыдущем уравнении величина &q равна нулю, поскольку либо р = 0, либо q = 0. Очевидно, что в этих случаях изменений дру- гой аллельной частоты не происходит, т.к. присутствует только один аллель. Когда 5]/? - s2q = 0, величина Aq в уравнении 3.14b равна нулю. Очевидно, что данное ра- венство соблюдается при условии, когда С Яе=^~, (3-15) 5] + 52 где qe означает равновесную частоту аллеля А2. Другими словами, при этой частоте в популяции поддерживаются два аллеля, а их частота неизменно находится в равновесии. Заметьте, что это равновесие - функция коэффициента отбора по двум гомозиготным генотипам. Свойства такого равновесия можно рассмотреть, выразив отклоне- ние частоты аллеля от равновесного в виде: = (•*, + ^{q ~ q) = q(sx + 52) - 5,, (Li, 1955). Выражение в скобках, стоящее в числителе уравнения 3.14b, равно S]-q(s+s2). Поэтому уравнение 3.14b принимает вид:
I. Основная модель отбора 139 +s2)(q~qe) w Очевидно, что при q>qe величина Aq отрицательная, а при q<qe - она положительная. В силу этих свойств данное равновесие называ- ется устойчивым. При отклонениях от устойчивого, или стабильного равновесия аллельная частота вернется к равновесной частоте алле- лей (см. пример 3.4 об экспериментах на дрозофиле). Как средняя приспособленность, так и изменение аллельной час- тоты - это функции коэффициента отбора и аллельной частоты. На рисунке 3.8 показаны два примера, когда отбор приводит к устойчи- вому равновесию при частоте аллеля А2, равной 0,5 (сплошные ли- нии) или 0,2 (пунктирные линии). При qe =0,5 и 0,0<#<0,5 величина изменения аллельной частоты {Aq) положительна с максимумом Aq немного выше 0,02 и с частотой аллеля около 0,2. При 0,5<<?<1,0 вели- чина изменения аллельной частоты отрицательна с максимумом, рав- ным -0,02 и с частотой аллеля ниже 0,8. С другой стороны, кривая значений при А<?=0,2 полностью асимметрична, ее значения ниже точки равновесия довольно малы, а выше - довольно велики. Обратите вни- мание на наклон обеих кривых в точке равновесия в сторону отрица- тельных значений, что говорит о стабильном равновесии. Величина наклона кривых показывает скорость возвращения аллельной часто- ты к равновесным значениям после небольших изменений в частоте. При равновесной частоте средняя приспособленность достигает максимума, это видно из рисунка 3.8. Возьмем производную от значе- ния w в знаменателе выражения 3.14b равной нулю и решим это урав- нение для q-. dw ----- 2s. - 2s.q - Is.q = 0, dq 1 1 2 так что 5, + S2 ’ Другими словами, аллельная частота изменяется таким образом, что приспособленность возрастает до тех пор, пока не достигнет мак- симальной величины при устойчивом равновесии. Тогда изменения аллельной частоты прекращаются, а приспособленность остается мак- симальной.
Глава 3. Понятие об отборе Рисунок 3.8. Средняя приспособленность (а) и изменение аллельной частоты (6) при се- лективном преимуществе гетерозигот. Вертикальные пунктирные линии показывают ус- тойчивые равновесные частоты для двух различных значений приспособленности. Подставляя величины равновесных частот аллелей [/7е=52/(51+52)] в выражение для средней приспособленности находим равновесную среднюю приспособленность: = 1 _ УгС?! +^2) = j Уг (5] + S2 ) + s2 (3.16) Иначе говоря, средняя приспособленность в данном случае меньше средней приспособленности генотипа с максимальной приспособлен- ностью на величину я s2/(S]+.s2) (относительная приспособленность гетерозигот равна единице).
I. Основная модель отбора Пример 3.4. Праут (Prout, 1971) исследовал преимущество гетерозигот в эксперименте с использованием мутантов D. melanogaster по четвер- той хромосоме. Эта хромосома занимает менее одной единицы карты и не вступает в рекомбинации. Используя рецессивные мутации глаз и щетинок eyeless (еу) и shaven (лт), Праут получил популяции мух, по- казанные в таблице 3.7. Оценки двух факторов, определяющих приспо- собленность, относительную плодовитость самцов и среднюю выжи- ваемость указывают на явное преимущество гетерозигот (см. таблицу 3.7). С учетом всех компонентов приспособленности ожидаемая рав- новесная частота аллелей у гетерозигот еу+ составляет 0,604 (пунк-тир- ная линия на рисунке 3.9). После колебаний вокруг этой частоты в по- колениях мух с 0 по 12 частота гетерозигот быстро приближается к ожидаемой равновесной частоте (сплошные линии на рисунке 3.9). ТАБЛИЦА 3.7. Генотипы и фенотипы мух, а также относительные величины двух ком- понентов приспособленности в эксперименте, показывающем преимущество гетерози- гот (Prout, 1971) Генотип +sv/+sv ey+/+sv еу+/еу+ Фенотип укороченные щетинки ДИКИЙ тип безглазые Плодови- тость самцов 0,047 1,0 0,247 Средняя выживаемость 0,856 1,0 0,852 Рисунок 3.9. Частота мутантного аллеля после колебаний в поколениях мух с 0 по 12 при преимуществе гетерозигот. Пунктирная линия показывает ожидаемую равновесную час- тоту, равную 0,604 (Prout, 1971).
Начиная с 1940-х годов появилась озабоченность, что ядерные взры- вы приведут к быстрому росту частоты вредных мутаций. В частно- сти, Мёллер обратил пристальное внимание на потенциальный груз таких мутаций в человеческой популяции (Muller, 1950) . Для оценки мутагенного действия радиации он ввел понятие генетического гру- за, который состоит в уменьшении приспособленности особей в по- пуляции. Считалось, что вредные рецессивные мутации, поддержива- емые балансирующим отбором (глава 8) и сегрегация гомозигот при преимуществе гетерозигот, служат основными факторами, которые обусловливают генетический груз (Wallace, 1970; Crow, 1986). В модели с преимуществом гетерозигот максимальная приспособ- ленность гетерозигот равна единице, поэтому величина генетическо- го груза составляет: L =l-w. Заменив величину средней приспособленности уравнением из выра- жения 3.16, получим: = _S|«2_ 5] + S2 ’ т.е. генетический груз является только функцией коэффициентов от- бора. В таком случае его величина максимальна при наибольших зна- чениях И S,. (3-17) g. Невыгодность гетерозигот В ряде случаев приспособленность гетерозигот может быть ниже при- способленности гомозигот. Такая картина наблюдается у межвидовых и внутривидовых гибридов, хотя здесь и неприменима однолокусная модель. Низкая приспособленность гетерозигот наблюдается и при наличии транслокаций на одной из хромосом и нормальной парной хромосомы. Такие гетерозиготы по хромосомным транслокациям ча- сто образуют несбалансированные гаметы с пониженной жизнеспо- собностью, что снижает приспособленность гетерозигот по сравне- нию с гомозиготами. Модель невыгодности гетерозигот может быть полезна для контроля численности популяций вредителей (Foster et al., 1972; Whitten, 1979). Для проверки модели невыгодности гетерозигот, воспользуемся пятой строкой таблицы 3.3, где приспособленность гетерозигот равна 1,0, а гомозигот Л1Л] и А,А2 - H-s^ и 1+$2, соответственно (в некоторых случаях эти величины стандартизуют так, что приспособленность
I. Основная модель отбора большинства гомозигот равна 1,0). Тогда аллельная частота после от- бора равна: „ _ ?о+^2?О Cj । 2 2 , l+s,^ + -Мо а изменение частоты аллеля А2 равно: pq(s2q-s}p) \ + sxp2 + s2q2 ’ (3.18а) (3.18b) Последнее уравнение может быть равновесным при (3.18с) Че = —. S, + s2 Однако, в этом случае величина Aq положительна при значениях боль- ше равновесной частоты и отрицательна при значениях меньше рав- новесной частоты. Такое равновесие называется нестабильным (не- устойчивым). При небольших отклонениях от равновесия аллельная частота продолжает изменяться (см. пример 3.5 с хромосомной из- менчивостью у Drosophila). Используя подход, который мы применя- ли в случае преимущества гетерозигот, преобразуем выражение 3.18Ь в виде: w Но в данном случае при q>qe величина \q положительна, а при q<qe она отрицательна, что указывает на отклонение аллельной частоты от равновесных значений. Средняя приспособленность и изменение аллельной частоты - это функции аллельной частоты и коэффициентов отбора. На рисунке 3.10 показаны два примера нестабильного равновесия при ^=0,5 (сплошные линии) и при s = 0,2 (пунктирные линии). Когда частота аллеля Л2 мень- ше 0,5, величина &q отрицательна, а при частоте аллеля больше 0,5 эта величина - положительна. Поэтому при <?0<0,5 в популяции случайным образом фиксируется аллель а при <7о>О,5 - аллель Аг Средняя при- способленность минимальна при нестабильном равновесии, поэтому при изменении аллельных частот увеличивается в зависимости от значения <70 либо частота аллеля либо частота аллеля А2, приспособленность также растет. Но при <?0<0,2 приспособленность не достигает максималь- ного значения 14-52, поскольку исходные значения аллельной частоты на- ходятся по другую сторону от линии нестабильного равновесия.
1.2 Рисунок 3.10. Средняя приспособленность (а) и изменение аллельной частоты (Ь) при отборе против гетерозигот. Вертикальные пунктирные линии указывают на нестабиль- ные равновесные частоты для двух различных значений приспособленности. Пример 3.5. Фостер с соавторами (Foster et al., 1972) представили результаты эксперимента по изменению аллельной частоты при отбо- ре против гетерозигот. Этот эксперимент создает основу для контроля численности насекомых с помощью компаундов или хромосом с транс- локациями, используя в качестве модельного организма D.melano- gaster. Поскольку гетерозиготы по хромосомным транслокациям часто образуют несбалансированные гаметы и поэтому обладают по- ниженной плодовитостью, их приспособленность намного ниже, чем у гомозигот по таким транслокациям. На рисунке 3.11а показан при- мер нестабильного равновесия с аллельной частотой 0,5, а на рисунке 3.11b — с частотой около 0,9. Через несколько поколений аллели в потомстве фиксируются в одном из типов хромосом, в зависимости от того, приведет ли изменение частоты аллелей к значениям выше или ниже линии нестабильного равновесия.
II. Развитие некоторых генетических положений I Поколение Рисунок 3.11. Изменение во времени частоты гетерозигот по хромосомной транслокации у D. melanogaster при нестабильном равновесии с аллельной частотой 0,5 (а) или 0,9 (Ь), (по Foster et al., 1972). II. Развитие некоторых генетических положений Некоторые положения, касающиеся генетических систем, очень су- щественны для развития основной модели отбора. Мы рассмотрим два таких принципа. Обсудим модели отбора по Х-сцепленным генам или генам гапло-диплоидных организмов, а затем - по множественным ал- лелям. Результаты действия отбора в этих биологически сложных си- стемах могут отличаться от основной модели отбора, которую мы об- суждали ранее. а. Х-сцепленные гены или гены гапло-диплоидных организмов Как говорилось в главе 2, самцы и гапло-диплоиды обычно гаплоид- ны по Х-сцепленным генам или по генам гапло-диплоидного организ- ма (см. обзор Hedrick, Parker, 1997). Поскольку отбор действует про- тив гаплоидов у самцов и против диплоидов у самок, то его результа- ты у двух полов могут существенно различаться. Допустим, что гено- типы А1А2 у самок и А2 у самцов летальны. В таком случае в потомстве не будет самок с генотипом A^t2, поскольку в родительском поколе- нии нет самцов с генотипом Аг Таким образом, взрослыми особями, несущими аллель Л2 могут быть только самки. Поскольку половина
таких аллелей попадает в каждом потомстве к сыновьям, которые по- гибают, то частота самок с генотипом А^А2 каждое поколение сокра- щается наполовину. Эти расчеты не касаются мутаций, которые могут вернуть летальную аллель в популяцию. Рассмотрим общую приспособленность по какому-нибудь гену. Вос- пользуемся величинами приспособленности из первой строки таблицы 3.8. Изменение аллельной частоты вследствие отбора можно вычислить из таблицы 3.9. Частоты генотипов до отбора представлены в таблице 2.6, мы пользовались этими величинами при проверке частот аллелей Х-сцепленных генов и генов гапло-диплоидов в отсутствие отбора. Ал- лельные частоты у самцов и самок после отбора равны: ТАБЛИЦА 3.8. Различная приспособленность самцов и самок по Х-сцепленным генам и генам гапло-диплоидов в результате отбора Самки Самцы Приспособленность ЛА, А1А2 А2А2 А] А2 (1) wn W12 И-22 И-2 (2) 1 1 !-S/ 1 (3) 1 — S| 1 1 — s2 1 + Sm 1 5т (4) 1.5 1.0 0.5 0.5 1.5 ТАБЛИЦА 3.9. Частота женских и мужских генотипов до и после отбора по Х-сцеплен- ным генам или генам гапло-диплоидов Генотипы самок Всего A]Ai A1A2 A2A2 Приспособленность Wn W12 W22 — Частота до отбора PfP™ Pffyn + Pm<lf *?f 9m 1 Взвешенный вклад PfPmWll (Pf4m + Pm9f >12 4f4m^22 Wf Частота после отбора (Pf 9m + Рт9/>12 qf<lmW22 1 "7 "7 Wf Генотипы самцов А] A2 Всего Приспособленность — Частота до отбора Pf 1 Взвешенный вклад pfW} <?>2 Частота после отбора Pf*i 4f^2 1 К
II. Развитие некоторых генетических положений 147 , i(Pf4m+Pm4f')wi2+qfqmw22 ч' =--------------------------- (3.19а) И , <lfW2 4'. = — , (3.19b) к т где w=pfp и'.. + (p.q +р q)w,2 + q.q w.. / Гfг т 11 f 1 т г т1]7 12 if 1т 22 И (символы f и т обозначают самцов и самок) В случае отбора только против самок с рецессивным генотипом А^А2 и гаплоидных самцов с генотипом А2 можно воспользоваться величинами приспособленнос- ти из строки 2 таблицы 3.8. Выражения 3.19а и 3.19b можно предста- вить в виде: , _ ^Pf<im +pm<if) + (J-sf)qfqm и , _ 9/(1-^) q” i-smqf ' (В случае летальных аллелей s=sm=l, поэтому q^-d и q'=\l1q). Из- менение аллельной частоты у двух полов равно: kPf^-qfViPn.+SfPf^ ^~sfqmqf и . smqf{\-qm) + qf-qm &qm =------—:-------------. l-smqf Поскольку эти два пола различаются по наследованию генов и отбору среди диплоидных самок и гаплоидных самцов, то даже при одинако- вой исходной частоте аллелей они быстро становятся неравными. Выражения 3.19а и 3.19b можно легко преобразовать для других зна- чений приспособленности и вычисления изменения частоты аллелей (см. пример с мутантным локусом white у Drosophila).
148 Глава 3. Понятие об отборе Для Х-сцепленных генов и генов гапло-диплоидов также возможен стабильный полиморфизм. Однако, условия такого полиморфизма более жесткие, чем для диплоидов, поскольку гаплоидные самцы не имеют преимущества гетерозигот. При заданных в строке 1 таблицы 3.8 значе- ниях приспособленности условия стабильного полиморфизма таковы: и'|и' < l/2(w +w )w > w2w22 . (3.20) Можно взять величины приспособленности из строки 3 таблицы 3.8. Тогда условия равновесия таковы: (l+sja-s.) <1>(1^)(1-52). Иначе говоря, сбалансированный полиморфизм возможен только тогда, когда самки обладают преимуществом гетерозигот, а отбор против сам- цов не очень строгий, или когда отбор такой же силы действует на два пола в обратном направлении. Для иллюстрации этих ограничений пред- положим, что зт>0. Для достижения стабильного полиморфизма нужно, чтобы выполнялись условия: 5 > S"'— 5 I, , И !+5и _Al_ в то время как для диплоидов достаточно, чтобы величины и s2 были больше нуля. Область стабильного полиморфизма занимает всего 58%, что сравнимо с диплоидами (Pamilo, 1979; Hedrick, Parker, 1977). Пример 3.6. Пример отбора по Х-сцепленному мутантному гену ок- раски глаз white у D.melanogaster представлен Хедриком (Hedrick, 1976). В эксперименте отбор направлен преимущественно против бе- логлазых самцов, у которых понижена способность к скрещиванию, хотя у белоглазых самок, гомозиготных по рецессивному аллелю, фер- тильность также слегка снижена. Как показано на рисунке 3.12а, при одинаковой исходной частоте аллелей у двух полов отбор нерезко эли- минирует мутантных особей. Однако, при разных исходных частотах аллелей значения аллельных частот у самцов и самок колеблются в течение нескольких поколений, а затем мутанты элиминируются слу- чайным образом. Заметьте, что после затухания таких колебаний ал- лельных частот значения частот аллелей у самцов лежат ниже значе- ний частот у самок. Кроме того, теоретические расчеты (пустые круж- ки) с помощью модели, учитывающей различия оценочных приспо- собленностей, очень сходны с экспериментальными данными.
II. Развитие некоторых генетических положений Рисунок 3.12. Изменение частоты Х-сцепленного мутантного аллеля white при (а) равных исходных частотах этого аллеля у двух полов и (Ь) при различных исходных частотах (по Hedrick, 1976) Черные и пустые кружки указывают на теоретические и экспериментальные данные. Изменение средних частот аллеля, а также аллельных частот у самок и самцов пока- зано сплошными линиями, линиями с короткими и длинными пунктирами, соответственно. Замечательный пример отбора по Х-сцепленным генам - отбор по локусу глюкозо-6-фосфатдегидрогеназы (G-6PD ) и устойчивости к малярии у человека (Ruwende et al., 1995). Убедителеный пример от- бора у гапло-диплоидов - отбор по аллелю Pgm-З локуса GP-9 у му- равья Solenopsis invicta (Ross, Keller, 1995; Keller, Ross, 1999). Ни в одном из этих примеров полиморфизм не является результатом простого отбора, поскольку он не может быть стабильным в случае ло- куса G-6PD, а в случае с локусом GP-9 он связан с потоком генов. При соблюдении условий, необходимых для стабильного полимор- физма, равновесная частота аллеля А2 у самцов равна: 5, +5 + 5 (1— S7) п ___ __2___т__т X___2 / Рт(е) ~ 2 /п \ ? S, + .S'2 +5 (2-5, — s2) а равновесная частота этого аллеля у самок равна: S, + х - s,sm j-f _ 2 т 1т U) + S2 + S (S, - S2) ’ При малых значениях s2 и sm (произведения этих величин довольно малы), равновесные частоты аллелей у двух полов сходны и прибли- зительно равны: .V, + .V = Р.М = ^7^ На рисунке 3.13 показан пример изменения аллельной частоты при сбалансированном полиморфизме, обусловленным дифференцирован- (3.21а) (3.21b)
Глава 3. Понятие об отборе Поколение Рисунок 3.13. Изменение во времени аллельной частоты Х-сцепленных генов и генов гапло-диплоидов при стабильном равновесии для самцов в точке 0,25, а для самок - в точке 0,5. ным отбором двух полов. Воспользуемся значениями приспособлен- ности из строки 4 таблицы 3.8, так что 5]= -0,5, s2= 0,5, .sm = -0,5. Из выражений 3.21аи3.21Ь имеем значения равновесных частот аллелей у самцов и самок: 0,25 и 0,5, соответственно, т.е. эти значения у двух полов существенно различаются. На рисунке 3.13 показано два набо- ра исходных аллельных частот: частоты выше равновесных (/>=0,8, pm=0,9,pf=0,15) и частоты ниже равновесных (р =0,2,рт=0,3,р=0,15). Исходные различия между полами по частоте аллелей приводят к тому, что в первых поколениях наблюдаются колебания частот с последую- щим асимптотическим приближением к равновесным значениям выше и ниже линии равновесия. Ь. Множественные аллели Как указывалось в главе 1, некоторые локусы представлены нескольки- ми аллелями. Аллоферментные локусы обычно содержат 3-4 аллеля, а другие, например микросателлиты или локус главного комплекса гис- тосовместимости (МНС) могут содержать много различных аллелей. Позже мы увидим, что условия поддержания множественного аллелиз- ма с помощью отбора, благоприятного для гетерозигот довольно слож- ны и имеют ряд ограничений (см. главу 9 и Lewontin et al., 1978). Основная модель отбора по двум аллелям может применяться и для множественных аллелей, при условии, что соотношения Харди-Вай- нберга до отбора таковы, что изменение частоты z-того аллеля после отбора равно:
II. Развитие некоторых генетических положений 151 ж p.(w.-w) 4?,=^^-=-----(3.22) w где средняя приспособленность особей, несущих аллель А., равна: п 7=1 а средняя приспособленность популяции составляет: п п -=1 7=1 Выражение 3.22 подходит для вычисления изменений аллельной час- тоты во времени. При отборе более, чем двух аллелей изменение их частоты может быть немонотонным. Для наглядности обратимся к таблице 3.10. В системе трех аллелей как аллель А , так и аллель А2 у гомозигот име- ют одинаковое селективное преимущество, но аллель Ах доминирует над аллелем Л3, а аллель А2 рецессивен по отношению к аллелю Ау Джеймс (James, 1965) предложил указанные величины приспособлен- ности для разных аллелей при изучении индустриального меланизма у березовой пяденицы с фенотипами melanic (Л,), insularia (А2) и typical (Л3). Если предположить, что исходно р=0,01,р2=0,2, а р3=0,79, то из- менение аллельных частот соответствует показанному на рисунке 3.14. В первых поколениях частота предпочтительных аллелей растет, но через 25 поколений частота аллеля Л, догоняет частоты других алле- лей, частота аллеля Л2 не увеличивается, а даже слегка падает случай- ным образом. Это обусловлено относительной невыгодностью аллеля Л2 в гетерозиготном состоянии при сочетании его с аллелем Ау Часто- та аллеля At продолжает увеличиваться до тех пор, пока аллель А3 по- чти полностью не исчезает из популяции. Затем частота аллеля At пре- кращает расти, поскольку аллели А и А2 равны по селективному пре- имуществу. Для равновесия по п различным аллелям необходимо условие, чтобы w— w = О I для всех п аллелей. Условия поддержания стабильного полиморфизма по трем аллелям сложнее, чем в случае преимущества гетерозигот по двум аллелям. Некоторые исследователи детально рассматривают эти условия и по- лученные ими результаты соответствуют данным Мэнделя (Mandel, 1970).
ТАБЛИЦА 3.10. Величины относительной приспособленности трех аллелей при направ- ленном отборе и оценки приспособленности генотипов при серповидноклеточной ане- мии (по Allison, 1956) Генотип (приспособленность) (1) Направленный АА AjA2 AjA3 a2a2 a2a3 A3A3 отбор (1+s) (1+s) (1+s) (1 + s) (I) (1) (2) Аллели серпо- АА AS AC ss sc cc видноклеточ- (0.976) (1.138) (1.103) (0.192) (0.407) (0.550) ной анемии Рисунок 3.14. Изменение во времени частоты трех аллелей при предпочтительности ал- лелей А, (частотар,) и А2 (частотар2); аллель At доминантный, а аллель А2- рецессивный по отношению к аллелю А} (см. строку 1 в таблице 3.10). Условия поддержания равновесных частот по трем аллелям - это функции нескольких выражений, например: x=w23 2-w22w3J, Х2= wn2-wnw3i, х= yv12 2 - wnw22, У1=И’12И’13-И’11И'23, У Г W13Wn - V,!’ Уз= W23W13 - V12’
II. Развитие некоторых генетических положений I ^ = Ух+У,~хг ^=У} + УГХУ Сбалансированный полиморфизм поддерживается при этих услови- ях, когда все значения хр х2, ху z, z2 и z3 > 0. Значения равновесных частот по этим трем аллелям равны: ^i(e) Z, + z2 + z3 z? =7+z +z (3.23) ^3<e) z, + z2 + Z3 ’ Итак, для поддержания полиморфизма по трем аллелям необходи- мо, чтобы жизнеспособность гетерозигот была намного выше жизне- способности гомозигот. Для равновесия по трем аллелям существен- ны четыре типа взаимоотношений между фенотипами, каждый из ко- торых в отдельности не обеспечивает стабильный полиморфизм: даже при высокой жизнеспособности могут не соблюдаться условия для рав- новесия частот аллелей. Во-первых, все гетерозиготы могут обладать большей приспособленностью, чем гомозиготы, т.е. wl2, w , w2} > , w22, wi}. Во-вторых, приспособленность одного из гетерозиготных генотипов может быть ниже, чем приспособленность ассоциированно- го с ним гомозиготного генотипа, например: и>)2, и,13> w > н’23> wn, w22. В-третьих, приспособленность одного из гетерозиготных генотипов может быть ниже приспособленности не ассоциированного с ним го- мозиготного генотипа, например: w , и,13 > wn> и,23> w22, wjy В-чет- вертых, приспособленность одного из гетерозиготных генотипов мо- жет быть ниже приспособленности двух не ассоциированных и одно- го ассоциированного с ним гомозиготного генотипа, например: , H’i3> н’зз> ^гз > w2i- В° всех этих случаях,по меньшей мере, два гетерозиготных генотипа обладают большей жизнеспособностью, чем гомозиготы. Кроме того, жизнеспособность ни у одного гетерози- готного генотипа не оказывается ниже, чем жизнеспособность всех гомозигот.Для иллюстрации последнего случая рассмотрим пример 3.7 с аллелями Д-цепей гемоглобина.
Пример 3.7. Ген, кодирующий Д-цепи молекулы гемоглобина, пред- ставлен несколькими полиморфными вариантами (см. Harding et al., 1997, для ссылок см. стр. 142). Наиболее изучен аллель серповидно- клеточности S, в гомозиготном состоянии обусловливающий серпо- видноклеточную анемию в некоторых африканских популяциях. При кислородной недостаточности красные кровяные клетки (эритроци- ты) у людей, несущих эти аллели, часто приобретают серповидную форму. У гетерозигот по нормальному аллелю и аллелю серповидно- клеточности с генотипом AS эритроциты имеют серповидную форму. Такие гетерозиготы, по-видимому, более устойчивы к малярии (см. Cavalli-Sforza, Bodmer, 1971). Продукт аллеля S отличается от про- дукта нормального аллеля только по одной аминокислоте в положе- нии 6, а его последовательность - только по одному нуклеотиду. Дру- гой аллель, С, обнаруженный в Западной Африке у гетерозигот, по- видимому, также обусловливает устойчивость к малярии в сочетании с аллелем А. Величины относительной приспособленности, вычис- ленные для шести возможных генотипов по этим трем аллелям (Allison, 1956), основаны на различной жизнеспособности (см. строку 2 в таб- лице 3.10). Относительная приспособленность гетерозигот с геноти- пами AS и АС самая высокая, а у гомозигот с генотипами АА и СС - выше, чем у гетерозигот с генотипом SC. Используя величины при- способленности, получим равновесные частоты для аллелей A, S и С. Из выражения 3,23 имеем: р = 0,83, р = 0,07,/?3=0,10. Во многих популяциях аллель С отсутствует, тогда сбалансирован- ный полиморфизм поддерживается при частоте аллеля Л, равной 0,854, и частоте аллеля 5, равной 0,146. На рисунке 3.15 показаны изменения частот этих трех аллелей во времени при исходной частоте аллеля С, равной 0,01 (/^=0,844, />2=0,146). Несмотря на возможность интродукции аллеля С, для уве- личения его частоты требуется очень много времени. Действительно, для достижения равновесной частоты 0,010 нужно 5000 поколений. Такое медленое изменение частоты аллеля обусловлено крайне малы- ми различиями между значениями средней приспособленности, кото- рые достаточны для поддержания равновесия частот в двухаллельной и в трехаллельной системах. Эти различия составляют менее 0,01%. Трехаллельная система полиморфизма может возникнуть из дву- халлельной. Условия роста в популяции частоты третьего аллеля до равновесных значений двух других аллелей связаны с условием рав- новесия. Так, частота аллеля А ( будет возрастать в присутствии алле-
1.0 0.8 - 00 £ ------------------------------------ ₽, 9 0.6 - р2 К л = Р3 i 0.4 - 5 0.2 - 0.0 i--— I----------1--------1-------1------- 0 1000 2000 3000 4000 5000 Поколение Рисунок 3.15. Теоретическое изменение во времени частот аллелей гена, кодирующего Д- цепи гемоглобина, при значениях относительной приспособленности генотипов из стро- ки 2 таблицы 3.10. лей А2 и Ау если z>Q. Частота аллеля А2 будет возрастать в присут- ствии аллелей Л, и Л , если z2 >0. Частота аллеля Л3 увеличится в при- сутствии аллелей Л j и Л , если z3 > 0. Другими словами, для поддержа- ния стабильного полиморфизма трех аллелей частота каждого из них должна возрастать от низких значений в присутствии двух других ал- лелей. Задачи 1. Сравните значения изменений аллельных частот при отборе про- тив рецессивных аллелей, которые получены с помощью уравне- ний 3.6а и 3.6с. (С помощью уравнения 3.6а можно вычислить значение qt для определенной величины s, а затем подставить по- лученную qt в выражение 3.6с и вычислить значение 1). Насколь- ко приближенное значение, полученное в выражении 3.6с, близ- ко к ожидаемому? 2. Показано, что изменение аллельных частот при доминировании описывается уравнением 3.12а, которое выполняется при значе- ниях й=0,0, 0,5 и 1,0. Выведите уравнение 3.13 для вычисления изменений аллельных частот при прогрессивном отборе. 3. Относительная приспособленность по гену устойчивости к вар- фарину в популяции крыс оценивается величинами 0,37, 1,0 и 0,68 для генотипов RR, RS и SS, соответственно (см. пример 3.1). Ка- ковы равновесные и случайные частоты в популяции с исходны-
156 Глава 3. Понятие об отборе ми частотами аллеля R, равными 0,0, 0,3, 0,7 и 1,0? Начертите график средней приспособленности и величин Aq для всего диа- пазона аллельных частот. 4. Допустим, что значения приспособленности трех генотипов дву- халлельного локуса представлены в геометрической прогрессии: 1 (генотип AtA ), 1-s (генотип А А2) и (1-s)2 (генотип А2А2). Како- ва частота генотипа А2 после отбора? Запишите соответствующее выражение в самой простой форме и сравните его с уравнением для вычисления аллельной частоты при отборе гаплоидов. 5. Относительная приспособленность вариантов генотипов состав- ляет 1,0, 0,5 и 0,8 для генотипов AtA , А[А2и А2А2, соответствен- но. Какова относительная приспособленность генотипов в попу- ляции, если приспособленность гетерозигот равна 1,0? Каковы значения равновесных и случайных аллельных частот в популя- ции, если исходные частоты аллеля А2 равны 0,0, 0,3, 0,7 и 1,0? Постройте график средней приспособленности и величин Aq для всего диапазона аллельных частот. 6. Допустим, что значения относительной приспособленности у са- мок гапло-диплоидного организма с генотипами А^Ар А^А и А?А2 равны, соответственно, 1,0, 1,0 и 0,8, а у самцов с генотипами А и А2 равны 1,0 и 0,8. Каковы частоты аллелей у этих двух полов через одно, два и три поколения, если в родительском поколении q =7=0,2? 1 т 1 f 7 7. Вычислите ожидаемые равновесные частоты аллелей A, S и С, исходя из значений приспособленности, данных в таблице 3.10. 8. Почему хороших примеров, показывающих преимущество гете- розигот так немного? Предложите, как найти новые примеры. 9. Почему большинство примеров невыгодности гетерозигот каса- ются хромосомных вариантов? Предложите механизм на генном уровне, который привел бы к невыгодности гетерозигот. 10. Какова ожидаемая частота летального аллеля с исходной часто- той, равной 0,5, через пять поколений? Если через пять поколе- ний наблюдаемая частота аллеля составит 0,28, то при каких зна- чениях 5 для полностью рецессивного гена происходит такое па- дение аллельной частоты? 11. Объясните, почему наибольшие ожидаемые изменения частоты рецессивного аллеля в поколении наблюдаются при аллельной ча- стоте 2/3? Почему наибольшие изменения частоты доминантного аллеля в поколении наблюдаются при аллельной частоте 1/3?
Задачи 12. Каковы приложения основной теоремы Фишера к естественному отбору? В каких случаях значения генетической вариансы и при- способленности могут равняться нулю? 13. Допустим, что значения приспособленности для какого-нибудь локуса равны 0,9, 1,0 и 0,6. Вычислите значение средней приспо- собленности при 7=0,4. Сравните это значение со значениями средней приспособленности для любых других аллельных час- тот этого локуса и объясните результат. 14. Предположим, что исходная и конечная аллельные частоты до и после отбора составляют 0,2 и 0,01. Сколько поколений потребу- ется для такого изменения аллельной частоты при отборе против рецессивного летального аллеля с величиной 5=0,2 и при отборе аддитивных аллелей с 5=0,1? 15. Условиям поддержания частоты трех аллелей удовлетворяют че- тыре различных соотношения жизнеспособности соответствую- щих генотипов. Приведите шесть значений жизнеспособности, которые удовлетворяют условиям, описанным в последнем раз- деле данной главы.
ГЛАВА 4 ОТБОР: ДРУГИЕ МОДЕЛИ И ОЦЕНКИ Теоретически оценка приспособленности не представляет трудностей, одна- ко на практике эти трудности поистине непреодолимы. До сегодняшнего вре- мени еще никому не удалось с точностью определить чистую приспособлен- ность особей по любому из локусов в генотипе в любой естественной среде обитания. Ричард Левонтин ( Richard Lewontin,!972) Слово NUH означает грызунов, Которые живут в маленьких клетках, Предназначенных для кроликов. Эти зверьки страшно беспокоятся из-за того, Что на самом деле их гораздо больше, чем клеток. И все сидящие в своих клетушках знают, Что другие зверьки просто жаждут занять их место. Поэтому каждому грызуну в своей клетке Приходится ее сторожить - иначе утащат не имеющие жилья. Доктор Сьюз ( Dr.Seuss). Для каждого естествоиспытателя ясно, что отбор представляет собой основной механизм адаптивной эволюции. Результатом этой эволю- ции являются такие знакомые каждому натуралисту фенотипические признаки, как адаптивные поведение, морфология и физиология. Ге- нетическая основа адаптивных изменений довольно сложна и трудно создать общую схему таких изменений. Понять основные эволюцион- ные принципы можно только систематизируя и оценивая различные типы отбора. В этой главе рассматривается целый ряд конкретных воп- росов, посвященных отбору, что позволит читателю понять разные модели отбора и оценить их значение для эволюционной генетики. В главе 3 мы предположили, что отбор обусловлен различной жиз- неспособностью особей с разными генотипами, и степень отбора под- дается оценке. Однако существуют разнообразные формы отбора осо- бей с определенными генотипами по плодовитости, способности к спа- риванию или образованию гамет, а также по выживаемости. Сначала мы обсудим, как происходит отбор по разным компонентам приспо- собленности. Затем приведем ряд примеров разных форм отбора: мей-
I. Компоненты приспособленности I 59 отический дрейф, системы самонесовместимости, негативно-ассорта- тивное (предпочтительное) скрещивание. Затем мы опишем различ- ные методы оценки величины отбора и рассмотрим, как влияют на эту величину условия обитания. Мы познакомимся с влияющими на отбор физическими факторами среды обитания (температура, влаж- ность) и биологическими параметрами, включая исследуемые виды и межвидовые взаимодействия (например, хозяин-паразит). Очевидно, что отбор - это весьма сложное явление и его моделирование для прог- нозирования генетических изменений в популяциях или для изуче- ния механизмов генетической изменчивости требует особой тщатель- ности. (.Компоненты приспособленности Дифференцированный отбор возможен на любой или на всех стадиях жизненного цикла особи: на уровне гамет, у молодых и у взрослых. Бундгаард и Христиансен (Bundgaard, Christiansen, 1972) разделили общую величину отбора в популяции на четыре основных компонен- ты: отбор особей по жизнеспособности (выживаемости) у зигот, по- ловой отбор, отбор гамет и отбор по плодовитости. Эту общую схему можно применить к насекомым, млекопитающим, растениям и дру- гим организмам, выделяя компоненты, которые наиболее важны для определенного вида. На рисунке 4.1 показаны эти компоненты отбора в пределах поко- ления. В популяционной генетике особое внимание уделяется отбору по жизнеспособности, или выживаемости особей, поскольку он легче всего поддается оценке и моделированию. Но во многих случаях по- ловой отбор, отбор гамет и отбор по плодовитости представляют не меньшую значимость. Мы вкратце обсудим, как дифференцирован- ный отбор влияет на все эти компоненты, а затем рассмотрим некото- рые модели отбора по этим компонентам. Поколение начинается с определенного состава зигот (вверху рисунка 4.1), который затем изменяется в процессе различной выживаемости осо- бей на разных стадиях жизненного цикла, т.е. в процессе отбора на жиз- неспособность. Этот отбор включает и выживаемость неполовозрелых особей. У насекомых с полным превращением, например, происходит отбор по жизнеспособности яиц, личинок, куколок и взрослых особей до спаривания. У растений происходит дифференцированный отбор по про- растанию семян, выживаемости проростков и взрослых растений в пери- од перед плодоношением. На пропорции различных генотипов у взрос- лых особей в популяции влияет также продолжительность этих стадий жизненного цикла или разная скорость развития.
Рисунок 4.1. Компоненты отбора с соответствующими примерами. В популяциях организмов, размножающихся половым путем, дей- ствует половой отбор. При этом пропорции различных генотипов сре- ди половозрелых самцов и самок отличаются от пропорций между особями, вступающими в скрещивания. Например, некоторые комби- нации генотипов более предпочтительны для скрещивания, чем дру- гие комбинации из-за разной способности самцов к спариванию или из-за предпочтения самками. Такой отбор весьма важен для живот- ных, но он встречается также и у растений. Животные или насеко- мые-опылители, например, могут более охотно навещать растения с определенным фенотипом и генотипом. В некоторых случаях происходит отбор гамет: из-за мейотическо- го дрейфа (нарушенной сегрегации) или неслучайного попадания ал- лелей в гаметы, так что гаметы с разными генотипами образуются в неравных количествах. В этих случаях пропорции зигот могут не со- ответствовать аллельным частотам у родителей, вычисленным исходя из случайного распределения аллелей в гаметы по законам Менделя. У некоторых растений особую роль играют факторы, ингибирующие опыление растений с определенным генотипом пыльцой определен- ного типа, и механизмы, ограничивающие самоопыление. Такие сис- темы самонесовместимости обычно зависят либо от генотипа пыль- цевых клеток, либо от генотипа растения, дающего пыльцу. Когда вклад зигот в генетическое разнообразие следующего поколе- ния различен, то создаются предпосылки для отбора на плодовитость: по выживаемости яиц, семян, мужских половых клеток или пыльцы. В общем, такой отбор - это результат различий в продукции женских га- мет, поскольку продукция мужских половых клеток и пыльцы обычно
II. Отбор на жизнеспособность не ограничена. Режим откладки яиц или длительность созревания се- мян также влияют на вклад определенных генотипов в следующее по- коление. Мы не будем рассматривать здесь этот тип отбора отчасти из- за экономии места, отчасти из-за того, что изменения аллельных частот при таком отборе сходны с результатами отбора на жизнеспособность (Penrose, 1949; Bodmer, 1965). Если считать отбор на плодовитость у двух полов примерно одинаковым, то его результаты описываются в модели отбора на жизнеспособность, когда такой отбор одинаков для двух полов. Рассматривая отбор на плодовитость, нужно очень осто- рожно отнестись к менделевскому расщеплению гамет. В модели Фре- лингера и Кроу, например (Frelinger, Crow, 1973) результаты такого от- бора соответствуют результатам отбора на жизнеспособность лишь применительно к одному полу. Дело в том, (см. пример 4.14 с транс- ферриновым локусом у голубей), что гетерозиготные по этому локусу самки в присутствии патогена обладают более высокой плодовитостью. Отрицательная корреляция между различными компонентами от- бора (например, один из аллелей данного локуса повышает плодови- тость и понижает жизнеспособность, другие аллели - понижают пло- довитость, но повышают выживаемость) называется плейотропным антагонизмом, и считается механизмом поддержания генетической изменчивости (Rose, 1982). Считается, что это явление играет боль- шую роль в жизненном цикле и в развитии старения. Однако, условия поддержания полиморфизма популяции с помощью плейотропного антагонизма довольно ограничены и не находят прямого эксперимен- тального подтверждения (Curtsinger et al., 1994; Hedrick, 1999a). II. Отбор на жизнеспособность Сначала рассмотрим расширенную модель отбора на жизнеспособ- ность, которая обсуждается в последней главе. Мы остановимся на различной выживаемости особей на разных этапах жизненного цикла и на отборе зигот у двух полов. Мы не будем подробно рассматривать влияние взаимоотношений генотипов родителей на выживаемость по- томства, хотя этот тип отбора приводит к нестабильному равновесию по резус-фактору крови в человеческой популяции (Cavalli-Sforza, Bodmer, 1971) и может привести к устойчивому полиморфизму по ло- кусу HLA (Hedrick, Thomson, 1988; Black, Hedrick, 1997). а. Различия в жизнеспособности на разных стадиях жизненного цикла Если жизнеспособность (выживаемость) различных зигот на разных стадиях жизненного цикла до скрещивания различна, то ее величина
162 Глава 4. Отбор: другие модели и оценки сводится к одному значению. Поясним это на простейшем примере. Допустим, что имеется группа зигот с определенным генотипом, из- вестна пропорция этих особей, выживших на стадии личинки (или проростков) и пропорция особей, достигших половозрелого возраста. Общее количество выживших особей представляет собой произведе- ние количеств особей, выживших на разных стадиях жизненного цик- ла, т.е. одну величину. В таблице 4.1 на примере растений показано такое умножение ве- личин выживаемости на трех стадиях жизненного цикла. В данном случае w.. , w , w обозначают пропорции растений с генотипом if, J y-g' у-s’ ур г г** г J' которые проросли, развились и дожили до половозрелого возраста, соответственно. ТАБЛИЦА 4.1. Различная жизнеспособность растений на разных стадиях жизненного цикла, выраженная для каждого из генотипов одной величиной Генотипы Стадия жизненного цикла М ЛА AA Доля проросших семян W22g Выжившие проростки W,, 1 п w 12.9 W, 22s Дожившие до половой зрелости W,, lip W,. I2p W22p Общая выживаемость W22SW22SW22P Относительная выживаемость WH W<2 W22 Общая выживаемость особей с данным генотипом равна произве- дению трех величин выживаемости особей на каждом этапе жизнен- ного цикла. Как следует из последней главы, условием устойчивого полиморфизма в популяции при отборе особей на жизнеспособность является преимущество гетерозигот по двум аллелям. Стандартизи- руем полученные произведения таким образом, что максимальная ве- личина равна 1. Таким образом, для поддержания устойчивого поли- морфизма при стандартизированных значениях или значениях, све- денных к одной величине, важно условие: wH<w12>w22. Очевидно, что из-за больших различий в выживаемости особей на разных стадиях жизненного цикла, трудно судить о преимуществе гетерозигот зара- нее. При дифференцированном отборе на жизнеспособность на раз- ных стадиях жизненного цикла, пропорции генотипов и аллельных частот могут варьировать в зависимости от стадии, отражая совокуп- ные результаты кумулятивного отбора. Однако применять получен-
ные пропорции особей с определенными генотипами к оценке степе- ни отбора нужно с осторожностью (Prout, 1969). Ь. Межполовые различия в жизнеспособности У многих организмов особи различного пола по-разному реагируют на факторы окружающей среды. Считается, что у различных по морфоло- гии пола организмов, например у птиц и млекопитающих, различия в давлении отбора приводят к морфологическим, поведенческим и фено- типическим отличиям. Хотя половой диморфизм часто связывают с по- ловым отбором (стр. 166), есть виды, у которых жизнеспособность осо- бей разного пола различна (Selander, 1996; ссылки в работе Hedrick, 1993). Для наглядности предположим, что два пола имеют селективные различия по одному локусу, указанному в таблице 4.2а, где w^, w^2 и wfi2 - величины относительной приспособленности самок с генотипа- ми А{А{, А\А2 и соответственно, a wmll, wmI2 и wm22- величины отно- сительной приспособленности самцов с такими же генотипами. Допус- тим, что qfn qm- частоты аллеля А2 у самок и самцов, тогда величины средней приспособленности у особей двух полов равны: = VmPf+ Wfl2(Pm4f + Pf4m) + Ч, = WmllPmPf+ ^(P^f + Pf^J + Изменение частоты аллеля A2 у особей двух полов равно (см. табл. 4.2а): Л _ lWfX2(Pmgf+Pfgm) + Wf224m<Jf f Wf , • ) л ^mn{pmqf+ pfqm') + wm22qm4f-wmqm = ---------------------------------. (4.1b) У разных полов отбор может проявляться по-разному. Например, направленный отбор может быть одной и той же направленности, но разной интенсивности. Весьма интересны случаи, когда отбор у двух полов действует в разных направлениях, приводя к устойчивому по- лиморфизму в популяции. В таких случаях для некоторых аллельных частот значения уравнений 4.1а и 4.1b равны нулю. Рассмотрим случай, когда отбор у двух полов происходит в разных направлениях, а гетерозиготы составляют промежуточный класс между гомозиготами. Соответствующие величины приспособленности при- ведены в таблице 4.2b, где s и sm — коэффициенты отбора самок с генотипом А}А{ и самцов с генотипом А2А2, соответственно. В данном и*
ТАБЛИЦА 4.2. Относительная приспособленность и изменение частот генотипов при дифференцированном половом отборе (а) и относительная приспособленность при действии полового отбора в одном и том же и в противоположном направлениях (Ь) Генотипы A,A2 A2A2 (а) Относительная приспособленность Самки */11 */12 */22 Самцы *mll *m!2 *m22 Частота до отбора PmPf /М/ + Pf(fm 4m*?/ Частота после отбора Самки WfllPmPf WfYlkPmUf + Pf<jm) Wf22<[m<lf Wf Wf Wf Самцы *ml i pmPf 4“ Pffyn) *m wm Wm (Ь) Относительная приспособленность Самки 1 ~Sf i-h 1 Самцы 1 1 - 1 $m случае равновесные частоты для самок и самцов с такими генотипами составляют: J___Г smsf-sm-sf + 2 у2 2smsf (4.2b) (Kidwell et al., 1977). Это уравнение верно только при условии, когда Sm Sm f 1+^ (4.2c) На рисунке 4.2 область равновесия показана графически в виде окра- шенной зоны. Очевидно, что к устойчивому равновесию в популяции приводит лишь очень большое давление отбора. Когда величина отбо- ра невелика, условия поддержания полиморфизма ограничены. Напри- мер, для достижения устойчивого полиморфизма при sm= 0,1 величи- на s должна находиться между 0,091 и 0,111. Заметьте, что получен- ная область равновесия сходна с областью равновесия в модели диф- ференцированного отбора в двух экологических нишах, которую мы рассмотрим позднее. Но в случае дифференцированного полового от-
Рисунок 4.2. Область стабильного равновесия (темная) при отборе по жизнеспособности особей двух полов в одном и в разных направлениях; .^и sm обозначают коэффициенты отбора против самок с генотипом A fAt и против самцов с генотипом А^А2, соответственно. бора частоты аллелей у двух полов могут существенно различаться, а в модели отбора по нишам они остаются одинаковыми. Интересно, что средовой отбор в зависимости от пола в отсутствие дифференци- рованного полового отбора может улучшить условия для поддержа- ния полиморфизма в популяции (Hedrick, 1993). III. Половой отбор Половой отбор действует различными способами, некоторые из них приводят к отбору того или иного предпочтительного аллеля, а дру- гие - к отбору сразу по двум или нескольким аллелям. Неслучайные позитивно-ассортативные скрещивания, при которых некоторые осо- би со сходными генотипами скрещиваются чаще, чем это теоретичес- ки ожидается, обычно не приводят к изменению аллельных частот, но увеличивают степень гетерозиготности, как, например, при инбридин- ге (глава 5). При предпочтительном скрещивании несходных генотипов (нега- тивно-ассортативное скрещивание) аллельные частоты, как правило,
изменяются, что приводит либо к фиксации какого-то определенного аллеля, либо к устойчивому полиморфизму. Перед обсуждением двух популяционно-генетических моделей не- случайного скрещивания, познакомимся с основными принципами по- лового отбора. Долгое время считалось, что успех спаривания у мно- гих видов сильно зависит от выбора самцов самками и от соревнова- ния между самцами за самок (Darwin, 1871). Самцы у многих видов птиц, млекопитающих, амфибий, рыб и насекомых выделяются по мор- фологическим или поведенческим признакам. По-видимому это свя- зано с соревнованием самцов за право спариваться с самкой или с при- влечением подходящей для спаривания самки. Вариабельность фено- типов у самцов, вероятно, указывает на специфичность их генотипа (Wilkinson et al., 1998). Примером ярких морфологических признаков у самцов могут служить огромные рога у баранов или огромные раз- меры самцов у морских слонов (тюленей). Необычным поведением отличаются самцы диких кур, строящие большие помосты (арены) и постоянно издающие громкие крики самцы лягушек. Считается, что приспособленность самых выдающихся самцов наивысшая, и это до- стигается за счет направленного отбора по специфическим призна- кам. Поскольку большинство морфологических и поведенческих при- знаков определяется многими генами, для изучения действия полово- го отбора необходимо привлечь генетику количественных признаков (см. главу 11). У самок имеется возможность выбора самцов с выдающимися морфологическими и поведенческими признаками среди самцов с менее заметными признаками. Для предпочтительного отбора выдающихся фенотипов самки должны точно оценивать различия самцов по размеру, форме, звуку и другим признакам. Таким образом, отбор самок направлен на другие признаки, дающие возможность такой оценки. При направленном отборе у двух полов (или только у самцов, поскольку самки выбирают заметных особей) теоретически должны закрепляться самцы со все более выдающимися признаками, по которым их выбирают самки (Fisher, 1930; Lande, Arnold, 1985; Kirkpatrick, Barton, 1997). Однако некоторые из этих предположений претерпели изменения (см. например, Holland, Rice, 1998; Qvamstrom, Forsgren, 1998; Widemo, Saether, 1999). Строгий отбор может действовать на обеспечивающие успех спаривания признаки и в других направлениях (Ryan, 1998). Допустим, громкий крик у самцов лягушки дает преимущества при спаривании, но приводит к более частому поеданию их хищниками. Их-за более высокой смертности таких самцов половой отбор ограничивается величиной, при которой выживаемость самцов выше, чем преимущества в спаривании.
а. Негативно-ассортативное скрещивание Несмотря на распространенное мнение о том, что людей «притягива- ет противоположность», в браках между людьми любые признаки все- гда положительно коррелируют. Действительно, у большинства видов наблюдается корреляция фенотипов (и в особенности генотипов) спа- ривающихся индивидов. Исключение составляют растения, у которых успешное опыление возможно только с участием сильно различаю- щихся особей. Это справедливо и для популяций, где преимущество в спариваниях получают редко встречающиеся по фенотипу самцы или самки. Такое негативно-ассортативное скрещивание у млекопитающих может быть основано на различиях в главном комплексе гистосовмес- тимости (МНС) (Potts et al., 1991; Ober et al., 1997; Hedrick, Black, 1997). Рассмотрим простую модель негативно-ассортативного скрещива- ния. Допустим, что аллель Л, - доминантный, тогда особи с генотипа- ми А [А1 и А {А2 имеют одинаковый фенотип, частота доминантного фе- нотипа равна Р+Н. При этом картина скрещиваний совпадает с более редкими скрещиваниями между подобными особями (двумя доминант- ными фенотипами или двумя рецессивными фенотипами), а не с тео- ретически ожидаемыми пропорциями при случайном скрещивании (для иллюстрации см. пример 4.1 о различных полиморфных типах цветков у некоторых растений). Вслед за Ли (Li, 1976) предположим, что доля случайных скрещиваний в популяции составляет (1-R), а оставшаяся доля особей R скрещивается предпочтительно: до- минантные фенотипы с рецессивными (см. табл. 4.3). Сначала опре- делим частоты потомства при скрещивании между доминантными фе- нотипами. Частота таких скрещиваний равна (Р+Н)2 (1-R), поскольку все они происходят в популяции случайным образом. Доля особей с аллелем А} среди доминантных фенотипов равна Р+\/2Н=р. Поэтому частота потомства с генотипом Л 1 от скрещиваний между доминан- тными фенотипами составит: p2(\-R). Частота особей, несущих ал- лель А2, среди особей с доминантным фенотипом равна 1/2/7. Поэто- му частоты особей с генотипами А}А2 и А^А2 в потомстве равны, соот- ветственно, рН( 1-2?) и 1/4/7 2(1-7?). Аналогично можно вычислить ча- стоту особей в потомстве от случайных скрещиваний. Пример 4Л. У некоторых видов растений имеется два типа цветков, которые различаются по высоте столбика с рыльцем, что приводит к необходимости перекрестного опыления между этими типами (Barrett, 1990). У первоцвета, Primula vulgaris, обычно встречается два типа
Глава 4. Отбор: другие модели и оценки таких цветков: игольчатый с длинным столбиком и низко прикреплен- ными пыльниками и бахромчатый с коротким столбиком и высоко при- крепленными пыльниками (рисунок 4.3). Положение пыльников, дли- на столбика и другие признаки, по-видимому, контролируются разны- ми аллелями нескольких тесно сцепленных генов (Dowrick, 1956). Эти аллели ассоциированы либо с доминантным бахромчатым фенотипом (5) либо с рецессивным игольчатым (5). Первоцвет опыляется насекомыми, которые обычно переносят пыльцу только с высоко расположенных пыльников у цветков бахром- чатого фенотипа на высокое рыльце цветков игольчатого типа. Более того, при попадании пыльцы с цветков одного типа на рыльце цветков этого же типа образуется крайне мало семян. В английской популя- ции первоцвета было обнаружено 1553 растения с бахромчатым фе- нотипом цветков (SS или &) и 1827 - с игольчатым фенотипом (55), (Ford, 1971). Обычно в природных популяциях преобладают растения с цветками первого типа, но бывают и обратные пропорции. Такие отклонения от равных пропорций, ожидаемых при условии только пе- рекрестного опыления, связаны, вероятно, с некоторой долей само- опыляющихся растений с игольчатым фенотипом при недоступности пыльцы с цветков бахромчатого фенотипа. Рисунок 4.3. Строение цветков первоцвета игольчатого и бахромчатого фенотипов. Пока- зано относительное положение рыльца и пыльников. Посмотрим, каковы пропорции генотипов в потомстве от R числа негативно-ассортативных скрещиваний. Такие скрещивания только между особями с доминантным и рецессивным фенотипами дают по- томство А.А2 или A^Ar Заметьте, что скрещивания А}АХ х А^А2 дают
ТАБЛИЦА 4.3. Частота типов скрещивания и пропорции генотипов в потомстве от негативно-ассортативных скрещиваний Тип скрещи- вания Частота Потомство A]Aj A2A2 А]- х А]~ (P + H)2(l -R) P2(1-R) pH(l-R) i№(l — R) Ai- х AjAj 2(P + H)Q(1 -R) + R pR 2₽Q(1-R)+ph HOO Ю + HR /fQ( R) 2(p + H) А7А? х AiAi tfU-R) — — Q41-R) P2(1-R) R)+ HR 1 ) 2(P + H) только гетерозигот, а половина потомства от скрещиваний АА2 х А2А2 также гетерозиготна. Поэтому количество гетерозигот в потомстве от негативно-ассортативных скрещиваний равно: дГ р н Ъ pr Lp + Я 2(P + //)J Р + Н' Суммарно частота потомства от этих скрещиваний показана в табли- це 4.3. Воспользовавшись этими величинами, найдем частоту аллеля А в следующем поколении: _ pR Р' = р2 (1 - R) + pq(l - R) + 2(Р + Н) = R =p^-R+w^)]- (4-3) Обратите внимание, что при Р+Н = 1/2 для любой величины Rp' = р. Действительно, когда Р+Н = 1/2 стабильное равновесие устанавлива- ется при р' > р, когда Р+Н < 1/2 и при р'<р, когда Р+Н > 1/2. Поэтому равновесная пропорция рецессивного генотипа А^А2 равна 1/2, а рав- новесные пропорции двух других генотипов А1А1 и АГА2 в сумме тоже равны 1/2. Ь. Преимущество скрещиваний с самцами редкого типа В 1960-х годах ряд исследователей получили экспериментальные под- тверждения частотно-зависимого скрещивания, в частности, преиму- щества спариваний с самцами редкого типа (экспериментальные дан- ные по двум хромосомным инверсиям у D.pseudoobscura приведены в примере 4.2). Когда такой тип самцов становится распространен- ным, преимущества в результате полового предпочтения при спари-
вании с этими самцами не наблюдается или такие спаривания стано- вятся невыгодными. Доказательства этого явления были получены в более поздних исследованиях (Salceda, Anderson, 1988). Однако во мно- гих других работах преимущество таких скрещиваний подтвердить не удалось. Партридж (Partridge, 1988) в своем обширном обзоре пред- положил, что эти несоответствия связаны с различиями в постановке экспериментов и в анализе данных (см. также Knoppien, 1985). Пример 4.2. Считается, что успех спаривания для самцов является функцией частот различных мужских генотипов в популяции. Ряд ис- следований, проведенных на D.pseudoobscura показал, что самцы с редкими для популяции генотипами имеют преимущество при спари- вании, которое называют преимуществом самцов редкого типа. Для экспериментальной проверки этого явления самцов с двумя генотипа- ми помещали вместе и наблюдали за результатами спариваний. Про- порции этих генотипов обычно широко варьируют, скажем от 10 до 90%, в то время как общее количество самцов остается постоянным. На рисунке 4.4 показаны данные такого эксперимента с самцами D.pseudoobscura, несущими различные хромосомные инверсии. За- метьте, что доля спарившихся самцов с определенным генотипом зна- чительно ниже пропорции присутствующих самцов с этим генотипом, если таких самцов много, и наоборот, т.е. успех самцов в спаривании уменьшается по мере повышения их частоты в лабораторной популя- ции. Это противоречит ожидаемому равенству отношений числа спа- Присутствующие Рисунок 4.4. График (сплошная линия) значений логарифмов отношения числа всех при- сутствующих самцов (ось абсцисс) и логарифмов отношения числа спарившихся самцов с двумя разными инверсиями (ось ординат), (Ehrman, 1967). Пунктиром показаны равные отношения присутствующих и спарившихся самцов. Устойчивое равновесие соответствует пересечению двух линий (отмечено стрелкой).
III. Половой отбор рившихся самцов вне зависимости от частоты их генотипов. Наклон экспериментальной кривой значительно меньше, чем наклон диаго- нали при спариваниях, не зависящих от частоты генотипов самцов. Устойчивое равновесие между двумя типами самцов возникает при частотах, соответствующих пересечению экспериментальным графи- ком диагонали (при соотношении присутствующих генотипов около 0,667, и при соотношении спарившихся самцов около 0,4, отмечено стрелкой, Ayala, 1972). Рассмотрим модель частотно-зависимого отбора в пользу редких ге- нотипов, предложенную Андерсоном (Anderson, 1969) для описания пре- имущества самцов редкого доминантного типа у Drosophila. Относитель- ный успех спариваний с особями генотипа ij определяется по формуле: У W..= 1 + (4.4а) где Р.. и s — частота генотипа и коэффициент отбора генотипа ij. При полном доминировании W1I = W12= 1+ 1-^ ’ S2 W22 = 1 + q2 , где S] и s2 - коэффициенты отбора в пользу доминантного и рецессив- ного генотипов, соответственно. В данном случае, успех спариваний особей с редким генотипом быстро растет, как это показано на рисунке 4.5 в виде функции частоты генотипа А2А2 при значениях 5, и s2, рав- ных 0,1. Частота генотипа, при которой достигается устойчивое рав- новесие, выраженная через значения 5, и s2, равна: (4.4b) а средняя приспособленность особей с редким генотипом составляет: VV =1 + 5, + S2. Модель частотно-зависимого отбора обладает несколькими инте- ресными свойствами, отличающими ее от модели преимущественно- го отбора гетерозигот. Во-первых, при равновесной частоте аллелей приспособленность особей со всеми генотипами одинакова. Это мож-
Рисунок 4.5. Относительная приспособленность особей с редким генотипом при частот- но-зависимом отборе в пользу этого генотипа как функция частоты генотипа А^АГ но проиллюстрировать на рисунке 4.5, а также подставив в уравнение для величины приспособленности значение равновесной частоты. Во- вторых, значение средней приспособленности при устойчивом равно- весии не максимизировано. В данном случае оно не зависит от ал- лельной частоты. В некоторых других моделях частотно-зависимого отбора значения средней приспособленности при устойчивом равно- весии минимальны. Наконец, преимущество гетерозигот в этой моде- ли не имеет значения, поскольку приспособленности гомозигот A , и гетерозигот одинаковы. IV. Отбор гамет В последней главе мы рассматриваем общую модель отбора гамет с учетом их разной жизнеспособности. Когда гетерозиготы занимают промежуточное положение между гомозиготами, такой отбор связан с отбором зигот. Отбор различающихся по жизнеспособности гамет очень распространен у растений. У животных от диплоидного гено- типа мужского родителя зависит белковый состав мужской половой клетки, в гаплоидных гаметах белки обычно не продуцируются. Мы коснемся двух типов отбора: мейотического дрейфа и систем самоне- совместимости, включая различную жизнеспособность гамет.
а. Мейотический дрейф Известно несколько генетических систем, когда у гетерозигот чаще об- разуются гаметы, несущие один из аллелей. В результате, такие аллели имеют преимущество для попадания к потомству и представлены в га- метах в разных долях, отличающихся от менделевских пропорций. Счи- тается, что такой мейотический дрейф (или нарушенное распределение аллелей) - результат синапсиса хромосом в мейозе (Wu, Hammer, 1991). Это пример интерференции генов (Crow, 1988), когда происходит уве- личение частоты одних генов по отношению к другим. В качестве хоро- шо изученных примеров мейотического дрейфа можно привести насле- дование t -аллелей у домовой мыши (пример 4.3), (Silver, 1993), а так- же аллелей локуса SD (segregation distorter) у D.melanogaster (Merrill et al., 1999) и локуса SR (sex ratio) у D.pseudoobscura и других видов Drosophila. Нарушение нормального расхождения гамет происходит в данных случаях только у самцов (см. Wilkinson et al., 1998), обычно мейотический дрейф встречается у одного из полов. Поскольку мейо- тический дрейф приводит к избыточной частоте одного из аллелей, для поддержания полиморфизма необходим уравновешивающий отбор, бла- гоприятный для аллеля дикого типа. Рассмотрим простую модель под- держания частоты t-аллеля, в которой действует такой отбор. Допустим, что гетерозиготные самцы образуют к гамет с дрейфую- щим аллелем А2 и 1 - к гамет с аллелем дикого типа. В следующем поколении половина аллелей А2 будет получена от самок с нормаль- ным распределением аллелей в гаметы и половина от самцов с нару- шенным распределением: ?Г у <РйЧ0 + ?о2) + | (2Ч?о+ ?о2) = = %\Р0(к+ у) +‘701- Изменение аллельной частоты равно: д? = ?! ~ ?0 = = pqk*, (4.5) где отклонение от нормального распределения аллелей к*=к- 1/2. Это выражение аналогично уравнению 3.7с из главы 3, если значение к* равно значению коэффициента отбора между двумя типами гамет. При &*>0 частота аллеля А2 асимптотически приближается к фиксирован- ной частоте.
Однако, в случае с /-аллелями, аллелями локусов SD и SR, и неко- торыми другими действует уравновешивающий отбор - другой ком- понент приспособленности. Поэтому частота аллеля А2 не достигает фиксированной величины. Например, гомозиготы с генотипом tt обыч- но погибают или самцы с таким генотипом стерильны. Как показано в таблице 4.4, в первом случае остается только 4 типа скрещиваний (Bruck, 1957). До отбора частоты зигот от этих скрещиваний опреде- ляются пропорцией гамет, полученных от гетерозиготных самок: к и \-к и от гетерозиготных самцов: t и +. После отбора частота аллеля t в следующем поколении составит: ,= q Р^+2РпРп + '-Р^2-ку Все /-аллели попадут к гетерозиготным особям, поскольку выживают только те из них, кто имеет генотип ++ и +/. По этой же причине часто- та этого аллеля в предыдущем поколении составит: Pl2=2q' и Ри=1-^’. Подставляя эти величины в уравнение получим: , _ д(2к - 4кд +1) q ' 2(1-2fa?2) При равновесии д' = q это выражение принимает вид: 4kq2 - 4kq + 2к - 1 = О, решение которого выглядит как I [Ц1-*)]Х 2 2к (4.6а) (4.6b) Для иллюстрации этого равенства рассмотрим пример 4.3. ТАБЛИЦА 4.4. Тип скрещиваний и частота генотипов в потомстве до отбора по г-аллелю Тип скрещивания 2x3 Частота Потомство (do отбора) ++ +t tt ++ х ++ p2 ^11 p2 ^11 — — +t X ++ J’llf’u 1-P12 l^llPu — ++ X +f Pl1P|2 (1 - *)PUP12 kPnPu — +t X +t p2 *12 -P2 2r12 -kP2 2**12
Пример 4.3. Многие природные популяции домашней мыши, Mus musculus, полиморфны по аллелям локуса t, расположенного на хро- мосоме 17. Большинство этих аллелей детальны в гомозиготном со- стоянии, но гетерозиготные по f-аллелям самцы продуцируют множе- ство половых клеток. Левонтин и Данн (Lewontin, Dunn, 1960), иссле- довали 19 новых мутантов по f-аллелям из лабораторных линий мы- шей и f-аллели дикого типа у 16 мышей из природных популяций. Они оценили пропорцию к половых клеток у самцов, несущих Лаллели (рисунок 4.6). У гетерозигот по f-аллелям среди мышей из природных популяций среднее значение к = 0,952 и соотношение аллелей дикого типа в потомстве превышало 0,85. С другой стороны, значения к у 8 из 19 лабораторных мутантов существенно не отличались от 0.5, хотя у четырех мутантов они были выше, а у некоторых — ниже 0,5. Подставляя к = 0,95 - среднее значение частоты аллеля t дикого типа - в выражение 4.6b, получим ^е=0,385. Однако, эта ожидаемая частота намного выше наблюдаемой в природных популяциях. Недав- ние исследования 3263 мышей из 63 популяций с помощью молеку- лярных методов, позволяющих обнаружить f-аллели, показали, что их аллельная частота составляет всего 0,062 (Ardlie, Silver, 1998). Мно- гие исследователи пытались определить факторы, ответственные за столь большие расхождения между теоретически ожидаемыми и на- блюдаемыми частотами. Оказалось, что к уменьшению частоты /-ал- Рисунок 4.6. Распределение по частоте (к) мутантных f-аллелей (а) и f-аллелей дикого типа (b), (по Lewontin, Dunn, 1960).
лелей могут привести различные комбинации мейотического дрейфа в популяциях малого размера, вымирание популяций и поток генов между популяциями (Lewontin, 1968; Levin et al., 1969; Nunney, Baker, 1993). Недавно было показано (Durand et al., 1997), что роль генного потока в падении частоты аллелей весьма ограничена. Большое зна- чение для уменьшения частоты t-аллелей может иметь отбор против гетерозигот и непостоянство величины мейотического дрейфа. Ь. Аллели самонесовместимости У ряда растений собственная пыльца не может прорасти на рыльце пестика из-за самонесовместимости и это исключает возможность са- моопыления. Самонесовместимость и гетеростилия (см. пример 4.1) предотвращают инбридинг, хотя эволюция этих механизмов до конца не ясна (Charlesworth, Charlesworth, 1987). Известно два основных типа самонесовместимости: гаметофитная, связанная с генотипом клеток пыльцы и спорофитная, зависящая от генотипа растения-опылителя. При гаметофитной несовместимости (рисунок 4.7) растение опыляет- ся пыльцой, несущей другие аллели. Растение с генотипом SXSV на- пример, не может опыляться пыльцой с генотипом S или S2, а только пыльцой с генотипом S3, 5дили каким-то другим. Это приводит к обя- зательной гетерозиготности по локусу несовместимости. При споро- фитной несовместимости способность пыльцы к прорастанию опре- деляется генотипом растения-опылителя и часть пыльцы может про- растать на рыльце растения с такими же аллелями. К примеру, пыльца с генотипом s, полученная от растения с генотипом Ss, может прорас- ти на рыльце растения с генотипом ss (рисунок 4.7b). (а) Растение-опылитель Рисунок 4.7. Схемы прорастания пыльцевой трубки при гаметофитной (а) и спорофит- ной (Ь) самонесовместимости.
IV. Отбор гамет ТАБЛИЦА 4.5. Частота генотипов у потомства при самонесовместимости по трем аллелям в случае, когда пыльца не прорастает на рыльцах растения с такими же аллелями несовместимости Женское растение Пыльца Частота Потомство $1$2 5.$з $2$3 S1S2 $з Pl2 — jP12 jP12 S1S3 «2 Р13 1Р13 — jP13 S2S3 S1 Р2з |Р23 jP23 — f(l -Р12) jd -P13) К1-Р23) Познакомимся с моделью гаметофитной несовместимости по трем аллелям. В таблице 4.5 приведены соотношения частот генотипов в потомстве разных поколений (поскольку Р12+ Г[3 + P2i = 1, то образу- ются только гетерозиготы): Р\=±(\-Р13), (4.7а) Р'=1(1-Р23). Изменение частоты генотипа SfS2 составляет: ^12 = ^12-Л2=|(1-зл2)- При ДГ = 0 равновесная частота для генотипов SrS’2 равна: Р = - 12(e) 3- Равновесные частоты для генотипов 5’rS’2n S2S3 также равны Частота аллеля 5) составляет: р<=-р +-р = 1(1 -р ) = р' что соответствует доле зигот с генотипом S2S3 в следующем поколении. Аналогичным образом можно вычислить и частоты других аллелей: р2=Р}3 и р3=Р12. Частота каждого из этих аллелей равна частоте гете- розигот в следующем поколении, не имеющих этого аллеля. Более того, равновесные частоты для всех аллелей также равны 1/3. Равновесие до- стигается довольно быстро даже в тех случаях, когда частоты не слиш- ком близки к равновесным, поскольку действует строгий отбор по типу скрещиваний. Как видно из рисунка 4.8, значения аллельных частот
4. Отбор: другие модели и оценки Рисунок 4.8. Изменение частоты трех аллелей самонесовместимости во времени при на- чальных частотах генотипов StS}H S2S}, равных 0,7, 0,28 и 0,02, соответственно. довольно сильно колеблются, пока не достигнут равновесных величин. Если какой-нибудь аллель относится к редким, то он имеет большие преимущества в успешном опылении. Частота этого аллеля будет рас- ти, поскольку пыльца, содержащая редкий аллель довольно редко соче- тается с материнским генотипом, содержащим такой же аллель. По аналогии с предыдущим примером, равновесная частота для каж- дого из п аллелей составит 1/п, при этом частота гетерозигот равна н(«-1)/2, а равновесная частота по всем гетерозиготным генотипам со- ставит 2[«(«-1)]. Теоретический анализ систем самонесовместимости (Wright, 1965а; Yokoyama, Hetherington, 1982) показал, что теория ком- бинированного отбора, конечного размера популяций, структуры попу- ляций и мутаций соответствует наблюдаемому в популяциях количеству аллелей (см. пример 4.4 по классическим исследованиям видов энотеры Oenothera), хотя учитывать все факторы довольно сложно (Vekemans et al., 1998). Недавно были получены результаты секвенирования последо- вательностей ДНК некоторых аллелей самонесовместимости, которые показали, что многие из таких аллелей появились очень давно, до дивер- генции видов (loerger et al., 1990). Эти данные проливают свет на потен- циальный эффект генетического дрейфа и соответствуют теории строго- го балансирующего отбора (Richman et al., 1996; Charlesworth, Awadalla, 1998).
V. Оценка Пример 4.4. Энотера Oenothera organensis - многолетнее редкое расте- ние, эндемичное для гор Орган на юге штата Нью Мехико. Вид насчи- тывает не более 5000 экземпляров, произрастающих в каньонах на вы- соте около 2000 метров (Levin et al., 1979). Аллели самонесовместимо- сти были обнаружены Эмерсоном (Emerson, 1939 ) при наблюдении за ростом пыльцевых трубок после многочисленных (более 3000) скре- щиваний. В выборке из 134 растений он идентифицировал 34 различ- ных аллеля. С тех пор было обнаружено, по меньшей мере, еще 11 ал- лелей. На рисунке 4.9 показано распределение частот таких аллелей. Значения частот указаны на горизонтальной оси. К примеру, в выборке четыре раза встречались пять разных S-аллелей (S9, Sl5, S]6, S35, S37) c частотой 4/134=0,0299. Ожидаемая равновесная частота для 34 аллелей составит 0,0294. В данном случае ряд аллелей имеет частоту выше рав- новесной, а другие аллели - ниже равновесной. Такая неожиданная из- менчивость аллельных частот, по-видимому, обусловлена генетическим дрейфом, а также малой выборкой по отношению к числу аллелей. Частота Рисунок 4.9. Частота 34-х различных аллелей самонесовместимости у энотеры Oenothera organensis (по Emerson, 1939). V. Оценка отбора Относительную приспособленность определяют как способность осо- бей с определенным генотипом к передаче своих аллелей последую- щим поколениям по сравнению с такой способностью у особей с дру- гими генотипами. Несмотря на кажущуюся простоту, оценивать отно- сительную приспособленность разных генотипов довольно сложно (Hedrick, Murray, 1983). Хорошо разработаны методы такой оценки в лабораторных и в исследованных природных популяциях, где можно взвесить различные составляющие отбора. 12*
Добжанский (Dobzhansky, 1955) считал, что «отсутствие надежных методов сопоставления приспособленности особей в популяциях соз- дает серьезные трудности» для популяционной генетики. Среднюю при- способленность особей в популяции принято определять как взвешен- ную среднюю относительных приспособленностей особей с различны- ми генотипами. В этом смысле приспособленность особей популяции представляет собой ограниченную величину для сравнения с приспо- собленностями особей других популяций, поскольку средняя относи- тельной приспособленности оценивается в пределах популяции. Доб- жанский (Dobzhansky, 1970) ввел абсолютную величину адаптивности, подчеркивая ее важность для эволюции. Адаптивность — это способ- ность популяции, организма или генотипа выживать и оставлять по- томство в определенной среде обитания. В этом смысле удобно пользо- ваться оценками популяционной экологии, например скоростью при- роста и емкостью популяции в определенной среде обитания. Часто проще получить две относительных величины: продуктивность — ко- личество биомассы взрослых особей, продуцируемое за единицу вре- мени и размер (численность) популяции — среднюю биомассу или чис- ло живущих в популяции особей. Мы сосредоточим свое внимание на оценке различий генотипов по относительной приспособленности. а. Отбор на жизнеспособность Сначала рассмотрим отбор на жизнеспособность среди особей, дос- тигших половозрелости. Другие компоненты отбора, например пло- довитость, отбор гамет и половой отбор можно оценивать по отдель- ности или, как увидим ниже, для полноты картины отбора можно оце- нить все компоненты сразу. Для оценки величины отбора, действую- щего на особей до половозрелости можно использовать отношение частот генотипов на ранних стадиях жизненного цикла (например на стадии проростков) к частотам генотипов во взрослом состоянии. Допустим, что Р.. и Р'— частоты генотипов до и после отбора, а vH, 1 и v22 - относительная жизнеспособность особей с генотипами А}А^ А.А2 и А2А2, соответственно. Тогда частоты генотипов после от- бора равны: р' _ ^1уп Г][- — 5 V ^12 =Ч2-, (4.8а) Р v р' _ 22v22 Г22 ~ ,
V. Оценка где v = РцУ,] + Р|2 + P22v22- Отношения частот генотипов гомозигот к частотам генотипов гетерозигот равны: Ptt _ РцУи Р' Р ’ Г\2 Г\2 Р' Р V 1 22 _ 1 22V22 Р' Р 1 12 -*12 Эти два уравнения можно решить для оценок относительной жизне- способности гомозигот: v,i = Р’ Р ‘ 11 ^12 Р' Р Г 12 Г11 (4.8b) ^22 = Р' Р г 22 -*12 Р' Р Г 12 Г22 Для иллюстрации рассмотрим пример с популяцией ячменя. Пример 4.5. С 1940 г. в Калифорнии (Дэвис) проводят скрещивания между 30 сортами культурного ячменя. В каждом поколении случай- ным образом отбирают семена, которые затем хранятся и доступны для исследований. В этой популяции ячменя провели электрофорети- ческий анализ некоторых аллоферментов, в основном эстераз (Allard et al., 1972b; Weir et al., 1974). Для оценки величины отбора по этим маркерным локусам в нескольких поколениях растений оценивали от- носительную жизнеспособность (и плодовитость) различных геноти- пов (Clegg et al., 1978а). В таблице 4.6 представлены данные по одно- му из трех тесно сцепленных локусов — локусу эстеразы А, проана- лизированному у растений из поколений 8 и 28. Эти результаты стан- дартизированы против наиболее распространенного в этих поколени- ях гомозиготного генотипа А{А{. Используя выражение 4.8b, можно оценить величины относительной жизнеспособности разных геноти- пов (метод оценки стандартных ошибок приведен у Clegg et al.). В поколении 8 ни одна из величин относительной жизнеспособности существенно не отличалась от жизнеспособности гомозигот A At, за исключением величин у гетерозигот А А2 и AtA3, для которых стан- дартные ошибки очень велики. Хотя выборка в каждом поколении со- ставляла около 1000 растений, колебание численности растений с ред- кими генотипами, например А А , было небольшим. В поколении 28 жизнеспособность растений с двумя наиболее распространенными ге- нотипами А^2 и А3А3 значительно ниже, чем жизнеспособность рас-
ТАБЛИЦА 4.6. Частоты зигот и взрослых растений в популяции ячменя и оценки их жизнеспособности по локусу эстеразы Л,стандартные ошибки даны в скобках (по Clegg et а/. 1978а) Генотип Поколение 8 Поколение 28 Зиготы Взрослые Жизнеспособ- ность Зиготы Взрослые Жизнеспособ- ность A]Ai 0.496 0.470 1.00 0.582 0.650 1.00 А2А2 0.350 0.388 1.17(0.09) 0.354 0.306 0.77(0.06) А3А3 0.143 0.134 0.98(0.12) 0.047 0.030 0.56(0.13) А1А2 0.002 0.007 2.99(2.05) 0.016 0.012 0.64(0.24) 41 A3 0.007 0.002 0.27(0.21) 0.000 0.002 - А2А3 0.002 0.000 — 0.001 0.000 — тений с генотипом A}AV Из-за высокого процента самоопыляющихся растений (у ячменя их более 99%, см. стр. 506), такие различия в вы- живаемости нельзя относить исключительно к межаллельным разли- чиям по аллоферментным локусам. Поэтому Клэгг с соавторами (Clegg et al.) считают, что «оценки отбора по этим локусам будут зависеть от результатов отбора по всему геному». Аналогично можно получить соотношения величин относительной выживаемости в поколениях от скрещиваний с известной пропорцией зигот и взрослых растений. При ожидаемых равных пропорциях зи- гот от скрещиваний между растениями с генотипами AfA и AfA2, на- пример, несмещенная оценка относительной выживаемости генотипа A At составит: Л11_ а12+Г (4.9а) где Nu и А — наблюдаемая численность взрослых растений с гено- типами AtAt и AtA2, соответственно (Haldane, 1956). Оценка коэффи- циента отбора против генотипа AtA равна 5 = 1- v|r Приближенная выборочная варианса этой оценки равна: и(у„).г"0+г'->)г " N где N — общая численность взрослых растений (см. пример по оцен- ке отбора у березовой пяденицы в разных условиях окружающей сре- ды).
V. Оценка Пример 4.6. Для иллюстрации явления адаптации к изменяющимся условиям окружающей среды часто пользуются примером меланиз- ма у березовой пяденицы, Biston betularia. Как говорилось в главе 3, считается, что поедаемость бабочек птицами служит основным фак- тором отбора, благоприятствующего темным формам в загрязненной местности и светлым - в незагрязненной. Эту гипотезу проверили в экспериментах добыча-изъятие как в промышленно загрязненных, так и в незагрязненных районах. Было показано, что в экологически чистой местности выживаемость светлоокрашенных форм пример- но в два раза выше, чем темноокрашенных (Kettlewell, 1973). Кларк и Шеппард (Clarke, Sheppard, 1966) экспонировали птицам мертвых бабочек на темном и бледном фоне (таблица 4.7). Получен- ные ими результаты полностью соответствуют мнению о защитном значении этих двух форм окраски. Величины относительной жизне- способности можно определить, пользуясь выражением 4.9а. Допус- тим, выживаемость светлоокрашенных форм typical на темном фоне составляет только 0,672±0,139, а выживаемость темноокрашенных форм melanic на светлом фоне составляет лишь 0,727±0,197. Как от- мечено на стр. НО, недавние исследования говорят о большом значе- нии и других эволюционных факторов. ТАБЛИЦА 4.7. «Выживаемость» мертвых темно- и светлоокрашенных бабочек, помещенных либо на темный, либо на светлый фон (по Clarke, Sheppard, 1966). Melanic Typical Фон Экспонир. Несъеденные Доля Экспонир. Несъеденные Доля Темный 70 58 0,83 70 39 0,56 Светлый 40 24 0,60 40 32 0,80 Когда зиготы одного типа образуются в два раза чаще, чем другого, допустим зиготы с генотипами А^А2 и А}А{ от скрещивания А}А2 х А А2, то несмещенная оценка относительной жизнеспособности генотипов AfA равна: 2N, ^2 + Г (4.9b) Аналогично, если от скрещиваний А А х A A k ожидается гетерозигот в три раза больше, чем гомозигот, то относительная выживаемость со- ставит:
3Nit v. =----- " A-A;;+l’ (4.9c) и величина отбора против гомозигот равна 5 =1- v (см. пример 4.7 об оценках отбора по генам HLA в семьях южно-американских индей- цев. Пример 4.7. Существуют убедительные доказательства строгого ба- лансирующего отбора по генам главного комплекса гистосовмести- мости человека (HLA) у южно-американских индейцев (Black, Salzano, 1981; Parham, Ohta, 1996). Для демонстрации действия балансирую- щего отбора в поколении лучше всего определить пропорции гомо- и гетерозиготного потомства у родителей с известными генотипами. Это нелегко из-за высокого полиморфизма по большинству локусов HLA во многих человеческих популяциях. Однако у южно-американских индейцев такой полиморфизм заметно ниже и можно определить рас- пространенные родительские аллели. В таблице 4.8 показана численность гетеро- и гомозиготного по- томства от браков между южно-американскими индейцами с одинако- вым гетерозиготным генотипом по этому локусу или с одним общим аллелем HLA-A или HLA-B (Black, Hedrick, 1997). Во всех четырех комбинациях преобладало гетерозиготное потомство, как ожидается по закону Менделя. В трех статистически значимых сравнениях сред- няя оценка отбора против гомозигот довольно высокая и равна 0,5. Доля гетерозигот в потомстве старшего возраста не выше, чем в по- ТАБЛИЦА 4.8. Гетеро- и гомозиготное потомство по двум генам от браков между южно- американскими индейцами: между одинаковыми гетерозиготами А А х А А (а) и между родителями с одним общим аллелем А А х ААк (Z>); 5 — оценка отбора против гомозигот (по Black, Hedrick, 1997) Гетерозиготы Гомозиготы X2 5 Наблюдаемое Ожидаемое Наблюдаемое Ожидаемое (а) HLA-A 56 40,0 29 40,0 12,8*** 0,58 HLA-B 55 41,5 28 41,5 8,8** 0,50 (Ь) HLA-A 169 151,5 33 50,5 8,1** 0,42 HLA-B 140 132,8 37 44,2 1,6 0,21 **Р<0,01, ***/’<0,001.
V. Оценка отбора томстве младшего возраста, что противоречит гипотезе о селектив- ной роли инфекционных заболеваний. Однако, для двух этих локусов не выявлено уменьшения численности гомозигот в потомстве от бра- ков с женщинами, гомозиготными по тому же аллелю, что и их мужья (данные не показаны). Поскольку в реципрокных браках происходит существенный отбор против гомозигот, вероятно, этот отбор основан на взаимодействии материнского организма и плода, что приводит к преимуществу гетерозигот. Сложно оценивать величину отбора, основываясь на изменении ал- лельных частот в разных поколениях, если нет данных о частоте алле- лей во многих поколениях (Prout, 1969). Поскольку не учитывается менделевское расщепление и недостаточно данных для оценки вели- чин относительной приспособленности, оценка степени отбора по из- менению аллельных частот в двух различных поколениях, может при- вести к неправильной зависимости отбора от частоты аллелей. Ь. Совершенный отбор Оценки отбора по жизнеспособности или другие специфические состав- ляющие отбора позволяют сосредоточить внимание на определенных эта- пах жизненного цикла, важных для рассматриваемого локуса. Но при этом можно не обратить внимания на другие его компоненты, влияющие на приспособленность в целом и определяющие различную жизнеспособ- ность особей с разными генотипами. Нет гарантии, что при благоприят- ном отборе на жизнеспособность особей определенного генотипа они получат также и преимущества в приспособленности. Действительно, половой отбор и отбор по плодовитости часто весьма важны, что указы- вает на необходимость тщательной их оценки вместе с оценкой отбора на выживаемость. При исследовании действия отбора важно оценивать все компоненты отбора, как направленного, так и ненаправленного. Для оценки разных типов отбора Христиансен и Фрайденберг (Christiansen, Frydenberg, 1973) разработали метод проверки серий спе- циальных нулевых гипотез. Он позволяет измерять компоненты отбо- ра в моногамной популяции с определенным числом поколений, ког- да выборку генотипов проводят за пределами одного поколения - от зиготы до зиготы. Для иллюстрации рассмотрим следующий пример с рыбой бельдюгой. Пример 4.8. Долгое время в Университете Ааруса (Дания) исследова- ли генетику живородящей рыбы бельдюги Zoarces viviparus. Один из
аспектов этого исследования касается локуса эстеразы .Esdll, в част- ности определения важных для этого локуса факторов отбора. Рас- смотрим некоторые результаты, которые можно использовать для оцен- ки плодовитости, отбора гамет, зигот и полового отбора. В таблице 4.9 показаны величины относительной плодовитости у рыб с тремя генотипами по локусам эстеразы в разные годы. (Christiansen et al., 1973). Приведено количество мальков, вынашива- емых самкой с определенным генотипом. В 1969г. плодовитость го- мозиготных самок А2А2 была несколько выше, а в 1970г. самой высо- кой плодовитостью отличались самки с генотипом А А . Однако, об- щая оценка плодовитости предполагает, что между этими генотипами нет существенной разницы. В таблице 4.10 представлены другие дан- ные по численности потомства с материнским генотипом и в случай- ной выборке. В скобках дано ожидаемое число потомства у каждого из генотипов, исходя из общих аллельных частот (частота аллеля At равна 0,367). Можно оценить величину отбора гамет у самок, вычис- лив долю гетерозиготного потомства у гетерозиготных самок. В от- сутствие отбора гамет можно ожидать, что половина мальков будет гетерозиготной и на самом деле, их доля мало отличается от 0,5. Срав- ТАБЛИЦА 4.9. Относительная плодовитость бельдюги с тремя генотипами по локусу эстеразы (по Christiansen et al., 1973) Генотип Численность Среднее количество Средняя плодовитость на молоди на самку самку рыб с генотипом А А 1969 A]Ai 111 106.2 ± 6.4 0.98 AtAj 357 108.6 ± 3.5 1.00 A2Ai 314 118.2 ±3.8 1.09 1970 AtAt 54 102.0 ±9.1 1.14 AiA2 158 89.1 ± 5.3 1.00 A2A2 165 84.8 ± 5.2 0.95 ТАБЛИЦА 4.10. Наблюдаемое и ожидаемое распределение аллелей локуса эстеразы у молоди с материнским генотипом, самок и взрослых самцов бельдюги в течение двух лет (по Christiansen et al., 1973) Генотип потомства СяЛПШ без мальков Взрослые самцы Материнский Аз А; Самки с мальками генотип А,А1 А1А3 А,А1 60(57.2) 105(98.7) — 165(156.0) 16(13.9) 86(86.1) А|А2 98(98.7) 255(269.2) 162(170.4) 515(538.4) 47(47.8) 284(297.3) А2А2 — 189(170.4) 290(294.2) 479(464.7) 40(41.3) 270(256.6) Всего 158 549 452 1159 103 640
V. Оценка отбора нивая аллельные частоты в мужских гаметах, представленных у маль- ков, с аллельными частотами у взрослых самцов, можно оценить ве- личину полового отбора против самцов. И вновь мы не обнаруживаем статистически значимых различий с ожидаемыми величинами. Срав- нивая частоты генотипов у самцов и самок с соотношениями Харди Вайнберга, можно оценить отбор против зигот. В данном случае дей- ствует отбор против гетерозигот, что было подтверждено дальнейши- ми исследованиями (Christiansen et al., 1977). с. Частоты генотипов Очевидно, что для обнаружения действия отбора нужно определить частоты генотипов и отклонения этих величин от соотношений Хар- ди-Вайнберга. Но, используя для оценки отбора наблюдаемые про- порции генотипов, мы сталкиваемся с рядом трудностей. Во-первых, эти пропорции помимо отбора зависят и от других факторов (Workman, 1969). К примеру, на долю наблюдаемых генотипов может повлиять инбридинг, который маскирует действие отбора (см. главу 5). Во-вторых, даже при действии отбора может не наблюдаться от- клонения от соотношений Харди-Вайнберга (Lewontin, Cockerham, 1959). Это можно продемонстрировать с помощью индекса фиксации, величина которого равна нулю при соблюдении закона Харди-Вайн- берга (см. главу 5). Допустим, известна частота генотипов взрослых особей после отбора на жизнеспособность (соответвующие величины обозначены '), тогда индекс фиксации равен: 2pV ’ Допуская, что величины относительной жизнеспособности особей с генотипами Х1Х1,Х|Х2 и Х2Л2 равны w ,, И'|2ИИ;2;, соответственно, полу- чим Р \= 2pqwX2lw,p'=(p1'wxx + pqw^) lw и w = P2™IX + 2pqwn +q2w22, тогда r = 1----2--------------------2---= (4 юл {p wH + pqwx2)(pqwx2 +q w22) v ’ pq(wnw22-Wn) {pwxx+qwx2){pwx2+qw22) ’ Очевидно, что для F = 0 и для соблюдения пропорций Харди-Вайн- берга необходимо, чтобы wHw22=w|22. Это условие справедливо, когда
отсутствует отбор (все величины приспособленности равны 1). Но оно выполнимо и при при строгом отборе, когда величины относительной приспособленности генотипов располагаются в геометрической про- грессии, например: 1, 1-5, (1-У)2 для генотипов АуАх ААпАД, соот- ветственно Предположим, что величины wn, w|2 и w22 равны 1,0, 0,5 и 0,25, ир = q = 0,5. После отбора доли генотипов составят 4/9 4/9 и 1/9, а пропорции Харди-Вайнберга соблюдаются для <?=1/3 и F=0 даже при строгом направленном отборе. Как говорилось выше, отбор может включать не только различную жизнеспособность зигот. О виде отбора можно судить, наблюдая про- порции генотипов. Например, отбор в предыдущем поколении приво- дит к различию аллельных частот в гаметах, продуцируемых особями двух полов и, возможно, к отклонениям от равновесия Харди-Вайн- берга (см. стр. 77). Во-вторых, строгий отбор, благоприятствующий плодовитости гетерозигот только одного пола, может привести к не- большим или вообще к нулевым отклонениям от соотношений Хар- ди-Вайнберга (Crow, Frelinger, 1973). В таблице 4.11 приведены доли генотипов у потомства в случае, когда гомозиготные самки бесплод- ны. В результате, частоты потомства с генотипами AfAt, AfA2, А^А2 рав- ны Ч2р, '/2 и ’/ q, соответственно. При равновесных частотах р = q = 0,5 и отклонения от соотношений Харди-Вайнберга не наблюдается даже в условиях строгого отбора. Если равновесия частот генотипов в по- пуляции нет, то наблюдается небольшое преимущество гетерозигот, как и ожидается по закону Харди-Вайнберга вследствие межполовых различий в аллельных частотах. ТАБЛИЦА 4.11. Частота генотипов в потомстве в случае, когда плодовиты только гетерозиготные самки с генотипом А^А2. Совершенный отбор действует против плодовитости (или жизнеспособности) гомозиготных самок Тип скрещивания Ч X <3 Потомство A(Ai А1А2 А2А2 А1Л2 х .А1А1 А1Л2 X А1А2 А1А2 X А2А2 Всего '1Р1 \рг - \рч РЧ \рч - X к гр \ и Оставим на время проблемы, связанные с использованием наблюда- емых частот генотипов. При равновесии аллельных частот в популяции отклонения от соотношений Харди-Вайнберга соответствуют оценоч- ным величинам относительной жизнеспособности двух типов гомози-
VI. Экологическая генетика и балансирующий о гот (Lewontin, Cockerham, 1959; см. также Brown, 1970). Однако веро- ятность того, что нулевая гипотеза (отсутствие различий в жизнеспо- собности) будет отклонена при селективных различиях в популяции, обычно мала. Статистическая сила теста 1/3 (см. стр. 34) равна: 1-Д = ^, (4.11) где величина F — задана уравнением 4.10, a N — размер выборки. При значениях w]p w12 и w22, равных 0,8, 1,0 и 0,8 (5=0,2), например, размер выборки, требуемый для обнаружения действия отбора в тече- ние 90% времени равен 851. VI. Экологическая генетика и балансирующий отбор Начиная с 1960-х годов, в популяционной генетике возобладал биоло- гический реализм, отчасти основанный на многозначных экологичес- ких факторах. Появилась надежда на развитие смежной дисциплины - популяционной биологии, применяющей концепции популяционной экологии к популяционной генетике и наоборот. Такой подход пред- полагает, что относительная приспособленность особей в популяции зависит не только от конкретных генотипов, но и от условий окружа- ющей среды. В одних условиях относительная приспособленность дан- ного генотипа может быть высокой, а в других - низкой. На относи- тельную приспособленность могут оказывать влияние такие факторы среды, как температура, влажность, тип почвы, а также биотические факторы: межвидовая конкуренция, хищники или жертвы, хозяева и паразиты. Под составом популяции понимается численность, возрас- тной и генетический состав ее особей. Две современные дисциплины - экологическая генетика и эволюционная экология - содержат эле- менты экологии, популяционной генетики и теории эволюции. Знакомясь с этими экологическими факторами, мы будем иметь в виду, что величина отбора зависит от среды и факторы среды могут изменяться во времени и в пространстве. Это в особенности относит- ся к физическим факторам среды. Затем мы рассмотрим частотно-за- висимый отбор, при котором селективными факторами могут служить другие организмы, например хищники, жертвы, хозяева или парази- ты. Влияние численности популяции на отбор можно изучить, пользу- ясь логистическим уравнением популяционной экологии для зависи- мости отбора от плотности популяции (см. Charlesworth, 1971; Roughgarden, 1971). В качестве примера можно привести зависящее от плотности популяции преимущество гетерозигот у морских брю- хоногих моллюсков (пример 4.9). Влияние на отбор возрастного со-
става популяции и плодовитости можно исследовать, пользуясь мат- рицами с величинами плодовитости и выживаемости особей различ- ных генотипов (см. Anderson, King, 1970; Charlesworth, 1994). Пример 4.9. В природных популяциях некоторых морских брюхоно- гих моллюсков распространен полиморфизм окраски. У моллюска Tisbe reticulata, обитающего в солоноватых водах Венецианской лагу- ны, исследовали зависимость пигментации от плотности популяции. (Battaglia, 1958). В этой популяции встречается три фенотипа с соот- ветствующими генотипами РР, РР" и VmVm. В одном из эксперимен- тов исследовали потомство от скрещивания РР’х РР1, живущее в условиях разной плотности (таблица 4.12). При низкой плотности за- селения в потомстве наблюдается распределение генотипов в отно- шении, близком к 1:2:1 с некоторым преобладанием гетерозигот. При средней и высокой плотности популяции гетерозигот намного боль- ше, чем гомозигот. Используя выражение 4.9b, можно оценить жизне- способность гомозиготных моллюсков по отношению к жизнеспособ- ности гетерозиготных. В условиях высокой плотности популяции от- носительная жизнеспособность гомозигот по двум аллелям составля- ет всего 0,66 и 0,61 от жизнеспособности гетерозигот. Это наглядно демонстрирует зависимость жизнеспособности от плотности популя- ции, когда с ростом плотности гетерозиготы получают все большее преимущество. ТАБЛИЦА 4.12. Численность потомства, оценки жизнеспособности (в скобках) и ожидаемые равновесные частоты аллеля Р морского брюхоного моллюска при разной плотности популяции (по Battaglia, 1958) Условия содержания А РР р'рп рп ут Че Низкая плотность 3839 904 2023 912 0,474 (0,89) (1,0) (0,90) Средняя плотность 1743 343 1015 385 0,571 (0,68) (1,0) (0,76) Высокая плотность 1751 353 1069 329 0,466 (0,66) (1,0) (0,61) В целом ряде работ была показана ассоциация между генетической изменчивостью и факторами среды (см. обзор Hedrick et al., 1976; Hedrick, 1986b). Разумеется, такая связь не означает, что факторы сре- ды определяют генотип, они оказывают влияние на отбор. Однако, не- которые данные противоречат гипотезе о том, что разные условия ок-
VI. Экологическая генетика и ружающей среды по-разному влияют на давление отбора. Один из наи- более исследованных полиморфизмов — полиморфизм окраски и ри- сунка раковины у улитки Сераеа nemoralis (см. пример 4.10). Но даже в этом случае связь генотип-среда не вполне очевидна. Пример 4.10. У сухопутной улитки Сераеа nemoralis окраска и рас- пределение полос на раковине полиморфны (см. рисунок 4.10). Этот полиморфизм, вероятно, поддерживается за счет неоднородности сре- ды обитания улиток (см. обзор Jones et al., 1977). В некоторых иссле- дованиях было показано, что полиморфизм поддерживается благода- ря разной поедаемости улиток птицами, в частности дроздами. Пти- цам чаще попадаются улитки с окраской раковины, не соответствую- щей фону (Cain, Sheppard, 1954; Clarke, 1960). Допустим, улитки с коричневой раковиной без полос хорошо замаскированы на темной почве, в то время как улитки с желтой полосатой раковиной менее заметны на стеблях растений. Однако выборочное поедание улиток не дает исчерпывающего объяс- нения полиморфизма их окраски. В некоторых ареалах частота встре- чаемости морфологических вариантов одинакова, независимо от гете- рогенности условий их обитания. В других ареалах с относительно од- нородной средой обитания обнаруживается клинальная изменчивость окраски раковины. Считается, что это явление, называемое эффектом ареала, обусловлено гетерогенностью внешней среды и климатических факторов, по-разному влияющих на различные формы улиток (Cain, Сштеу, 1963). Некоторые данные указывают, что поддержание полимор- Рисунок 4.10. Характер окраски раковины у улитки Сераеа nemoralis (по Jones et al., 1977).
физма окраски раковины у С. nemoralis обусловлено сложным взаимо- действием средовых и генетических факторов, относительное значение которых варьирует в зависимости от ареала. Эти общие соображения подтверждаются многолетними исследованиями популяций С. nemoralis (Cain et al., 1990; Cook, Pettitt, 1998; Cowie, Jones, 1998). Интересно, что C.nemoralis случайно попала в некоторые районы Северной Америки вместе с овощами, ввозимыми из Европы. Неко- торые из этих колоний улиток были исследованы по окраске ракови- ны и по аллоферментным локусам (Brussard, 1975). Оказалось, что по историческим сведениям колонии близ Лексингтона (штат Вирджи- ния), завезены из Италии, а другие популяции попали в США и Кана- ду из Северной Европы. Хотя в общем и наблюдается соответствие климатической гипотезе, в некоторых популяциях действует эффект основателя. К примеру, раковины всех улиток из Хэррисонберга (штат Вирджиния) были розоватыми в полоску, а улиток из Лондона (штат Онтарио) - желтыми в полоску. Согласно классической модели постоянства приспособленности двухаллельных генотипов (глава 3), устойчивое равновесие существует только при условии, когда приспособленность гомозигот ниже при- способленности гетерозигот. Обычно модели отбора, при котором может поддерживаться полиморфизм, называются моделями балан- сирующего отбора. К ним относятся и модели преимущества гетеро- зигот (глава 3), отбора на жизнеспособность в зависимости от пола и модели самонесовместимости, о которых говорилось выше, а также модель изменчивого отбора, которую мы обсудим далее в этой главе. Ряд биологических и средовых факторов могут обусловить изме- нение приспособленности, так что относительная приспособленность особей с определенным генотипом станет высокой в одних условиях обитания и низкой — в других. Если отнести понятие среды только к факторам, влияющим на относительную приспособленность, то изме- нение приспособленности под действием этих факторов показано в таблице 4.13. Приспособленность особей с генотипом A tA , например, наиболее высока в среде 1, а наиболее низкая — в условиях среды 2 и 4. Если оценивать среднюю приспособленность по каждому генотипу во всех средах обитания, то у гетерозигот она окажется выше, чем у гомозигот, хотя приспособленность гетерозигот в отдельно взятой сре- де обитания может быть и не самой высокой. Это явление можно на- звать предельным преимуществом гетерозигот (или предельным сверхдоминированием), оно позволяет наблюдать, как изменчивость отбора приводит к чистому преимуществу гетерозигот. При этом с из-
VI. Экологическая генетика и балансирующий отбор ТАБЛИЦА 4.13. Изменение приспособленности в результате влияния различных условий среды, приводящее к предельному преимуществу гетерозигот, когда арифметическая средняя приспособленности гетерозигот выше, чем у гомозигот Среда обитания М 1 1+s 1 1 - s 2 1 —S 1 1 3 1 1 1 — s 4 1 - S 1 1 + s Средняя 1 -s/4 < 1 > 1 - s/4 менением условий среды варьирует и степень доминирования. Допу- стим, в среде 2 приспособленность особей с генотипом А}А2 такая же, как у особей с генотипом А^А2, а в среде 3 она равна приспособленно- сти особей с генотипом АА . Такое полное изменение доминирования (величина изменяется от 1 до 0) в природе встречается, по-видимому, редко. Кроме того, арифметическая средняя может и не подойти для оценки преимущества гетерозигот. Как увидим в дальнейшем, в неко- торых случаях для этого лучше пользоваться геометрической или гар- монической средней. Важно, что изменчивость отбора не обязательно приводит к под- держанию полиморфизма (Prout, 1967; Lewontin, 1974). Рассмотрим пример, когда дифференцированный отбор влияет на жизнеспособ- ность особей в разных фазах жизненного цикла. При этом существу- ют две формы - доминантная (одна гомо- и одна гетерозиготная) и рецессивная (см. таблицу 4.14). Предположим, что на личиночной ста- дии развития или на стадии проростка жизнеспособность рецессив- ной формы выше (v >1), однако в дальнейшем она снижается (г^<1). Казалось бы, балансирующий отбор должен поддерживать полимор- физм популяции. Однако, эти составляющие приспособленности «сжи- маются» таким образом, что общая приспособленность форм равна произведению величин относительной приспособленности на разных стадиях жизненного цикла, т.е. vLvA (см. обсуждение на стр. 162). По- этому допускают, что между данными генотипами нет других разли- чий в приспособленности, а общая относительная приспособленность доминантной формы меньше, равна или больше приспособленности рецессивной формы. Если общая относительная приспособленность доминантной формы выше приспособленности рецессивной, аллель А} случайным образом становится фиксированным. Когда такая при- способленность доминантной формы ниже приспособленности рецес- 13 — 7660
Глава 4. Отбор: другие модели и оценки ТАБЛИЦА 4.14. Пример различной жизнеспособности на двух стадиях жизненного цикла, которая «сжимается» до одной величины жизнеспособности М ЛА Жизнеспособность личинок (или проростков) Жизнеспособность молодых 1 1 VL и половозрелых особей 1 1 Общая жизнеспособность 1 1 сивной формы, случайным образом фиксируется аллель Аг В малове- роятных случаях, когда приспособленности двух форм равны, эти фор- мы нейтральны по отношению друг к другу, и обе сохраняются в по- пуляции. Можно предполагать, что поддерживать полиморфизм в по- пуляции гаплоидных организмов крайне сложно. Однако, как показы- вает пример 4.11, такой устойчивый полиморфизм возможен. Пример 4.11. Распространенная бактерия Pseudomonas fluorescens бы- стро приспосабливается к новым условиям обитания и дает множе- ство мутантов. В однородной постоянно перемешиваемой среде обна- руживается только одна морфологическая форма - гладкая. В простран- ственно неоднородной среде (без перемешивания) обнаруживается, по меньшей мере, три формы: гладкая, складчатая и ворсистая, которые встречаются с заметной частотой во всех пассажах бактериальной культуры (Rainey, Travisano, 1998), (рисунок 4.11). Для оценки влия- ния однородности среды на генетическую изменчивость бактерий клет- Рисунок 4.11. В гомогенной (а) и гетерогенной (Z?) среде были обнаружены гладкие фор- мы бактерий (кружки). Кроме того, в гетерогенной среде найдены складчатые (треуголь- ники) и ворсистые (квадраты) мутантные формы бактериальных клеток (по Rainey, Travisano, 1998).
VI. Экологическая генетика и балансирующий о, ки помещали из гетерогенной среды в гомогенную. Через две недели разнообразие форм заметно сокращалось и составило одну четверть от их разнообразия в гетерогенной среде. Перенос бактерий назад в гетерогенную среду быстро восстанавливал высокий уровень разно- образия клеток. Для распространения новой мутантной формы в популяции необ- ходимо, чтобы редкие мутанты имели преимущество в приспособлен- ности перед остальными формами. Чтобы убедиться в этом, конку- рентоспособность всех трех морфологических форм была измерена в попарных тестах (рисунок 4.12). В пяти из шести комбинаций при- способленность редких форм оказалась значительно выше приспособ- ленности распространенных форм клеток. Различия в приспособлен- ности между гладкой формой-основателем и двумя другими произ- водными формами позволяют поддерживать устойчивый полиморфизм в популяции бактерий. Экологические механизмы поддержания раз- нообразия до конца не понятны, однако бактерии складчатой формы слипаются друг с другом и концентрируются ближе к поверхности среды. Это дает им возможность быстрее усваивать кислород и пита- тельные вещества. Когда клетки складчатой формы становятся слиш- ком распространенными, они начинают размножаться медленнее и пре- имущество этой формы снижается. Рисунок 4.12. Конкурентоспособность различных морфологических форм бактерий (SM - гладкая форма, WS - складчатая, FS - ворсистая). Стрелки указывают на распростра- ненный генотип, а их противоположный конец - на редкий. Цифрами обозначены отно- шения конкурентоспособности редкого генотипа к конкурентоспособности распростра- ненного генотипа, единица указывает на равную конкурентоспособность двух генотипов (по Rainey, Travisano, 1998). 13*
196 Глава 4. Отбор: другие модели и оценки Перед рассмотрением некоторых моделей неоднородной среды, об- судим основные различия между влиянием на генетическую изменчи- вость популяции изменений среды в пространстве и таких изменений во времени. При изменениях во времени, скажем, год - влажно, год - сухо, каждая особь должна выдерживать эти изменения путем адапта- ции или погибнуть, не адаптируясь. При изменениях в пространстве - в одном месте влажно, а в другом - сухо, лишь часть особей в популя- ции подвержена воздействию этих факторов среды в определенный отрезок времени. Иначе говоря, особи с некоторыми генотипами и часть их потомков будут хорошо адаптированы к условиям окружаю- щей среды, а часть особей - не адаптированы. По-видимому, поддер- живать генетическое разнообразие при изменении условий среды во времени сложнее, чем при пространственных изменениях этих усло- вий. Действительно, большинство ассоциаций генотип-среда относят- ся к пространственной неоднородности среды обитания, а не к изме- нениям среды с течением времени (Hedrick et al., 1976; Hedrick. 1986). He ясно, связано ли отсутствие известных ассоциаций генотип-время с очень низким полиморфизмом или же с трудностью обнаружения таких ассоциаций и соответствующего полиморфизма. а. Пространственная изменчивость Первая теоретическая модель для изучения влияния пространствен- ных изменений среды на приспособленность была предложена Ливе- ном (Levene, 1953). Согласно этой модели, ареал подразделяют на не- сколько экологических ниш. После оплодотворения множество зигот случайным образом распределяется в каждую из таких ниш. Часть из них погибает, а остальные формируют фиксированную численность особей в данной нише. При этом предполагается, что еще до спарива- ния все взрослые особи каждого поколения, обитающие в разных ни- шах, свободно перемещаются из одной ниши в другую. Общая схема такой модели показана на рисунке 4.13, причем различных ниш мо- жет быть две и более. Посмотрим, как создаются условия для полиморфизма. Допустим, что имеется двухаллельный локус, а величины приспособленности осо- бей с генотипами АуА{, А}А2, А^А2, обитающих в z-той нише, равны, соответственно, w , 1 и w22.. Подставляя эти значения приспособлен- ностей в выражение 3.3а, можно вычислить изменения аллельных ча- стот в z-той нише: _ РЧ[рУ ~ Wll,) ~ 9(1 ~ W22,)]
VI. Экологическая генетика и Рисунок 4.13. Модель отбора при изменениях в пространстве среды. где w, = w р2+ 2pq +w . q2. Допустим, что имеется т ниш и доля особей, обитающих в z-той нише составляет с, тогда Изменение аллельных частот во всех т нишах равно: bq = = P<T^Ci 1=1 XI - - ^22,) (4.12а) W или равно взвешенной доле генетических изменений в различных нишах. Для определения условий устойчивого полиморфизма введем но- вую функцию h(q), так что *(<?) = — = pq Xi-Wn,)-Xi-w22,) wi Заметьте, что при делении на величину pq эта функция не равна нулю при значениях р = 0 или q = 0. Значения функции h(q) располагаются между нулем и единицей. Поэтому при положительных значениях /г(0) и отрицательных значениях /г(1) должно существовать не менее одно- го устойчивого равновесия аллельных частот (Levene, 1953). Анало- гично, частота аллеля А2 растет от малых значений и падает от боль- ших значений. При q = 0 Л(0)=У
Поскольку это выражение должно быть положительным, то частота аллеля Л2 растет от малых значений, а условие устойчивого равнове- сия соблюдается при или --------<1. (4.12b) 2Л/Под- выражение слева равно гармонической средней величины относитель- ной приспособленности особей с генотипом AtAp обитающих во всех нишах. При отрицательных значениях Л(1) можно показать, что ----<!, (4.12с) ZC-/VV22.. т.е. при устойчивом равновесии гармоническая средняя относитель- ной приспособленности особей с генотипом А2А2 должна быть мень- ше единицы. Поэтому при устойчивом равновесии гармоническая сред- няя приспособленности двух гомозиготных генотипов должна быть меньше этой величины для гетерозигот. Обратите внимание, величи- на гармонической средней такова, что устойчивый полиморфизм яв- ляется результатом баланса между приспособленностями разных ге- нотипов и пропорционального вклада в равновесие особей в каждой из ниш. При сбалансированном полиморфизме величины приспособ- ленности и вклада особей из разных ниш должны быть уравновеше- ны гармоническими средними и быть меньше единицы, особенно при слабом давлении отбора. Проиллюстрируем эти теоретические выкладки на примере. Пред- положим, что существует всего две ниши и аддитивный направлен- ный отбор благоприятствует в нише 1 аллелю А . Значения приспо- собленности равны 1 +s, 1 и 1-5. В нише 2 действует такой же по силе, но обратный по направлению отбор, благоприятствующий алле- лю А2, так что значения приспособленностей равны 1 - s, 1 и 1 + s. Если аллельные частоты в этих нишах одинаковы, то пропорции осо- бей в каждой из ниш равны = с2 = 0,5 и левые половины выражений 4.12b и 4.12с примут вид 1 - s2, а условия устойчивого полиморфизма будут соблюдены. Но по мере того, как в одной из ниш начинает пре- обладать один из аллелей, значение общей аллельной частоты будет отражать действие отбора в этой нише, пока не исчезнет устойчивый
VI. Экологическая генетика и балансирующий отбор 199 полиморфизм. В этом случае для поддержания устойчивого полимор- физма при 5 = 0,1 значения с] должны располагаться между 0,45 и 0,55. Гиллеспай (Gillespie, 1978) предложил общую модель изменчивого отбора с учетом сильной вариабельности аллоферментов, обнаружен- ной во многих природных популяциях. Но, согласно этой модели, «во всех нишах приспособленность гетерозигот выше арифметической сред- ней приспособленности гомозигот» (Maynard Smith, Hoekstra 1980). Таким образом, величины приспособленности по этой модели приво- дят к полному изменению доминирования, когда приспособленность гетерозигот ближе к величинам приспособленности, благоприятным для отбора гомозигот (Maynard Smith, Hoekstra, 1980; Hedrick, 1986). При этом неизменным остается вывод о строгих условиях поддержания по- лиморфизма, зависящего от изменчивого отбора. Для модели Ливена требуется предельное преимущество гетерози- готных особей, т.е. преобладание гармонической средней гетерозигот. Но в некоторых случаях сбалансированный полиморфизм может су- ществовать даже при одинаковой относительной приспособленности гетерозигот и особей с одним из гомозиготных генотипов обитающих во всех экологических нишах. Другими словами, в разных условиях обитания варьирует относительная приспособленность только одного из генотипов - скажем, A^2 - так что приспособленности особей с генотипами AtAp А}А2и А^А2, обитающих в z-той нише, равны 1,1 и w22... Эта модель абсолютного или полного доминирования может ис- пользоваться для изучения доминантных морфологических полимор- физмов, включая мимикрию или покровительственную окраску. Условия поддержания полиморфизма в популяции при абсолютном доминировании соблюдаются, когда величины приспособленности в разных нишах варьируют в пределах: (4ЛЗ) (Prout, 1968). То есть, гармоническая средняя изменчивого по частоте аллелей генотипа должна быть меньше единицы, а соответствующая арифметическая средняя - больше единицы. Графически эти условия представлены на рисунке 4.14, где пропорции особей в двух нишах одинаковы с, = с2 = 0,5 (по Hedrick et al., 1976). При слабом давлении отбора диапазон величин, обеспечивающих полиморфизм, невелик. К примеру, для обеспечения устойчивого полиморфизма при относитель- ной приспособленности гомозигот А2А2 в нише 1, равной 0,9, значе- ния относительной приспособленности гомозигот в другой нише долж- ны располагаться между 1,1 и 1,125.
Отбор: другие модели и оценки Рисунок 4.14. Области устойчивого полиморфизма при значениях относительной приспособленности генотипов AtA}, AfA2 и А?А2 равных 1, l,w в условиях среды 1 и 1,1, И22 2 в условиях среды 2. Темным выделена область изменчивости в пространстве среды, обеспечивающей равновесие, в отличие от изменчивости во времени. При отборе генотип-специфичная среда обитания особи предпо- читают жить в нишах, где их приспособленность максимальна, поэто- му условия поддержания полиморфизма менее строгие. Степень тако- го отбора можно вычислить с помощью стандартизированных вели- чин, представленных в таблице 4.15, где h - доля гомозигот с высокой приспособленностью, обитающих в наиболее подходящей нише (Hedrick, 1990а). ТАБЛИЦА 4.15. Отбор генотип — среда обитания, где h — доля гомозигот, выбирающих наиболее подходящую для адаптации экологическую нишу Ниша 4] A2 a2a2 1 he. (1 - h)Cl 1 hcx + (1 - h)c2 Cl (1 - h)cx + hc2 о (1 - h)c2 hc2 Z hc2 + (1 - h)c2 C2 (1 — h)c} +hc2
Рисунок 4.15. Область устойчивого полиморфизма по модели Ливена, когда локальный отбор по месту обитания отсутствует (темная область) или существует при значении й=0,625 (области между кривыми). Величина с, означает долю особей в нише 1, a s - селективные различия между двумя гомозиготами. Если приспособленность особей с генотипом А}А выше в экологи- ческой нише 1, а приспособленность особей с генотипом А2А2 - в нише 2 и разница в приспособленности всех гомозигот, обитающих в одной нише, суммарно равна s, то условия поддержания полиморфизма име- ют вид, графически представленный на рисунке 4.15. Сравним эти ус- ловия с моделью Ливена, в которой нет отбора по месту обитания, но также даны разные значения приспособленности в двух экологических нишах. Даже при умеренном отборе по месту обитания (h = 0,625) ус- ловия поддержания полиморфизма значительно шире, чем в модели Ли- вена. Действительно, оценка средней величины h (Hedrick, 1990а) на примере данных по Drosophila (Jaenike, 1985), а также у грибов по срав- нению с томатами (0,745) и лимона по сравнению с апельсином (0, 626), подтверждает невысокий уровень отбора по месту обитания (Hoffman, O’Donnell, 1990). Смит (Smith, 1993) обнаружил, что за полиморфизм размера клюва у африканских воробьиных из рода Pyrenestes по-види- мому, отвечает единственный ген. В этом случае наблюдается корреля- ция между размером клюва и пищевыми предпочтениями, т.е. поддер- жание генетической изменчивости в свободно скрещивающейся попу- ляции этих птиц связано с отбором по месту обитания.
Ь. Изменчивость приспособленности во времени Как говорилось ранее, условия поддержания стабильного полимор- физма при изменчивости приспособленности со временем более стро- гие, чем при пространственном отборе. Впервые такие условия при изменяющейся в разных поколениях приспособленности были опре- делены Холденом и Джаякаром (Haldane, Jayakar,1963). Они показа- ли, что при значениях относительной приспособленности генотипов А Ах, А}А2 и А^А. , равных и>н1 и щ,2.., устойчивый полиморфизм в z-том поколении будет поддерживаться при условии, что п ~IW22’- (4.14а) где п — число поколений. Другими словами, для устойчивого полимор- физма при изменяющейся со временем приспособленности геометри- ческие средние относительной приспособленности обоих гомозиготных генотипов должны быть меньше геометрической средней этой величи- ны у гетерозиготных генотипов. Поскольку геометрическая средняя всегда больше гармонической средней, условия поддержания полимор- физма в этом случае более строгие, чем при пространственном измене- нии приспособленности. Предположим, что имеется всего два типа окружающей среды, ска- жем жаркое и холодное время года, и что популяция живет в этих ус- ловиях на протяжении ряда поколений. В условиях среды обитания 1 отбор благоприятствует аллелю со значениями приспособленности для генотипов А}АХ, А^А и А2А2, равными 1+ s, 1 и 1- 5. В условиях среды 2 действует такой же по силе, но противоположный по направ- лению отбор, благоприятствующий аллелю А2, так что значения при- способленности особей с генотипами А^, АА2и А2А2равны, соответ- ственно, 1 - s, 1 и 1 + 5. При равной численности особей во всех поко- лениях, находящихся в этих средах, условия поддержания полимор- физма сходны. Однако, если в одних условиях обитания поколения будут жить несколько дольше, то одно из значений геометрической средней величины приспособленности превысит единицу, и в этой среде будет действовать направленный отбор. При 5 = 0,1 для поддер- жания устойчивого полиморфизма в каждой из сред значения относи- тельной приспособленности должны находиться в интервале от 0,475 до 0,525. Условия поддержания устойчивого полиморфизма при полном до- минировании, когда со временем изменяется только относительная приспособленность особей с генотипом А2А2, тоже довольно строгие:
VI. Экологическая генетика и балансирующий отбор В этом случае геометрическая средняя приспособленности изменчи- вых генотипов должна быть меньше единицы, а арифметическая сред- няя этой величины — больше единицы. Эти условия для двух сред обитания с равной численностью особей в различных поколениях гра- фически представлены на рисунке 4.14. Темная площадь обозначает область устойчивого полиморфизма при пространственной изменчи- вости и при отсутствии изменений среды обитания со временем. При слабом давлении отбора диапазон величин, отвечающих этим услови- ям, очень мал. К примеру, при относительной приспособленности оби- тающих в среде 1 особей с генотипом А^Аг, равной 0,9, значения отно- сительной приспособленности особей в другой среде обитания долж- ны находиться между 1,1 и 1,111. Но даже при наличии устойчивого полиморфизма, изменение ал- лельной частоты по направлению к равновесным значениям может быть очень медленным. Как показано на рисунке 4.16, величина при- способленности изменчивых гомозигот, обитающих в среде 1, равна 0,9, а в среде 2 - 1,108, при этом предполагается, что условия обита- ния изменяются через каждое поколение (см. ниже), и что равновес- ные частоты аллелей равны 0,484 и 0,497. Заметьте, что через 500 по- колений аллельная частота еще не достигла равновесных значений, приближаясь к ним от исходно низкой частоты. Интересно, что условия поддержания устойчивого полиморфизма при изменчивости среды обитания во времени не зависят от характе- ра этой изменчивости (Haldane, Jayakar, 1963; Gillespi, 1971). Иначе говоря, условия поддержания полиморфизма одинаковы и при изме- нении сред обитания в каждом поколении, и при таких изменениях через 50 поколений. Однако различный характер изменения сред оби- тания может привести к различиям в распределении частот аллелей в популяциях, так что ожидаемая гетерозиготность в разных условиях среды будет совсем не одинаковой. Для наглядности посмотрим, как можно представить изменение ус- ловий среды во времени. Такие изменения можно охарактеризовать как с детерминистской (следуя определенному циклу), так и со стоха- стической (определенная вероятность изменений, приводящих к оп- ределенной среде) точек зрения. Полностью детерминистский подход, хотя и не является общепринятым, но позволяет описывать изменчи- вость у биволтинных насекомых с чередующимися весенне-летним
Рисунок 4.16. Изменение аллельной частоты во времени при устойчивом полиморфизме, обусловленном изменчивостью со временем среды обитания и отбором гомозигот одного типа. Две пунктирные линии указывают на равновесные аллельные частоты в двух раз- личных средах обитания. (5) и зимним (F) поколениями. Каждый год с изменением окружаю- щей среды проходит цикл смены этих поколений, так что со временем получается последовательность поколений SFSFSF.... Такие циклы могут включать одинаковое число поколений, обитающих в разных условиях среды, или же длинную последовательность поколений, жи- вущих в одной среде и более короткую — в другой. При заданной ис- ходной точке такой последовательности можно определить среду, в которой будут обитать t поколений через какое-то время. Допустим поколение 0 у таких биволтинных насекомых обитает в среде 5, тогда через три поколения популяция будет обитать в среде F. Большинство факторов среды не носит сезонного характера и под- чиняется случайным изменениям. Простейший способ представить та- кие изменения состоит в рассмотрении двух типов среды обитания, на- пример влажного и сухого времени года. Затем можно определить ве- роятность перехода одного типа среды в другой. Допустим, вероятность того, что поколение t + 1 окажется в среде 1, как и поколение t равна а (альфа), а вероятность того, что поколение t + 1 и поколение t окажутся в среде 2 равна Д (бета). Тогда переход поколений между этими среда- ми обитания можно описать с помощью таблицы 4.16а. Связь между последовательными сменами сред (г) равна:
VI. Экологическая генетика и балансирующий отбор ДЖ.Б.С.ХОЛДЕН (1882-1964) Дж.Б.С. Холден, вместе с Фишером и Райтом заложил теоретические основы по- пуляционной генетики. Он был выдающимся биохимиком и плодовитым писате- лем (см., Clark, 1968, биографические данные можно найти у Crow, 1992). Холден особенно интересовался математическими моделями отбора по одному локусу. Считая отбор и мутации факторами, совместно влияющими на частоту аллелей в популяции, он вывел уравнение баланса этих факторов. Холден описал условия поддержания полиморфизма в различных системах, включая Х-сцепленные локу- сы и изменяющийся во времени отбор (избранные труды см. у Dronamraju, 1990). Одна из его проникновенных статей под названием «В защиту классической гене- тики» (Haldane, 1964) - это отпор критицизму Майра (Мауг,1963) и математичес- кой школе эволюционной биологии. В 1957г. Холден уехал из Англии в Индию, там он оказал огромное влияние на многих ученых-биологов. Незадолго до своей смерти от рака Холден написал поэму «Занятная штука, этот рак», которая начина- лась такими словами: «Хотелось бы стать Гомером, И спеть оду раку прямой кишки, Который убил гораздо больше парней, Чем погибло при разорении Трои». г=а+Д-1, (4.15) т.е. имеется самокорреляция. Поэтому при а = Д = 0,0, что указывает на смену среды в каждом поколении, самокорреляция г = - 0,1. Ана- логично, при а= /3= 1,0 смены среды не происходит и г = 1,0. Эти три варианта смены сред показаны в таблице 4.16b, где величины само- корреляции равны 0,0, 0,8 и -0,8. ТАБЛИЦА 4Л6. Общая модель стохастических (случайных) изменений двух сред обитания (а). Ниже (Ь) показаны три варианта последовательной смены этих сред, и самокорреляция г между этими событиями (см. текст) (а) Поколение t Поколение t + 1 Среда 1 Среда 2 Среда 1 Среда 2 а 1—0 1 — а 0 г = а + Р - 1 (Ь) 0.5 0.5 0.5 0.5 г — 0.0 0.9 0.1 0.1 0.9 0.1 0.9 0.9 0.1 г = 0.8 г — -0.8
G06 Глава 4. Отбор: другие модели и оценки Предположим, что величины приспособленности особей с геноти- пами А2А2 в среде 1 равны 1,0, 0,9 и 0,8, а в среде 2 - 0,8, 0,9 и 1,0, т.е. против всех аллелей в двух средах действует отбор оди- наковой силы. Типичная картина изменений аллельных частот при дан- ных значениях приспособленности и трех вариантах смены сред, взя- тых из таблицы 4.16b, показана на рисунке 4.17 (данные получены методом Монте-Карло). При г = -0,8, когда смена среды происходит практически каждое поколение, происходит реверсия (полное изме- нение) частот аллелей, при этом реверсии (смены среды) не произош- ло лишь в поколениях 8, 9, 25, 27 и 39. С другой стороны, при г = 0,8 реверсии наблюдались только в поколениях 7, 13, 19, 23, 33 и 37. В результате таких изменений наблюдается либо тенденция к со- хранению аллельных частот на уровне исходных значений, либо тен- денция к сдвигу этих частот. К примеру, при г = -0,8 частоты аллелей в ряду поколений остаются на уровне исходного значения 0,5. При г = 0,8 частота аллелей во многих популяциях становится ниже 0,1 или выше 0,9. Очевидно, что характер изменений в окружающей сре- де оказывает существенное влияние на распределение аллельных час- тот и в некоторых популяциях изменяет частоту аллелей практически до 0,0 или 1,0 даже при вероятности устойчивого полиморфизма. По- скольку мы рассматриваем бесконечную популяцию, фиксации каких- то аллелей не происходит. Когда частота аллеля в популяции падает до нуля или оказывается близкой к единице, речь идет о псевдофик- Рисунок 4.17. Изменение во времени частоты аллеля Л2 при отборе в двух различных средах обитания и самокорреляции между этими средами, равной -0,8, 0,0 или 0,8.
VI. Экологическая генетика и балансирующий от сации и такого аллеля. По мере роста уровня самокорреляции растет и уровень псевдофиксации. Исключением из строгих условий поддержания полиморфизма при изменениях окружающей среды во времени могут быть поколения в диапаузе, например у впадающих в спячку (оцепенение) насекомых и животных, а также семена растений в периоде покоя (Ellner, Hairston, 1994; Hedrick, 1995). В этих случаях особи, находясь в неактивном состоянии, могут избежать влияния среды, в которой их приспособ- ленность низкая. Условия полиморфизма становятся шире, в особен- ности тогда, когда смена сред происходит в строгой последовательно- сти через каждое поколение и доля животных в диапаузе или семян в периоде покоя довольно высока (Hedrick, 1995а). В таком случае по- ток генов между двумя взаимно неперекрывающимися группами осо- бей, допустим весенним и зимним поколением, очень незначителен. с. Частотно-зависимый отбор У множества организмов, включая насекомых, птиц, злаки, относитель- ная приспособленность, по-видимому, является функцией частот раз- личных генотипов, представленных в популяции (см. обзор Clarke et al., 1988). В тех случаях, когда значения относительной приспособлен- ности генотипов находятся в обратной зависимости от частоты этих генотипов в популяции, модели частотно-зависимого отбора, обуслов- ливающего сбалансированный полиморфизм, представляют большой интерес (см. стр. 171 и работу Wright, 1969). Если аллель редкий, то приспособленность гомозигот по этому аллелю будет более высокой, чем у особей с другими генотипами из-за преимуществ в жизнеспособ- ности и спаривании. Частотно-зависимый отбор может привести к бо- лее быстрой фиксации определенного аллеля, например, редкого невы- годного аллеля, когда редкий тип цветка не узнается опылителями или необычная окраска делает рыбу из стаи более заметной для хищника. При частотно-зависимом отборе значения относительной приспо- собленности отдельных генотипов являются функцией частоты дру- гих генотипов в популяции. Отбор такого типа наиболее часто пред- ставлен отбором на жизнеспособность и половым отбором и опосре- дован поведенческими факторами, например предпочтением хищни- ка поедать особей с данным генотипом (см. пример 4.12) или пред- почтительным спариванием самок с самцами определенного геноти- па (см. пример 4.2). Иногда в основе частотно-зависимого отбора ле- жат физиологические особенности (допустим взаимодействие между растениями и гусеницами), связанные или с дифференцированным пи- танием, или с выработкой жертвой ядовитых веществ.
Глава 4. Отбор: другие модели и оценки Пример 4.12. Замечательный пример частотно-зависимого отбора - цих- лидовая рыбка Perissodus microlepis из озера Танганьика (Hori, 1993). Эта рыбка специализируется на поедании чешуи у других живых рыб, вырывая ее с боковой поверхности туловища жертвы. Из-за несиммет- ричности челюстей рот этих цихлид открывается либо направо, либо налево (рисунок 4.18). Оказалось, что право- или левосторонний рот определяется одним геном, причем аллель правостороннего рта доми- нирует над аллелем левостороннего. Рисунок 4.18. Асимметрия рта, обнаруженная у цихлиды-чешуееда из озера Танганьика. У рыбки вверху правосторонний рот, у рыбы внизу — левосторонний (по Hori, 1993). В нескольких экспериментах удалось обнаружить полное соответствие направленности рта цихлиды со стороной жертвы, которую рыбка атако- вала: особи с правосторонним ртом всегда нападали на левый бок жерт- вы и наоборот (Hori, 1993). Однако только 20% таких атак заканчивались добычей чешуи. Оказалось, что во время преобладания цихлид с право- сторонним ртом у их жертв чаще встречаются шрамы на левой стороне тела, а в год, когда были более распространены рыбки с левосторонним ртом преобладали шрамы на правой стороне тела их жертв. В данном случае мы имеем дело со строгим частотно-зависимым отбором. Если в популяции рыбок начинают преобладать формы с оп- ределенной направленностью рта, то жертвы будут обороняться от воз- можных нападений с этой стороны, уменьшая вероятность захвата че-
VI. Экологическая генетика и балансирующий от шуи. В результате установится равновесие частот обоих генотипов, что и наблюдается в действительности (рисунок 4.19). Хотя средняя частота встречаемости каждого генотипа не отличается от 0,5, при- мерно каждые пять лет повторяется цикл колебаний частот с ампли- тудой около 0,15. Не вполне ясно, связан ли такой цикл с отставанием по времени, поскольку Р. microlepis начинает питаться чешуей в воз- расте двух лет или же с тем, что ответ жертв на атаки цихлид не стро- го зависит от частоты генотипа хищника. Как правило, при частотно- зависимом отборе изменчивость видов-жертв поддерживается хищ- никами, но в данном случае рыбы-жертвы поддерживают морфологи- ческую изменчивость хищной цихлиды. Год Рисунок 4.19. Изменение частоты синистральных рыб (с левосторонним ртом) в течение 11 -летнего периода наблюдений в двух местах обитания с 95%-ным доверительным ин- тервалом для каждой выборки (по Ноп, 1993). Чтобы представить себе зависимость жизнеспособности от часто- ты генотипа предположим, что жизнеспособность организмов по-раз- ному опосредована различными генотипами и зависит от взаимодей- ствия между этими организмами (Huang et al., 1971; Cockerham et al., 1972). Если относительная приспособленность особи при взаимодей- ствии с особями одинакового генотипа подавляется больше, чем при взаимодействии с особями других генотипов, то в популяции может сложиться устойчивый полиморфизм. Имея два аллеля, мы получим
Глава 4. Отбор: другие модели и оценки девять величин приспособленности, т.к. рассматриваем все возмож- ные комбинации генотипов друг с другом. К примеру, приспособлен- ность особей с генотипом АХА} при взаимодействии только с особями генотипа А2А2 равна и>н 22. Предположим, что значения относительной приспособленности — это функция частот других генотипов в популяции. Принимая во вни- мание закон Харди-Вайнберга, получим результирующие значения приспособленности: "и ”l2 =p2wi2ii + 2W2.,2 + ?Ч2.22> iv22 =P2W22.11 + 2Ww22.|2 + <72w22 22. Частота аллеля Л2 после отбора составит: 9(pwI2+qw22) w а изменение аллельной частоты равно: А? = ^[?(^22 -w12)], (4.16) w где общая средняя приспособленность равна: w = p2wn + 2pqwn + q2 w22. Выражение 4.16 сходно с уравнением 3.3а, но значения приспособ- ленности представляют собой функцию частот генотипов. Есть данные, что приспособленность растений зависит от генотипов окружающей растительности. Действительно, некоторые растения пре- красно уживаются друг с другом, усиливая относительную приспособ- ленность соседних растений, в то время как другие оказывают на своих соседей вредный эффект. Такое явление конкуренции было обнаружено у ряда видов овса (см. Harper, 1977 и данные по ячменю из примера 4.13). Для растений-самоопылителей эта модель описывается уравнением 4.16 без учета менделевского расщепления (Cockerham, Burrows, 1971) и по- лучена с учетом условной приспособленности. Она сходна с моделью межвидовой конкуренции, где равновесия представляют собой исключи- тельно функцию коэффициентов межвидовой конкуренции. Пример 4.13. В таблице 4.17 показано взаимное влияние некоторых сортов ячменя друг на друга (Allard, Adams, 1969). Диагональ обозна- чает урожайность сортов по отношению к урожайности сорта Клаб
VI. Экологическая генетика и балансирующий отбор ТАБЛИЦА 4.17. Относительная урожайность сортов ячменя в чистом виде при конкуренции с другими сортами (по Allard, Adams, 1969) Конкурирующий сорт Сорт Atlas Club Mariout Hero Vaughn Atlas 1,08 1,11 1,10 1,11 Club Mariout 1,05 1,00 1,03 1,04 Hero 1,05 1,05 1,04 1,07 Vaughn 0,97 1,01 1,03 1,01 Мэриот (Club Mariout). Другие графики говорят об относительной уро- жайности растений этих сортов, высаженных в ряды по соседству с сортами, указанными сверху. Видно, что в плохих условиях урожай- ность сорта Атлас (Atlas) в чистом виде наивысшая, и этот сорт хоро- шо конкурирует с другими сортами ячменя. Но урожайность других сортов, соседствующих с сортом Атлас, падает. Сначала эти четыре сорта были высеяны в равных пропорциях, а затем наблюдали за изменением их численности в ряду поколений (Suneson, 1949). Менее чем через 15 поколений сорт Атлас стал доми- нирующим, обеспечивая более 90% всего урожая на корню (рисунок 4.20а). С помощью матрицы значений относительной урожайности, взя- тых из таблицы 4.17, Аллард и Адамс (Allard, Adams, 1969) предска- зали изменение частот генотипов этих сортов, а также исход межсор- товой конкуренции (рисунок 4.20b). Их результаты соответствуют на- блюдаемым, когда сорт Атлас становится доминирующим, а осталь- Поколение Рисунок 4.20. Изменение наблюдаемой частоты генотипов четырех сортов ячменя во вре- мени (а) и теоретически ожидаемые изменения (b), (по Allard, Adams, 1969). 14*
Глава 4. Отбор: другие модели и оценки ные сорта быстро элиминируются. Однако имеется существенная раз- ница во времени, за которое происходят такие изменения. Теорети- чески сорт Атлас не достигает 90% всего урожая даже через 75 поко- лений, в то время как на практике это происходит уже через 15 поко- лений. Оказалось, что межсортовая конкуренция была даже более силь- ной, чем ожидалось из эксперимента по относительной урожайности. Взаимодействие между разными видами может влиять на отбор. Согласно концепции совместной эволюции, конкурирующие виды, на- пример, хищник и жертва, хозяин и паразит, или мутуалисты могут эволюционировать в ассоциации друг с другом (Thompson, 1994). Дей- ствительно, взаимодействие хищников и их жертв, хозяев и паразитов может обусловить частотно-зависимый отбор (Ebert, 1998; Kaltz, Shykoff, 1998). Допустим, новый генетический тип организма-хозяи- на может быть устойчивым к распространенным паразитам, но со вре- менем, в силу селективных преимуществ, этот тип хозяина становит- ся распространенным, а паразиты приобретают вирулентность. Классический пример совместной эволюции хозяина и паразита - ввоз в Австралию английских кроликов (Fenner, 1965). Для борьбы с безудержно размножающимися кроликами был использован вирус мик- соматоза. В результате, популяция кроликов сократилась до 1% от пер- воначальной. Затем у животных появилась устойчивость к этому ви- русу, а сам вирус стал менее вирулентным. Когда вирулентность слиш- ком высокая, хозяин быстро погибает и вирусы не передаются другим животным. Сейчас устойчивость кроликов к высоким концентрациям пестицидов в некоторых районах Австралии сильно возросла, поэто- му требуются новые средства биологического контроля за их числен- ностью. Оказалось, что во многих случаях способность жертвы или хозяина избегать поедания или паразитизма, равно как и способность хищника или паразита находить и использовать жертву или хозяина, находятся под генетическим контролем. Хотя генетическая детерми- нированность ассоциаций хищник-жертва и хозяин-паразит может контролироваться рядом генов, есть множество примеров, когда за это отвечают лишь несколько генов. Мимикрия, как форма спасения от хищника, например, может быть обусловлена малым числом генов (Joron, Mallet, 1998). Это же относится к устойчивости хозяина по от- ношению к паразиту (см. пример 4.14, описывающий устойчивость голубей с трансферриновым генотипом к патогенам). У многих расте- ний по-видимому, широко распространена система аллелей устойчи- вости к специфическим штаммам паразитов и трансгенные обмены между хозяином и паразитом (Thompson, Burdon, 1992), которые в
VI. Экологическая генетика и последнее время активно исследуются с помощью молекулярных ме- тодов (Grant et «/.,1998; Rossi et al., 1998). Пример 4.14. Один из лучших примеров преимущества гетерозигот и диф- ференцированной устойчивости хозяина к патогенам был предложен Фре- лингером (Frelinger, 1972). Он показал, что самки голубей, гетерозиготные по аллелю, кодирующему негемообразующий белок трансферрин (TfA и 7/®) выводят больше птенцов, чем гомозиготы. Из таблицы 4.18 видно, что гетерозиготные самки высиживают 67% яиц, а гомозиготные - всего 46% и 52%. При отборе против гомозигот 5, = 0,31 и s2 = 0,22, а ожидаемая равновесная частота генотипа TfA равна 0,58 (эта величина вычисляется так же, как при преимуществе гетерозигот, см. Frelinger, Crow, 1973). В трех разных популяциях голубей частота аллеля TfA составляла 0,38, 0,52 и 0,59, что близко к частотам, наблюдаемым в эксперименте. Исследуя это явление, Фрелингер выращивал культуры дрожжей в среде, содержащей экстракт белка яиц самок разных генотипов и очищенный трансферрин этих же самок. В обоих экспериментах наблюдалось более сильное инги- бирование роста дрожжей в средах с экстрактами из яиц гетерозиготных самок (рисунок 4.21). Известно, что трансферрин замедляет рост различ- Рнсунок 4.21. Рост дрожжей на среде с очищенным трансферрином, выделенным из го- лубей с генотипами TfA TfA (A), TfA Tf8 (АВ) и TfsTfs (В) и на контрольной среде без транс- феррина.
4 Глава 4. Отбор: другие модели и оценки ТАБЛИЦА 4.18. Вылупляемость птенцов у самок голубей с распространенными трансферриновыми генотипами TfA Т/Л, TfA TfB и TfB TfB и соответствующие величины относительной выживаемости птенцов Генотип самки TfA Т/Л TfTfB Tf TfB Число отложенных яиц 128 267 144 Число вылупившихся птенцов 59 180 75 Доля вылупившихся птенцов 0,46 0,67 0,52 Относительная приспособленность 0,69 1,0 0,78 ных микроорганизмов, жизнедеятельность которых зависит от присутствия ионов железа. Полученные данные говорят о том, что два распространен- ных трансферриновых аллеля комплементарны друг другу и обеспечива- ют усиление защиты от микробной инфекции яиц или маленьких птенцов, имеющих запасы материнского трансферрина. Задачи 1. Предложите эксперимент для проверки важности какого-нибудь локуса для всех компонентов отбора. 2. Относительная приспособленность гомозигот с генотипами А А{ и Л2Л,у самцов равна 1,0 и 0,89, а у самок - 0,9 и 1,0, соответ- ственно. Каковы равновесные частоты у двух видов при проме- жуточной приспособленности гетерозигот? Определите диапазон значений s , при котором возможен стабильный полиморфизм, если самки подвержены такому же отбору, как и самцы. 3. Покажите, что значения средней приспособленности и равновес- ные частоты при полном доминировании и частотно-зависимом отборе описываются уравнением 4.4b. 4. Считаете ли Вы, что многие из примеров мейотического дрейфа и сходных явлений просто не обнаружены? Как можно провести эксперимент по исследованию значения мейотического дрейфа? 5. Предположим, что исходные частоты локуса самонесовместимо- сти у растений с генотипами SfS2, S}S}, S2S} равны 0,2, 0,5 и 0,3, соответственно. Какова первоначальная частота аллеля и какова его частота через одно и два поколения? 6. Обсудите факторы, вносящие вклад в изменчивость по частоте аллелей самонесовместимости, приведенную на рисунке 4.9. Как можно оценить относительное значение всех этих факторов?
Задачи 7. От скрещивания А{А2 х А А2получено 40 особей с генотипом А}А{, 100 особей с генотипом А А2 и 45 - с генотипом Л2Л2 (численность до половой зрелости). Какова несмещенная оценка величин отно- сительной жизнеспособности двух гомозиготных генотипов? 8. Приведите численный пример изменения приспособленности в пространстве, обусловливающего устойчивый полиморфизм, причем такая же изменчивость во времени не обеспечивает ус- тойчивого полиморфизма (предположите, что имеется всего две среды обитания). Покажите, почему это происходит. 9. Допустим, что изменчивость приспособленности в пространстве одной среды обитания равна 1,0, 1,0 и 0,8, а в другой среде — 1,0, 1,0 и 1,2. Каков диапазон значений ср обеспечивающий ус- тойчивый полиморфизм? Изобразите графически равновесную аллельную частоту в этом диапазоне значений. 10. Предположим, что среда обитания изменяется во времени со сме- ной весеннего и зимнего поколений. Каковы равновесные ал- лельные частоты в этих средах обитания, если приспособлен- ность особей разных генотипов в весеннем поколении равна 1,0, 1,0 и 1,22, а в зимнем - 1,0 1,0 и 0,8? 11. Предложите эксперимент по исследованию селективных разли- чий, основанных на физических факторах среды, частоте мор- фологических форм и плотности популяции при заданном по- лиморфизме известной величины. 12. Почему оказалось, что полиморфизм, обусловленный изменчи- востью в пространстве, выражен лучше, чем полиморфизм, обус- ловленный изменчивостью во времени? 13. Примеры 4.2, 4.7 и 4.9 соответствуют модели балансирующего отбора. Возьмите один из этих примеров и предложите экспе- рименты по исследованию механизмов отбора. 14. Частоты аллелей в двух поколениях могут привести к псевдоча- стотно-зависимому отбору. Допустим, что значения относитель- ной приспособленности генотипов AfA , А{А2 и А2А2до отбора равны 0,9, 1,0 и 0,9, а = 0,1, 0,25 или 0,9 (исходно существуют соотношения Харди-Вайнберга). Для определения частот гено- типов до отбора используйте выражение 4.8b. Для поколений после отбора используйте величины, представленные в таблице 3.2. Объясните полученные результаты. 15. На примере 4.14 показано важное значение трансферрина в фор- мировании устойчивости к патогенам. Как можно детально ис- следовать его роль в эксперименте эмпирическими способами, чтобы определить, опосредовано ли преимущество гетерозигот трансферриновыми локусами?
ГЛАВА 5 ИНБРИДИНГ И СВЯЗАННЫЕ С НИМ ВОПРОСЫ Даун, 17 июля, 1870 Мой дорогой Лаббок, Знаю, что завтра состоится Перепись и сильно надеюсь, что Вы выразите свое мнение по поводу включения в анкету вопросов, касающихся близкородственных браков. Как Вам известно, я исследовал этот вопрос в течение ряда лет и убедился в существовании великого физиологического закона, очень важного для человече- ства. В Англии и во многих областях центральной Европы возражают против браков между кузенами из-за их предполагаемых вредных последствий, но это мнение не основано на прямых доказательствах. Таким образом, крайне желательно, чтобы оно было признано ложным, или же было подтверждено, поскольку в последнем случае можно считать браки между кузенами нецелесообразными.... Ваше мнение важно еще и потому, что могло бы подтвердить правдивость часто повторяющегося утверждения, что кровнородственные браки приводят к глухонемоте (глухоте и немоте), слепоте и т.д.; и все подобные утверждения можно легко проверить в результате одной единственной переписи. Примите уверения в моей искренности, Ваш Чарльз Дарвин По словам моей матери, вскоре после рождения, в колыбели, меня атаковали мура- вьи. Дело происходило в Каире, поэтому я предполагаю, что это были так называе- мые муравьи-фараоны, Monomorium pharaonis... эти крохотные желтые муравьи - известные сладкоежки, более того, в их гнездах отмечается беспорядочный инб- ридинг, включающий братьев и сестер. Уильям Гамильтон (1993) Популяции, в которых происходят случайные скрещивания, по-видимо- му, встречаются у большинства организмов. К исключениям относятся популяции растений с высокой степенью самоопыления и популяции некоторых беспозвоночных, например Hymenoptera (Перепончатокры- лых), у которых распространено скрещивание по типу брат - сестра, а также популяции растений и животных, которые могут размножаться бесполым путем (партеногенетически) и популяции людей со значитель- ной степенью кровного родства. Все эти варианты неслучайного скре- щивания долго занимали ученых и являются предметом интенсивного изучения до сих пор.
I. Инбридинг Сначала мы обсудим последствия инбридинга, а также представим ре- зультаты положительно-ассортативных скрещиваний и бесполого размно- жения. В общем, наибольшая степень инбридинга обнаруживается у рас- тений, где системы скрещивания можно разделить на три основные типа: преимущественное перекрестное опыление (ауткроссинг), смешанный тип - самоопыление и перекрестное опыление, а также преимущественное самоопыление. Только для преимущественно перекрестноопыляющихся видов применимы основные выводы для случайно скрещивающихся по- пуляций, и только в этом случае, когда действует отбор, наличие инбри- динга может привести к совершенно другим последствиям, чем отсут- ствие инбридинга. В конце главы мы представим введение в две смежные области. Во- первых, растения и некоторые животные могут размножаться бесполым путем или путем партеногенеза. Если в генотипе у потомства нет новых мутаций, то потомки имеют такой же генотип, как и родитель. В резуль- тате, частоты генотипов равны пропорциям Харди-Вайнберга (если дей- ствие других эволюционных факторов незначительно). Мы рассмотрим, как оценить пропорцию бесполого размножения и определить частоты генотипов в этом случае. Во-вторых, у насекомых, птиц, человека и дру- гих организмов наблюдаются неслучайные в отношении фенотипа скре- щивания. Некоторые из таких моделей скрещивания, например положи- тельно ассортативные скрещивания действуют только на частоты фенотипов, а не на частоты аллелей. Но большинство моделей скрещи- вания (см. главу 4), включает селективное скрещивание, которое может привести к изменению частот аллелей и появлению стабильного поли- морфизма или фиксации того или иного аллеля. I. Инбридинг Неслучайное в отношении фенотипа скрещивание происходит в популяци- ях, где скрещивающиеся особи находятся в большем или меньшем род- стве друг к другу. Такие скрещивания называются инбридингом в отли- чие от случайного аутбридинга. Ни инбридинг, ни аутбридинг, сами по себе, не приводят к изменению частот аллелей, но оба приводят к пере- распределению аллелей в генотипах. В инбредной популяции частота го- мозигот повышена, а частота гетерозигот понижена относительно соот- ношений Харди-Вайнберга. При аутбридинге наблюдается обратное соотношение: частота гетерозигот повышена, а гомозигот - понижена по сравнению с пропорциями при случайном скрещивании. Конечно, внут- ри популяции, не имеющей структуры, эффект перекрестного оплодот- ворения (аутбридинга) не может быть велик. Только когда особи пред-
8 Глава 5. Инбридинг и связанные с ним вопросы почтительно скрещиваются с особями из другой популяции (или субпо- пуляции) наблюдается значительное влияние перекрестного оплодотво- рения на частоты генотипов. Следует отметить несколько других общих закономерностей. Во-пер- вых, генотипические изменения, обусловленные инбридингом, проявля- ются во всех локусах генома. Заметьте, что на все локусы влияет генный поток, а отбор или мутация действуют только на единственный локус (или на тесно сцепленные с ним локусы). Во-вторых, влияние на частоты гено- типов может быть совершенно незначительным, если система скрещива- ния изменится. Например, высокая частота гомозигот, являющаяся резуль- татом самооплодотворения, может быть полностью уничтожена одним поколением случайного скрещивания. Наконец, инбридинг и генетичес- кий дрейф, в общем, сходно влияют на гетерозиготность, но результаты их действия различны. Инбридинг (в большой популяции) может привести к понижению гетерозиготности без изменения частот аллелей данного локу- са в популяции. С другой стороны, генетический дрейф может вызвать изменение частоты аллелей, но не приведет к понижению гетерозиготнос- ти в популяции. Только при рассмотрении усредненного влияния генети- ческого дрейфа на данный локус во многих популяциях, или на многие локусы в данной популяции, можно выявить зависимость уровня гетеро- зиготности от генетического дрейфа (см. главу 6). Сначала определим коэффициент инбридинга (/), как вероятность, что у какой-либо особи в данном локусе окажутся два аллеля, идентич- ные по происхождению, (ibd, или identical by descent). Это означает, что они являются точными копиями аллеля, который находился в генотипе одного из прародителей в предшествующем поколении. Для иллюстра- ции этой концепции представим, что у особи имеется два случайных аллеля из пула аллелей, доступных в популяции. После того, как выбран первый аллель, существует вероятность f что следующий выбранный гомологичный аллель, будет таким же, как и первый. Если вероятность, что первый аллель - это А{, равна р, а вероятность, что второй аллель - тоже А (идентичный по происхождению), равна/ то вероятность иметь оба аллеля А , идентичных по происхождению, составляет pf Однако, есть вероятность, что оба аллеля А неодинаковы по проис- хождению, хотя идентичны по структуре. Например, они могут быть идентичными как аллоферментные или микросателлитные варианты, или иметь идентичную нуклеотидную последовательность, но не происхо- дить при этом от одного исходного (предкового) аллеля. Эта вероятность равна /?2(1 -/), где р1 - вероятность последовательного выбора двух алле- лей Ах и (1 -/) - вероятность, что второй аллель не идентичен по проис- хождению первому. Таким образом, частота генотипа /4/( равна
I. Инбридинг 219 P=pf+p2(l-f) = = p2+fpq. Общая формула пропорций трех генотипов при уровне инбридинга f сле- дующая: P=p2+fpq, H=2pq-2fpq, (5.1) Q = q2 +fpq, (Wright, 1931), где первое слагаемое - пропорция Харди-Вайнберга, а вто- рое - отклонение от этой пропорции. Размер и знак коэффициента инбри- динга отражает отклонение частот генотипов от пропорций Харди-Вайн- берга таким образом, что, когда f = 0, частоты зигот соответствуют пропорциям Харди-Вайнберга, а, когда/> 0, наблюдается дефицит гете- розигот. Поскольку f- это вероятность, то ее значения лежат в пределах от 0 до 1. Если/= 1 (т.е. максимальная величина при инбридинге) то: Р=Р, Я= О, Q = q. И пропорции гомозигот в популяции соответствуют аллельным часто- там. Пропорции, данные в выражении 5.1, могут быть получены разными способами. Один из способов проследить эффект инбридинга - предста- вить, что часть популяции скрещивается случайно (1 -/), а другая часть - путем инбридинга (/). Поскольку частоты гетерозигот в этих двух частях равны 2pq и 0, то общая частота гетерозигот равна: Я=2^(1-/ + 0(/) = = ipq - zfpq- Сходным образом, частота генотипа А ! равна: P = p2(\-f)+pf= = р2 + fpq, потому что частота генотипов А А в инбредной части равна р. Выражение 5.1 для частоты гетерозигот может быть записано для/: / = 1- —. (5.2) ipq
Из этого равенства ясно, что f- функция отношения наблюдаемой гете- розиготности к гетерозиготности, рассчитанной по соотношению Хар- ди-Вайнберга, или ожидаемой (при отсутствии инбридинга). При инб- ридинге, Н < 2pq, поэтому f> 0. Для любого значения f частота аллеля остается той же. Поэтому, при подстановке частот генотипов, данных в выражении 5.1, в уравнение для подсчета частоты А , имеем р = Р + ±Н= = (Р2 + fP<l) + i(2pq~ Ifpq) = = p2 + pq = p, т.е. инбридинг действует только на частоты генотипов, а не на частоты аллелей. Инбридинг может оказывать значительное влияние на относительные частоты генотипов. Обычно редкие рецессивные генотипы становятся более частыми. Иллюстрирующие эту закономерность данные представ- лены на рисунке 5.1, где частота редких рецессивных заболеваний пока- зана для двоюродных сибсов (здесь f = ). Эти частоты следует срав- нить с пропорцией браков между двоюродными сибсами в общей популяции. Например, в Японии браки между двоюродными сибсами встречаются с частотой 0,05, но доля браков между двоюродными сибса- 1.0 0.8 - 0.6 - 0.4 - 0.2 - f 0.0 - “Европа Япония Рисунок 5.1. Частота браков между двоюродными сибсами среди индивидов, поражен- ных некоторыми наследственными болезнями, и частота таких браков в общей популяции в Европе и в Японии (по Bodmer and Cavalli-Sforza, 1976), (ФКУ - фенилкетонурия).
ми от которых имеются дети, пораженные альбинизмом, в десять раз выше (примерно 0,56). В Европе браки между двоюродными сибсами встреча- ются с частотой только 0,02, но среди них также в десять раз выше доля семей (0,2) с детьми, пораженными альбинизмом. Для генетического объяснения этих наблюдений мы можем изучить частоту рецессивных генетических заболеваний среди индивидов из кровнородственных браков. Инбридинг приводит к возрастанию часто- ты рецессивных гомозигот, что в свою очередь приводит к увеличению частоты заболевания. Сравним пропорцию рецессивных гомозигот для данного коэффициента инбридинга с пропорцией рецессивных го- мозигот в неинбредной популяции (Q = <?2). Отношение этих двух вели- чин равно: Qr _ + fPQ Q q1 = 1 + — , (5.3) q т.е. превышает 1 при любой частоте аллеля. Это отношение очень велико при низких аллельных частотах, что обычно наблюдается для рецессив- ных заболеваний и возрастает с уровнем инбридинга. В таблице 3.1 дано такое отношение для трех уровней инбридинга и нескольких аллельных частот. Например, когда f = (коэффициент инбридинга при браке меж- ду двоюродными сибсами) и q = 0,01, в инбредной группе наблюдают в семь раз больше пораженных индивидов, чем в группе, где браки заклю- чаются случайным образом (см. пример 5.1 о частых заболеваниях кожи в потомстве от близкородственных браков). ТАБЛИЦА 5.1. Отношение пропорции рецессивных гомозигот с данным коэффициентом инбридинга к пропорции рецессивных гомозигот, соответствующей равновесию Харди-Вай- нберга, для нескольких частот аллеля f 1 32 1 16 8 0,001 32,2 63,4 125,9 0,01 4,1 7,2 13,4 0,1 1,3 1,6 2,1 0,5 1,0 1,0 1,0
Пример 5.1. В изолированных человеческих популяциях часты близко- родственные браки вследствие ограниченного числа подходящих партне- ров. На рисунке 5.2 представлена одна из родословных изолированной островной популяции побережья Югославии (из работы Vogel, Motulsky, 1997). Разновидность ладонно-подошвенного кератоза (болезнь Mai de Meleda) - аутосомно-рецессивноое заболевание, характеризующееся утол- щением кожи на кистях (ладонях) и стопах. Действительно, аллели, при- водящие к заболеванию, в этой популяции, вероятно, происходят от од- ной мутации, а их высокая частота достигнута случайно, что обусловлено генетическим дрейфом (глава 6). В этой родословной два близкородствен- ных брака (между индивидами Ша и П1Ь и между индивидами IVa и IVb), обозначенных двойными линиями, соединяющими этих супругов. Двою- родные сибсы Ша и ШЬ должны быть гетерозиготами, потому что двое из их семерых детей поражены. Другой близкородственный брак между IVa (гетерозиготой), и гомозиготным больным IVb; двое из трех детей в этом браке поражены. Хотя это заболевание не встречается в других популя- циях, его распространенность в данной популяции приводит к резкому росту числа гетерозигот. II ill IV V Рисунок 5.2. Родословная с двумя близкородственными браками и высокой частотой ред- кого наследственного заболевания (по Vogel and Motulsky, 1997). Как принято в генетике человека, кружки и квадратики обозначают женщин и мужчин, соответственно. Закрашен- ные символы обозначают пораженных индивидов. Поколения представлены в нисходящем порядке и близкородственные браки отмечены двойными линиями. а. Самооплодотворение Наиболее крайним типом обнаруживаемого при половом размножении инбридинга является самооплодотворение. [У гомоспорных папоротни- ков и некоторых других близких организмов наблюдают еще более край- ний тип самооплодотворения, называемый внутригаметофитным опло-
дотворением, при котором образуются только гомозиготы, (Hedrick, 1987а)]. При полном самооплодотворении популяция разделяется на серии ли- ний, которые быстро становятся гомозиготными. Как показано в таблице 5.2, только при самооплодотворении существует три типа скрещивания, которые происходят в популяции с частотой, соответствующей относи- тельным пропорциям генотипов: Р}=Р0+±Н0, ^=}Н0, Q,=Qv + ^. Частота аллеля А в следующем поколении равна: = (ро+±но)+±но = =р0’ т.е. самооплодотворение не приводит к изменению частоты аллелей. Однако пропорции генотипов сильно изменяются. Отношение для ге- терозиготности в двух последовательных поколениях, в общем, следую- щее ^+1=|Я,, где Ht - гетерозиготность в поколении t. Эта рекуррентная (возвратная) зависимость может быть обобщена для любого числа поколений так, что Н,=&Н0 . (5-4) ТАБЛИЦА 5.2. Типы скрещиваний и частоты генотипов потомства при полном самоопло- дотворении Типы скрещиваний Частоты Потомство АЛ АЛ л2л2 А\А\* A\Ai Л - - АА х A<Ai М 7^о А7А2 х A./L, - - Qo Всего 1 Рй+\на 7Яо 2о+ Так как величина (у)' всегда меньше единицы и быстро стремится к нулю при возрастании t, то со временем гетерозиготность быстро умень-
шается и асимптотически стремится к нулю. Аналогично, частоты гомо- зигот равны: Р, =Р0 + ±[1-(±)']Н0, й=мнж. Если t возрастает, эти величины достигают значений: - ^0 + 2 Я0 — Ро ’ Qt = Qo + iHo = Яо ’ потому что значения в скобках достигают единицы. Таким образом, час- тоты гомозигот действительно становятся равны частотам соответствую- щих аллелей в исходном поколении. Это иллюстрирует рисунок 5.3, где Но = 0,5 и начальные пропорции соответствуют отношению Харди-Вай- нберга. Уровень гетерозиготности быстро снижается, достигая через шесть поколений значение менее 1%. Эти верно и в случае множественных ал- лелей (выражение 5.4 описывает снижение гетерозиготности, обуслов- ленной самооплодотворением, для любого числа аллелей), (Li, 1976). Рисунок 5.3. Изменение частот генотипов со временем при самооплодотворении, если исходное соотношение частот генотипов соответствует отношению Харди-Вайнберга, и р = q = 0,5. h. Частичное самооплодотворение У многих самооплодотворяющихся организмов наблюдают некоторую сте- пень случайного скрещивания (перекрестного оплодотворения). В таких
системах со смешанным типом скрещивания пропорции потомков, обра- зующихся в результате самооплодотворения, обозначают S, а оставшуюся пропорцию (7) составляют потомки, образующиеся в результате перекре- стного оплодотворения (5 + Т =1). Таким образом, чтобы определить частоты генотипов через одно поколение, можно суммировать частоты генотипов особей, образующихся в результате самооплодотворения и пе- рекрестного оплодотворения, как показано в таблице 5.3, тогда: /’=7>o2+S(Po+1/7o), Hx=2Tp0q0+ASH0, (5.5а) Qx=Tq2o+S{Qo+AHo), где первый член уравнения обозначает количество потомков, образую- щихся в результате перекрестного оплодотворения, а второй член - коли- чество потомков, образующихся в результате самооплодотворения. ТАБЛИЦА 5.3. Типы скрещиваний и частоты генотипов у потомства, если S- пропорция потомков от самооплодотворения, а Г- пропорция потомков от перекрестного оплодотво- рения Тип скрещивания Частота Потомство АА АЛ А2А2 Самооплодотворение (А) AtAx х АХАХ SP SP - - АА х АА SH Ash Ash aSh х Л/2 SQ - - SQ Перекрестное оплодотворение (Ауткроссинг) (Т) яд х яд ТР2 ТР2 АХАХ х АхА2 Т2РН ТРИ ТРН - АХАХ хАД T2PQ - T2PQ - АхА2 х АхА2 TH2 А TH2 A TH2 ^ТН2 хАА T2HQ - THQ THQ А2А2 х А2А2 TQ2 - - TQ2 Всего 1 Тр2 + S(P + AH) 2Tpq + jSH Tq2+S(Q + ±H) Еще можно показать, что частота аллеля А} в следующем поколении не изменяется и что
p,=/’+i//1 = = Tpl + 5(P0 +1Я0) + l(27po9o + |5Я0)= = Трй(рй + <?0) + S(P0 + |Я0) = Частоты генотипов изменяются со временем, но в отличие от случая пол- ного самооплодотворения, гетерозиготность не стремится к нулю асимп- тотически. При частичном самооплодотворении пропорция случайных скрещиваний (перекрестное оплодотворение) в популяции восстанавли- вает гетерозиготы каждое поколение, так что их частота не может быть снижена до нуля. В качестве иллюстрации на рисунке 5.4 даны измене- ния частот генотипов для примера с S = 0,9, q = 0,7 с исходными пропор- циями, соответствующими равновесию Харди-Вайнберга. Частоты всех этих трех генотипов изменяются достаточно быстро и достигают своих асимптотических величин в течение несколько поколений. Рисунок 5.4. Изменение частот генотипов со временем для примера частичного самооп- лодотворения (S=0,9) при пропорциях, исходно соответствующих равновесию Харди-Вай- нберга с q = 0,7. Эти асимптотические величины являются равновесными пропорциями инбридинга для данного уровня самооплодотворения и данной частоты аллеля. Равновесные пропорции можно получить из рекуррентных (воз- вратных) отношений, приведенных в выражении 5.5а. Во-первых, эти повторяющиеся отношения имеют силу для любой пары соседних поко- лений. Таким образом,
I. Инбридинг 227) Ht+{= 2Tpq + SHt, vj\q индексы частот аллелей отсутствуют, так как изменений частоты ал- леля не происходит. При равновесии гетерозиготность не изменяется, поэтому Н = Не Таким образом, полагая Н = Н,- Не, где Не - это равновесная гетерозиготность, находим: H=2Tpq + ±SH = -ipqQ-S) 2-S ’ Можно применить тот же подход для определения частоты гомозиготы AtAt. Для этого подставим равновесную гетерозиготность из выражения, данного выше Ре=7р2+$(Ре+±Не) = „ 2 г. г. 1 of 4оо(1- 5) А 2 Ярд = Тр2 + SPe +±S ----- =р2 + 4 [ 2-S ) 2-5- Так же можно рассчитать частоту генотипа А^, тогда равновесные про- порции инбридинга следующие: -р‘+ *2- 2-5’ W1-5) 2-5 (5.5b) 2-S После ряда поколений (вне зависимости от исходных пропорций), про- порции генотипов достигают своих равновесных величин (что указывает на стабильность равновесия) согласно частотам аллелей и пропорции са- мооплодотворения. Например, конечные частоты генотипов, показанные на рисунке 5.4, равны 0,262, 0,076 и 0,662 для генотипов А^, AfA2 и А^А2, соответственно. Для иллюстрации влияния S на гетерозиготность, на рисунке 5.5 пред- ставлены равновесные пропорции гетерозигот при разном уровне само- оплодотворения. Заметьте, что при 5 = 0 гетерозиготность соответствует гетерозиготности при соотношении Харди-Вайнберга, при 5 = 1 гетеро- зиготность равна нулю. Действительно, наибольшее понижение пропор- ции гетерозигот наблюдается при высоких значениях 5.
Рисунок 5.5. Равновесная частота гетерозигот при разных уровнях частичного самоопло- дотворения и трех различных частотах аллелей. Рекуррентные (возвратные) отношения для величины инбридинга, обус- ловленного полным и частичным самооплодотворением, также можно ис- пользовать при описании изменений частот генотипов. Рекуррентное от- ношение для полного самооплодотворения следующее: и из этого следует вывод: /,=1-(1)'(1-/о)- (5.6а) Поскольку t становится большим, то ожидаемый коэффициент инбри- динга достигает единицы. При частичном самооплодотворении имеем: (5.6b) При возрастании t это выражение достигает равновесной величины Л s 2-5’ (5.6с) а при перекрестном оплодотворении: 1-Г 1 + Т’ (5.6d)
с. Оценки перекрестного оплодотворения и самооплодотворения Для оценки величины перекрестного оплодотворения и самооплодотво- рения используют два основных подхода: прямой, при котором иденти- фицируют отдельных потомков от перекрестного оплодотворения, и не- прямой (косвенный), при котором предполагают, что наблюдаемые пропорции генотипов находятся в равновесных пропорциях инбридинга. Эти подходы дали бы одинаковые оценки перекрестного оплодотворе- ния, если бы пропорции перекрестного оплодотворения были постоянны в течение нескольких поколений (для достижения равновесных пропор- ций инбридинга достаточно времени) и если действие отбора, потока генов и генетического дрейфа на частоты генотипов в недавних поколе- ниях не очень велико. Так как все эти факторы эволюции могут воздей- ствовать на частоты генотипов, при измерении оценки эффекта инбри- динга у частично самооплодотворяющихся организмов обычно используют индекс фиксации F. Если бы пропорции генотипов определялись только системой скрещиваний, то и прямая, и косвенная оценки индекса фикса- ции равнялись бы коэффициенту инбридинга. Для прямого определения степени перекрестного оплодотворения, обычно необходимо знать генотипы родителей матери (отцовский гено- тип обычно не известен) и потомства. Пропорции типов потомков, ожи- даемых от гомозиготного родителя матери, имеющего генотип Л Л. приве- дены в таблице 5.4а, гдер. ир,- частоты аллелей А.иА (или всех других аллелей кроме А) в пуле мужских гамет. В этой ситуации возможны два типа потомков от гомозиготных материнских генотипов. При частоте ал- леля Ав пуле мужских гамет, равной р, наблюдаемая пропорция гетеро- зиготного потомства составит: Н=ТР]. Это выражение можно преобразовать для получения степени перекрест- ного оплодотворения Т =— Pi Если из N общего числа потомков N составляют гетерозиготы, то сте- пень перекрестного оплодотворения равна: PjN (5.7а)
ТАБЛИЦА 5.4. Пропорции генотипов потомков, ожидаемые исходя из гомозиготного ма- теринского генотипа А А. (а) и гетерозиготного материнского генотипа А А, (Ь), когда про- порции скрещиваний S и Т - результат самооплодотворения или перекрестного оплодот- ворения, соответственно Частота скрещиваний Генотипы потомков АА. 1 1 АА. > j АА J J Другие (Н*) (а) S S - - - Т Тр. Тр, - - (Ь) S 7s — S 2 S 7s т -1ТР. \т(р. + р) 2^7 ТХУ-р-р) и S = 1 - f. Если локусы сильно вариабельны, (например, микросателли- ты) то гетерозиготная мать гораздо информативнее гомозиготной (Viard et al., 1997а), и наблюдаются четыре категории потомков (таблица 5.4b). В этом случае простая оценка степени перекрестного оплодотворения равна: ^-р,-р/ (5‘ где И* включает всех гетерозиготных потомков кроме потомков с геноти- пом АА. Используя отношение, данное в выражении 5.6d с оценкой перекрест- ного оплодотворения из выражения 5.7а, можно оценить индекс фикса- ции F: \-Т (5'7С) где индекс D обозначает прямую оценку. Если в популяции существует равновесный инбридинг и происходит частичное оплодотворение, то для оценки индекса фиксации можно ис- пользовать непрямой (косвенный) метод. Величину равновесия можно оценить, используя отношение из выражения 5.2 только для значений наблюдаемой гетерозиготности и гетерозиготности, соответствующей соотношению Харди-Вайнберга, так что
I. Инбридинг A=i- Н 2pq (5-8) Индекс фиксации оценен для ряда видов и прямым, и косвенным спо- собами (Brown, 1979). Виды можно разделить на преимущественно пере- крестно оплодотворяющиеся (аутбредные) и преимущественно самооп- лодотворяющиеся (инбредные). Для аутбредных видов косвенная оценка индекса фиксации чаще выше, чем прямая оценка (например, у флокса Phlox drummondii), а для инбредных видов прямая оценка чаще ниже (как у дикого овса, в примере 5.2). Другими словами, у аутбредов меньше гетерозигот, чем следовало ожидать из прямой оценки перекрестного оп- лодотворения, в то время как у инбредов больше гетерозигот, чем ожида- ется из прямой оценки (Brown, 1979). Внутри популяции пропорция самооплодотворения может варьировать из-за ряда генетических или средовых факторов (Clegg, 1980). Например, оценочный уровень перекрестного оплодотворения может варьировать вследствие генетических различий среди семей или даже между различ- ными локусами, выявляя возможные различия отбора в одной и той же популяции. К тому же, экологические факторы (плотность популяции, активность опылителя и влажность) могут влиять на степень перекрест- ного оплодотворения. Пример 5.3 представляет исследование индуциро- ванных окружающей средой вариаций самооплодотворения в различное время и в разных местах обитания улитки с высокой степенью самоопло- дотворения. Пример 5.2. Дикий овес был завезен в Калифорнию из Средиземноморья в 1700-х годах, а теперь известен тем, что из него получают пищевой краситель. Джейн и Маршалл (Jain and Marshall, 1967) обследовали ряд калифорнийских популяций двух видов дикого овса, Avena fatua и A.barbata, по видимым генетическим полиморфизмам. Действительно все популяции A.barbata были мономорфны, тогда как популяции A. fatua - высоко полиморфны. Пример из полученных ими данных представлен в таблице 5.5 для двух локусов: один определяет черную (ВВ или ВЬ) или серую (bb) окраску цветковых чешуй, а другой - опушенные (LsLs или Lsls) или неопушенные (Isis) листовые влагалища. Три участка, данные в таблице 5.5, отобраны в зависимости от преобладающего вида: преиму- щественно A. fatua (участок 1), смешанное произрастание (участок 2) и преимущественно A.barbata (участок 3). Оценки частот рецессивных ал- лелей и индексы фиксации варьируют между участками, но совпадают по локусам внутри участка. Однако, прямые оценки перекрестного опло-
Глава 5. Инбридинг и связанные с ним вопросы дотворения для A.fatua в интервале между 0,02 и 0,05, что дает величину Fd - 0,9 до 0,96 - гораздо выше, чем наблюдаемый на участке 1 индекс фиксации, определенный косвенным методом. На участке произрастания A. fatua частоты генотипов, по-видимому, зависят не только от системы оплодотворения, но и от других факторов (см. Brown, 1979). ТАБЛИЦА 5.5. Частоты генотипов, оценки частот рецессивного аллеля и косвенная оцен- ка индекса фиксации для двух локусов на трех участках произрастания дикого овса, A.fatua (Jain and Marshall, 1967). Участок 1 Участок 2 Участок 3 Частоты генотипов Частоты генотипов Частоты генотипов вв 0,712 0,548 0,667 вь 0,138 4=0,219 0,071 4=0,417 0,060 4=0,303 ьь 0,150 F, =0,597 0,381 #,=0,854 0,273 #,=0,858 LsLs 0,775 0,571 0,291 Lsls 0,125 q =0,162 0,071 4=0,395 0,064 4=0,677 Isis 0,100 F, =0,539 0,358 F, =0,851 0,645 #,=0,853 Дополнительно к генетическим факторам и факторам окружающей сре- ды существует также статистическая вариация в оценке (даже если ис- тинной вариации при самооплодотворении у растений нет). На рисунке 5.6 показаны результаты, полученные Ритландом и Гандерсом (Ritland and Ganders, 1985) при исследовании вариаций степени перекрестного оплодотворения между семьями (потомками одного растения) Bidens menziesii на Гавайях. Гистограмма показывает действительные оценки, а закрашенные кружки - распределение, ожидаемое, исходя из случайнос- ти оплодотворения. Заметьте, что две популяции сильно отличаются по степени перекрестного оплодотворения: у растений из популяции Puu Kooke перекрестное оплодотворение очень редкое, а у большинства рас- тений из популяции Akumoa наблюдается перекрестное оплодотворение. Во-вторых, наблюдаемое различие между растениями популяции Puu Kooke незначительно выше, чем ожидаемое, тогда как в выборке из Akumoa наблюдаемые различия в оценках существенно выше ожидаемых. По-ви- димому, эта дополнительная наблюдаемая вариация является результатом пространственной вариации аллельных частот и степени самооплодотво- рения.
Пример 5.3. Высокая степень самооплодотворения характерна, прежде всего, для популяций растений. Однако было показано, что для некото- рых улиток и слизней также характерна высокая степень самооплодотво- рения. Viard et al. (1997b) оценили степень самооплодотворения у тропи- ческой пресноводной улитки, Bulinus truncatus, обитающей в Нигере, используя четыре высоко полиморфных микросателлитных локуса. Вы- борки проводились в разных местах обитания и в разное время. Таблица 5.6. представляет средние наблюдаемые и ожидаемые гетерозиготности в пяти популяциях с большими размерами выборок из трех типов мест оби- тания в течение года, так как длина поколения довольно коротка - от выборки 2/94 до 1/95 прошло четыре-пять поколений, а от выборки 1/95 до 2/95 - одно поколение. ТАБЛИЦА 5.6. Наблюдаемые и ожидаемые гетерозиготности для четырех микроса- теллитных локусов и оценки степени самооплодотворения в пяти популяциях самоопло- дотворяющейся улитки Bulinus truncatus (Viard et al., 1997b). Выборки в популяциях про- водились в три разные периода из постоянного (Р), вариабельного (SP) и временного (Т) мест обитания Популяция места Тип обитания Время проведения выборки 2/94 1/95 2/95 НЕ S "о S "о НЕ S S Boyze 1 Р 0,08 0,24 0,82 0,03 0,21 0,92 0,04 0,22 0,91 0,88 Тега R Р 0,01 0,40 0,98 0,02 0,55 0,98 0,09 0,64 0,92 0,96 Namanga W SP 0,01 0,67 0,99 0,09 0,50 0,91 0,01 0,36 0,98 0,96 Mari Sud SP 0,18 0,65 0,84 0,14 0,66 0,88 0,14 0,74 0,90 0,87 Bala т 0,00 0,21 1,00 0,01 0,21 0,98 0,01 0,20 0,92 0,97 Средняя 0,06 0,43 0,93 0,06 0,43 0,93 0,06 0,43 0,93 0,93 Во весь период проведения выборок и во всех популяциях средняя наблюдаемая гетерозиготность довольно низкая (0,06), а средняя ожи- даемая гетерозиготность при случайном скрещивании равна 0,43. Об- щая оценка степени самооплодотворения равна 0,93, S = 2Fl/(\ + F;) и не зависит ни от времени взятия выборок, ни от места обитания. Сход- ство в степенях самооплодотворения между разными местами обитания очевидно связано с интенсивным передвижением особей между места- ми обитания.
Инбридинг и связанные с ним вопросы Рисунок 5.6. Изменения степени перекрестного оплодотворения между растениями в двух гавайских популяциях Bidenz menziesii (Ritland and Ganders, 1985). Гистограмма и закра- шенные кружки показывают наблюдаемую и ожидаемую степень перекрестного оплодо- творения, соответственно. d. Регулярные системы инбридинга Как мы видели, при полном самооплодотворении гетерозиготность сни- жается со временем очень быстро. У организмов, для которых полное самооплодотворение невозможно, наиболее крайней формой инбридин- га является скрещивание между полными сибсами (брат-сестра, см. ри- сунок 5.7а). При создании высоко гомозиготных линий животных для тестирования эффективности лекарственных препаратов и других хими- ческих веществ, линии мышей и крыс поддерживают в течение многих поколений путем скрещивания между собой полных сибсов. Некоторые линии D. melanogaster поддерживают, скрещивая полных сибсов на протяжении сотен поколений, что делает теоретическое прав- доподобие гетерозиготности в любом локусе довольно малым. Скрещивание между полными сибсами снижает гетерозиготность до- статочно быстро, но не так быстро, как полное самооплодотворение. Дей- ствие на гетерозиготность продолжительного скрещивания между пол- ными сибсами можно определить из следующих отношений: Я(+2=±Я,+1+1Я„
Поколение t f+1 t+2 t+3 (a) Рисунок 5.7. Родословные, демонстрирующие системы регулярного скрещивания между сибсами (а) и двойными двоюродными сибсами (Ь). Кружки и квадратики обозначают жен- ских и мужских особей, соответственно, а стрелки обозначают взаимосвязь родитель-по- томок. Индивиды в поколении t не считаются родственниками. где Н - это гетерозиготность в /-ом поколении. Такое продолжительное скрещивание между полными сибсами в действительности сходно со скре- щиванием внутри закрытой (изолированной) популяции из двух индиви- дов, самооплодотворение у которых невозможно. Если исходная гетеро- зиготность Но = 1 (ни один аллель не идентичен по происхождению), то = 1, Я2= 0,75, Я3 = 0,625, Я4 = 0,5, Н5 = 0,406 и т.д. Эти частоты соответствуют дробям 1/1, 2/2, 3/4, 5/8, 8/16, 13/32 и т.д. Интересно, что знаменатель в этих дробях удваивается каждое поколение, а числитель определен из ряда Фибоначчи, так что каждое число этого ряда - сумма двух предыдущих чисел (Crow, 1986). Рекуррентное (возвратное) отношение для коэффициента инбридинга при продолжительном скрещивании между полными сибсами равно: Z+2 = где/^ коэффициент инбридинга в Лом поколении. Коэффициенты инбри- динга являются дополнениями гетерозиготностей в данном поколении; так что f = \ - Н. Позже мы рассмотрим, как определить коэффициент инбридинга для этого случая, исходя из родословной. Другая регулярная система скрещивания называется системой скре- щивания между двойными двоюродными сибсами (см. родословную на рисунке 5.7b). В этой схеме скрещиваются индивиды, являющиеся двою- родными сибсами с двух сторон. Другими словами, все четыре прароди- теля у них общие. Влияние системы скрещивания на гетерозиготность в этом случае описывается уравнением: Я,+3Ч^+7^+^-
Эта схема скрещивания идентична той, которая была бы в популяции из четырех индивидов, если исключить скрещивание между сибсами и самооплодотворение. Возвратное отношение для коэффициента инбридинга равно: ft+3 = | + 2 Л+2 + 4 Л+1 + %ft Эти и другие регулярные системы скрещивания обсуждаются Кроу и Ки- мурой (Crow, Kimura, 1970) и Ли (Li, 1976). Сравнение темпа снижения гетерозиготности с HQ = 1 для полного самооплодотворения, результаты скрещивания между полными сибсами и скрещивания между двойными двоюродными сибсами представлены на рисунке 5.8. Считается, что исходные родители не родственны и гете- розиготность уменьшается с задержкой на одно и два поколения при скре- щивании между полными сибсами и двойными двоюродными сибсами, соответственно. Для всех этих систем скрещивания гетерозиготность со временем приближается к нулю, хотя и в довольно разном темпе. Имейте в виду, что гетерозиготность в модели полного самооплодотворения умень- шается в два раза в каждом поколении. Гетерозиготность при скрещива- нии между полными сибсами уменьшается медленнее, а при скрещива- нии между двойными двоюродными сибсами - еще медленнее. Для определения асимптотического темпа снижения гетерозиготности предположим, что соотношение между гетерозиготностью в разных по- колениях равно: Рисунок 5.8. Потеря гетерозиготности со временем в трех системах скрещивания (по Crow, Kimura, 1970).
I. Инбридинг 237 (5.9) где Л - это характеристика темпа снижения гетерозиготности или про- порция остаточной гетерозиготности через одно поколение. При самооп- лодотворении Л = 0,5 потому что в каждом поколении остается только 50% гетерозиготности. При продолжительных скрещиваниях между пол- ными сибсами это отношение равно: j_ 1 2 + 4Л или в квадратичной форме: Положительным корнем этого выражения будет Л - 0,809 - пропорция остаточной гетерозиготности каждого поколения при продолжительном скрещивании между полными сибсами. При продолжительном скрещи- вании между двойными двоюродными сибсами асимптотическая величи- на Л = 0,920 на каждое поколение. Эти темпы потери гетерозиготности ниже, чем для популяций численностью 2 и 4, соответственно (см. стр. 279-280), потому что чистое самооплодотворение и самооплодотворение со скрещиванием между сибсами не допускаются. Эриксон с сотрудни- ками (Erikkson et al., 1976) обнаружили, что две линии крыс, инбридинг у которых поддерживался продолжительным скрещиванием полных сиб- сов в течение почти 100 поколений, все еще остаются гетерозиготными по нескольким локусам, что совершенно противоречит теоретическим предсказаниям (0,809100 - что очень малая величина). Действительно, ге- терозиготность в инбредных линиях такая же, как у аутбредных крыс (это предполагает наличие другого фактора, обусловливающего инбридинг в этих инбредных линиях). е. Другие уровни частичного инбридинга В природных популяциях двуполых организмов может быть смешанная система скрещивания между близкими родственниками и неродствен- ными индивидами. Например, имеется определенная доля скрещива- ний между полными сибсами, а остальная доля - между неродственны- ми индивидами. По аналогии с ранее рассмотренным частичным самооплодотворением можно было бы ожидать возрастание гомозигот- ности до равновесного уровня инбридинга, определенного пропорцией скрещиваний между полными сибсами. Равновесный уровень инбри- динга равен:
°2 4-3S2 ’ где S2 - пропорция скрещиваний между полными сибсами (первый уро- вень инбридинга у перекрестно оплодотворяющихся организмов). Если степень инбридинга равна j (Hedrick, Cockerham, 1986), то равновесный уровень инбридинга равен: 2j ~(2J ’ (5.10а) а равновесная гетерозиготность равна: H = 2pq 1-(1-(1/2^))Уу (5.10b) На рисунке 5.9 показана равновесная гетерозиготность в случайно скре- щивающейся популяции при различных уровнях частичного инбридин- га. Очевидно, что чем более близкородственные скрещивания и чем выше пропорция инбридинга, тем значительней потеря гетерозиготности. На- пример, доля самооплодотворения, равная 0,25, понижает гетерозигот- ность на 16%, тогда как такая доля скрещиваний между двоюродными сибсами понижает гетерозиготность только на 2%. Если такая потеря ге- терозиготности, сравнима с пропорциями, соответствующими равнове- Уровень инбридинга Рисунок 5.9. Равновесная гетерозиготность относительно обнаруживаемой гетерозигот- ности в случайно скрещивающейся популяции для четырех различных уровней частичного инбридинга (5, - частичное самооплодотворение; S, - частичное скрещивание между пол- ными сибсами; у - частичное скрещивание между полусибсами; и S4 - частичное скрещи- вание между двоюродными сибсами).
сию Харди-Вайнберга, то можно подсчитать пропорции различных ти- пов скрещивания, объясняющие дефицит гетерозигот. f Оценка инбридинга из родословных Как говорилось выше, коэффициент инбридинга (/) - это вероятность идентичности по происхождению (ibd, подразумевается, что гомозигот- ность - результат того, что два аллеля индивида, произошли от одного предкового аллеля). Вероятность ibd варьирует в зависимости от степени родства родителей изучаемого индивида. Например, если родители не являются родственниками, то индивид не может быть гомозиготным по происхождению. Другой крайний случай наблюдается при половом раз- множении без учета внутригаметофитного самооплодотворения, если оба родителя - это один и тот же самооплодотворяющийся организм. Тогда вероятность наличия у потомства аллелей ibd, равна 0,5. Предположим, что родитель гетерозиготен и его генотип А А . Тогда половина потомков с генотипами и АуА,, будет иметь аллели ibd. Мы можем получить коэффициент инбридинга f из родословной, в которой происходит скре- щивание между родственными особями, вычисляя вероятность ibd. Ниже дан пример вероятностных значений и обсуждается метод расчета цепи. На рисунке 5.10а дана родословная, где два полудвоюродных сибса (индивида, имеющих одного общего прародителя), X и Y, скрещиваются, Рисунок 5.10. Родословные при скрещивании между полудвоюродными сибсами (а) и при браке между двоюродными дядей (тетей) и племянницей (племянником) (Ь). Ромбы обо- значают индивидов независимо от пола, СА - общий предок, а 1 /2 — вероятность сегрегации аллелей между поколениями.
G40 Глава 5. Инбридинг и связанные с ним вопросы давая инбредного потомка, Z. Все неродственные индивиды исключены из родословной, так как они не вносят вклад в коэффициент инбридинга. Родители Z имеют общего предка, обозначенного СА (в данном случае, либо дедушку, либо бабушку), с генотипом А{А . Для вычисления коэф- фициента инбридинга нужно знать вероятность наличия у Z либо гено- типа А{Ар либо А.А2, (т.е. обладает ли он двумя аллелями ibd). Генотип А^АХ возможен, если оба родителя (X и Y) передадут Z гаметы с аллелем А\. Вероятность этого события равна вероятности передачи аллеля Ах че- рез три поколения от обоих родителей, или: Рг(А1отХ) = (1)({)(|)=|, Pr(A, otY) = (1)(1)(})4, где | - это вероятность сегрегации аллеля между поколениями - напри- мер, вероятность того, что Ах будет передан от СА к V, от V к X или от X к Z. Так как аллель А{ должен быть передан Z от двух родителей, вероят- ность идентичности по происхождению для аллеля А является произве- дением индивидуальных вероятностей: Рг (Л,Л, в Z) = [Рг (Я, от Х)][Рг (А1 от Y)] = £. Подобным образом, вероятность ibd для аллеля Л 2 равна: Рг (A^2 в Z) = [Рг (Л2 от Х)][Рг (Л2 от Y)] = X. Тогда общая вероятность ibd (коэффициент инбридинга) у индивида Z равен: /= Рг (Л/,) + Рг (Л^) = - 64 + 64 ~ 32 ’ Можно использовать тот же подход для расчета коэффициента инбри- динга при скрещивании между полными сибсами. Предположим, что каж- дый аллель у исходных родителей можно идентифицировать. Тогда роди- тельские генотипы можно представить, как Л(Л2 и Л3Л4, (показано на верхней строке таблицы 5.7). Так как предполагается, что родители гете- розиготны (не имеют аллелей ibd), то их коэффициент инбридинга равен 0,0. Все их потомки - гетерозиготы (не ibd), поэтому коэффициент инб- ридинга в первом поколении также равен 0,0. Однако, во втором поколе- нии имеется вероятность, что аллели этих индивидов будут ibd. Это по- казано на схеме скрещивания 4x4 внизу таблицы 5.7. Вероятность наличия ibd у индивида с генотипом А^, составляет-г (сумма четырех верхних скрещиваний слева). Вероятности наличия ibd для каждого из
I. Инбридинг ТАБЛИЦА 5.7. Генотипы, идентичные по происхождению и полученные в течение двух поколений скрещивания (браков) между полными сибсами, где все исходные родительские аллели (поколение 0) различны Поколение 0 А, А 2 х А 3А 4 Поколение! А,А„ ±-А,Ал, -у Л, Ал, ±-А, А, 4 1 3’ 4 1 4’ 4 2 4’ 4 2 4 Поколение 2 Самцы ТАА ±А,А, 4 1 4 4 А А — Л, Ал 4 2 4 1 АЛ, л, 64 1 ' АЛ, Л 64 АЛ Л 64 - 1 64 А3 А3 7АА АЛ, Л 64 1 АЛ, Л, 64 - АЛ л 64 4 4 Самки АЛ Л 64 4 4 4 А А АЛ3 Л 64 - ал л2 64 ал2л2 64 а А А 64 3 3 7АА - АЛ, л, 64 4 4 ал2 л2 64 ал л2 64 АЛ, Л, 64 4 4 генотипов А^А2, А^А3 и Л4Л4 также равны-j^. Таким образом, общая веро- ятность ibd (коэффициент инбридинга для одного поколения скрещива- ний между полными сибсами) равна сумме этих вероятностей, или j. g. Метод расчета цепи Расчет цепи - это прямой способ, часто используемый для вычисления коэффициента инбридинга. Цепь для данного общего предка начинается с одного родителя инбредного индивида, поднимается до общего предка и возвращается вниз к другому родителю. Например, на рисунке 5.10а цепь представляет собой X-V-CA-W-Y. Численность индивидов в цепи (А/) можно использовать для определения ожидаемого коэффициента ин- бридинга, обусловленного наличием общего предка, так что г (1 Т f= 2 • (5Л1а) 16 — 7660
Глава 5. Инбридинг и связанные с ним вопросы На рисунке 5.10 цепь для родословной включает пять индивидов, поэто- му ,/=yj , что согласуется с предыдущим результатом. Если имеется более одного общего предка, тогда коэффициент инбридинга вычисляют как сумму величин f для разных цепей, или т , У*, т /1 \ / = ХЫ ’ (5Л1Ь) где т - количество общих предков и N. - количество индивидов в цепи i. Это выражение используют для вычисления f при браках между двою- родными дядей (тетей) и племянницей (племянником), X и Y на рисунке 5.10b (имеется дополнительное поколение в одной линии возрастов срав- нительно с нормальным скрещиванием двоюродных сибсов). В этом слу- чае существует два общих предка, СА! и СА2, имеющих шестизвенные цепи X-V-CA^U-W-Y и X-V-CA2-U-W-Y, соответственно, так что /=О6+(|)6=^. Когда общий предок инбреден, коэффициент инбридинга можно вы- вести из формулы: т , У*, m I 1 \ / = (1 + ЛА>)> (5-Ис) где fcAM- коэффициент инбридинга г-того общего предка, (см. пример 5.4 для родословной с одним инбредным общим предком.) При вычисле- нии коэффициента инбридинга для сложных родословных важно обнару- жить все цепи для общего предка. При проверке правильности всех це- пей, удостоверьтесь, что данный индивид представлен в цепи только один раз и что цепь всегда спускается от общего предка к родителю. Для слож- ных родословных, очень полезен подход, предложенный Баллоу (Ballou, 1983), а для систематического определения всех родственных связей час- то требуется специальная компьютерная программа (Lacy, 1994). Пример 5.4. При выведении пород собак, лошадей и других животных часто наблюдают сложные примеры инбридинга. В популяциях исчезаю- щих видов, под держивающихся в неволе, имеются довольно сложные ро- дословные (Hedrick et al., 1997). Для примера можно обратиться к родос- ловной из природной популяции большой синицы (см. van Noordwijk, Scharloo,1981). На рисунке 5.11 показана гипотетическая родословная с несколькими общими предками, один из которых инбреден. В таблице 5.8 дается список общих предков и цепей, соединяющих двух родителей. Если В - общий предок, то возможны два пути появления инбридинга: аллели могут передаваться от В к родителю Y через Е и L, либо через Е, J
I. Инбридинг Рисунок 5.11. Гипотетическая родословная со сложной историей инбридинга. и М. В результате В можно будет рассматривать как общего предка дваж- ды, что показано в таблице 5.8. Если у всех общих предков коэффициент инбридинга равен 0,0 (кроме общего предка Н, который является инбред- ным, поскольку его родители С и D - полусибсы), то можно подсчитать количество индивидов в цепи (их три), что дает коэффициент инбридин- га у Н, равный (у)3 = 0,125. Вклад каждого общего предка в коэффици- ент инбридинга дан в последней колонке таблицы 5.8. Суммируя, нахо- дим ожидаемый общий коэффициент инбридинга для Z, равный 0,0509. При организации работы по генетическому сохранению искусственно поддерживаемых популяций исчезающих видов в равной степени важно поддерживать генетическое разнообразие, избегать инбридинга и содер- ТАБЛИЦА 5.8. Общие предки и их цепи, коэффициенты инбридинга и вклад каждого об- щего предка в коэффициент инбридинга для Z (см. рисунок 5.11) Общий предок Цепь А. fcAM Вклад в f А X-K-G-C-A-D-H-L-Y 9 0,0 (|)9 =0,0020 В X-K-H-D-B-E-J-M-Y 8 0,0 (у)9 =0,0020 В X-K.-H-D-B-E-L-Y 8 0,0 (у)8=0,0039 С X-K-G-C-H-L-Y 7 0,0 (у)7 =0,0078 н X-K-H-L-Y 5 0,125 (|)5( 1,125) = 0,0352 /=0,0509 16*
G44 Глава 5. Инбридинг и связанные с ним вопросы жать представительное число основателей (производителей), (Ballou et al., 1995). Один из способов достижения этих целей - минимизировать средний коэффициент родства в популяции. Коэффициент подобия (kinship coefficient) между двумя индивидами определяется как вероят- ность того, что случайно выбранные у них аллели, идентичны по проис- хождению (Falconer, Mackay, 1996) и равны коэффициенту инбридинга их потомков. Генетически важные индивиды имеют наименьшее среднее родство ( средний коэффициент родства между данным индивидом и все- ми живыми индивидами в популяции), (Ballou, Lacy, 1995). Их можно скрестить с другими генетически важными индивидами, не являющими- ся близкими родственниками. Наиболее обычные типы браков между родственниками у человека - между дядей и племянницей (/’=|), двоюродными братом и сестрой (f=-^-), двоюродными дядей (тетей) и племянницей (племянником) (f=~^) и троюродными братом и сестрой (/ = 7). В популяции с различными типами межродственных браков средний уровень инбридинга можно вы- числить следующим образом: 7 = 2>Л (5.12а) где Xj - пропорция популяции с определенным типом скрещивания (бра- ка) и с коэффициентом инбридинга fj. Средний коэффициент инбри- динга для тех же данных можно вывести из формулы: У>,/2' <5Л2Ь> где %! - пропорция самооплодотворения, х2 - пропорция браков между родственниками первой степени родства (полными сибсами и родителя- ми с потомками) и т.д. (Hedrick, Cockerham, 1986). Данные из четырех выборок с относительно высоким инбридингом приведены в таблице 5.9. Наиболее частый тип близкородственных браков - это браки между дво- юродными сибсами; например, в индийской популяции такие браки со- ставляют одну треть от всех браков. В этой выборке средний коэффици- ент инбридинга самый высокий и равен 0,0324, а уровень равновесного инбридинга еще выше: 0, 0533 (Hedrick, 1986а). Для Х-сцепленных генов и генов у гапло-диплоидных организмов тех- нику расчета цепей, с некоторыми модификациями, можно использовать при вычислении коэффициента инбридинга. Во-первых, коэффициент инбридинга не значим у организмов, имеющих только один аллель в дан- ном локусе. Следовательно, его нельзя определить у гапло-диплоидного самца или для Х-сцепленного гена у мужских особей (имейте в виду, что
ТАБЛИЦА 5.9. Пропорции различных типов браков, средний коэффициент инбридинга и равновесный инбридинг в выборках из четырех стран с относительно высоким инбридин- гом (Cavalli-Sforza, Bodmer, 1971) Страна Кол-во браков Пропорции браков Л Дядя-племянница Тетя-племянник Двоюродные сибсы Двоюродные Дядя—племянница Тетя-племянник Троюродные f сибсы Индия 6945 0,0923 0,3330 - 0,0324 0,0533 Гвинея 739 - 0,1908 0,0054 0,0622 0,0131 0,0173 Япония 152790 - 0,0615 0,0133 0,0228 0,0046 0,0051 Бразилия 212090 0,0006 0,0263 0,0081 0,0132 0,0022 0,0023 у птиц и ящериц самки - это гетерогаметный пол, а самцы - гомогамет- ный пол, поэтому принципы расчета для полов обратные). Во-вторых, поскольку самцы гапло-диплоидные организмов получают все Х-сцеп- ленные гены от матерей, вероятность передачи генов от матери к сыну равна единице. В результате, самцов можно исключить из цепи и подсчи- тывать только самок. Наконец, при сцеплении «от самца к самцу», цепь наследственности разрывается, так как сын не получает генов от отца, и результирующий коэффициент инбридинга равен нулю. Вследствие это- го коэффициент инбридинга может быть высоким или равняться нулю, в зависимости от чередования полов в родословной и совершенно отли- чаться от коэффициента инбридинга по аутосомным генам. Чтобы объединить эти различия, формулу расчета цепи для Х-сцеп- ленных генов и генов гаплодиплоидных организмов модифицировали сле- дующим образом (5.13а) где Nf- количество женских особей (самок) в цепи. Эту формулу можно представить в общем виде: где коэффициент инбридинга суммирован во всех цепях с учетом инбри- динга у общего предка. Если общий предок - самец, то его коэффициент инбридинга должен быть равен нулю. На рисунке 5.12 представлены три примера родословных, иллюст- рирующих инбридинг для Х-сцепленных и гапло-диплоидных генов.
связанные с ним вопросы Рисунок 5.12. Родословные, иллюстрирующие инбридинг для Х-сцепленного гена или гена гапло-диплоидного организма, где квадратики обозначают мужские особи, а кружки - жен- ские. Родословная (а) - брак брат-сестра, родословные (Ь) и (с) - браки между полудвою- родными сибсами. В браке брат-сестра на рисунке 5.12а показаны две цепи (X-CA^Y и X-CA2-Y), по одной для каждого общего предка. Однако цепь для об- щего предка СА! разорвана из-за передачи от отца к сыну, от СА! к Y. Вторая цепь содержит две женские особи, согласно выражению 5.13а,/ = -i-, такая же величина f и для аутосомных генов при браке брат-сестра. Если Z - это мужской потомок, то его коэффициент инб- ридинга равен нулю. На рисунках 5.12b и 5.12с представлены примеры браков полудвою- родных сибсов с цепями X-U-CA-V-Y. На рисунке 5.12b в цепи три женс- ких особи, поэтому f — у, а на рисунке 5.12с f = -j^-, потому что в цепи четыре женских индивида. Существуют и другие родословные для бра- ков полудвоюродных сибсов, в которых /= 0, так как в родословной сле- дуют друг за другом два мужчины. Имеется четыре разных типа браков между двоюродными сибсами: два с/= 0, один с f - f и один с f = . В ряде областей Индии отдается предпочтение последнему типа брака, обусловленное культурными традициями (при этом матери двоюродных сибсов, вступающих в брак, являются сестрами). Вследствие этого коэф- фициент инбридинга для Х-сцепленных генов значительно выше, чем для аутосомных генов (Hedrick, Parker, 1997). Иногда полезно знать степень родства двух индивидов в популяции, даже если они не оставляют потомства. Райт (Wright, 1922) предложил, что в таких случаях следует использовать коэффициент генетической кор- реляции или коэффициент родства (г). Например, в некоторых случаях, необходимо узнать степень родства пары, которая не в состоянии произ- вести потомство, например двух женских или двух мужских индивидов. Более того, для Х-сцепленных генов у мужских индивидов для Х-сцеп-
I. Инбридинг ленных генов и у гапло-диплоидов нет коэффициента инбридинга, но они могут иметь аллели, общие с другими индивидами из популяции. Для двух диплоидных неинбредных индивидов коэффициент родства, г, равен удвоенному коэффициенту инбридинга возможного потомства (см. Lee, 1976) г = 2f. (5.14) Например, коэффициент родства двух сестер (диплоидов) - полных сиб- сов от брака брат-сестра, равен у . Интерес к генетическому родству у гапло-диплоидных общественных насекомых отряда Перепончатокрылые (Hymenoptera) вызван работами Гамильтона (Hamilton, 1964, 1972). Он показал, что в гапло-диплоидной системе коэффициент родства между сестрами, равный 0,75, выше, чем в комбинации мать-дочь (0,5). Из этого следует, что самки могут более успешно распространять свои аллели с помощью потомства сестер, чем с помощью своего собственного женского потомства. Гамильтон (Hamilton, 1964) полагает, что высокая родственность среди сестер может лежать в основе общественного поведения у Hymenoptera (Перепончатокрылых), у которых одна из сестер становится царицей, а другие сестры - рабочи- ми особями. ТАБЛИЦА 5.10. Генотипы родителей и потомков при уникальности каждого родительско- го аллеля (а), и коэффициент родства для пар сестра-сестра (Ь) и мать-дочь (с) у гапло- диплоидов (а) Родители А А., (самка) х .4,(самец) Женские потомки (Ь) Сестра-сестра уД,Д3и Сестра р2лз р,л3 р2л3 Сестра ГО 0,5 г = 0,75 (с) Мать-дочь у Д, А3 0,5 Дочь 1,0 Мать А 0,5 0,5 г =0,5
Поскольку гаплоидный родитель-самец всегда передает один и тот же аллель, каждая самка из потомства несет аллель А . Женские потомки по- лучают одинаковый аллель от родителя-самки и, следовательно, имеют оди- наковые генотипы; например, обе сестры из пары могут иметь генотип А}Ау Общий коэффициент родства для сестер поэтому равен у (1,0 + 0,5)= = 0,75, а для пары мать-дочь он равен 0,5, потому что они всегда имеют один общий аллель. При этом предполагается, что имеется только один родитель-самец (хотя это неправдоподобно для медоносных пчел и некото- рых других Hymenoptera). Действительно, если количество самцов возрас- тет, г между сестрами достигнет 0,5, как между матерью и дочерью. h. Инбридинг в природных популяциях животных Хотя скрещивания по типу брат-сестра наблюдаются у некоторых насеко- мых, например у муравьев (Passera et и ос (West, Herre, 1998), а высокий уровень самооплодотворения существует у некоторых улиток, слиз- ней (Foltz et al., 1984; Viard et al., 1997a, 1997b) и рыб (Turner et al., 1992), по-видимому нет надежных доказательств значительного уровня инбри- динга у большинства позвоночных (и у многих других животных). Роллз и др. (Ralls et al., 1986) провели обширное исследование инбридинга у птиц и млекопитающих и обнаружили несколько случаев скрещиваний, сильно отличающихся от ожидаемых случайных скрещиваний, в частности, наи- больший уровень инбридинга оказался в популяции лесного королька из Австралии, где 19,4% скрещиваний являются скрещиваниями между роди- телями и потомками или полными сибсами. Однако последующие молеку- лярно-генетические исследования по установлению отцовства показали, что у большинства потомков отцами являются не самцы данной обще- ственной группы, а самцы вне ее, т.е. птицы - близкие родственники в популяции скрещиваются очень редко. В двух изолированных островных популяциях птиц, где все особи были маркированы, по-видимому, суще- ствовал некоторый инбридинг. Популяционное исследование около 50 раз- множающихся пар большой синицы, Parus major, на голландском острове Фрилэнд определило уровень инбридинга в пределах от 0,015 до 0,036 (van Noordwijk, Scharloo, 1981). Этот уровень оказался несколько выше, чем ожидается при случайном скрещивании в ограниченной популяции из приблизительно 100 взрослых особей. Эти различия могут зависеть от фак- торов, влияющих на эффективный размер популяции (см. главу 6), напри- мер от наблюдаемых различий в размере семьи и изменений численности популяции со временем и в пространстве. Подобным образом с 1975 года исследовали популяцию из почти 90 пар певчего воробья, Melospiza melodia, обитающего на острове Мандарт (Mandarte), Британская Колумбия, Канада, (Keller, Arcese, 1998). Хотя в
I. Инбридинг этой популяции наблюдалась некоторая степень близкородственных скре- щиваний (f> 0,125), большая часть этих скрещиваний произошла после прохождения популяции через «бутылочное горлышко», в результате чего ее численность уменьшилась до 6% от исходной. Детальное исследова- ние родословной показало, что в малочисленной популяции средний ко- эффициент инбридинга очень близок к ожидаемому. Это означает, что инбридинг не стал выше или ниже, так как степень предпочтения или избежания инбридинга такая же, как и ожидаемая. К тому же, при слу- чайных скрещиваниях пропорции различных классов инбридинга не от- личались от ожидаемых величин. Для определения степени родства между индивидами в популяции и для решения проблем эволюционной биологии при отсутствии родос- ловной полезно использовать молекулярные маркеры. Сравнительный анализ перекрывания полос в мультилокусных ДНК- фингерпринтах, по- лученных от разных индивидов в популяции позволяет выявить пары близких родственников (в качестве контроля используется стандартизи- рованное сравнение полос с учетом случайности их перекрывания). На- пример, бесшерстные кротовые крысы, Heterocephalus glaber - это почти безволосые и слепые грызуны, живущие в норах большими подземными колониями. Подобно многим видам, бесшерстные кротовые крысы - об- щественные животные: у них наблюдаются коллективная забота о потом- стве, перекрывание поколений внутри колонии и разделение трудовой и репродуктивной функций между морфологически различными кастами (Sherman et al., 1991). Рив и др. (Reeve et al., 1990) показали, что пере- крывание полос ДНК-фингерпринта у бесшерстных кротовых крыс в раз- ных колониях варьирует приблизительно от 0,55 до 0,7, а в помете у полных сибсов - от 0,85 до 1 (рисунок 5.13). Перекрывание полос у осо- би, пойманной внутри природной колонии также варьирует от 0,85 до 1, т.е. крысы внутри колонии ближе друг к другу по степени родства, чем полные сибсы. Были предложены методы использования молекулярно-генетических данных для оценки родства конкретных индивидов (Lynch, 1988; Queller and Goodnight, 1989; Ritland, 1996; Lynch, Ritland, 1999). Если локус кодо- минантный, то варианса выборки коэффициента родства, в общем, обрат- но пропорциональна общему числу аллелей всех локусов (Ritland, 1996), поэтому для достоверной оценки необходимо изучить либо много двухал- лельных локусов, либо несколько мультиаллельных. Молекулярные иссле- дования также применяют для различения альтернативных типов родства, например полных сибсов от полусибсов (Thompson, 1975). Однако часто затруднительно различить классы более отдаленной степени родства, чем сибсы и родители с детьми (вторая и более высокие степени родства).
121 Потомство, полученное от g io- скрещиваний внутри колонии Ц в - _ й в- 4 - 1 1 2- JSgSSrafi О -L, j । । । |J— 0.5 0.6 0.7 0.8 0.9 1.0 Вероятность перекрывания полос Рисунок 5.13. Распределение перекрывания полос в мультилокусных фингерприитах у бес- шерстных кротовых крыс: у животных, пойманных в поле из разных колоний; у крыс, пой- манных в поле внутри колоний и крыс-сибсов (по Reeve etal., 1990). II. Инбридинг и отбор а. Инбредная депрессия Было отмечено, что инбридинг увеличивает частоту гомозигот и понижает частоту гетерозигот. Это отклонение от пропорций Харди-Вайнберга вли- яет на среднюю приспособленность популяции, скорость изменения час- тот аллелей и состояние стабильного полиморфизма. Инбредная депрес- сия - это понижение приспособленности, обусловленное инбридингом. Степень депрессии у разных видов и даже в разных популяциях одного вида варьирует (Lynch, Walsh, 1997, Karkkainen et al., 1996). В последние годы наблюдался повышенный интерес к изучению уров- ня инбредной депрессии, который вызван исследованиями по эволюции систем скрещивания у растений и приспособленности редких и исчезаю- щих видов. При отсутствии инбредной депрессии предпочтительно само- оплодотворение, так как аллель, обусловливающий самооплодотворение,
II. Инбридинг и отбор 251 представлен в потомстве в два раза чаше, чем не обусловливающий само- оплодотворение (Fisher, 1941). Когда инбредная депрессия достаточно вы- сока и сопоставима с этим двукратным превышением аллельной частоты, самооплодотворение перестает иметь преимущество (см. Uyenoyama et al., 1993). Исчезающие виды стоят на грани вымирания из-за внешней эколо- гической угрозы, вызванной хозяйственной деятельностью человека. Од- нако, если численность популяций вида мала или инбридинг происходит по другим причинам, то приспособленность популяций может быть низ- кой из-за инбредной депрессии. Вместе с другими биологическими факто- рами это еще более увеличивает вероятность вымирания вида (Soule, 1986). Величина инбредной депрессии широко варьирует у разных организмов. Например, три поколения скрещиваний между полными сибсами у японско- го перепела приводят к полной потере репродуктивной приспособленности (Sittman et al., 1966), а у некоторых видов сосны инбредная депрессия так высока, что при самооплодотворении не образуется жизнеспособного по- томства (Lende et al., 1994). Проведены исследования степени инбредной депрессии у Drosophila, мышей и человека (см. пример 5.5). Линии некото- рых модельных организмов, таких как мыши и D.melanogaster, поддержива- ют в лабораториях путем скрещиваний между полными сибсами в течение сотен поколений. Однако неизвестно, сколько линий потеряно при поддер- жании этих нескольких лабораторных линий, т.к. отбор между ними состоит в поддержании немногих линий с высокой жизнеспособностью. Более того, у ряда видов растений с преимущественным самоопылением при инбредно- сти наблюдается небольшое снижение приспособленности, хотя это и не всегда верно (Husband, Schemske, 1996). Полагают, что в этих популяциях отбор идет против леталей или ослабленных аллелей с более низкой приспо- собленностью (см. стр. 121 и главу 8). Пример 5.5. Во многих исследованиях, выполненных на разных видах дрозофилы проанализированы такие параметры, как выживаемость (жиз- неспособность), фертильность у самцов и самок, вес мух и количество щетинок (Lynch, Walsh, 1998). Почти во всех случаях наблюдается общая тенденция увеличения эффекта генов с возрастанием инбридинга. Немало работ посвящено инбридингу у человека. Некоторые наибо- лее интересные данные суммированы в статье Schull, Neel (1965), о по- следствиях атомных бомбардировок в Хиросиме и Нагасаки (Япония). В таблице 5.11 приводятся данные по смертности детей у родителей с разной степенью родства. Отчетливо видна тенденция к увеличению смерт- ности с возрастанием величины инбридинга. Другой пример демонстрирует влияние инбридинга на численность потомства и его жизнеспособность у мышей (Connor, Bellucci, 1979). В
ТАБЛИЦА 5.11. Процент детской смертности в двух популяциях Японии с известной сте- пенью родства родителей (Schill, Neel, 1965) Популяция Степень родства родителей (/) Не являются родственниками (0) Троюродные сибсы (-^) Двоюродные дядя (тетя) и племянница (племянник) ( зу) Двоюродные сибсы ( ) v 1о 7 Хиросима 3,55 4,43 7,18 6,12 Нагасаки 3,42 3,18 4,94 5,25 этом исследовании изучались дикие популяции мышей, инбредные в те- чение ряда поколений, и проводился мониторинг средних значений при- способленности. Как показано на рисунке 5.14, с ростом инбридинга на- блюдалось почти линейное падение численности потомства. Однако жизнеспособность потомства понижалась только при очень высоких уров- нях инбридинга. Поскольку эти эксперименты проводились в течение ряда поколений, существует вероятность изменения частот аллелей, по- этому уравнения инбредной депрессии, не учитывающие аллельных час- тот в данном случае не применимы. На уровень инбредной депрессии может влиять ряд других факторов. Во-первых, инбридинг может по-разному воздействовать на различные фенотипические характеристики. В общем, у животных изучена жизне- Рисунок 5.14. Численность и жизнеспособность потомства у линий мышей, инбредных в течение 20 поколений (Conor, Bellucci, 1979).
II. Инбридинг и отбор 253 способность, но другие компоненты приспособленности (плодовитость и способность к спариванию), также зависят от инбридинга (Miller, Hedrick, 1993). Хасбенд и Шемски (Husband, Schemske, 1996) обнаружили, что у большинства самоопыляющихся растений на ранних ступенях жизненно- го цикла (образование семян и их прорастание) уровень инбредной деп- рессии низкий, а на поздних ступенях жизненного цикла (рост и разви- тие) значения инбредной депрессии наибольшие. Во-вторых, уровень инбредной депрессии варьирует в зависимости от факторов окружаю- щей среды. Если условия окружающей среды более мягкие, (например, в лаборатории или оранжерее), то инбредная депрессия оказывается мень- ше, чем в природной среде или при наличии стрессовых факторов среды (Dudash, 1990; Miller, 1994). В-третьих, генетические основы инбредной депрессии могут варьировать. Оказалось, что у Drosophila около полови- ны генетического груза является результатом леталей с низкой долей до- минантных аллелей (h = 0,02), а около половины (.? = 0,01 до 0,05) - с более высокой долей доминантных аллелей (Л = 0,3) (Charlesworth, Charlesworth, 1987). Не ясно, насколько общими являются эти наблюде- ния, но у некоторых видов доля генетического груза, обусловленная дета- лями, существенно ниже. Изучим, как инбридинг может воздействовать на среднюю приспо- собленность популяции по одному локусу. Если величина генотипичес- кой приспособленности равна представленной в главе 3, а частоты гено- типов взяты из выражения 5.1, то средняя приспособленность при инбридинге равна: = wn(p2 + fP<l)+ Wn&pq - 2fpq)+ w22(q2 + fpq) = = w+^(w„ + w22-2w12), где первое слагаемое - это средняя приспособленность w = p2w}} + 2pqwl2 + q2w22, как в выражении 3.1, а второе слагаемое - изменение приспособленнос- ти, обусловленное инбридингом. Инбредную депрессию можно опреде- лить как разницу в приспособленности между аутбредной и инбредной популяциями, или: W-Wf =-fpq(wu + w22-2wl2). (5.15а) Заметьте, что инбредная депрессия является функцией частот аллелей и взаимоотношения между приспособленностями, т.е. линейной функцией коэффициента инбридинга. В отсутствие инбридинга (f= 0) или при про- межуточных фенотипах у гетерозигот по сравнению с гомозоготами ад- дитивное действие генов равно нулю: (+ w22 - 2w12 = 0) и инбредная
G54 Глава 5. Инбридинг и связанные с ним вопросы депрессия отсутствует. Возможно, что инбридинг способствует повыше- нию приспособленности популяции при условии, что w, । + w22 - 2 и-’12 > 0. Предположим, что доминантность вредного локуса равна h, так что приспособленности генотипов J и J А, равны 1, 1 - hs и 1 - s, соответственно, тогда: w-wf = sfpq(\-2h). (5.15b) При аддитивности (h = 0,5) инбредная депрессия отсутствует, так как 1 - 2h = 0. Инбридинг наиболее сильно влияет на приспособленность, когда гетерозиготы близки по приспособленности к гомозиготам A А (ве- личина h - наименьшая). Наблюдаемый эффект инбридинга в популяции является суммой эффектов по всем локусам. Иными словами, любой из ряда локусов может внести некоторый вклад в уменьшение приспособ- ленности, наблюдаемое при инбридинге. Для характеристики мультилокусного влияния инбридинга на выжи- ваемость (жизнеспособность) Мортон и др. (Morton et al., 1956) разрабо- тали модель, в которой локусы, влияющие на жизнеспособность, дей- ствуют независимо и мультипликативно (см. главу 10). В этом случае выживаемость - это единственный параметр, обусловливающий приспо- собленность. Поэтому приспособленность индивидов при инбридинге f приближается к величине, равной wf = wae~Bf, (5.16) где w0 и му- приспособленности в отсутствие инбридинга (уровень инб- ридинга не превышает /), В - коэффициент регрессии, измеряющий ско- рость снижения приспособленности при инбридинге; в отсутствие инб- редной депрессии он равен нулю. Количество летальных эквивалентов равно 25 и определяется как количество локусов, которые в гомозигот- ном состоянии привели, в среднем, к одному смертельному исходу. Доля выживаемости в различных инбредных популяциях указывает на величи- ну инбредной депрессии у разных видов. Это видно на примере инбред- ной депрессии у жизнеспособных особей ряда содержащихся в неволе исчезающих видов (см. пример 5.6 о двух исчезающих видах волка). Пример 5.6. Влияние инбридинга на приспособленность у многих орга- низмов долговременное. Ролле с сотрудниками (Ralls et al.,1979) впервые зафиксировали пониженную выживаемость инбредных животных по срав- нению с неинбредными - разводимыми в неволе исчезающими видами. Результаты этих исследований имели большое значение для содержания популяций животных в зоопарках и привели к реорганизации программ по разведению содержащихся в неволе исчезающих видов с целью ис-
II. Инбридинг и отбор 255 ключить инбридинг. Дальнейшее исследование (Ralls et al., VMS) расши- рило ряд изученных видов, при этом для оценки инбредной депрессии у жизнеспособного потомства были использованы разные коэффициенты инбридинга внутри вида (выражение 5.16). Хотя варианса (дисперсия) оцененной инбредной депрессии среди видов была велика, среднее ко- личество летальных эквивалентов среди видов (3,14) значительно (сход- ство с величиной л, по-видимому, случайно). С другой стороны, у некоторых поддерживающихся в неволе исчезаю- щих видов влияние инбридинга на компоненты приспособленности стати- стически не значимо. Например, у двух исчезающих видов:мексиканского и красного волка, оценка максимального правдоподобия 2В равна 0,00 (ри- сунок 5.15), а 95%-ый доверительный интервал для 2В варьирует от 0,00 Рисунок 5.15. Наблюдаемая средняя выживаемость при каждом уровне инбридинга у мексиканского волка (а) и у красного волка (b), (Kalinowski et al., 1999). Площади кругов пропорциональны количеству родившихся индивидов, а линия приспособленности соответ- ствует модели Мортона (Morton et al., 1956).
(256 Глава 5. Инбридинг и связанные с ним вопросы до 1,68 у мексиканского волка и от 0,00 до 0,74 у красного волка (Kalinowski et al., 1999). Исследованные выборки включали 251 особей мексиканского волка (5 уровней инбридинга) и 688 особей красного волка (29 уровней инбридинга). Однако, концентрация мексиканских волков при двух после- довательных уровнях инбридинга (f= 0,1875 и f= 0,25) и большое количе- ство неинбредных красных волков несколько снижает статистическую силу этих данных (Kalinowski, Hedrick, 1999). Лайкр и Риман (Laikre, Ryman, 1991) обнаружили в высоко инбредной содержащейся в неволе популяции финно-скандинавских волков значительную инбредную депрессию для ряда признаков, связанных с приспособленностью, а также высокую частоту наследственной слепоты (Laikre et al., 1993). У растений инбредную депрессию обычно измеряют, сравнивая при- способленности индивидов, появившихся в результате самооплодотворе- ния, с приспособленностями аутбредных или случайно скрещивающихся индивидов. Используют следующее выражение: ws- 5=1- — wo (5.17а) где Wj- приспособленность потомства от самооплодотворения и w - при- способленность потомства от перекрестного оплодотворения (Husband, Schemske, 1996). Выражение 5.16 можно преобразовать, сравнивая при- способленности неинбредных индивидов (w ) с приспособленностью инбредных vvv при инбридинге f тогда получим: (5.17b) b. Изменение частот аллелей и условия для полиморфизма Для определения влияния инбридинга на направленный отбор и условий для постоянного полиморфизма рассмотрим в качестве примера действие частичного самооплодотворения на отбор. С учетом отбора, выражение 5.5а можно модифицировать следующим образом: „ J7p2 + S(/?,+lH,,)]w„ 1 w ’ (2Tpq ^-^SHAw... Н[ = < 07 12, (5.18) W п _[Tq2 +S{Q0+\H0y\w12 W
II. Инбридинг и от где средняя приспособленность равна: w = wu[Tp2 +S(P0+^H0')\ + wn(2Tpq + ^SHa)+ + w22[^2 +5(й+|Я0)]. В результате частичного самооплодотворения изменение частоты ал- лелей, обусловленное направленным отбором, существенно возрастает. Предположим, что равновесие частот генотипов устанавливается при полном самооплодотворении (гетерозиготы отсутствуют). В этом край- нем случае отбор редуцируется до гаметического отбора, где дифферен- циал отбора - это разница между двумя гомозиготами (величина \q по сравнению со случайным скрещиванием удваивается). На рисунке 5.16 показано изменение частоты аллеля и приспособлен- ности при прогрессивном отборе по рецессивным генам при трех вели- чинах частичного самооплодотворения. Даже небольшая доля частично- го самооплодотворения (5 = 0,25) приводит к значительному возрастанию изменчивости частоты аллеля. Наиболее значительное влияние на гене- тическое изменение оказывает новый рецессивный благоприятный му- тантный аллель, тогда как наименьший эффект проявляется при доми- нантном аллеле. При некоторых скрещиваниях, применяемых при Рисунок 5.16. Изменение средней приспособленности (а) и аллельной частоты (Ь) с тече- нием времени при селективном преимуществе рецессивов с s = 0,2 и при доле частичного самооплодотворения, равной 0,0,0,25 или 0,95. 17 — 7660
G58 Глава 5. Инбридинг и связанные с ним вопросы искусственном отборе, чередуют поколения инбридинга с отбором или проводят одновременно инбридинг и отбор. Пример 5.7 показывает из- менения частоты генотипа у полностью самооплодотворяющегося расте- ния резуховидки Таля, Arabidopsis thaliana (сем. Крестоцветные). Пример 5.7. Асмуссен с сотрудниками (Asmussen et al., 1998) исследовали влияние отбора у полностью самооплодотворяющегося модельного расте- ния Arabidopsis thaliana на аллели гена актина, act2. В основе лаборатор- ной популяции были растения, гетерозиготные по дикому аллелю А и по мутантному аллелю А. Затем проследили частоты генотипов в течение нескольких поколений (рисунок 5.17). В первом поколении частота гомо- зигот дикого типа была выше частоты мутантных гомозигот, а во втором поколении частота гомозигот А^А была выше, чем частота гетерозигот (частота гомозигот была ниже частоты гетерозигот). Изменение час- тот генотипов можно определить с учетом относительных приспособлен- ностей (жизнеспособностей) с помощью выражения 5.18, где Но = 1 и 5=1. Оказалось, что изменения в поколении 3 приближаются по приспо- собленности к 1, 0,87 и 0,7 для генотипов ААр А,А2 и А^42, соответствен- но. При этих приспособленностях в течение 20 поколений частота мутант- ного аллеля стала бы менее 0,001 так что в популяции произошла бы быстрая потеря мутанта. Хотя другие комбинации сходных значений приспособ- ленности согласуются с динамикой генотипов, очевидно, что существует сильный отбор против мутантных гомозигот, и что гетерозиготы имеют более низкую приспособленность, чем дикие гомозиготы. Вледствие этого на величину инбредной депрессии могут влиять изме- нения инбридинга и численности популяции, происходившие в прошлом, т.е. история популяции. При наличии инбридинга отбор более эффекти- вен для ослабляющих вредных аллелей. Например, самоопыление в попу- ляции перекрестно опыляющегося водяного гиацинта в течение пяти поко- лений приводит к тому, что инбредная депрессия резко снижается. В данном случае инбридинг не привел к снижению приспособленности после пер- вых нескольких поколений принудительного скрещивания, последующее влияние инбридинга, фиксирующего вредные аллельные варианты, обна- руживается в росте приспособленности у гибридов от скрещиваний между инбредными линиями. С другой стороны, пример уменьшения инбредной депрессии из-за инбридинга в популяции газели, содержащейся в неволе, (Templeton, Read, 1983) легко объясняется изменениями выживаемости в популяции со временем (Kalinowski et al., 2000). Пропорция инбредной депрессии, обусловленная леталями, может изменяться из-за прошлой ис- тории популяции. Например, если популяция недавно прошла через тес- ный инбридинг или ^бутылочное горлышко», то она имеет низкую про-
II. Инбридинг и отбор Рисунок 5.17. Изменение частот генотипов в гене актина в экспериментальной популяции полностью самооплодотворяющегося растения Arabidopsis thaliana (Asmussen et al., 1998). Поколение 0 исходно представлено одним растением, генотипы потомства прослежены в трех поколениях (заштрихованные символы). Ожидаемое изменение частот генотипов, дан- ные приспособленности 1,0,87 и 0,7 для генотипов А}А и А-А.. показаны для поколе- ния 5 (незаштрихованные символы). порцию леталей. С другой стороны, вредные варианты, вызывающие инб- редную депрессию, могут быть фиксированы тесным инбридингом или в результате эффекта бутылочного горлышка и таким образом понижать об- щую приспособленность популяции (Hedrick, 1994). Если приспособленность гетерозигот высокая, то скорость изменения частоты аллеля может быть резко сниженной в результате инбридинга. Предположим, что гетерозиготы отсутствуют из-за полного самооплодот- ворения и симметричного преимущества гетерозигот. В этом случае по- теря гетерозигот, вызванная системой скрещивания, приводит к недиф- ференцированному отбору (два гомозиготных генотипа имеют одинаковые относительные приспособленности). Инбридинг воздействует также на условия устойчивого равновесия, поскольку он затрагивает частоты генотипов. Воркмен и Джейн (Workman, Jain, 1966) и Кимура и Ота (Kimura, Ohta, 1971) определили условия ста- бильности при частичном самооплодотворении: 2w22(l-w22) S< ~ , WU+W22-2WI1W22 2^,(1-™,)) 5 <----------~-----, (5.19) где 0,5 < wn, w22 < 1. 17'
G60 Глава 5. Инбридинг и связанные с ним вопросы Область стабильности, но с определенным уровнем самооплодотворе- ния, видна в нижнем левом квадранте на рисунке 3.3 (см. Hayman, 1953) и на рисунке 5.18, где 5 = 0,95. При случайных скрещиваниях в популя- ции в этой области полной приспособленности существует устойчивый полиморфизм. Но в случае частичного самооплодотворения область ус- тойчивого полиморфизма уменьшается (затемненные области). Откры- тое пространство - это область, где еще существует устойчивый поли- морфизм. Она разделена на две зоны, в зависимости от количества гетерозигот по сравнению с ожидаемым согласно соотношению Харди- Вайнберга (F < 0 и F > 0, соответственно). Таким образом, область стабильности существенно уменьшена из-за инбридинга и при преимуществе гетерозигот для поддержания полимор- физма с учетом частичного самооплодотворения отбор должен быть впол- не симметричным (особенно когда малы селективные различия : wip w достигают 1,0). Например, если S = 0,95 и w22 = 0,9, то при значениях wn между 0,888 и 0,91 небольшие различия в отборе между гомозиготами в разных популяциях у высокоинбредных видов могут привести к значитель- ным различиям в частотах аллелей. Если S = 0,95 и w22 = 0,9, то wu < 0,888 и аллель Аг стремится к фиксации, а если w > 0,91, то аллель А стремит- ся к фиксации (Hedrick, 1990b). Если действует пространственно диффе- ренцированный отбор, то даже при высокой степени самооплодотворения может быть достигнут генетический полиморфизм (Hedrick, 1998). Рисунок 5.18. Область преимущества приспособленности гетерозигот при частичном са- мооплодотворении (5), равном 0,95. Темные области обозначают величины приспособлен- ности, которые обусловлены направленным отбором, а светлые области обозначают значе- ния приспособленности, которые обеспечивают устойчивое равновесие.
II. Инбридинг и отбор 261 с. Родственный отбор До сих пор мы обсуждали модели индивидуального отбора - т.е. есте- ственного отбора, основанного на генотипах или фенотипах каждого ин- дивида, полагая, что от них зависит плодовитость, жизнеспособность, преимущество при скрещивании и т.д. этого индивида. Но, возможно, что отбор действует через близких родственников индивидов, т.е. через родственный отбор (Maynard Smith, 1964). Действительно, и Фишер (Fisher, 1930), и Холден осознавали возможности родственного отбора, и на вопрос одного моралиста, отдал бы он свою жизнь за брата, Холден как-то ответил: «Нет, но я прожил бы ее за двух братьев». Когда родственные индивиды взаимодействуют друг с другом неслу- чайным образом, это может повлиять на приспособленность родственни- ка иным образом, чем на неродственных индивидов. Например, индиви- ды часто взаимодействуют со своими сибсами иначе, чем с другими индивидами, и, как результат, могут повысить приспособленность этих сибсов. Для действия родственного отбора структура популяции должна состоять из родственных групп, но эти родственные группы могут быть физически не разделены, а существовать, как часть большой популяции. Родственный отбор формирует условия для развития альтруистическо- го (общественного) поведения. Альтруистическое поведение предполага- ет, что индивид или индивиды (альтруисты, или доноры) жертвуют своей приспособленностью с целью повышения приспособленности других ин- дивидов (реципиентов). Гамильтон (Hamilton, 1964) обобщил условия альт- руистического поведения в терминах г (коэффициента родства донора и реципиента), стоимости (с) - приспособленности для донора и пользы (6) - приспособленности для реципиента. Он сделал вывод, что для увеличе- ния частоты аллеля альтруизма должно выполняться следующее условие Г>Т- (5.20) b Этот результат был подтвержден при использовании различных методов. Например г между двумя сибсами равен 0,5, поэтому для увеличения частоты аллеля альтруизма величина с должна быть меньше, чем 0,56. Для гапло-диплоидного организма значение г между двумя сестрами равно (с учетом единственного оплодотворения матери). Таким обра- зом, условием для увеличения частоты гена альтруизма у гапло-диплоидов является с < 0,756, т.е. большая допустимая стоимость, чем у диплоидных организмов. Поскольку эти условия менее жесткие, чем у диплоидов, Га- мильтон (Hamilton, 1964) предположил, что именно это явилось причиной, почему общественность (социальность) в родословной отряда Hymenoptera возникала несколько раз в гапло-диплоидной группе, и только один раз - у
G62 Глава 5. Инбридинг и связанные с ним вопросы диплоидных членистоногих (у термитов). Хотя эти генетические гипотезы могут служить обоснованным объяснением множественности происхожде- ния общественного поведения у Перепончатокрылых, существуют и дру- гие приемлемые гипотезы (West Eberhard, 1975). Подход Гамильтона был использован для определения приспособленнос- тей донора и реципиента (West Eberhard, 1975). В этом случае принято поня- тие совокупной приспособленности, т.е. приспособленности индивида с учетом действия ее на родственников этого индивида, каждый из которых взвешен по коэффициенту своего родства. Например, индивид, помогающий выживать родственнику, действительно повышает свою совокупную приспо- собленность, так как родственник содержит некоторые аллели, общие по про- исхождению. Конечно, такое поведение нельзя назвать истинно альтруистич- ным, а скорее способом самораспространения своих собственных аллелей. III. Бесполое, или апомиксное размножение Организмы могут размножаться путем клонирования, апомиксиса, парте- ногенеза и других типов бесполого размножения. Здесь мы кратко рас- смотрим типы бесполого размножения, при котором все потомство иден- тично своей матери. Для удобства ограничимся репродуктивными системами, которые приводят к одинаковым генетическим последствиям, и назовем их бесполым размножением Только при бесполом размноже- нии частота генотипов в популяции практически не изменяется. В некоторых популяциях с бесполым размножением существует опре- деленная пропорция случайных скрещиваний, или ауткроссинга. Если в такой популяции пропорция бесполого размножения равна А, а пропор- ция случайных скрещиваний равна Т, то генетически рекуррентные (воз- вратные) отношения равны: Pt = Tpi2 + АР0, . Я, = 2Tpq + АН0, Q,=Tq2+AQ0, где первое слагаемое - это пропорция особей, полученных при случай- ном скрещивании, а второе слагаемое - пропорция особей, полученных при бесполом размножении. Общее решение этих равенств следующее: Pt = р2 + А'(Ро~р2), H=2pq+A‘(H0-2pq), (5.21) £ = <72 + Л'(б0-92). Когда значение t станет очень велико, частоты генотипов достигнут про- порций Харди-Вайнберга, так как коэффициент второго члена, А', дос-
III. Бесполое или апомиксное размножение 263 тигнет нуля. Эффект частичного бесполого размножения заключается в замедлении достижения равновесия Харди-Вайнберга, но даже неболь- шая доля полового размножения теоретически может привести к пропор- циям Харди-Вайнберга. Но, в отличие от частичного инбридинга, при этом не возникают новые равновесные пропорции генотипов. Пример изменения частот генотипов при частичном половом размножении (А = 0,8) показан на рисунке 5.19, где исходные пропорции индивидуальных генотипов в популяции равны 0,30 - для генотипа Л и 0,70 - для гено- типа А^А2. Для таких пропорций бесполого размножения приближение к пропорциям Харди-Вайнберга происходит относительно быстро: через шесть поколений частоты генотипов приблизятся к частотам, соответ- ствующим отношению Харди-Вайнберга. В отличие от частичного самооплодотворения, приближенные пропор- ции генотипов в данном случае такие же, как для случайного скрещива- ния. Методы прямой оценки доли бесполого размножения при исследова- нии потомства родителя, имеющего известный генотип, разработаны Маршаллом и Брауном (Marshall, Brown, 1974). Предположим, что случайная выборка рецессивных гомозигот полу- чена из популяции особей с генотипом А^4.2, а у их потомства определено количество индивидов с рецессивными (A^j и доминантными (ЛД2) фенотипами. Ожидаемые пропорции особей в популяции, размножаю- щихся разными способами равны: Q = А + Т, « д’ Н = Тр Рисунок 5.19. Изменение частоты генотипов в течение времени при частичном бесполом размножении (А = 0,8), при котором Ро = 0,3 и Qo = 0,7.
G64 Глава 5. Инбридинг и связанные с ним вопросы для рецессивного и доминантного потомства, соответственно. Другими словами, пропорция А рецессивного потомства образуется при бесполом размножении, а оставшаяся часть определяется произведением доли аут- кроссинга и частоты рецессивного аллеля в популяции. Все доминантное потомство образуется в результате ауткроссинга, при котором происхо- дит передача доминантного аллеля. Оба уравнения можно объединить для получения значения доли бес- полого размножения в популяции: Если из А общего числа потомков N - гетерозиготы, то оценка доли бесполого размножения равна ^,2 ^=1-^7, (5-22) где N ~ общее число ожидаемых потомков. Полное обсуждение этих про- цедур для различных типов наследования и для смешанной модели (бес- полое размножение, самооплодотворение и случайное скрещивание) мож- но найти в работах Маршалла и Брауна (Marshall, Brown, 1974), Маршалла и Вейра (Marshall, Weir, 1979) и Оверета и Асмуссена (Overath, Asmussen, 1998). Пример 5.8. Многие виды беспозвоночных размножаются главным обра- зом (или исключительно) бесполым путем. Например, Daphnia magna преимущественно размножается партеногенезом, образуя потомство, иден- тичное материнскому родителю (хотя факультативно происходит и поло- Рисунок 5.20. Репродуктивный статус самок Daphnia magna в течение 2-летнего перио- да, половой и партеногенетический типы размножения показаны вверху и внизу рисунка (по Young, 1979).
IV. Положительная ассортативность скрещивания 265 вое размножение, которое считается результатом действия стрессовых факторов среды). Приближенное значение доли репродукции половым путем можно получить при оценке репродуктивного статуса индивидов в выборке. В течение двух лет Янг (Young, 1979) наблюдал выборки D.magna из пруда в Англии. Оказалось, что большинство особей были нерепродуктивными или размножались путем партеногенеза. Только в конце лета 1973 г. и летом 1974 г. были отмечены самки, размножающие- ся половым путем (фертильные), (рисунок 5.20). На рисунке 5.20 самцы не показаны, но они были обнаружены летом 1974г. В общем, в этой популяции дафния размножалась преимущественно бесполым путем: от 100% случаев - большую часть времени до 60% - в июле 1973 года. IV. Положительная ассортативность скрещивания Ассортативные (предпочтительные) скрещивания - это неслучайные скрещивания, когда особи с определенным генотипом (сходным или раз- личным) скрещиваются между собой чаще, чем это ожидается. Если пары образованы особями с близкими фенотипами, то говорят о положительной ассортативности, а если фенотипы различаются - об отрицательной ассор- тативности скрещивания. Положительная ассортативность скрещивания сходна с инбридингом, приводящим к увеличению числа сходных феноти- пов, при этом вероятность скрещивания особей со сходными фенотипами выше, чем вероятность случайных спариваний в популяции. Некоторые модели ассортативного скрещивания сходны с моделями инбридинга в том, что они не изменяют частоты аллелей, но влияют на частоты генотипов (Crow, Kimura, 1970). Однако во многих моделях ассортативного скрещи- вания частоты аллелей все же изменяются, потому что пропорции индиви- дов в скрещиваниях отличаются от пропорций индивидов в популяции. Важно, что ассортативное скрещивание воздействует на частоты только тех локусов, которые участвуют в определении фенотипов для полового отбора (и генотипы, определяемые этими локусами, ассоциированы с ними неслучайно), тогда как инбридинг влияет на все локусы генома. У человека, по-видимому, существует положительная ассортативность браков по таким вариабельным признакам, как рост, цвет кожи, интел- лект (Vogel, Motulsky, 1997), хотя эта корреляция часто не очень высока. К тому же, существует положительная корреляция для таких специфи- ческих признаков, как глухота или слепота, хотя обусловливающих эти фенотипы причин довольно много. У многих птиц существует сильный половой отбор и в некоторых случаях может быть предпочтение особей, имеющих фенотип, сходный с материнским. Это, в общем, приводит к
рбб Глава 5. Инбридинг и связанные с ним вопросы положительной ассортативности скрещивания (если мать и потомки сход- ны по фенотипу), но в некоторых случаях может привести к отрицатель- ной ассортативности скрещивания (если они имеют разные фенотипы вследствие генетической сегрегации). Последнее наблюдается, когда оба родителя гетерозиготны и имеют доминантный фенотип, а потомок - ре- цессивная гомозигота. Положительная ассортативность скрещивания мо- жет проявляться и у растений, когда опылитель кормится на определен- ной высоте или его привлекают цветки данного цвета и, в результате, опыляются сходные растения и на растения попадает пыльца только с тех растений-опылителей,которые цветут одновременно с опыляемыми. Рассмотрим влияние положительной ассортативности скрещивания на частоты генотипов. Предположим, что аллель Л] доминирует над алле- лем А2, так что скрещивания происходят только либо между доминанта- ми, либо между рецессивами (четыре типа скрещиваний в таблице 5.12). Два других возможных типа скрещивания, А^А{ х А2А2 и А А2 х А?А2, про- исходят между разными фенотипами. С учетом сегрегации при образова- нии потомства, частоты трех генотипов у потомства будут равны р_(Р + Я/2)2_ р2 1 i-е i-е’ (Р±Я/2)^ 1-2 1-2’ 4(1-2) 1-2 • Как и при инбридинге, в этой модели не происходит изменения частот аллелей, поскольку пропорция индивидов, участвующая в скрещиваниях та же, что и в популяции. Однако пропорции генотипов со временем значительно изменяются, частота гомозигот возрастает, а гетерозигот - снижается. Основное рекуррентное отношение для гетерозигот равно: 2рЯ0 2 р + tHa (5.23b) Оно стремится к нулю с увеличением числа поколений (как при инбридинге). Маловероятно, чтобы в популяции происходило полностью ассорта- тивное скрещивание. Рекуррентные (возвратные) отношения для частично ассортативного скрещивания такого типа, где R - пропорция положи- тельно ассортативных скрещиваний и Г- пропорция случайных скрещи- ваний (R + Т=1), следующие:
IV. Положительная ассортативность скрещивания ТАБЛИЦА 5.12. Типы скрещиваний и частоты генотипов в потомстве при полной положи- тельной ассортативности скрещивания для доминантного гена. Типы скрещиваний Частота Потомство AtAt х АА P^V-Q) - - AtAt х А.А^ 2PH/(\-Q) PH/(1-Q) PH/(1-Q) - АуАг х А,А2 Н1 / (I - 0 IP /[4(1- 0] Н2 / [2(1 - 0] Н2 / [4(1 - 0] Q - - е р2 рЯ q2 +Q(p-q) 1 i-е i-е i-e Р, = Тр2+-^— 1-Qo’ Я, =T2pq+^^- 1-Qo’ (5-24) 0=^+^t) + 7?e°- Изменение гетерозиготности со временем дано на рисунке 5.21 для трех уровней положительно ассортативных скрещиваний, при исходных пропорциях, соответствующих отношению Харди-Вайнберга, и р = 0,5. При полностью положительно ассортативных скрещиваниях (7? = 1,0), Рисунок 5.21. Изменение гетерозиготности со временем для трех уровней положительно ассортативных скрещиваний.
Г268 Глава 5. Инбридинг и связанные с ним вопросы гетерозиготность в конце концов падает до нуля, но более медленным темпом, чем при полном самооплодотворении. При частично ассорта- тивном скрещивании гетерозиготность быстро достигает равновесных значений 0,390 и 0,200, тогда как при ассортативном скрещивании рав- новесные значения равны 0,5 и 0,9. Даже при высоком уровне положи- тельно ассортативных скрещиваний гетерозиготность поддерживается на достаточно высоком уровне. Задачи 1. В определенной популяции со средним коэффициентом инбридин- га 0,005, частота аллеля редкого рецессивного заболевания также равна 0,005. Каков процент больных гомозигот в этой популяции по сравнению с популяцией, где браки происходят случайно? Какие можно сделать выводы? 2. Предположим, что исходная гетерозиготность равна 0,3 и пропор- ции частот генотипов соответствуют равновесию Харди-Вайнбер- га. Какова ожидаемая гетерозиготность через два поколения при S = 0, S = 0,5 и S = 1 ? Объясните результаты. 3. Предположим, что в чередующихся поколениях пропорция самооп- лодотворения варьирует между 0,8 и 1,0. Если исходные пропорции генотипов в популяции соответствуют равновесию Харди-Вайнберга при q = 0,5, то какова гетерозиготность в первых четырех поколени- ях? Предположим, что в другой популяции доля самооплодотворяю- щихся особей составляет 0,9. Какова гетерозиготность в первых че- тырех поколениях? Сравните эти два результата графически. 4. В эксперименте по оценке пропорции случайных скрещиваний в популяции группу особей с генотипом А А выращивали в популя- ции, где р, = 0,3. Из 1000 потомков от особей с генотипом А}А} 100 были гетерозиготны. Какова оценка уровня перекрестного скрещи- вания, включая стандартную ошибку? Какова пропорция гомози- готного потомства, произведенного при перекрестном скрещивании? 5. Уровень перекрестного скрещивания, по-видимому, варьирует сре- ди локусов, семей, популяций и родственных видов. Придумайте эксперимент, в котором можно установить причину этой вариабель- ности. В чем эволюционная значимость этой вариабельности? 6. Вычислите ожидаемую гетерозиготность для пяти первых поколе- ний (Но = 0,5) в разных линиях, где размножение происходит путем самооплодотворения, скрещивания между сибсами и скрещивания между двойными двоюродными сибсами. 7. Показано, что у птиц и млекопитающих наивысший уровень инбри- динга составляет около 10% скрещиваний между полными сибсами.
Задачи 269 Каков равновесный уровень инбридинга для данного уровня и ка- ков в результате ожидаемый уровень гетерозиготности по сравне- нию с максимально возможным? 8. Вычислите ожидаемый коэффициент инбридинга у потомства ин- дивидов IVa и IVb в родословной, показанной на рисунке 5.2. 9. Постройте диаграмму четырех возможных типов скрещиваний между двоюродными сибсами, когда пол родителей определен (см. рисунок 5.12b и 5.12с для двух скрещиваний между полудвоюродными сибса- ми). Вычислите ожидаемый коэффициент инбридинга в потомстве от каждого из этих скрещиваний для гапло-диплоидных организмов. 10. Допустим, что локус сегрегирует в популяции с аллельной частотой, равной 0,9 (для Л]) и 0,1 (для А2) и, что приспособленности генотипов ЛД2 и А^А.. равны 1, 1 и 0,8, соответственно. Какова инбредная депрессия от этого локуса при скрещивании полных сибсов? Предпо- ложим, что имеется еще 500 локусов, идентичных данному, и что при- способленности по этим локусам перемножаются, так что общая при- способленность составляет . Какова ожидаемая относительная приспособленность при скрещивании между полными сибсами? 11. Дана с амоопл од отворяющаяся популяция растений, и относитель- ная приспособленность потомства, полученного после оплодотво- рения, составляет 0,6 от приспособленности потомства, полученно- го в результате перекрестного скрещивания. Каковы оценки инбредной депрессии и значение летального эквивалента? 12. В примере 5.7 оценки относительных приспособленностей трех ге- нотипов равны 1,0, 0,87 и 0,7. Используя эти приспособленности и предполагая, что Но = 1 и S = 1, определите частоты генотипов и частоту аллеля А через одно и два поколения? 13. Некоторые популяции растений могут размножаться ауткроссингом, самооплодотворением и бесполым способом. Выведете выражение гетерозиготности после одного поколения при всех трех типах раз- множения и определите равновесную частоту гетерозигот. Как уро- вень бесполого размножения изменяет равновесную гетерозиготность? 14. К какому эволюционному преимуществу или вреду может привести бесполый способ размножения? Как можно исследовать это у конк- ретного организма? 15. Постройте график равновесной гетерозиготности для различных уровней положительно ассортативного скрещивания, когда р = 0,1, 0,3 и 0,5. Сравните его с графиком на рисунке 5.5 для частичного самооплодотворения.
ГЛАВА 6 ГЕНЕТИЧЕСКИЙ ДРЕЙФ И ЭФФЕКТИВНЫЙ РАЗМЕР ПОПУЛЯЦИИ Взгляды Фишера и Райта на эволюционную значимость случайных изменений в популяции прямо противоположны. Для Фишера, случайные изменения - это сво- его рода шум в системе, снижающий эффективность детерминирующих процес- сов в популяции. Райт считает, что случайные флуктуации могут обусловить но- вые генные комбинации и последующие эволюционные изменения. Кроме того, почти нейтральные гены и мутации множественных аллелей увеличивают вероят- ность скрытого полиморфизма, когда мутантные аллели обнаруживаются только электрофоретически или другими тонкими методами. Джеймс Кроу и Моту Кимура (James Crow, Motoo Kimura, 1970) Вариации признаков, не будучи полезными или вредными, остались бы вне дей- ствия естественного отбора как флуктуирующие элементы (что ясно видно у по- лиморфных видов) либо зафиксировались в организмах, живущих в определен- ных природных условиях. Чарльз Дарвин (Charles Darwin, 1859) С момента возникновения популяционной генетики продолжается спор о значении случайного изменения частот аллелей, обусловленных ограни- ченным размером популяции. Дело в том, что во многих природных по- пуляциях (с достаточно большой численностью) случайные эффекты малы по сравнению с эффектами таких факторов, как отбор и поток генов. Если действие отбора или величина генного потока малы относительно разме- ра популяции, то долговременные генетические изменения, обусловлен- ные дрейфом генов, могут быть значительны. Эту возможность (даже при больших размерах популяции) развивает теория нейтральности, соглас- но которой селективно нейтральные варианты образуются в результате мутаций и изменяются по частоте под влиянием генетического дрейфа (см. обсуждение в главе 9). В определенных условиях популяция ограни- ченного размера может быть так мала, что генетический дрейф становит- ся значительным даже для селективных локусов или при генном потоке. Во-первых, некоторые популяции могут иметь маленький размер (чис- ленность) в течение относительно продолжительного периода времени из-за ограниченных ресурсов на обитаемой территории и низкой способ-
Глава 6. Генетический дрейф и эффективный размер популяции ности к расселению на подходящих местах обитания, из-за территори- альности между особями или других факторов. Количество ящериц в по- пуляции может быть ограничено, например, территориальностью, птиц - местами гнездований и территориальностью, расселяющихся растений - открытым местообитанием и неспособностью передвигаться между мес- тами обитания. Изолированные популяции (сухопутные животные, рас- тения на острове, позвоночные или беспозвоночные в озере или другие виды, обитающие на замкнутой территории) в течение продолжительно- го времени могут также иметь низкую численность. Во-вторых, в некото- рых популяциях численность падает периодически, например, это проис- ходит зимой у многих видов беспозвоночных, периодическое резкое снижение численности популяций из-за отсутствия кормовой базы на- блюдается у маленьких грызунов (лемминги и полевки), при эпидемиях, периодически уничтожающих популяции животных и растений, и при сезонном высыхании водоемов. На размер популяций многих видов вли- яют также популяционные флуктуации, образующие «бутылочное гор- лышко» - периоды, в течение которых существование популяции под- держивается за счет выживания только небольшого числа особей. Классическим примером периодических колебаний является взаимосвязь численностей рыси и белоногого зайца в Канаде, где у этих видов наблю- даются 9-10-летние колебания (флуктуации) численности, и плотность популяции меняется на порядок и более. В результате, в периоды низкой плотности индивиды обоих видов часто становятся чрезвычайно редки. Малый размер популяции важен, когда популяция основана несколь- кими индивидами. Например, многие островные популяции начинались с очень небольшого числа основателей. Если популяцию основывает един- ственная женская особь, оплодотворенная единственной мужской особью, то имеется только четыре генома (два - от женской особи и два - от муж- ской). У растений целая популяция может произойти от одного семени (от двух геномов при самооплодотворении). В результате, популяция, про- изошедшая от маленькой группы основателей, может иметь низкую гене- тическую изменчивость, высокую или низкую частоту определенного аллеля, обусловленную эффектом основателя. Такие исходные ограниче- ния числа основателей, важны и в некоторых человеческих популяциях. Некоторые религиозные изоляты, например как общины амишей и хатте- ритов в Северной Америке, произошли от малого числа европейских эмиг- рантов; такие отдаленные места, как остров Тристан да Кунья, были засе- лены всего несколькими индивидами (см. пример 6.1 о редком типе карликовости у амишей и ряд родословных островитян). Более того, вы- сокая частота некоторых редких генетических болезней в популяциях ряда стран (например, в Финляндии) также обусловлена эффектом основате-
272 Глава 6. Генетический дрейф и эффективный размер популяции ля. При этом вероятность некоторых генетических вариантов увеличива- ется в результате относительно малого числа исходных основателей (Norio et al., 1973; de la Chapelle, Wright, 1998). Пример 6.1. В популяции амишей графства Ланкастер (Пенсильвания) высока частота рецессивного заболевания, известного как шестипалая карликовость (рисунок 6.1), или синдром Эллиса-ван Кревелда (EvC), (McKusick, 1978). В 40 сибствах из популяции, размером около 13000 че- ловек, обнаружено 82 человека, пораженных этим заболеванием. С уче- том инбридинга, частота рецессивного аллеля, обусловливающего карли- ковость, оценивается, как равная примерно 0,066, а частота самого заболевания - около 0,005. На ограниченное число основателей в этой популяции указывает то, что 80 родителей в этих 40 сибствах ведут свое происхождение от Самуеля Кинга и его жены - первых членов общины. Исходя из этих сведений о родословной, становится очевидным, что вы- сокая частота заболевания исходно обусловлена эффектом основателя. Либо Самуель Кинг, либо его жена были носителями рецессивного алле- ля; и поскольку многие индивиды в популяции являются их потомками, частота заболевания теперь высокая. Тристан да Кунья - маленький, отдаленный остров в южной Атланти- ке, расположенный около 2900 км западнее Южной Африки. В 1816 году британцы основали на острове гарнизон, чтобы предотвратить спасение французами Наполеона, который был в ссылке на о. Святой Елены (на 2259 км севернее). Из генеалогических записей следует, что родоначаль- ницами современной популяции были 15 женщин, но сейчас остались потомки только семи из них: M.L., прибывшей на остров в 1816 г., M.W., S.W. и M.W. - в 1827, S.P. - в 1863 и E.S. и A.S. - в 1908. Поскольку мтДНК наследуется по материнской линии без рекомбинаций, типы со- временной мтДНК можно использовать для определения цепей родос- ловной, ведущих к женщинам-основательницам. В таблице 6.1 представ- лены типы мтДНК, обнаруженные у 161 современного индивида, для девяти различных районов мтДНК, найденных сначала с помощью SSO зондов и затем охарактеризованных по различиям последовательности (Soodyall et al., 1997). Согласно историческим данным, S.W. и M.W. отме- чены как сестры, но структура мтДНК показывает, что они имеют разные типы мтДНК. M.W. и M.W. были матерью и дочерью, a E.S. и A.S. - сес- трами, (оба случая подтверждаются данными по исследованию мтДНК). Другими словами, по генеалогическим данным следует ожидать четыре основателя мтДНК, а наблюдается - пять.
Глава 6. Генетический дрейф и эффективный размер популяции Рисунок 6.1. Рентгенограмма кистей человека из общины амишей с синдромом Эллиса- ван Кревелда - формы карликовости, при которой пораженные имеют по шесть пальцев на обеих руках (по V.McKusick). ТАБЛИЦА 6.1. Различия последовательностей, обнаруженные методом типирования специфических олигонуклеотидов (SSO) у жителей о. Тристан да Кунья. Показано число индивидов с SSO-типами, прослеживаемое до женщины-основательницы (Soodyall et al., 1997) Женщины-основательницы Последовательность Nt доля) S.W. ACTTGTTTCG 46 (0,29) M.W. и M.W. GTTCGCTTCG 34 (0,21) E.S. и A.S. GCTTATCTTG 25 (0,16) M.L. ATCTGCCCTA 11 (0,07) S.P. GTCTGTCCTG 45 (0,28) Всего 161 (1,0) Малый размер популяции имеет большое значение, когда исследуемая популяция относится к вымирающему или исчезающему виду. В 1920 году из-за неумеренной охоты и уничтожения мест обитания в живых оста- лось только 20 журавлей-кликунов. Благодаря охране и разведению в не- воле численность птиц медленно увеличилась до 200, а недавно во Фло- риде появилась новая оседлая популяция журавлей-кликунов. Северный морской слон был почти полностью уничтожен в девятнадцатом веке из- за неумеренной охоты. На отдаленном пляже острова Гваделупа (Мекси- ка) осталось всего около 20 особей морского слона. Сейчас насчитывают более 100000 северных морских слонов, происходящих из этой малень- кой колонии (Bonnell, Selander, 1974; Hoelzel at el., 1993; см. также при- мер 6.3). Более того, многие виды, например лошадь Пржевальского, ка- лифорнийский кондор, чернолапый хорек и мексиканский волк, в природе вымирают. Все ныне живущие особи этих видов происходят от живот-
Глава 6. Генетический дрейф и эффективный размер популяции ных, разводимых в неволе при создании охраняемых популяций. Лошади Пржевальского - единственный сохранившийся до наших дней вид ди- ких лошадей, происходят от 13 животных, пойманных около 1900 г. (Boyd, Houpt, 1994). Калифорнийские кондоры - самые большие птицы в Север- ной Америке, происходят от 14 птиц, последние из которых были пойма- ны в 1987 г. Чернолапые хорьки происходят от шести животных, пойман- ных в Вайоминге в 1986 г. (Seal et al., 1989). И все мексиканские волки происходят от семи животных, пойманных в Мексике в 1970-х (Hedrick et al., 1997). Для таких видов разработаны программы реинтродукции, ко- торые используют потомков пойманных особей для создания охраняемых популяций в естественных местах обитания. Во всех этих программах были и поражения, и победы. Поддержание этих видов имеет большое значение (Ballou et al., 1995), поскольку не ясно, сохранили ли эти виды, пройдя сквозь бутылочное горлышко (вследствие почти полного их унич- тожения) достаточную степень генетической изменчивости для адапта- ции к изменениям окружающей среды в будущем. СЫОЭЛ РАЙТ (1889 - 1988) Сьюэл Райт родился в штате Иллинойс (США), его ранние экспериментальные работы по- священы проблемам в области физиологической генетики и генетики развития. Он одним из первых обратил внимание на прямую связь между генами и ферментами (белками), (Wright, 1917). Работая с морской свинкой, Райт детализировал комплексные модели насле- дования ряда генов окраски меха. Райт не печатал свои работы в виде монографий до конца 1960-х и 1970-х годов (его четырехтомная работа является всесторонним научным трудом; Wright, 1968,1969,1977, 1978), но его вклад в анализ инбридинга, рассмотрение ограничен- ного размера популяций и многих других вопросов является фундаментальным для попу- ляционной генетики. Действительно, генетический дрейф иногда называют эффектом Сьюэла Райта. Райт использовал ряд простых математических методов для понимания эффекта ог- раниченного размера популяции, и его взгляд на факторы (и их взаимодействия), влияющие на эволюционно-генетические процессы лежит в основе рассуждений и расчетов многих современных популяционных генетиков. Провайн (Provine, 1986) написал биографию С. Райта, а Хилл (Hill, 1995) дал обзор его ранних статей. Влияние ограниченного размера популяции на генетическую измен- чивость был глубоко изучен в 1930-х и 1940-х годах Райтом (Wright, 1969, для обобщения). Для понимания эффекта генетического дрейфа в 1950-х годах Кимура развил метод диффузного равенства (Kimura, Ohta, 1971). Эта элегантная работа внесла большой вклад в основы наших знаний о взаимодействии генетического дрейфа и таких факторов, как отбор, му- тации и поток генов. Мы остановимся на моделях дискретных поколений и проиллюстрируем динамику генетической изменчивости в ограничен- ной популяции. Как говорится в последней главе, инбридинг и генети-
I. Генетический дрейф 275 ческий дрейф, в общем, оказывают сходное влияние на гетерозиготность, но при изучении конкретного локуса в популяции ожидаемые результаты различаются. Фундаментальное значение генетического дрейфа в моле- кулярной эволюции очевидно. Очень малый размер популяций у многих исчезающих и вымирающих видов придает генетическому дрейфу осо- бенное значение. I. Генетический дрейф Все представленные выше примеры ограниченного размера популяций могут иметь одно общее генетическое последствие: малый размер попу- ляции приводит к возможному изменению частот аллелей. Случайное изменение частот аллелей (результат выбора гамет от поколения к поко- лению) называют генетическим дрейфом. Генетический дрейф оказы- вает одинаковый ожидаемый эффект на все локусы генома. В большой по численности популяции генетический дрейф вызывает лишь небольшое случайное изменение частоты аллелей в каждом поколении. Если размер популяции мал, то частота аллеля в разных поколениях значительно из- менится, что может привести к случайной фиксации или потере аллеля. На рисунке 6.2 показано ожидаемое изменение частоты аллеля в ма- ленькой диплоидной популяции с двумя аллелями. В этом примере ис- пользован метод Монте-Карло с одинаковыми, случайными номерами - имитации изменений аллелей в четырех популяциях (см. стр. 26). На ри- сунке 6.2 сплошными линиями обозначены четыре репликата (копии) ги- потетической диплоидной популяции численностью N = 20 (2N = 40), а пунктирной линией - средняя частота аллеля А2 для четырех копий. Во всех репликатах исходная частота аллеля А2 равнялась 0,5. В одной из этих моделей аллель А2 зафиксировался в 19 поколении, а в другой - про- изошла потеря аллеля А2 в 28 поколении. В оставшихся двух репликатах сегрегация двух аллелей произошла к концу 30 поколения. Как видно из рисунка, дрейф генов может вызывать значительные и беспорядочные изменения частот аллелей в довольно короткий период времени. С другой стороны средняя для четырех репликатов варьирует гораздо меньше; она находится в пределах от 0,625 (в поколении 19) до 0,475 (в поколении 30), но, в общем, около исходной частоты, равной 0,5. Если имеется достаточно много репликативных популяций, то ожидаемых из- менений в средней частоте аллеля не происходит, поэтому <7о = <71 = <?2 =••• = ?, =- = ?«’ где qt - средняя частота аллеля А2 в поколении t репликатов. Постоянство средней объясняется тем, что возрастание частоты аллеля в некоторых репликатах погашается снижением частоты аллеля в других репликатах. 18*
Рисунок 6.2. Изменение во времени аллельной частоты для четырех репликатов (сплош- ные линии) в популяции численностью 20 особей. Средняя частота аллеля А2 для четырех репликатов показана пунктирной линией. Отдельные репликаты либо фиксируют аллель А2 (q = 1), либо теряют его (д = 0). Ожидаемая пропорция популяций, в которых произойдет фиксация данного аллеля, равна исходной частоте этого аллеля. Другими словами, если исходная частота аллеля Л2 равна q0, то вероятность фиксации этого аллеля, u(q) (пропорция репликативных популяций с фиксированным аллелем) равна w(4) = 40- (6.1) Например, если исходная частота равна 0,1, то в 10% случаев популяция станет фиксированной по этому аллелю. Если исходная частота аллеля А равна 0,9, то в 90% случаев он станет фиксированным. В основе теории нейтральности, используемой в молекулярной эволюции (см. главу 9), ле- жит открытие, что при отсутствии дифференцированного отбора вероят- ность фиксации данного аллеля равна его исходной частоте. Поскольку средняя частота аллеля неизменна, а распределение частот аллелей в реп- ликативных популяциях изменяется, то общий эффект дрейфа можно оце- нить, определяя гетерозиготность или изменение частоты аллеля в репли- кативной популяции (см. пример 6.2 о вариантах окраски глаз у Drosophila). Порой интересно определить влияние генетического дрейфа на все гены в данной популяции. Если различные гены подвержены действию генети- ческого дрейфа независимо друг от друга, то его эффект можно наблюдать,
I. Генетический дрейф изучая множество генов одного организма. На практике это затруднитель- но, поскольку у разных генов имеется разное число аллелей, разные ал- лельные частоты, и они могут быть сцеплены с другими локусами, подвер- женными отбору. Но все-таки важно помнить, что дрейф генов действует по существу одинаковым образом на все локусы в данной популяции. Пример 6.2. Классический пример влияния ограниченного размера по- пуляции на частоту аллеля привел Бари (Buri, 1956). Он наблюдал за час- тотой двух аллелей локуса brown, влияющего на цвет глаз у Drosophila melanogaster, в случайно отобранных популяциях с численностью 16 осо- бей. Аллели, bw15 и bw, были выбраны потому, что они почти нейтральны по отношению друг к другу. В результате можно исследовать эффект ог- раниченного размера популяции на частоту аллеля почти независимо от действия отбора. Некоторые данные из его исследования представлены двумя способами: сначала на рисунке 6.3 (ряд из 107 линий, в котором имеется от 0 до 32 генов в различных поколениях), и затем на рисунке 6.4 (средняя и варианса частоты аллеля среди линий). Количество генов bw75 Рисунок 6.3. Распределение аллелей bw75 во времени в популяциях численностью 16 осо- бей для сегрегирующих репликатов в эксперименте Бари (Buri, 1956).
Рисунок 6.4. Ожидаемые и наблюдаемые средняя (а) и варианса (Ь) частоты аллеля в эксперименте Бари (Buri, 1956). Ожидаемая варианса получена при использовании выра- жения 6.4а для популяции с численностью 9 особей. Гистограмма на рисунке 6.3 показывает, что распределение частот ал- лелей среди репликатов во времени имеет все больший и больший раз- мах. Такой графический способ представления данных (но для многих репликатов), показан на рисунке 6.2 вместе с гистограммой для каждого из поколений. Количество линий, фиксированное для одного из двух ал- лелей, возрастает приблизительно с линейной скоростью после поколе- ния 4. В поколении 19 оно почти одинаково для двух аллелей: 30 - фикси- рованных для аллеля bw и 28 - фиксированных для bw75. На рисунке 6.4а показана средняя частота аллелей среди всех реплика- тов (фиксированных и нефиксированных) из эксперимента Бари. Как и ожидается при малом или недифференцированном отборе, значение сред- ней частоты очень близко к исходной частоте (0,5). Наблюдаемая вариан- са частоты аллеля показана на рисунке 6.4b заштрихованными (черными) кружками. Как ожидается, варианса возрастает со временем и, по-види- мому, стремится к теоретическому максимуму, равному 0,25. Теоретичес- кая варианса вычислена согласно выражению 6.4а и показана пунктир- ной линией. Размер популяции, использованный в выражении и определенный Бари, равен 9 и дал хорошее приближение к наблюдаемо- му возрастанию вариансы со временем.
Для получения ожидаемой гетерозиготности в ограниченной по разме- ру популяции предположим, что в популяции N диплоидных индивидов и что каждый индивид вкладывает две гаплоидные гаметы в следующее по- коление (Crow, Kimura, 1970). Для получения потомства будем случайно (и с заменой) выбирать аллели от этих родителей. Вероятность, что одинако- вый аллель будет выбран дважды, составляет 27V[1/(2jV)]2 = 1/2N. Вероят- ность, что два аллеля, выбранные для потомка - разные, равна 1 - 1/2N. Однако, даже если два аллеля разные (получены от разных роди- телей), есть вероятность, что эти аллели одинаковы, так как они произошли от общего предка в каком-либо предшествующем поколении. Если пред- положить (см. главу 5), что Д - коэффициент инбридинга в поколении I, то вероятность идентичности этих двух аллелей по происхождению равна: (6-2) Это уравнение можно преобразовать в виде: Вспомним из главы 5, что 1 -Д= Н / (2pq), тогда (6.3а) т.е. скорость снижения гетерозиготности в каждом поколении находится в обратной зависимости от размера популяции. Отношение между гетерозиготностями в течение нескольких поколе- ний можно вывести из выражения 6.3а: (6.3b) Если известна исходная гетерозиготность, то можно предсказать гетеро- зиготность, спустя t поколений: Отсюда можно найти приблизительное время, в течение которого про- изойдет потеря данной пропорции гетерозиготности. Например, количе- ство поколений, пройденных до пропорции х (= от исходной гете- розиготности, равно t = -2N In х.
Глава 6. Генетический дрейф и эффективный размер популяции Можно определить, что время, в течение которого произойдет потеря 50% гетерозиготности, (полжизни) равно 1,397V. На стр. 324 показано изменение гетерозиготности при разделении по- пуляции на субпопуляции (эффект Воланда). Используя выражение 7.3а, связывающее гетерозиготность с вариансой частоты аллеля (И) получим: H=2pq-2Vq. Если подставить это значение в выражение 6.3b для Ht и преобразовать его, то варианса частоты аллеля в поколении t составит: Vq; = РйЧй (6.4а) С увеличением количества поколений t возрастает и варианса стре- мится к максимуму pQqv Например, если р0 = 0,3, варианса частоты аллеля будет стремиться к максимуму 0,21 со скоростью, являющейся функцией размера популяции. Через одно поколение (/ = 1) варианса составит у 4 2N ’ (6.4b) т.е. равна биномиальной выборочной вариансе. В качестве оценки влия- ния генетического дрейфа на частоту аллеля и сравнения его с другими эволюционными факторами такими, как отбор, поток генов или мутации, стандартное отклонение от q для одного поколения приблизительно рав- но среднему абсолютному значению изменения частоты аллеля (T.Prout, персональное сообщение). Например, если р0 = q0 = 0,5 и N = 50, то (Е)|/2 = 0,05, что приблизительно равно среднему а. Метод матрицы вероятностей Хотя невозможно точно определить, насколько велико изменение часто- ты аллеля в популяции, обусловленное генетическим дрейфом, мы мо- жем рассчитать вероятность того, что частота аллеля будет определенной величиной. Например, при аллельной частоте, равной 0,4 и численности популяции, равной 10 вероятность того, что аллельная частота останется неизменной (0,4) через одно поколение, равна 0,18. Такие вероятности можно определить для разных популяций различных размеров и для раз- ных частот аллелей. Они позволяют исследовать различные эффекты ге- нетического дрейфа. Эти вероятности можно расположить в форме мат- рицы, и они могут предоставить ожидаемое изменение в распределении аллелей в популяции ограниченного размера во времени.
I. Генетический дрейф Элементами такой матрицы являются вероятности определенного ряда аллелей в следующем поколении, давших определенный ряд в предше- ствующем поколении (см. стр. 32-33). Элементами такой матрицы, кото- рую называют матрицей вероятностей переходов, или вероятностной транзиционной матрицей, являются вероятности i аллелей А2 в поколе- нии t + 1, давших j аллелей А2 в поколении t. Эти элементы можно рассчи- тать из биномиального выражения вероятностей следующим образом: . _ (2У)! Г j ГУ j А tj (2N-i)W.[ 2N ) (22V? где частота А2 в поколении t равна j I2N и 2N-число аллелей в популяции. ТАБЛИЦА 6.2. Матрица вероятностей переходов для популяции размера два (2N = 4), где величины обозначают вероятность i аллелей А2 в поколении t + 1, данных j аллелей Л, в поколении t Поколение t + 1 Поколение t 0 1 2 3 4 0 1 0,3164 0,0625 0,0039 0 1 0 0,4219 0,25 0, 0469 0 2 0 0,2109 0,375 0,2109 0 3 0 0,0469 0,25 0,4219 0 4 0 0,0039 0,0625 0,3164 1 Простой пример такой матрицы дан в таблице 6.2 для популяции раз- мером 2 (2N = 4). В матрице пять колонок, соответствующих возможному состоянию в поколении t (0, 1, 2, 3 или 4 аллеля А2) и пять рядов, соответ- ствующих возможному состоянию в поколении t + 1. Заметьте, что в пер- вой и последней колонках имеется только один элемент, не равный нулю (в первом и в последнем рядах, соответственно). Это происходит, потому что, если популяция станет гомозиготной по какому-либо аллелю (А или А), то она останется гомозиготной по этому аллелю (если другой аллель не будет реинтродуцирован в популяцию). Такие два состояния аллелей: О аллелей А2 и 4 аллеля А2 называют абсорбирующими состояниями. С другой стороны, все элементы в средних трех колонках не равны нулю, что указывает на существование вероятности перехода популяции во все- возможные другие состояния. Например, вероятность 0 аллелей А2 из поколения^ 1 иодного аллеля Л2в поколении Z(x01) равна (0,75)4= 0,3164. Заметьте, что сумма вероятностей всех колонок равна единице, потому
Глава 6. Генетический дрейф и эффективный размер популяции что эти значения отмечают все возможные переходы из исходного состо- яния. С помощью матрицы переходов, которая дает вероятность изменения из одного состояния в другое, можно оценить ожидаемое изменение рас- пределения частоты аллеля во времени для популяций данного разме- ра. Такое распределение частоты аллеля в популяциях одного размера называют генно-частотным распределением. Можно наблюдать измене- ние этого распределения, предполагая некоторое исходное распределе- ние аллельных частот в популяциях и потом рассчитывая распределения в будущих поколениях, используя матрицу переходов. Пропорция попу- ляций, которые имеют j аллелей А2 в поколении t, равна у t, а сумма всех состояний популяций равна единице, или 2N ;=0 Если мы найдем матрицу величин вероятностных переходов (величи- ны х.) Xи вектор популяционного состояния (величины у.) У, то можно определить распределение популяционных состояний от одного момента времени до другого, умножая матрицу переходов на вектор популяцион- ных состояний (помните, что это генно-частотное распределение), или Другими словами, пропорция популяций в состоянии i в момент времени t + 1 может быть получена умножением матрицы X на вектор Y, так что 2N У,,+1 = у=0 Следовательно, пропорция популяций в состоянии i в момент времени t + 1 - это сумма всех состояний произведения перехода в состояние i из состояния j и пропорции популяций в состоянии j в момент времени t. Если исходное распределение состояний популяции равно У, то данное выше возвратное отношение можно преобразовать в следующее: У=Х'УО. Для иллюстрации изменения популяции со временем, используем мат- рицу переходов, данную в таблице 6.2. Предположим, что исходно все популяции имели равное число аллелей А и Аг Другими словами, два из четырех аллелей в нулевом поколении были Аг, (тогда у20= 1,0), а все другие исходные состояния равны 0,0 (q0 = 0,5). При этом исходное рас- пределение аллельных частот между популяциями изменяется со време- нем, как это представлено в таблице 6.3. Высокая пропорция популяций
I. Генетический дрейф становится гомозиготной либо по аллелю либо по А . Действительно, уже после трех поколений почти 50% популяций становятся гомозигот- ными либо по аллелю А р либо по аллелю А2 из-за малого размера популя- ций. В конечном итоге 50% популяций становятся гомозиготными по ал- лелю А1 и 50% - по аллелю А2. Среднюю частоту аллелей А2 в поколении t можно определить из вы- ражения: | 2N q' Частоты аллеля А2 в разных поколениях для этого примера представлены в таблице 6.3, в ее нижней части. Заметьте, что частота аллеля А2 остает- ся, равной 0,5, несмотря на то, что распределение аллельной частоты сре- ди репликатов постоянно изменяется, пока не произойдет фиксация всех репликатов. В конце концов половина репликатов становится фиксиро- ванной по аллелю А , и эта вероятность фиксации равна исходной частоте аллеля А . ТАБЛИЦА 6.3. Распределение аллельных частот и гетерозиготность по поколениям в популяции с размером два (2N = 4) при q,, = 0,5 Поколение Число аллелей А2 0 1 2 3 4 оо 0 0 0,0625 0,1660 0,2490 0,3117 ... 0,5 1 0 0,25 0,2109 0,1604 0,1205 ... 0,0 2 1 0,375 0,2461 0,1813 0,1356 ... 0,0 3 0 0,25 0,2109 0,1604 0,1205 ... 0,0 4 0 0,0625 0,1660 0,2490 0,3117 ... 0,5 ?, 0,5 0,5 0,5 0,5 0,5 0,5 Н t 0,5 0,375 0,2812 0,2109 0,1582 ... 0,0 Важное наблюдение состоит в том, что существует постоянный темп снижения гетерозиготности на поколение. Гетерозиготность в поколении t равна: Связь гетерозиготностей в поколениях следующая:
G84 Глава 6. Генетический дрейф и эффективный размер популяции где Л указывает на скорость снижения гетерозиготности (выражение 5.9). Для иллюстрации мы можем использовать гетерозиготность, рассчитан- ную для ранних поколений (таблица 6.3), где Но, Н1 иН2 равны 0,5, 0,375 и 0,2812, соответственно. В этом случае Л = 0,75 для всех сравнений между смежными поколениями. Сначала может показаться странным, что это снижение гетерозиготности отличается от ожидаемого снижения при скре- щивании между полными сибсами (см. главу 5). Дело в том, что в данном случае существует вероятность случайного скрещивания, поэтому поте- ря гетерозиготности происходит несколько быстрее, чем при отсутствии самооплодотворения. Предыдущее выражение можно преобразовать в виде: Н, ’ где значение Л специфично для популяции конкретного размера и равно Л = 1—- 2№ как показано в выражении 6.3а. Второй пример показан в таблице 6.4, где исходно во всех популяциях присутствует только аллель А , так что у{0 =1,0 (q0 = 0,25), а вероятность других исходных состояний равна 0,0. Как и в предыдущем примере, по- пуляция становится фиксированной либо по аллелю Л , либо по аллелю А . Заметьте, что частота аллеля А2 остается равной 0,25 и скорость сни- жения гетерозиготности (Л) такая же, как в предыдущем примере (несмот- ря на то, что исходные частоты и гетерозиготности различны). Вероят- ность фиксации аллеля А2 равна исходной частоте аллеля А2 (0,25). ТАБЛИЦА 6.4. Распределение аллельных частот и гетерозиготность в поколениях в по- пуляциях с размером два (2N = 4) при q0 = 0,25 Число аллелей Аг Поколение 0 1 2 3 4 оо 0 0 0,3164 0,4633 0,5484 0,6038 0,75 1 1 0,4219 0,2329 0,1471 0,1003 0,0 2 0 0,2109 0,1780 0,1353 0,1017 0,0 3 0 0,0469 0,0923 0,0943 0,0805 0,0 4 0 0,0039 0,0336 0,0748 0,1137 0,25 ?, 0,25 0,25 0,25 0,25 0,25 0,25 Н t 0,375 0,2812 0,2109 0,1582 0,1187 0,0
I. Генетический дрейф 285 Можно использовать метод матрицы вероятностей для вычисления распределения частот аллелей в ограниченной популяции с течением вре- мени. Рассмотрим популяцию численностью 20 (2N= 40) и проследим ее распределение аллельной частоты во времени при равной исходной час- тоте аллелей А{ vlAv так что у200= 1,0 и все другие исходные состояния популяции равны 0,0. Тогда распределение частот аллелей следует образ- цу, представленному на рисунке 6.5 для поколений 1, 5 и 20 (рисунок 6.5 - это сглаженное изображение действительного распределения.) Через пять поколений распространение аллелей заметно увеличивается и после 20 поколений более 16% всех популяций - гомозиготны (половина по А] и половина по Л2). Очевидно, что распространение аллелей происходит очень быстро, и к поколению 20 в еще оставшихся полиморфными попу- ляциях наблюдается почти однообразное распределение всех состояний популяции. В конце концов, половина популяций становится фиксиро- ванной по аллелю Ах и половина - по аллелю Аг, потому что исходная частота аллеля равна 0,5. Среднее время фиксации аллеля (например, аллеля А2) зависит от раз- мера популяции и исходной частоты аллеля. При увеличении размера популяции влияние генетического дрейфа на поколение становится мень- ше, и требуется больше времени, чтобы случайные изменения накапли- вались и привели к фиксации аллелей. Чем дальше исходная частота от единицы (частота при фиксации), тем больше требуется времени для фик- сации аллеля. Время фиксации можно вычислить путем повторения мат- рицы переходов до тех пор, пока не будут зафиксированы все популяции Рисунок 6.5. Сглаженное распределение частот аллеля для популяции численностью 20 с исходной частотой аллеля, равной 0,5, через 1, 5 и 20 поколений.
((286 Глава 6. Генетический дрейф и эффективный размер популяции Т(<1) = ~^(У2к.,-У2к.,-1), (6.5а) Ч /=1 где член в скобках - пропорция популяций, которые станут фиксирован- ными в поколении t. Сумма разделена на частоту аллелей, потому что только q популяций станут фиксированными по аллелю А . Кимура и Ота (Kimura, Ohta, 1971), используя диффузное приближение для долговре- менной модели, вывели выражение для среднего времени фиксации ал- леля А2 при исходной частоте q: Т. . ^(1-?)1п(1-?) т (?) =-------. (6.5b) Заметьте, что среднее время фиксации - это линейная функция размера популяции. Оно уменьшается с возрастанием исходной аллельной часто- ты, приближаясь к единице. Например, если исходные значения частоты q = 0,2 и 0,8, то среднее время фиксации равно 3,57tVh 1,617V, соответ- ственно. Это приближение и результат, полученный при использовании матрицы переходов, достаточно близки, пока размер популяции очень мал. На рисунке 6.6 представлены пропорции популяций, фиксирующих аллель А2 каждое поколение, для трех разных исходных частот аллеля А2 при численности популяции, равной 20. Эти пропорции получены с по- мощью матриц вероятности перехода. Заметьте, что при исходной часто- Рисунок 6.6. Сглаженное распределение популяций, фиксирующих аллель Аг в каждом поколении, при трех разных исходных частотах аллеля и N = 20.
те аллеля Л2 равной 0,8, в большинстве случаев фиксация происходит в первые несколько поколений. При исходной частоте 0,2 пик периода фик- сации аллеля Л значительно запаздывает. Эти различия обусловлены об- щей величиной изменений частоты аллеля, необходимых для того, чтобы произошла фиксация (она разная для различных исходных частот алле- лей). В этом случае среднее время фиксации, определенное из выраже- ний 6.5а и 6.5b при q = 0,2, равно 69,5 и 71,4 поколений, соответственно. Ь. Эффект основателя и «бутылочного горлышка» Популяция может произойти лишь от небольшого числа индивидов, пото- му что она либо малочисленна исходно, либо в определенном поколении в процессе эволюции популяции выжило малое число особей. В первом слу- чае речь идет об эффекте основателя, а во втором - об эффекте «бутылоч- ного горлышка», которые часто приводят к случайным колебаниям генети- ческой изменчивости, так что частота аллелей будет отличаться от частот в исходной (предковой) популяции (это выразится в более низкой гетерози- готности и в уменьшении числа аллелей). Для высоко вариабельных локу- сов потеря числа аллелей сказывается более быстро, чем потеря гетерози- готности. Например, микросателлитный локус в «бутылочном горлышке» из 5 индивидов (2У = 10) потеряет, по крайней мере, половину своих алле- лей, но только около 10% гетерозиготности. На основе дифференциальной скорости потери был разработан тест (Comuet, Luikart,1996), позволяющий оценить эффект «бутылочного горлышка». Сначала изучим потенциальное значение эффекта основателя. Для понимания влияния численности основателя на аллельные частоты опре- делим вероятности полиморфизма у основателей. Когда пропорции в ро- дительской группе соответствуют пропорциям Харди-Вайнберга, веро- ятность аллельного полиморфизма в группе основателей численностью N равна: * = i-b,T +{p^N +.. .+(pW +• •]= (или единица минус вероятность мономорфизма). На рисунке 6.7. показана величина R, как функция численности основателя для разных частот алле- ля (если имеется всего два аллеля). Если частоты аллелей одинаковы, то для высокой вероятности включения в популяцию сразу двух аллелей не требуется большой численности основателя. Например, популяция осно- вателей может состоять только из трех или более индивидов, а вероятность включения обоих аллелей с равными частотами составляет уже более 95%. Если частоты двух аллелей в родительской популяции далеки от равенства
Рисунок 6.7. Вероятность аллельного полиморфизма, показывающая различную числен- ность основателей в выборке для трех разных аллельных частот. (скажем 0,95 и 0,05), то число основателей, необходимых для включения обоих аллелей (в действительности, для включения редкого аллеля) с 95%-ой веро- ятностью должно быть 30 и более. При инбридинге в родительской попу- ляции и если частоты генотипов не соответствуют равновесию Харди-Вайн- берга, вероятность полиморфизма у основателей можно рассчитать из равновесных частот генотипов инбридинга. Вероятность мономорфной выборки выше для популяции данного размера при сильном инбридинге (таком, как у растений и животных с высокой частотой частичного самооп- лодотворения, нежели в популяции, где пропорции соответствуют равно- весию Харди-Вайнберга). Если предположить, что в результате эффекта основателя или «буты- лочного горлышка» численность популяции сильно возрастает, то после- дующая генетическая изменчивость в популяции определяется числен- ностью основателей (или численностью популяции, прошедшей через «бутылочное горлышко»), частотой аллелей (или генотипов) и внутренне обусловленным ростом численности после образования популяции (Nei etal., 1975). Численность основателей оказывает большое влияние на число аллелей в популяции, потому что при основании популяции элиминиру- ются аллели с низкими частотами. С другой стороны, средняя гетерози- готность также до некоторой степени зависит от численности основате- ля, но в первую очередь - от скорости роста популяции после ее основания. Гетерозиготность снижена за счет ограниченного размера популяции (по- казано в выражении 6.3а). Если N= 2 - это наименьшая численность осно-
вателей для перекрестно оплодотворяющихся организмов, тоН = 0,75/7; и гетерозиготность снижается в каждом поколении до 75% от ее преды- дущего уровня. Если рост популяции от малого числа основателей замедлен, то каж- дое поколение происходит потеря гетерозиготности до тех пор, пока по- пуляция не достигнет существенного размера, как показано на рисунке 6.8 (из Nei et al., 1975). В этом примере гетерозиготность перед «буты- лочным горлышком» была равна 0,138 (среднее значение, наблюдаемое для аллоферментных полиморфизмов у Drosophila). Затем были созданы популяции основателей численностью 2 особи (сплошная линия) и 10 осо- бей (пунктирная линия) и с внутренней скоростью роста популяции (г), равной 0,1 или 1,0 (г = 0 показывает, что размер популяции не изменяет- ся, а г = 1 означает быстрый рост популяции). Мутация позволила восста- новить потерю гетерозиготности. Гетерозиготность в случае двух осно- вателей (г = 0,1) снижается менее чем до 0,01 (меньше 7% от исходного значения) и остается такой, пока мутации действительно не восстановят изменчивость. Заметьте, что потеря гетерозиготности происходит в тече- ние первых десяти поколений. Однако, если внутренняя скорость роста в десять раз выше (г = 1,0), то гетерозиготность снижается приблизительно только до 0,09 (около 65% исходного значения), потому что размер попу- ляции восстанавливается очень быстро и потеря аллелей происходит толь- ко в нескольких первых поколениях (см. пример 6.3). Потеря гетерозиготности, связанная с эффектом «бутылочного горлыш- ка» или с эффектом основателя может быстро привести к появлению ге- нетического расстояния между предковой популяцией и популяцией, про- шедшей через «бутылочное горлышко». Представим, что предковая популяция содержит десять аллелей, а после «бутылочного горлышка» имеется одна фертильная женская особь (2N= 4). В результате, по край- ней мере шесть аллелей будут потеряны в «бутылочном горлышке», кото- рое вызовет значительные изменения аллельных частот в популяции по- томков и создаст генетическое расстояние между исходной и последующей популяциями за одно поколение. Модифицируя формулировку Чакраборти и Нея (Chakraborty, Nei, 1977), Хедрик (Hedrick, 1999b) представил ожи- даемое стандартное генетическое расстояние через t поколений таким об- разом: 1-Я0 D. = ——In 2 [1-77O(1-1/(27V))'J’ где /70 - гетерозиготность до «бутылочного горлышка» и N - эффектив- ный размер популяции, прошедшей «бутылочное горлышко». (6.6) 19 — 7660
Рисунок 6.8. Изменение гетерозиготности во времени после основания популяции (или «бутылочного горлышка») двумя (сплошные линии) или десятью (пунктирные линии) особями. Величины г показывают внутреннюю скорость роста после основания (из Nei et al., 1975). На рисунке 6.9 представлено ожидаемое генетическое расстояние - результат «бутылочного горлышка», соответствующее гетерозиготнос- ти, равной [1 - 1/(2Л/)]' (гетерозиготности популяции до прохождения «бутылочного горлышка») для различных исходных значений гетерози- готности. При высокой исходной гетерозиготности - такой, как у мик- росателлитных локусов, эффект «бутылочного горлышка» может быть достаточно большим. Например, величина «бутылочного горлышка» в течение одного поколения равна двум особям (0,75 на горизонтальной оси). Тогда для Но, равной 0,7 и 0,9, генетическое расстояние будет 0,230 и 0,589, соответственно. Петкау с сотрудниками (Paetkau et al.,1997) об- наружили, что у бурых медведей на острове Кодьяк и у черных медве- дей на острове Ньюфаундленд гораздо более низкие гетерозиготности, чем было отмечено в других выборках. Генетическое расстояние между этими островными популяциями и материковыми популяциями значи- тельно больше, чем можно предполагать, исходя из географических рас- стояний между этими популяциями. Это указывает, что потеря гетеро- зиготности, обусловленная малым размером популяции, оказывает значительное влияние на генетическое расстояние между этими попу- ляциями.
I. Генетический дрейф 291 Рисунок 6.9. Ожидаемое генетическое расстояние, образованное в результате «бутылоч- ного горлышка» в одной популяции, которое привело к потере гетерозиготности при раз- ных исходных гетерозиготностях. Пример 6.3. Считалось, что северный морской слон был уничтожен из-за неумеренной охоты в конце девятнадцатого века, когда в 1884 г. коллек- ционерами были убиты «последние» 153 животных. К счастью, несколь- ко животных уцелело на отдаленном пляже острова Гваделупа, и их по- томки были вновь открыты в 1892 г. Однако, количество родоначальников современной популяции, размером более 100 000 животных, распростра- ненных до центральной Калифорнии, не превышало 20 особей (Bonnell, Selander, 1974). В современной популяции этих животных обнаружено всего два гаплотипа мтДНК (Hoelzel et al., 1993) с оценками частот, 0,275 и 0,725, что дает оценку разнообразия гаплотипов с учетом поправки на малый размер популяции, равную 0,409. В популяции южных морских слонов на острове Южная Джорджия обнаружено 23 различных гаплоти- па. Оценка их разнообразия, которую можно использовать как оценку разнообразия в популяции северных морских слонов до прохождения че- рез «бутылочное горлышко», равна 0,980. При исследовании изменчиво- сти аллоферментов не обнаружено гетерозигот по 24 локусам у 159 жи- вотных, а в другом исследовании - по 43 локусам у 67 животных. С другой стороны, найдено (Gales et al., 1989), что средняя гетерозиготность по 35 локусам у 100 южных морских слонов равна 0,032. Предположим, что потерю разнообразия мтДНК можно описать сле- дующим уравнением: 19*
1 Nef., где исходное разнообразие Но = 0,980, наблюдаемое современное разно- образие Ht = 0,409 и - эффективный размер популяции женских осо- бей в поколении i (смотри выражение 6.10а). Исследуя популяции раз- личной численности и разную продолжительность эффекта «бутылочного горлышка», Хедрик (Hedrick, 1995b) обнаружил, что наблюдаемую поте- рю изменчивости мтДНК можно объяснить либо прохождением популя- ции численностью 12 особей через «бутылочное горлышко» в течение одного поколения, либо популяции численностью 44 особи в течение 3 поколений. Эти результаты сходны с результатами Хельзеля и сотрудни- ков (Hoelzel et al., 1993), которые использовали другую модель. По мнению Хедрика, отсутствие изменчивости по аллоферментным ло- кусам не связано с эффектом «бутылочного горлышка», по крайней мере, в популяции южного морского слона, представляющей предковое (исходное) разнообразие. Это указывает, что у северного морского слона изменчивость аллоферментов перед прохождением популяцией «бутылочного горлышка» была ниже, чем в популяции северного морского слона. Единственный спо- соб проверить эту вероятность - определение генетической изменчивости у северного морского слона в период до «бутылочного горлышка», используя многочисленные экспонаты музеев естественной истории. II. Эффективный размер популяции При исследовании действия генетического дрейфа предполагается впол- не определенная численность популяции. При определенных экологичес- ких исследованиях (например, тех, что касаются ограниченности таких ресурсов как пища и свет), для измерения численности популяции подхо- дит общее число индивидов на территории, или цензовое число. Для мно- гих организмов, которые ведут скрытый образ жизни или за которыми трудно вести наблюдения, очень трудно точно оценить численность всех особей в популяции. В результате, популяционные экологи детально ис- следуют методы расчета или оценки количества индивидов в популя- ции или популяционную плотность (Krebs, 1994; Begon et al., 1996). Однако для эволюции, в первую очередь, имеет значение количество размножающихся особей, а не их цензовое число. Эти два измерения раз- мера популяции могут очень различаться, потому что размножающаяся часть популяции может составлять только малую долю от всего количе- ства индивидов в популяции. Например, у деревьев, млекопитающих и других организмов, которые созревают только после продолжительного
II. Эффективный размер популяции 293) ювенильного периода, большая часть популяции находится в дорепро- дуктивной фазе. У людей и некоторых других позвоночных существует также значительная доля особей в пострепродуктивном периоде. Иногда можно оценить численность размножающейся популяции с достаточной степенью точности, учитывая такие индикаторы репродуктивной актив- ности, как гнездование и размер кладки у птиц, численность колоний у животных или количество цветущих растений в популяции. Численность размножающейся части популяции может не отражать размера популяции, но этот параметр вполне подходит для эволюцион- ных исследований. Кроме того, важны такие факторы, как изменчивость в соотношении полов размножающихся особей, количество потомков на одну особь, количество размножающихся индивидов в разных поколени- ях и тип размножения. Все эти факторы могут влиять на генетический вклад в следующее поколение, и общая оценка размножающейся популя- ции не принимает их в расчет. Эволюционные процессы, протекающие в популяциях с ограниченной численностью, позволяют исследовать мо- дель идеальной популяции. Идеальную популяцию численностью N, в которой все родители равновероятно могут быть родителями любой осо- би в потомстве, можно рассматривать с позиций эффективного размера популяции. Другими словами, гаметы выбираются случайно от всех раз- множающихся особей и вероятность каждой взрослой особи продуциро- вать определенную гамету равна 1/N (N - количество размножающихся особей). Эта базовая модель предполагает, что диплоидные организмы дают и мужские, и женские гаметы, т.е. существует возможность самооп- лодотворения. В таком случае, если N велико, то распределение числа потомков (га- мет) на родителя (к) стремится к распределению Пуассона: -к 1 к Р(к)=?-^-, kl где к - среднее число потомков на родителя, Np*. Предположим, что в среднем у каждого родителя по два потомка (к = 2, потому чтор* = 2/N), как было бы в популяции, численность которой не меняется. Тогда веро- ятность, что данный индивид не имеет потомства (к = 0) равна е2 = 0,135, вероятность иметь одного потомка 2е~2=0,270, двух потомков -0,270, трех потомков - 0,18 и т.д. Важно, что при распределении Пуассона среднее число потомков (к) и варианса числа потомков V(k), равны. На стр. 297 мы рассмотрим, как отклонения от распределения Пуассона могут быть объединены для оценки эффективного размера популяции. Для опреде- ления эффективного размера популяции используются 3 характеристики: инбридинг, варианса и собственная величина эффективного размера по-
G94 Глава 6. Генетический дрейф и эффективный размер популяции пуляции (Crow, Denniston, 1988). Эффективный размер инбридинга свя- зывает поколение инбридинга в данной популяции и в идеальной популя- ции; варианса эффективного размера связывает возрастание аллельной частоты в данной популяции и в идеальной популяции; собственная ве- личина эффективного размера связывает потерю гетерозиготности в данной популяции и в идеальной популяции. Другими словами, эффек- тивный размер популяции - это размер идеализированной популяции, в которой имеются те же уровень инбридинга, варианса аллельной частоты и потеря гетерозиготности, как и в исследуемой популяции. Разные типы эффективного размера популяции, в общем, либо идентичны, либо дос- таточно сходны (если численность такой популяции неизменна). При не- которых условиях (например, численность популяции увеличивается или уменьшается) уровень инбридинга и вариансы в такой популяции могут сильно изменяться (Kimura, Crow, 1963). а. Раздельнополость Для анализа эффективного размера популяции у раздельнополых орга- низмов рассмотрим сначала популяцию, состоящую из tVоднополых орга- низмов. Если вероятность получить аллель от каждого родителя равна 1/N, то вероятность получения двух аллелей от одного и того же индиви- да в родительском поколении равна (1/7V)2. Поскольку в популяции N ин- дивидов, вероятность для любого индивида получить аллели от того же родителя составляет N (1/7V)2 = 1Z7V- В такой идеализированной популя- ции из N индивидов любой из родителей имеет равную вероятность про- извести любого потомка (N = Ne), т.е. существует эффективный размер популяции (инбридинговый эффективный размер популяции). Теперь рассмотрим двуполый организм и предположим, что половина гамет происходит от индивидов одного пола (женские) и половина от дру- гого пола (мужские). В этом случае для определения инбридингового эф- фективного размера популяции можно использовать вероятностный под- ход, сходный с предыдущим случаем (Kimura, Crow, 1963). Во-первых, вероятность того, что два аллеля у разных индивидов в поколении t полу- чены от женской особи из поколения t - 1, равна (т)(у) = j. Используя то же рассуждение, что и выше, получим, что вероятность происхождения двух аллелей от одной женской особи составляет 1/(4Д^.), где Nf-количе- ство женских особей в популяции. Подобным образом, вероятность происхождения двух аллелей от одной мужской особи из предыдущего поколения равна 1/(4AQ, где Nm- количество мужских особей. Комбини- рованная вероятность происхождения двух аллелей от одного организма из предыдущего поколения (независимо от женской или от мужской осо- би) равна:
II. Эффективный размер популяции Ne 4Nf+4Nm- Это выражение можно преобразовать для Nf, так что эффективный раз- мер популяции составит: 4NfNm Nf+Nm- (6.7) Если количества женских и мужских особей равны, то N = Nm = ^N, и Ne - N. У некоторых видов численность женских и мужских особей неодина- кова. Обычно количество размножающихся самцов меньше, чем количе- ство размножающихся самок, (#,<#), потому что некоторые самцы скре- щиваются с несколькими самками. Однако, для некоторых видов верно обратное: самки скрещиваются с несколькими самцами. Предположим, что один самец скрещивается со всеми самками колонии или гарема (это происходит в некоторых популяциях позвоночных, где самцы контроли- руют гаремы самок, как у большеротого барана и морских слонов (см. ниже и пример 6.3). В этом случае выражение 6.7 принимает вид 4W, Ne =---— Nf+V Заметьте, что максимальное значение этого выражения равно 4,0, когда величина велика. Поскольку каждый пол вкладывает в потомство по- ловину генов, сокращение количества размножающихся особей одного пола может значительно уменьшить эффективный размер популяции, как это видно на рисунке 6.10, где представлен эффективный размер популя- ции для разных количеств самок при Nm = 1, или Nf. Изучение изменчивости мтДНК и ядерной ДНК у южного морского слона показывает, что оценка соотношения полов, основанная на наблюдениях за поведением (около 40 самок на одного самца) может сильно переоценивать действительное соотношение полов (Slade etal., 1998). Эффективное соот- ношение полов, оцененное исходя из генетических данных, составляет толь- ко около 4 или 5 самок на одного самца. Различие в этих оценках отчасти можно объяснить переоценкой доли успешных копуляций и коротким пе- риодом времени, в течение которого доминирует один самец (1-2 года). На непрямые генетические оценки влияют и другие факторы. Для аллелей Х-сцепленных генов или аллелей гапло-диплоидных орга- низмов, определение эффективного размера популяции несколько отли- чается, потому что самки содержат две трети, а самцы - одну треть всех аллелей. В этом случае эффективный размер популяции равен:
Рисунок 6.10. Эффективный размер популяции при Nm = NrNm = и Nm = 1. (6.8) N e 2Nf+4Nm> (Wright, 1931). Если численность самок и самцов одинакова (Nf=Nm=±N), то Ne = N, потому что самцы гаплоидны. В популяциях у некоторых об- щественных Перепончатокрылых (Hymenoptera), например у медоносной пчелы, имеется всего одна размножающаяся самка, или царица (матка). В этом случае N = 1, и выражение принимает вид 9N N =---- 2 + 4AV Максимальные значения этого выражения достигаются, когда N велико (2,25). Это уравнение представлено на рисунке 6.11 для эффективного размера популяции (Nf = Nm) при N = j Nm. Эффективный размер популя- ции важен, когда мы рассматриваем колонию медоносных пчел размером 20 000 и более, в которой только одна размножающаяся самка, и она скре- щивается почти с дюжиной самцов, а большая часть популяции - это не- размножающиеся рабочие самки. Ь. Вариация числа гамет Распределение потомков (гамет) у родителей может быть неслучайным из-за генетических, средовых или других факторов. Например, у некото- рых птиц имеется строго определенное количество яиц в кладке, поэтому варианса количества яиц в кладке может быть около нуля. С другой сто- роны, если все кладки или выводки выживают или погибают как группа,
II. Эффективный размер популяции 14 Рисунок 6.11. Изменение эффективного размера популяции для Х-сцепленных генов или гапло-диплоидов генов при N. = W 1 W и N, = 1. г J т I 2. т J то варианса количества потомков может быть больше пуассоновского. Когда популяция имеет постоянный размер, эффективный размер попу- ляции приблизительно равен: (6.9а) Kt+2 где Vk - варианса количества потомков. Если размер популяции изменяет- ся так, что к 2, то для вычисления эффективного размера популяции можно использовать следующее общее выражение (Kimura, Crow, 1963; Crow, Denniston, 1988): (6.9b) k-\ + VJk Отношение эффективного размера к цензовому размеру приблизительно равно: 2 N l + Vk/k’ (6.9с) (Crow, 1954). Если Vk =к, то распределение потомков соответствует рас- пределению Пуассона и отношение 6.9с равно единице. Если Vk = 0, (на- пример, в искусственной популяции, где способны выжить по два потомка от каждого родителя), то NJN = 2. Если Vk поддерживается низким, то эф- фекта ограниченного размера популяции отчасти можно избежать. Одна-
G98 Глава 6. Генетический дрейф и эффективный размер популяции ко, обычно варианса больше, чем среднее значение, и в результате значение N/N меньше единицы. У некоторых организмов, например устриц, даю- щих много потомков (Hedgecock et al., 1992) большинство молоди - это потомство только нескольких особей, и отношение N/N может быть до- вольно низким. Оценивая данные по D. melanogaster с учетом вариации числа гамет, Кроу и Мортон (Crow, Morton, 1955) обнаружили, что отноше- ние Ne/Nу некоторых видов находится в пределах от 0,74 до 0,90, а отноше- ние NJN в популяциях людей - в пределах от 0,69 до 0,95. Нанни (Nunney,1993, 1996) показал, что теоретически отношение N/N в поколе- нии обычно близко к 0,5 и редко выходит за пределы от 0,25 до 0,75. Пример 6.4. Регистрация рождений в популяциях людей часто дает очень важную демографическую информацию. Имаизуми с сотрудниками (Imaizumi et al.,1970) детально исследовали регистрационные записи в нескольких поколениях приблизительно у 1000 японских семей, прожи- вающих в сельской общине. Одним из показателей фертильности (плодо- витости) было общее число детей, доживших до 18 лет и старше. Семьи разделили на пять когорт, в зависимости от возраста матери, чтобы мож- но было выявить любые временные тенденции в изменении плодовитос- ти. Обобщенные данные представлены в таблице 6.5, где kn Vk - это сред- нее значение и варианса размера семьи. Отношение эффективного размера популяции к действительному размеру можно вычислить, пользуясь урав- нением 6.9с. Из таблицы 6.5 видно, что средняя и варианса размера семьи в послед- ние десятилетия существенно снизились. В ранних когортах средняя и варианса почти одинаковы, но в последней когорте (1921-1930) варианса гораздо ниже средней. В результате, отношение NJN равно 1,43; что озна- чает, что эффективный размер значительно больше действительного раз- мера. Это связано с широким контролем за рождаемостью и желанием иметь не более двух детей. ТАБЛИЦА 6.5. Средняя и варианса общей рождаемости в пяти когортах сельской япон- ской популяции и отношение эффективного размера популяции к действительному, рас- считанное из уравнения 6.9с (по Imaizumi et al., 1970) Дата рождения матери 1881-1890 1891-1900 1901-1910 1911-1920 1921-1930 к 4,60 4,80 4,28 3,28 2,74 4,58 5,12 4,79 2,75 1,09 N/N е 1,00 0,97 0,94 1,09 1,43
II. Эффективный размер популяции Иногда полезно рассчитать эффективный размер популяции для двух полов раздельно. Для генов, наследующихся только через один пол, таких как мтДНК, хлДНК и Y-хромосома, эффективный размер популяции для данного пола связан с влиянием инбридинга или генетического дрейфа на эти гены (см. стр. 306-307). Для ядерных генов, варианса числа потомков может значительно различаться между двумя полами. Эффективный раз- мер популяции для определенного пола вычисляется по формуле Nfkf -1 k f -1 + F7, / kf ’ J J Nmkm-\ Nem - km-i + Vkm/km' (6.10a) (6.10b) для женского и мужского пола, соответственно (Lande, Barrowclough, 1987; смотри пример 6.6 далее). Эти величины можно объединить для расчета общего эффективного размера популяции: 4N N N _ ' Nef+Nem (6.10с) с. Инбридинг Значительный инбридинг в популяции может снизить ее эффективный размер. В общем, эффективный размер популяции как функция величи- ны инбридинга равен: (6.П) где/- коэффициент инбридинга (см. главу 5). Другими словами, инбри- динг лишь несколько понижает Ne, если величина f находится в пределах от 0,0 до приблизительно 0,10. Однако, у высоко самооплодотворяющих- ся растений или животных, значение f может достичь единицы, а величи- на Ne достигнет у N. Дело в том, что при почти полном инбридинге поте- ря изменчивости в популяции сходна с потерей изменчивости в гаплоидной популяции численностью N. Однако в гаплоидной популяции с такой чис- ленностью образуется только N гамет, что эквивалентно диплоидной по- пуляции численностью у N (Cabarello, 1994). Недавно Лиу с сотрудника- ми (Liu et al., 1998) исследовали разнообразие последовательности в популяциях горчицы, различающихся по способам опыления (от пере- крестноопыляемых до самоопыляемых популяций). Ожидалось, что по- лученные результаты будут соответствовать расчетам (выражение 6.11).
Глава 6. Генетический дрейф и эффективный размер популяции Пример 6.5. Сравнение систем скрещивания по их влиянию на генетичес- кую изменчивость наиболее подходит, когда разные популяции одних и тех же видов различаются по уровню инбридинга. Лиу с коллегами (Liu et al., 1998) недавно определили степень нуклеотидного разнообразия в локу- се Adh-1 у горчицы, Leavenworthia crassa. Авторы изучали три различных типа популяций: самонесовместимые (S около 0), с неполной самосовмес- тимостью (промежуточные значения S) и самосовместимые (S около 1). На рисунке 6.12 представлено среднее нуклеотидное разнообразие в пределах трех типов популяций. Наблюдаемая степень изменчивости в каждой по- пуляции согласуется с уровнем самоопыления: самая высокая изменчивость при низком уровне самоопыления, отсутствие вариаций - при высоком уров- не самоопыления. Результаты сходны для интронных последовательнос- тей (150 сайтов) и молчащих последовательностей (114 сайтов). Получен- ные различия даже выше, чем ожидалось. По-видимому, в этих популяциях, помимо инбридинга, действуют другие факторы, которые дифференциаль- но влияют на разнообразие последовательностей локуса Adh-1. 0.03 0.02 0.01 0.00 S около 0 Промежуточные S около 1 значения S Уровень самоопыления в популяции Рисунок 6.12. Разнообразие последовательности гена Adh-1 в популяциях горчицы L. crassa с разными уровнями самоопыления (S), (по Liu et al., 1998). Заштрихованные и не зашт- рихованные полосы обозначают интронные последовательности и молчащие последова- тельности, соответственно. В популяциях при 5 около 1 изменения последовательности отсутствуют. d. Изменение численности популяции во времени Вариабельность численности популяции в разных поколениях может сильно влиять на общий эффективный размер популяции. Изменения размера популяции могут происходить вследствие регулярных, цикли-
II. Эффективный размер популяции ческих изменений численности популяции, периодических уменьшений популяции из-за болезней или других факторов или сезонных измене- ний численности. Общий эффективный размер популяции сильно зави- сит от ее наименьшей численности, потому что после прохождения «бу- тылочных горлышек» все оставшиеся в популяции особи происходят от особей, переживших «бутылочное горлышко». Это видно при опреде- лении изменений гетерозиготности в течение времени (Crow, Kimura, 1970). Известно, что Но. Если N изменяется из поколения в поколение, тогда где Ne.t - эффективный размер популяции в поколении i. Общий эффек- тивный размер популяции - это та величина, которая вызывает то же сни- жение гетерозиготности, что изменяющиеся величины так что Решая это уравнение, находим, что (6.12а) Если величина Neне слишком мала, то эффективный размер популяции приблизительно равен: <6-12Ь) Таким образом, эффективный размер популяции примерно соответствует гармонической средней эффективных размеров популяции в индивиду- альных поколениях. Представим, что популяция в последовательных поколениях имеет эффективные размеры 10, 100 и 1000. При Н= 0,5 имеем, что Н = 0,475,
[Г302 Глава 6. Генетический дрейф и эффективный размер популяции Н2 = 0,473 и Н, = 0,472 согласно этим ограниченным размерам. Из выра- жения 6.12b получим эффективный размер популяции, равный 27,0. Тог- да гетерозиготность снижается таким образом, что Н = 0,491, Н2 = 0,482 и Н, = 0,473, достигая в третьем поколении той же гетерозиготности, что и в популяции с вариабельной численностью. Эффект «бутылочного горлышка» очень важен при определении эф- фективного размера популяции. Предположим, что популяция насекомых возрастает в десять раз каждые два поколения летом и возвращается к своему естественному низкому уровню из-за зимней смертности; напри- мер, размеры популяции N, ЮУи 100У Средний цензовый размер (ариф- метическая средняя) за три разные поколения 36,7N. Однако, эффектив- ный размер популяции (выражение 6.12b) равен только 2,7N, т.е. гибель особей выше на порядок. В примере 6.6 показано, как изменение числен- ности потомков у двух полов и изменения в поколениях могут быть вклю- чены в общую оценку эффективного размера популяции. Пример 6.6. На эффективный размер популяции могут влиять различные факторы, включая соотношение полов, неслучайную изменчивость чис- ленности потомков у двух полов и различия эффективного размера в поколениях. Для иллюстрации действия этих факторов их можно объеди- нить в одной оценке эффективного размера популяции (Lande, Bar- rowclough, 1987). В таблице 6.6 представлено число потомков, получен- ное от отдельных женских и мужских особей из растущей популяции в течение трех поколений. Заметьте, что в образовании потомства в каждом поколении участвует больше самок, чем самцов, так что среднее число потомков на самку меньше, чем на самца (таблица 6.7), а варианса в чис- ле потомков на самку ниже, чем на самца. Используя выражение 6.10а и эти данные, получим, что эффективный размер популяции для самок в первом поколении равен: N« «=4,12. З-1 + j Подобным образом, Nm = 1,38. Заметьте, что эффективный размер попу- ляции для самок выше, чем цензовый размер, потому что варианса числа потомков у самок ниже, чем среднее число потомков, и что эффективный размер у самок более чем в три раза выше, чем эффективный размер у самцов. Общий эффективный размер популяции в этом поколении равен: N = 4(4.12)(1.38) 4,12 + 1,38
II. Эффективный размер популяции ТАБЛИЦА 6.6. Количество потомков для самок и самцов в увеличивающейся популяции в течение трех поколений (по Lande, Barrowclough, 1987) Поколение Самки Количество потомков Самцы Количество потомков 1 А,В 4 М 9 С 3 N 3 D 1 2 А 5 М 9 В,С 4 N 5 D 3 О,Р 3 E,F 2 G,H 0 3 А,В 5 М 12 C,D 4 N 9 E,F,G 3 О 7 H,I,J,K 2 Р 5 L 1 Q 3 R, S,T 0 ТАБЛИЦА 6.7. Среднее значение и варианса числа потомков для самок и самцов в трех поколениях по данным, представленным в таблице 6.6 Поколение Количество самок Количество самцов kt кт VKf G,„ 1 4 2 3,0 6,0 2,00 18,00 2 8 4 2,5 5,0 3,43 8,00 3 12 8 3,0 4,5 1,64 20,86 Для поколений 2 и 3 эффективные размеры популяции для самцов снова ниже, чем для самок из-за высокой вариансы числа потомков и количе- ства индивидов. Используя эти величины, общие эффективные размеры для поколений 2 и 3 равны 8,97 и 13,10, соответственно. Подставляя эти значения эффективных размеров популяции в выра- жение 6.12а получаем общий эффективный размер популяции: Ne -и 2 1—1— Ji-------1—У1------!— (2)(4,3) I (2)(8,97) I (2)(13,10) 6,91. Другими словами, потеря генетического разнообразия популяции такая же, как при постоянном эффективном размере популяции, равном 6,91. В
304 Глава 6. Генетический дрейф и эффективный размер популяции этом примере арифметическая средняя эффективных размеров в поколе- ниях составляет 8,73, что несколько выше, чем оценка эффективного раз- мера 6,91. Это указывает, что низкий эффективный размер в первом поко- лении приводит к снижению общего эффективного размера популяции. Эффективные размеры для поколений можно подставить в выражение 6.12b: 3 Ne =-------------------------= 6,98. (1/4,13)+ (1/8,97)+ (1/13,10) В этом случае, даже в нескольких поколениях и при незначительных из- менениях эффективного размера в поколениях, гармоническое среднее приближение очень близко к точной формуле. е. Возрастная структура Часть особей в популяции может находиться в пререпродуктивном пери- оде (до полового созревания), часть - в пострепродуктивном, а часть - в репродуктивном. К тому же, у особей разных возрастов могут варьиро- вать рождаемость, и смертность, что обусловлено как генетически, так и факторами среды. В результате, эти особи могут вносить разный вклад в генетическую непрерывность популяции. Например, особи в пострепро- дуктивном периоде не вносят дополнительного вклада, даже если живут в этом периоде длительное время. С другой стороны, только что достиг- шая репродуктивного возраста особь, может внести в популяцию боль- шой генетический вклад. Включение детальной демографической информации в оценку эффек- тивного размера популяции осложнено, особенно при перекрывании по- колений и при возрастных различиях в жизнеспособности и плодовитос- ти; поэтому было разработано несколько подходов (см. Cabarello, 1994). Например, Ней и Имаицуми (Nei, Imaizumi, 1966) предполагают, что эф- фективный размер популяции приблизительно равен: Ne=TNa, (6.13) где Т - средний возраст репродукции в годах (длина поколения) и Na - число индивидов, родившихся за год и доживших до репродуктивного возраста. Применяя этот подход к демографической информации о жен- щинах европейской расы, живущих в США, Фельзенштайн (Felsenstein, 1971) обнаружил, что отношение эффективного размера популяции к цен- зовому размеру приблизительно равно 0,34. Нанни и Элам (Nunney, Elam, 1994) предложили подход, при котором простые демографические данные можно объединить для оценки отношения эффективного размера
II. Эффективный размер популяции 305 популяции к количеству взрослых индивидов. Они вычислили эту оцен- ку у ряда видов, включая пятнистую сову, медведя гризли и улитку Сереа nemoralis, и обнаружили, что их способ вполне достоверный. f Размер соседства Во многих естественных ситуациях нет четких границ, разделяющих по- пуляции, поэтому невозможно оценить эффективный размер отдельной популяции. Для расчета эффекта ограниченной популяции у видов с про- тяженным распределением в пространстве Райт (Wright, 1943) ввел в по- пуляционную генетику понятие соседства. Размер соседства - это число индивидов в круге радиусом в два раза больше, чем стандартное отклоне- ние генного потока на поколение (2 К12) в одном направлении. Таким об- разом, если известна плотность популяции (<7) и площадь круга соседства (4тг1/), мы можем оценить эффективный размер популяции в соседстве: Ne=^Vd. (6.14) У животных такие оценки осложнены, так как генный поток - это функ- ция ряда факторов, включая плотность, источник пищи и генетическую изменчивость. У растений при оценке размера соседства может потребо- ваться учет генного потока на различных стадиях жизненного цикла (см. пример 6.7, где генный поток у фиалок (распространение пыльцы) обес- печивается различными способами). Пример 6.7. У разных видов фиалок (Beattie, Culver, 1979) распростра- нять семена могут муравьи, также может происходить баллистическое рассеяние семян из семенных капсул или распространение их с помощью специальных опылителей. Различные типы рассеяния, плотность и об- щие оценки эффективного размера популяций у трех видов фиалки даны в таблице 6.8. Распространение, обусловленное муравьями, баллистичес- ким рассеянием и опылителями, составляет 4%, 22% и 74% от размера ТАБЛИЦА 6.8. Варианты распространения (V), плотность (d) и оцененный эффектив- ный размер популяции (учитывая все три типа распространения) у трех видов фиалок Виды Варианты распространения d А Муравьи Баллистический Опылитель V. pedata 0,18 0,46 11,07 9,6 547 V. pennsylvanica о,и 0,69 5,27 7,2 310 V. rostrata 0,11 0,70 2,61 6,7 167
006 Глава 6. Генетический дрейф и эффективный размер популяции соседства, соответственно. При баллистическом рассеянии семена чаще распространяются дальше, чем при их рассеянии с помощью опылителя. g. Гены митохондрий, хлоропластов и Y хромосом Для установления родства между группами и изменчивости внутри попу- ляций исследуют гены таких органелл, как митохондрии и хлоропласты, а также гены Y-хромосом. Если соотношение между полами во всех трех случаях одинаково, то ожидаемый эффективный размер популяции равен У74, потому что эти гены передаются особями одного пола и только осо- бям этого же пола, т.е. они только одного типа (в гаплоидном состоянии). Однако, эффективные размеры популяции для разных полов могут быть различны. Поскольку мтДНК обычно наследуется по материнской линии и хлДНК, по-видимому, всегда наследуется по материнской линии, то эф- фективный размер популяции для генов этих органелл составляет N f Ne=-^, (6.15а) или половину эффективного размера популяции женских индивидов (см. выражение 6.10а). Если количество спаривающихся самцов или эффек- тивный размер популяции мужских индивидов мал, тогда эффективный размер для такого гена может быть действительно выше, чем для ядерно- го гена того же организма. Например, если Nm равен 1, как обсуждалось выше, тогда максимальное значение Ne для ядерного гена будет 4. По- скольку N может быть гораздо больше, чем 8, наблюдаемый Ne может быть больше для гена органелл, чем для ядерного гена. Эффективный размер популяции для генов Y- хромосомы, и для мтДНК (если она наследуется по отцовской линии, как у хвойных, например), равен: N Ne=—^~, (6.15b) или половине эффективного размера популяции мужских индивидов (вы- ражение 6.10b). У организмов с низким эффективным размером популя- ции мужских особей эффективный размер для такого гена может быть гораздо меньше, чем для ядерного гена того же организма. h. Генетические методы оценки эффективного размера популяции Для кратковременной оценки эффективного размера популяций были раз- работаны три различных подхода с учетом влияния генетического дрей-
II. Эффективный размер популяции 307 фа на различные популяционно-генетические характеристики (Schwartz et al., 1998). В популяциях большого размера влияние генетического дрей- фа может быть очень мало, что приводит к значительным изменениям в оценке эффективного размера популяции. При условии, что другие факторы незначимы, генетический дрейф приводит к ожидаемому изменению частот аллелей в поколениях. Если размер популяции станет меньше, а число поколений увеличится, ожида- емый генетический дрейф приведет к большему изменению частот алле- лей. Поллак (Pollack, 1983) и Уэплз (Waples, 1989) показали, что такие временные изменения аллельной частоты можно объединить для оценки эффективного размера популяции. Для оценки эффективных размеров популяции самок и общей популяции Лайкр с сотрудниками (Laikre et al.,W№>) использовали данные по структуре мтДНК и аллоферментов в популяции шведской коричневой форели (Salmo trutta). Оценки эффек- тивных размеров популяции самок и общей популяции составили 58 и 97, соответственно, что близко к соотношению при равенстве эффектив- ных количеств самок и самцов. Во-вторых, вследствие генетического дрейфа возникает гаметическое неравновесие или неравновесие по сцеплению (см. главу 10). Выражение 10.6с показывает, что при данной частоте рекомбинаций между локусами в популяции ограниченного размера существует ожидаемая величина нерав- новесия между локусами. Если значения неравновесия и частоты рекомби- наций известны, то можно получить оценку N.(Hill, 1981; Waples, 1991). В-третьих, небольшое число родителей может привести к возраста- нию гетерозиготности в потомстве из-за случайных изменений аллель- ных частот у родителей женского или мужского пола. Величину возраста- ния гетерозиготности можно использовать для оценки эффективного размера популяции родителей (Pudovkin et al., 1996; Luikart, Comuet, 1999). Эти три подхода (см. стр. 422; Fu, Li, 1993), позволяют оценивать эффек- тивный размер популяции по многим высоко полиморфным локусам, ко- торые стали доступны для изучения у многих организмов. Оценки эффективного размера популяции, основанные на генетичес- ком подходе и демографических способах, дают сходные результаты. Обзор опубликованных данных (Frankham, 1995) показывает, что оценки, основанные на двух подходах, хорошо согласуются. Франкхэм обнару- жил, что отношение NJN для демографических и генетических оценок значительно ниже, чем прогнозировал Нанни (Nunney,1993). Однако, во многом это расхождение вызвано включением выборок с большим чис- лом поколений (Vucetich et al., 1997), что приводит к снижению общей оценки N, (если существует значительная вариация эффективного разме- ра популяции между поколениями).
рое Глава 6. Генетический дрейф и эффективный размер популяции III. Отбор в ограниченных популяциях В отсутствие дифференцирующего отбора в локусе может произойти фиксация или потеря аллеля вследствие генетического дрейфа. Вероят- ность фиксации аллеля равна его исходной частоте, поэтому, если аллель редкий, вероятность фиксации достаточно низка. В противоположность этому, в неограниченной популяции (где по определению нет генетичес- кого дрейфа) частота благоприятного аллеля всегда возрастает, прибли- жаясь к фиксированной. В ограниченной популяции благоприятный ал- лель может быть потерян из-за случайного действия генетического дрейфа. Вероятность фиксации благоприятного аллеля в ограниченной по- пуляции, и(р) - это функция исходной частоты аллеля, интенсивности отбора, благоприятствующего аллелю, и численности ограниченной по- пуляции. Для объединения этих факторов и определения вероятности фиксации аллеля Кимура (Kimura, 1962) вывел общее уравнение диффу- зии (подробные математические выкладки см. в работе Kimura, Ohta, 1971). а. Направленный отбор Если предположить, что относительные приспособленности трех гено- типовЛ1Л1,Л1Л2иЛ2А2равны 1 +5, 1 + hs и 1,то с учетом величин, данных для «прогрессивного отбора» в ряду ЗЬ таблицы 3.3 получим общее урав- нение диффузии: , \ Jo и( р) = —-------------- e-2Ns[{2„-YW^}dx О где N - эффективный размер популяции. Это значение вероятности фик- сации зависит от исходной частоты аллеля А (р), уровня доминантности (/г), размера популяции (N) и селективного преимущества аллеля (.s). Здесь включены четыре параметра, но система сводится к трем параметрам, поскольку N и s всегда являются произведением. Это выражение являет- ся достаточно точным даже для прерывистых во времени популяций, если их численность относительно велика. При аддитивном действии генов (h = 0,5) это выражение имеет вид: 1 _ e~2Nsp U(P) = ~--TNT (6.16Ь) 1-е Взаимосвязь между различными параметрами и их влияние на вероят- ность фиксации аллеля показана на рисунках 6.13 и 6.14. На рисунке 6.13 вероятность фиксации определена для трех уровней доминантности и раз- личных исходных частот аллеля (Ns = 2,0). Величина Ns, равная 2,0, может (6.16а)
III. Отбор в ограниченных популяциях Рисунок 6.13. Вероятность фиксации аллеля при разных исходных частотах аллеля и трех уровнях доминантности (.Vs—2,0). Рисунок 6.14. Вероятность фиксации аллеля при разных величинах Ns и трех исходных частотах аллеля при аддитивном действии генов (h = 0,5). быть получена из комбинации 1000 и у = 0,002 или N= 100 и 5 = 0,02. И сильно зависит от исходной частоты аллеля: вероятность фиксации, и(р) бы- стро растет, если р возрастает от низкой величины. При низких аллельных частотах также существенны и различия и(р) уровней доминантности. Если р = 0,1, то вероятности фиксации для h = 0,0,0,5 и 1,0 равны, соответственно, 0,223, 0,335 и 0,461. В общем, возрастающий уровень доминантности значи- тельно увеличивает и (р), пока это значение не приблизится к 1,0.
Глава 6. Генетический дрейф и эффективный размер популяции Когда Ns « 1, т.е. л « 1/N, изменение частоты аллеля, в первую оче- редь, определяется генетическим дрейфом: и(р) ~ р. Если Ns » 1, тогда изменение частоты аллеля, прежде всего, зависит от отбора и и (р) » р. На рисунке 6.14 показана вероятность фиксации для нескольких ис- ходных частот аллеля при разных уровнях Ns и аддитивном действии ге- нов (h = 0,5). При возрастании значения Ns вероятность фиксации также повышается: при значении р, равном только 0,1, вероятность фиксации равна уже 0,631 (Ns = 5). Для определения вероятности фиксации благоприятного аллеля, позволяющей следить за изменением распределения частоты аллеля во времени, используются матрицы вероятности переходов. В этом случае элементы матрицы нужно модифицировать таким образом, чтобы учиты- вались результаты отбора и генетического дрейфа. Это можно сделать, предположив, что отбор изменяет частоту аллеля перед выборкой: <617а> где ,_ (1 + hs)pq + q2 1 + Ihspq + sp2 и q =j!2N np = 1 -j/2N. На рисунке 6.15 представлен пример, где N= 20, 5 = 0,1, h = 0,5 и исходная частота аллеля А во всех популяциях равна 0,5. Вероятность фиксации аллеля (выражение 6.16b), составляет 0,78. Распреде- ление частоты благоприятного аллеля отражает действие направленного от- бора даже через пять поколений. Через 20 поколений 20,6% популяции будет фиксировано по благоприятному аллелю и только 3,1% - по неблагоприят- ному. Для понимания действия отбора сравните рисунки 6.5 и 6.15, где пока- заны одинаковые параметры (за исключением результатов отбора на рис. 6.15). Ь. Балансирующий отбор Зная скорость снижения гетерозиготности, можно определить действие отбора по поддержанию генетической изменчивости в ограниченной по- пуляции. Для любого данного режима отбора асимптотическое снижение гетерозиготности - это снижение, независимое от начального распреде- ления частот аллелей и равное Я,+1 = (l-d)H,, где d - скорость снижения гетерозиготности (обозначает приближенную величину потери гетерозиготности) при нефиксированной частоте алле-
III. Отбор в ограниченных популяциях 3 IjJ) Рисунок 6.15. Сглаженное распределение частоты аллелей для популяции численностью 20 особей и с исходной частотой аллеля, равной 0,5, при отборе через 1, 5 и 20 поколений; приспособленности генотипов А^А^А^и Ayl., равны 1,1, 1,05 и 1,0, соответственно. (6.18) ля и величину прироста для абсорбирующих состояний. В отсутствие отбора d - и это уравнение сводится к выражению 6.3а. Темп снижения гетерозиготности можно понимать как приближенную вероятность, что нефиксированная по данному аллелю популяция в сле- дующем поколении станет фиксированной либо при q = 0,0, либо при q = 1,0. Отношение этой величины для нейтрального локуса к такой же величине для локуса, подверженного действию отбора, называют факто- ром задержки (Robertson, 1962), или: rf = ——. 2Nd В отсутствие отбора фактор задержки равен единице, a d = 1/(22V). Отбор может замедлять скорость фиксации аллеля по сравнению с нейтрально- стью, т.е. d < 1 / (2N) и rf>\. Ожидаемый эффект любой модели отбора можно исследовать при расчете влияния отбора на частоту аллеля, и за- тем используя эти величины для вычисления элементов матрицы перехо- дов (выражение 6.17а). Фактор задержки особенно полезен при определении влияния различ- ных моделей балансирующего отбора на сохранение генетической измен- чивости в ограниченных популяциях. Робертсон (Robertson, 1962) деталь- но изучил влияние ограниченного размера популяции на отбор в пользу гетерозигот. Если относительные приспособленности генотипов A,At, А^А2 и А2А2 равны 1 - sp 1 и 1 - s2, то значение фактора задержки для разных
0^12 Глава 6. Генетический дрейф и эффективный размер популяции величин составляет N (s, + s2). Это показано на рисунке 6.16 при разных равновесных величинах в популяции ограниченного размера. Заметьте, что вертикальная ось на графике дана в логарифмической шкале, потому что при N (s{ + s2) = 16 и равновесной частоте около 0,5 скорость потери гетерозиготности довольно низка, и фактор задержки становится большим. Если в неограниченной популяции отбор может привести к сбалансированному полиморфизму, то в популяции ограни- ченного размера генетическая изменчивость меньше, чем в популяции, где отбор не действует. Другими словами, в некоторых случаях, баланси- рующий отбор в ограниченной популяции действительно повышает темп падения гетерозиготности по сравнению с нейтральностью. При значе- ниях qe меньше 0,2 или больше 0,8, фактор задержки меньше единицы (величины достигаемой в отсутствие отбора). Другими словами, в попу- ляциях с преимуществом гетерозигот и относительно неравными вели- чинами приспособленностей гомозогот генетическая изменчивость умень- шается быстрее, чем в популяциях, где отбор не действует. В основе различной скорости потери генетической изменчивости в ограниченной популяции при различных типах отбора лежит изменение частот аллелей в неограниченной популяции (Hedrick, 1972). В общем, наиболее важными факторами, повышающими фактор задержки, явля- ются равновесные частоты аллеля (как показано в модели преимущества гетерозигот) и величины \q при частотах аллеля около 0,0 и 1,0. Высокая величина \q снижает темп роста числа гомозигот в популяции ограни- ченного размера в результате случайных эффектов. Рисунок 6.16. Фактор задержки в модели преимущества гетерозигот при разных величи- нах N(st + л\), (по Robertson, 1962).
Задачи 3 Задачи 1. Через сколько поколений ожидаемая гетерозиготность в популяции численностью 10 и 100 особей составит 5% от исходной величины ? 2. Вычислите матрицу вероятностей для N = 2 в отсутствие отбора. Предположим, что исходное генно-частотное распределение следу- ющее^^; 0,2; 0,2; 0,2; 0,2. Каково это распределение и гетерозигот- ность через одно и два поколения? 3. Каково ожидаемое время фиксации для аллеля при исходной часто- те 0,1, если размер популяции составляет 10, 100 и 1000 особей? Почему время фиксации аллеля зависит от размера популяции? 4. Какова вероятность полиморфизма в группе из четырех основателей, если частоты двух аллелей одинаковы? Какова вероятность полиморфизма в этой группе основателей, если одинаковы частоты десяти аллелей? 5. Каково ожидаемое увеличение генетического расстояния между дву- мя популяциями, если одна из популяций прошла через «бутылоч- ное горлышко» (N = 3) в течение одного поколения, а исходная гете- розиготность составляла 0,6? 6. Найдите значение Ne, если у диплоидного организма N = 5 и Nm = 1. Найдите значение Ne, если у гаплоидного организмаN = 1 и Nm= 10. 7. Определите N, если в четырех последовательных поколениях раз- меры популяции одинаковы: 5,50, 10 и 100? Чем различаются реше- ния уравнений 6.12а и 6.12b? 8. Эффективный размер популяции большерогих овец оценивается для самок как Ne = 100 и для самцов - как Nem =10. Каковы ожидаемые эффективные размеры популяции для генов мтДНК, Y-хромосомы и аутосомного гена? 9. Какова вероятность фиксации аддитивного благоприятного аллеля, если его исходная частота 0,1, 10, а его селективное преимуще- ство равно 0,01, 0,1 и 0,25? 10. Рассчитайте матрицу вероятностей для N= 2, когда \q - j sq(l - q) и s = 0,1 .Используя то же исходное генно-частотное распределение, как в вопросе 2 (0,2; 0,2; 0,2; 0,2; 0,2), найдите это распределение через одно и два поколения. Сравните полученные результаты с рас- пределением в отсутствие отбора. 11. Предложите эксперимент, позволяющий определить влияние гене- тического дрейфа на изменчивость в данном локусе? 12. Предложите другие (помимо эффекта «бутылочного горлышка») объяснения низкой гетерозиготности аллоферментных локусов у се- верного морского слона (пример 6.3).
ГЛАВА 7 ПОТОК ГЕНОВ И СТРУКТУРА ПОПУЛЯЦИЙ До сих пор возникают споры о значении потока генов в эволюции. Существует мнение, что он обычен между популяциями: небольшой поток генов ведет к уни- фикации вида и влияет на внутрипопуляционную генетическую изменчивость. Некоторые исследователи считают поток генов необычным явлением, а действие естественного отбора в популяциях и субпопуляциях - не зависимым от потока генов. Вероятно, справедливы оба эти мнения, однако доказать значение потока генов в природных популяциях некоторых видов невозможно из-за отсутствия пря- мого способа оценки его уровня. Монти Слэткин (Monty Slatkin) (1981) В предыдущих главах мы рассмотрели действие различных эволюцион- но-генетических факторов в единичной популяции. У большинства ви- дов популяции часто подразделяются на маленькие единицы вследствие разнообразных географических, экологических или поведенческих фак- торов. Например, популяции рыб в водоемах в зоне приливов, деревья в сельскохозяйственных угодьях и насекомые на растениях-хозяевах под- разделены на субпопуляции этих видов, занимающие подходящие места обитания (ареалы). Подразделенность популяции может быть также след- ствием поведенческих особенностей (стадность у приматов, у террито- риальных птиц и в колониях общественных насекомых). Когда популяция подразделена, то межпопуляционные генетические связи зависят, в первую очередь, от величины эффективного потока генов между субпопуляциями или подгруппами. Когда интенсивность генного потока между группами высока, генетический поток направлен на гомо- генизацию генетической изменчивости между группами. Когда генный поток слаб, генетический дрейф, отбор и даже мутации в отдельных груп- пах могут привести к генетической дифференциации. Некоторые типы миграций (например, миграции птиц, которые се- зонно совершают перелеты в тропики) необязательно приводят к обме- ну генами между субпопуляциями. Передвижение или распространение особей на другие территории в поисках пищи, в процессе которых не происходит спариваний или репродукции, также не являются генети- чески эффективными генными потоками. Даже передвижение взрослых индивидов, способных к репродукции, может не привести к генетичес-
Глава 7. Поток генов и структура популяций 3 I 5 кому вкладу из-за отсутствия спаривания в результате действия пове- денческих или других факторов. Эндлер (Endler, 1977) попытался раз- личить генный поток, миграции и распространение особей. Следуя его рекомендациям, мы используем термин генный поток (поток генов) для обозначения передвижения генов между группами, приводящего к генетическому обмену. К примеру, внутри водораздела между отдельными группами рыб или растений может быть значительная доля генетических обменов. Обмен генами может происходить между соседними водоразделами, но с мень- шей интенсивностью, чем между группами внутри водораздела. В еще большем масштабе, популяции могут существовать в совершенно разде- ленных водоемах, между которыми вероятно происходит небольшой пря- мой обмен, но у которых имеется некоторая общая генетическая история, зависящая от интенсивности генного потока между соседними группами или от случайного генного потока между отдаленными территориями. Это иерархическое представление полезно при описании общих межпопу- ляционных взаимосвязей и при документировании пространственного распределения величины генетической изменчивости. Таким образом, подразделенность популяций предполагает, что меж- популяционные различия существовали всегда. С другой стороны, отдель- ные субпопуляции могут угаснуть, а затем восстановиться за счет реко- лонизации (заселения) особями из других субпопуляций. Например, водоемы в зоне прилива могут обеспечивать подходящее местообитание для конкретных видов рыб, но из-за вымирания этих видов внутри водо- ема в зоне прилива, и в данном водоеме в зоне прилива не будет рыбы до тех пор, пока не произойдет реколонизация рыбами из других водоемов в этой зоне. Когда популяции в подходящих местах обитания вымирают и замещаются при реколонизации особями из других субпопуляций, ее на- зывают метапопуляцией (Hanski, 1998). По динамике вымирания и ре- колонизации метапопуляции могут отличаться от традиционной подраз- деленной популяции, но иногда любую подразделенную популяцию называют метапопуляцией (Hanski, Gilpin, 1997). Это связано с повышен- ным интересом к ландшафтным исследованиям с целью оценки истори- ческого и современного генных потоков (Sork et al., 1999). Сначала рассмотрим действие генного потока и популяционную струк- туру в неограниченной популяции и обсудим методы, используемые для оценки генного потока и популяционной структуры. Затем исследуем объединенное действие потока генов и генетического дрейфа на характер и величину генетической изменчивости. Наконец, мы определим объеди- ненное действие потока генов и отбора, поддерживающее генетическую изменчивость и формирующее клины.
Глава 7. Поток генов и структура популяций I. Структура популяций Генетическая изменчивость субпопуляций в составе популяции может быть различной вследствие нескольких эволюционных причин. Напри- мер, популяция может быть представлена локальными субпопуляциями, в которых происходит генетический дрейф или неслучайные скрещива- ния, или отбор по-разному действует в разных субпопуляциях. Другими словами, в структуру популяции могут вносить вклад все известные ге- нетические факторы. Для того, чтобы выяснить влияние структуры попу- ляции на характер и величину генетической изменчивости, исследуем эффект простейшей популяционной структуры: модели материк - ост- ров, и затем рассмотрим обобщенную модель популяции. Такие модели не могут служить конкретным биологическим примером, но они прибли- жены к реальным ситуациям и позволяют определить результат действия ограниченного генного потока. а. Модель материк-остров Существует ряд примеров эффективного однонаправленного генного пото- ка, например, из континентальной популяции в островную. Популяции ви- дов, обитающих на островах вблизи больших массивов суши (континентов или материков) или в воде (в прудах, озерах) могут служить источником по- тока генов. К таким источникам относятся периферические популяции лю- бого вида, постоянно пополняющиеся индивидами из основного ареала. Предположим, что островная популяция получает мигрантов из боль- шой исходной материковой популяции, как показано на рисунке 7.1а. Допустим, что ответный (реципрокный) поток генов не оказывает значи- тельного влияния на частоту аллеля в исходной популяции и островная популяция достаточно велика (поэтому влияние генетического дрейфа относительно мало по сравнению с эффектом потока генов). Пусть про- порция мигрантов, переселяющаяся в островную популяцию каждое по- коление, равна т, а пропорция немигрантов (резидентов) равна 1 - т. Если частота аллеля А2 у мигрантов (материк) равна q , а частота этого аллеля на острове до появления генного потока равна qw то частота алле- ля А2 после действия потока генов составит: Ч\ =(l-m)q0+mqm = = Qo-m(qa-qJ. (7.1а) Изменение частоты аллеля после одного поколения потока генов равно: ^-m(q0 -qm). (7.1b)
I. Структура популяций Остров Материк Рисунок 7.1. Иллюстрация модели материк-остров (а) и популяционной структуры с тремя субпопуляциями (Ь). Из этого выражения очевидно, что частота аллеля неизменна, если т = О или дй = qm. Для нас интересна только вторая альтернатива, так как при т = 0 потока генов не наблюдается. Предположим, что величины qm и т постоянны во времени и принимают значения между нулем и единицей. Если q., < qm, то частота аллеля А2 на острове возрастает, а если q0> q , то эта частота понижается, указывая, что при q = qon популяции существу- ет устойчивое равновесие аллельных частот. На рисунке 7.2 показано вли- яние различных аллельных частот у мигрантов на значение &q при т = 0,1. Заметьте, что изменение аллельной частоты возрастает линейно по мере того, как значение частоты удаляется от равновесной величины и достигает абсолютного максимума (либо нуля, либо единицы) в зависи- мости от величины q . 1 т Рисунок 7.2. Изменение аллельной частоты в модели материк-остров при трех различ- ных частотах аллеля у мигрантов (т = 0,1).
Глава 7. Поток генов и структура популяций Если поток генов непрерывен, то во втором поколении частота аллеля равна: (h = (l-m)q} +mqm. Преобразуя это выражение для q. получим: q2 =(\-m)1q(> +[1 - (1 - m)2qm. Общее решение этого возвратного уравнения, связывающего частоту алле- ля А2 в поколении t с частотой аллеля в исходном поколении следующее: q, = (1-ш)'?0 + [1 —(1 -m)']qm. (7.1с) С возрастанием t qt асимптотически стремится к равновесной величине qm. Для иллюстрации темпа приближения к равновесию на рисунке 7.3 дается изменение частоты аллеля во времени для двух значений qfj = 0,1 и 0,9, когда qm = 0,4 и т = 0,1. Как и следует ожидать из рассмотрения зна- чений \q на рисунке 7.2, частота аллеля изменяется сначала в максималь- ном темпе и замедляется при асимптотическом приближении к равнове- сию. Поскольку в этой модели генный поток однонаправленный, островная популяция действительно образована из индивидов, полностью происхо- дящих от мигрантов. В результате, аллельная частота на острове прибли- жается к частоте аллеля на материке, так как все больше и больше инди- видов в островной популяции являются потомками мигрантов (см. пример 7.2 позже). Рисунок 7.3. Изменение частоты аллеля со временем для двух разных исходных частот аллеля в модели материк-остров, когда qm = 0,4 и т = 0,1.
I. Структура популяций 3 19 Ь. Обобщенная модель Модель материк - остров изучает изменение частоты аллеля только в ос- тровной популяции, предполагая, что важен только поток генов с матери- ка на остров. Согласно более общей модели, поток генов может суще- ствовать между всеми частями структурированной популяции. Предположим, что популяция состоит из к субпопуляций, и пропорция индивидов, мигрирующих из субпопуляции j в субпопуляцию i каждое поколение, равна т . Результат представим в виде матрицы параметров потока генов, называемой матрицей обратных миграций по Бодмеру и Кавалли-Сфорца (Bodmer, Cavalli-Sforza, 1968), которая описывает ген- ный поток между субпопуляциями (см. таблицу 7.1). Пропорция немиг- рантов для популяции i определена значением т . Сумма значений каж- дого ряда в этой матрице равна единице, потому что она описывает пропорцию генов, пришедшую из любой другой субпопуляции в данную субпопуляцию, или: IX =1- 7=1 Заметьте, что сумма колонок (рядов) матрицы не равна единице. На ри- сунке 7.1b представлена схематическая иллюстрация популяции с тремя субпопуляциями и девятью результирующими параметрами генного по- тока (слева вверху таблицы 7.1) ТАБЛИЦА 7.1. Матрица миграций, показывающая пропорцию генного потока в одном поколении из одной субпопуляции в другую Субпопуляция в поколении t + 1 Субпопуляция в поколении t 1 2 3 J к Всего 1 щ|3 . ти • ти 1 2 Щ21 /и22 "С . • "С m2t 1 3 тп щ32 /и33 . 1 i тп та щ 3 . "С 1 k "С mt2 т,. . А/ 1
320 Глава 7. Поток генов и структура популяций В каждой субпопуляции может быть разная частота А2, поэтому обо- значим частоту аллеля в /-той субпопуляции как q. Таким образом, часто- та А2 в z-той субпопуляции после потока генов будет равна: Q, = «,i?i + mi2q2 + - + +...+ mtkqk = k = £'М, (7.2a) 7=1 или сумме произведений пропорции мигрантов из /-той субпопуляции в z-тую субпопуляцию и частоты аллеля у мигрантов из j-той субпопуля- ции. Изменение частоты аллеля во всех субпопуляциях можно определить, используя матричную систему записи (см. главу 1). Обозначим матрицу миграций как М, а вектор частот аллеля для разных субпопуляций в поко- лении t - как Qt. Тогда, й+, и в общем виде, й= Wo- Элементы матрицы дают пропорцию особей в субпопуляции i и поколении t, которые произошли из субпопуляции j в поколении 0. Из этих равенств можно получить частоты аллеля в любом будущем поколе- нии, взяв постоянные величины т в течение времени. За длительный период времени аллельные частоты сблизятся и достигнут асимптоти- ческой величины, которую можно рассчитать из выражения: (7.2b) 7=1 где т} t - элемент в усиленной матрице миграций с величиной t, доста- точной для достижения элементами своих асимптотических величин. Пример 7.1 иллюстрирует поток генов между тремя человеческими по- пуляциями в Судане. Пример 7.1. Для измерения интенсивности потока генов между субпопу- ляциями необходимо идентифицировать индивидов в разных поколени- ях. Существует множество хорошо документированных примеров струк- туры человеческих популяций, например трех популяций в Судане (Roberts, Hioms, 1962). Пропорции потока генов между этими популяци- ями показывают, что большая доля индивидов не мигрирует (см. таблицу 7.2). Например, т,, = 0,985, или 98,5% индивидов в популяции Nuer не
I. Структура популяций 321 ТАБЛИЦА 7.2. Пропорция потока генов между тремя суданскими популяциями (по Roberts, Hioms, 1962) Реципиентная популяция Исходная (донорская) популяция (1) Nuer (2) Dinka (3) Shilluk (1) Nuer (2) Dinka (3) Shilluk 0,9850 0,0125 0,0025 0,0138 0,9775 0,0087 0,0000 0,0098 0,9902 мигрируют из одного поколения в следующее. Оценочные частоты алле- ля М групп крови MN в популяциях Nuer, Dinka и Shilluk равны 0,575, 0,567 и 0,505, соответственно. Если использовать матрицу миграций из таблицы 7.2, то прогнозируемые значения частот аллеля в будущих поко- лениях приведут к изменениям, изображенным на рисунке 7.4. Эти изме- нения аллельной частоты невелики, так как пропорция немигрантов вы- сока, а исходная дифференциация между популяциями мала. В этом случае асимптотическая частота аллеля М для группы из трех популяций будет равна 0,546. Из таблицы 7.1 и примера 7.1 видно, что все индивиды происходят из одной известной субпопуляции, но они могут мигрировать в популяцию из- вне в результате экзогамных браков между членами популяции и мигранта- ми извне. Данные, представленные в примере 7.3 по видам тропических де- ревьев и западно-африканским шимпанзе показывают, что у существенной доли потомства в популяции родители могут происходить из других терри- Рисунок 7.4. Изменение частоты аллеля М в суданских популяциях, использованы мат- рицы миграций из таблицы 7.2.
322 Глава 7. Поток генов и структура популяций торий (субпопуляций). В таком случае к матрице миграций с элементами т.Е образующей k + 1 колонку, можно добавить еще одну колонку. Тогда частота аллеля в субпопуляции /, (см. матрицу миграций), будет равна: 7=1 где последние члены, т .Е и qF соответствуют интенсивности потока генов в субпопуляцию z извне и частоте аллеля у этих мигрантов. Асимптоти- ческая частота аллеля в этом случае зависит от частоты аллеля у мигран- тов (как в модели материк - остров). При малой доле экзогамии частоты аллеля в субпопуляциях исходно равны и затем постепенно достигают частоты аллеля у экзогамных мигрантов. Таким образом, если существу- ет поток генов из связанных групп субпопуляций извне, то частоты алле- ля действительно будут отражать генетический состав этих иммигран- тов. При этом предполагается, что влияние генетического дрейфа и отбора на частоту аллелей незначительно. с. Эффект Воланда Выборка особей из структурированной популяции может содержать гете- рогенные подвыборки (например, когда субпопуляции разделены физи- ческими или экологическими барьерами, ограничивающими передвиже- ние между группами особей). Если эти подвыборки сильно различаются по аллельным частотам, то появится чистый дефицит гетерозигот и из- быток гомозигот (даже если соотношение Харди-Вайнберга выполняет- ся в каждой подвыборке, см. Wahlund, 1928). Это довольно удивительно, так как квадрат средней частоты аллеля в популяциях меньше среднего значения квадрата частот аллелей в популяциях. Этот эффект, известный как принцип Воланда, или эффект Воланда можно проиллюстрировать следующим образом. Предположим, что р. и ^.частоты аллелей А и соответственно, в популяции z. Наблюдаемые средние частоты трех генотипов, A tAt, А {А2 иА2А2, в к субпопуляциях рав- ного размера (при соответствии каждой субпопуляции пропорциям Хар- ди-Вайнберга) равны: Р = -Ур> к^' ’ К e=|b,!. К
I. Структура популяций 323 Однако, ожидаемые пропорции трех генотипов могут отличаться от на- блюдаемых генотипических пропорций. Средние частоты аллелей А{ иЛ2 во всех k субпопуляциях, при их равенстве в каждой субпопуляции, составят: Можно ожидать, что частоты трех генотипов А ХА f, А jА2 и^ Д2 будут р2, 2pq и q2, соответственно. Таким образом, разница между наблюдаемой и ожи- даемой частотами генотипа А2А2 равна: — 2 I 1 V 2 I —2 -<? = г 9 = ( к у I К I = ~^QlQ+kq2) = К = 7^q‘ к Последняя строка соответствует вариансе частот аллеля А2 (Г) между суб- популяциями. Таким образом, разница между наблюдаемыми и ожидае- мыми частотами А^2 равна вариансе аллельной частоты в субпопуляциях. Наблюдаемые генотипические частоты можно записать в следующем виде: P = P2+Vq, H=2pq-2Vq, (7.3а) Q=Q2+vq- В результате, наблюдаемая частота гомозигот по сравнению с ожидаемой в большой гомогенной популяции повышена на величину V, а наблюдае- мая частота гетерозигот понижена на удвоенную величину вариансы. Та- кой же результат получился бы, если бы популяции были объединены в течение времени с временными изменениями в аллельных частотах. Для иллюстрации эффекта Воланда предположим, что в двух популя- циях частоты аллеля Л2 различны, q} = 0,4 и q2 = 0,8. Предполагая, что в каждой субпопуляции пропорции генотипов соответствуют равновесию Харди-Вайнберга, частоты генотипов AtAt, AtA2 и А 2А2 равны 0,36, 0,48 и
[Г324 Глава 7. Поток генов и структура популяций 0,16 в популяции 1 и 0,04, 0,32 и 0,64 в популяции 2, а наблюдаемые час- тоты генотипов, Р, Н и Q равны 0,2, 0,4 и 0,4, соответственно (напри- мер, Q =f(^j2 +92) = 0,4). Если во всей популяции пропорции соответ- ствуют соотношению Харди-Вайнберга, то ожидаемые частоты генотипов равны для генотипов А1А2иА2А20,16, 0,48 и 0,36. Таким образом, из выражения 7.3а варианса равна 0,04, и это отклонение от пропорций Хар- ди-Вайнберга обусловлено только объединением выборок, которые от- личаются по частотам аллелей. Из этих расчетов становится ясным, что явно большая гетерогенность в частотах аллелей должна приводить к заметному отклонению от про- порций Харди-Вайнберга только вследствие эффекта Воланда. Напри- мер, различие в аллельных частотах в 0,1 между двумя субпопуляциями приводит к наблюдаемому увеличению каждой из гомозигот (И) только на 0,0025. Наибольший эффект наблюдается, когда две разные популяции фиксированы по двум разным аллелям, и наблюдаемое увеличение каж- дой гомозиготы (Г) равно 0,25, так как гетерозигот не наблюдается. Хотя при множественном аллелизме общая частота всех гетерозигот снижается, частота конкретной гетерозиготы может не понижаться. Если корреляция между частотами различных аллелей высока, то частота не- которых гетерозигот может быть действительно больше, а частота неко- торых гомозигот - меньше, чем ожидается (Li, 1969). Для множествен- ных аллелей наблюдаемые частоты генотипов равны: P^lp^+ZCOV^, (7.3b) где COV - коварианса частот аллелей А.иА}в популяциях, равная COVp^ =1^Р.Р}-Р.Рг Иногда трудно определить, является ли дефицит гетерозигот следстви- ем инбридинга или эффекта Воланда. Однако инбридинг может изменять частоту гетерозигот во всех локусах, тогда как эффекту Воланда подвер- жена частота гетерозигот только в тех локусах, в которых имеется вариа- ция аллельной частоты между субпопуляциями. Далее, когда аллели мно- жественны, инбридинг редуцировал бы все гетерозиготы, тогда как при эффекте Воланда частота некоторых гетерозигот понижается, другие не подвергаются воздействию, или же их частота повышается. d. Гаметический и зиготический генные потоки Генный поток может происходить на разных стадиях жизненного цик- ла и может оказывать разные эффекты в зависимости от возраста, пола
I. Структура популяций или характеристик мигрантов. В частности, поток генов, происходя- щий на гаметической стадии (пыльца или сперма) или на зиготичес- кой (семена или проростки) может иметь совершенно разные послед- ствия. Например, семена, которые собираются в каком-то одном месте и затем сохраняются животными, их запасающими, впоследствии дают начало субпопуляциям, которые различаются по аллельным частотам. В результате может наблюдаться отклонение от пропорций Харди-Вай- нберга вследствие эффекта Воланда, т.е. дефицит гетерозигот и избы- ток гомозигот. Генный поток через гаметы или пыльцу может совершенно по-разно- му влиять на пропорции генотипов в популяциях. Предположим, что пул пыльцы состоит из пыльцы мигрантов с частотой А равной qm, и пыльцы растений-резидентов с частотой аллеля А2, равной q. В таком случае, если пропорция т - это пыльца от мигрантов, то общая частота аллеля А2 в пуле пыльцы равна: QP =^-m)q + mqm. Полагая, что частота аллеля А2 в женских гаметах равна q, получим часто- ту трех генотипов: Р=РРр, H=pqp+ppq, Q = qqp Эти пропорции аналогичны представленным в выражении 2.6а для раз- личных частот аллелей в женских и мужских гаметах. Очевидно, миг- рация пыльцы с различной аллельной частотой с другой территории может привести к возрастанию гетерозиготности и к снижению гомози- готности. Таким образом, генные потоки через семена и пыльцу могут оказывать противоположное действие на пропорции генотипов в попу- ляции. Полезно было бы объединить два типа генных потоков (пыльцу и се- мена, или гаметический и зиготический) в одну общую меру интенсивно- сти генного потока. Поскольку генетическое содержание пыльцы гапло- идно, а пыльцы - диплоидно, общий генный поток равен: m = ^тр + ms, где интенсивности генных потоков пыльцы и семян равны тр и тр соот- ветственно. Для оценки соотношения генных потоков пыльцы и семян используют общее и материнское (мтДНК) значения Fsr т.е. меры подраз- деленности популяции.
G26 Глава 7. Поток генов и структура популяций II. Оценка генного потока и структура популяции Оценить интенсивность генного потока в большинстве популяций доволь- но трудно. Например, оценивая передвижения индивидов между популя- циями (скажем, миграции насекомых или грызунов), можно переоценить поток генов в популяцию, так как мигранты могут не оставлять или ос- тавлять меньше потомства по сравнению с немигрирующими особями. Однако идентифицировать мигрантов, обусловливающих поток генов, довольно сложно, так как они могут существовать лишь непродолжитель- ный период времени, но скрещиваться на территории данной субпопуля- ции. Оценка вероятности, что эти распространяющиеся особи внесут ге- нетический вклад в популяцию, значима, и поэтому с этой оценкой следует соотносить измерения степени распространения особей. Непрямые из- мерения генного потока с использованием генетических маркеров полез- ны для подтверждения поведенческих или других наблюдений или в слу- чае, когда такие наблюдения неубедительны или невозможны. Простейшая непрямая оценка гибридных популяций - это оценка родительских попу- ляций. Более общее число мигрантов между группами измеряют, исполь- зуя методы оценки популяционной структуры, такие, как F коэффициен- ты и связанные с ними измерения. Для оценки генного потока можно использовать также частоту редких аллелей и другие измерения (Slatkin, Barton, 1989 и Cockerham, Weir, 1993). а. Популяции гибридов Гибридные популяции, включающие мигрантов из других популяций, представляют интерес, поскольку они располагаются на границах рас- пространения вида, и для них характерна высокая генетическая изменчи- вость. Такие популяции обычно появляются в результате скрещивания (смешения) двух или более родительских популяций в течение продол- жительного периода времени, (см. пример 7.2, в котором исследуются не- гроидные и европеоидные источники происхождения афро-американс- кого населения). Если родительских популяций только две, то пропорцию потока генов (так называемую примесь) из одной популяции в одном поколении можно оценить преобразованием равенства 7.1а: Если поток генов существует в течение ряда поколений, то индексы в этом выражении следует изменить:
II. Оценка генного потока и структура популяции 32Z) М = ^ Ян-, (7.4а) Ча ~Чв где М - оценка общей интенсивности генного потока индивидов из ро- дительской популяции В в гибридную популяцию Н (1 - М - пропорция из родительской популяции A), (Cavalli-Sforza, Bodmer, 1971). Частоты аллелей в родительских популяциях А и В и в гибридной популяции Н равны q 4, qB и q^ соответственно. Пример 7.2. Интенсивность потока генов (примесь) оценивалась в ряде человеческих популяций, происходящих от нескольких популяций. В ча- стности, для оценки интенсивности потока генов от европеоидов к афро- американцам использовали локусы групп крови (Reed, 1969; Adams, Ward, 1973). Однако, некоторые из этих локусов подвержены действию отбора, а также генного потока, и для достоверной оценки потока генов различия аллельных частот между предковыми европеоидной и негроидной груп- пами недостаточно велики. Парра с сотрудниками (Parra et al., 1998) об- наружили 10 так называемых популяционно-специфических аллелей, по которым наблюдается максимум различий между популяциями африкан- ского и европейского происхождения. Это двухаллельные локусы, боль- шинство из которых - результат наличия или отсутствия полиморфизма сайтов рестрикции. В таблице 7.3 даны частоты четырех из этих аллелей для выборок негроидов, европеоидов и шести выборок индивидов, име- ющих преимущественно негроидное происхождение. Наиболее сильные различия аллельных частот отмечены для маркера FY-NULL*!, который присутствует у всех обследованных европеоидов и ни у одного негроид- ного индивида. Оценка общего генного потока (и стандартная ошибка) в правом столбце сходна с оценкой в выражении 7.4а, но объединяет эф- фект генетического дрейфа и выборочной вариансы (Long, 1991) и ском- бинирована по 10 локусам. Наиболее низкая оценка потока генов была получена из выборок с Ямайки и из Чарльстоуна (Южная Каролина). Считается, что в южных популяциях США доля европеоидного источника происхождения мень- ше, но в выборке из Нью-Орлеана отмечается наибольшая доля европео- идного элемента происхождения. Более того, существуют значительные вариации оценок вклада европеоидного элемента происхождения в раз- ных выборках из северных регионов США (Parra et al., 1998). Оценка потока генов, специфичного по материнской или отцовской линиям, (по вариантам мтДНК и Y-хромосом) в девяти выборках из США, для кото- рых имелись данные по обоим типам маркеров, дала величину генного
ТАБЛИЦА 7.3. Частоты аллелей четырех характерных популяционно-специфических локусов у негроидов и европеоидов из шести популяций США с преобладанием населе- ния негроидного происхождения (Parra et al., 1998). В правом столбце дана оценочная пропорция европеоидного источника происхождения для популяций негроидного проис- хождения, усредненная по 10 популяционно-специфическим локусам Популяция FY-NULL*! ОСА2*1 RB2300*! GC-1F т* Негроиды 0,000 0,098 0,920 0,824 Европеоиды 1,000 0,769 0,333 0,156 Афро-американцы Мейвуд, ИЛ 0,185 0,203 0,776 0,710 0,188±0,014 Нью-Йорк 0,210 0,220 0,821 0,738 0,198±0,021 Филадельфия 0,160 0,137 0,802 0,771 0,138±0,019 Чарльстоун, ЮК 0,112 0,208 0,888 0,765 О,116±О,О13 Нью-Орлеан 0,200 0,284 0,842 0,669 0,225±0,016 Ямайка 0,065 0,091 0,870 0,790 О,О68±О,О13 потока для мтДНК, равную 0,140, а для Y-хромосомы - 0,248. Таким об- разом, видимо исторически сложилось различие соотношения полов в европеоидном источнике происхождения: больше браков между европе- оидными мужчинами-американцами и негроидными женщинами-амери- канками, чем наоборот. Начиная с конца семнадцатого века, в США в качестве рабов было завезено большое количество коренных африканцев. Предположим, что генный поток с тех пор имеет постоянную интенсивность, и что средняя длина поколения составляет примерно 25 лет. Тогда прошедшее число поколений (г), в течение которых существовал поток генов, приблизительно равно 12. При этом значение т из выражения 7.4b (ниже) составило бы 0,021 для популяции Нью-Орлеана и 0,010 - для популяции Чарльстона. Гипотетический поток генов в течение времени для аллеля FY-NULL*! при этих величинах соответствует представленному на рисунке 7.5. Эта модель показывает, что поток генов оказывает больший эффект на часто- ту аллеля в ранних поколениях, и что частота аллеля в гибридной популя- ции достигает частоты в европеоидной родительской популяции В только асимптотически (приближенно). Можно оценить пропорцию потока генов за поколение в течение ряда поколений, преобразуя выражение,7.1с:
II. Оценка генного потока и структура популяции 329 Рисунок 7.5. Гипотетическое изменение частоты аллеля со временем в афро-американс- кой популяции при двух разных оценках потока генов. Черные кружки обозначают совре- менные частоты аллеля FY-NULL*!, а пунктирная линия - асимптотическую частоту. Тогда поток генов из популяций Л и В в популяцию //равен: (1-т)' = ^~9д . Qa ~Qb Преобразуя, имеем: т = 1-евд/Э (7.4b) где х = (qн- qB)/(qA-q^=\-M величина m - оценка пропорции генно- го потока в гибридную популяцию из родительской популяции В за одно поколение. Эта оценка генного потока предполагает, что влияние отбора и генетического дрейфа на частоты аллелей пренебрежимо мало по срав- нению с интенсивностью генного потока. б. Прямое наблюдение потока генов Интенсивность потока генов можно измерить прямым методом при иден- тификации особей в популяции. Прямое наблюдение потока генов воз- можно, например, у людей при регистрации рождений или другой дос- тупной информации о родословных или у других организмов при возможности идентификации или маркировки особей. Имеется много спо- собов различной маркировки особей: зажим пальцев у грызунов, кольце-
(ГЗЗО Глава 7. Поток генов и структура популяций вание лап у птиц, кодированные проволочные ярлыки у рыб и радиопере- датчики у более крупных животных. Условие существования генного по- тока - передвижение и взаимодействие особей внутри скрещивающейся популяции. При использовании высоко вариабельных генетических мар- керов иногда можно идентифицировать родителей генетически и таким образом определить пространственное передвижение гамет между поко- лениями без прямой информации о передвижении родителей (пример 7.3). Когда распределение особей в популяции непрерывно, вариансу рас- стояния генного потока и плотность популяции можно использовать для оценки размера соседства (см. главу 6). Однако распределение расстоя- ния генного потока может быть различным, часто с увеличением числа немигрантов и дальних мигрантов. Общее описание такого потока генов осложнено, и подбор подходящих теоретических распределений для на- блюдаемых данных также затруднен (см. Cavalli-Sforza, Bodmer, 1971). Кроме того, генный поток может различаться между полами: зачастую он значительно выше у особей мужского пола или мужских гамет (пыльцы), чем у особей женского пола (см. пример 7.3). Для оценки разных интен- сивностей генного потока у двух полов используют среднее арифмети- ческое между двумя полами,т =(mf +rnm)/2, где mf №я- оценки жен- ского и мужского генных потоков. Пример 7.3. С помощью высоко вариабельных генетических маркеров можно определить «отцовство» у семян в популяциях растений, где отно- сительно невелико количество потенциальных опылителей, и таким об- разом оценить интенсивность потока генов пыльцы (Chase et al., 1996). Для определения производителей пыльцы в 72-х независимых скрещива- ниях у пологообразующего древесного растения Pithecellobium elegans в Коста-Рике использовали 9 микросателлитных маркерных локусов. Пыль- ца в 41 случае происходила от 28-ми взрослых деревьев, произраставших на выбранной площадке. Шесть таких опылителей для дерева 106 обо- значены на рисунке 7.6. Один из них (дерево НО) растет на расстоянии более 300 метров от реципиента, а 9 из 31-го опылений, по-видимому, были результатом самоопыления (или опыления неизвестным деревом этого вида, растущим за пределами выборочной территории). Два других скрещивания могли произойти с любым из двух деревьев на выборочной территории, а 20 остальных опылений связаны с деревьями, растущими за пределами выборочной территории. Поскольку 20 из 72 генов от муж- ского родителя (и ни один от женского родителя) были получены от дере- вьев, растущих извне, то средняя оценка внешнего потока генов, включая передвижение семян, составила т = (0,00 + 0,28)/2 = 0,14. Среднее рас- стояние для известных скрещиваний (исключая возможные случаи само-
II. Оценка генного потока и структура популяции Рисунок 7.6. Карта популяции пологообразующего древесного растения, Pithecellobium elegans, на территории Коста-Рики с отдельными взрослыми растениями, обозначенны- ми номерами. Другие неизвестные репродуктивные деревья растут в частично дегради- рованном природном лесу (затемненная площадь), (Chase et al., 1996). Линии обозначают известные случаи потока пыльцы к дереву 106 в центре карты. оплодотворения) было 142 метра, значительно дальше, чем ближайший сосед (27 метров). Это недооценка расстояния генного потока пыльцы, потому что 20 из скрещиваний были от производителей пыльцы за преде- лами территории. Высокая средняя дистанция генного потока пыльцы согласуется с тем, что Р. elegans, опыляется бабочками из сем. Sphingidae, совершающих длинные перелеты в поисках пищи (пыльцы и нектара). Другой пример также показывает вклад особей за пределами субпопу- ляции в общий генный поток (Gagneux et al., 1997). Для определения мик- ро сателлитных генотипов в 14 парах мать-детеныш и потенциального отцовства использовали образцы шерсти шимпанзе в стаде из 52 живот- ных в Западной Африке. Известно, что шимпанзе живут общественными группами и спариваются внутри группы. Спаривания часто случайны, но иногда доминантный самец монополизирует все спаривания с данной сам- кой, находящейся в состоянии эструса. Действительно, отцами 7 детены-
(£332 Глава 7. Поток генов и структура популяций шей оказались самцы, живущие вне стада, а еще 7 детенышей - самцы специфичного стада. Таким образом, у 7 из 14 потомков гены отца (но не гены матери) были получены не из стада, следовательно, оценка внешне- го потока генов т = (0,00 + 0,50)/2 = 0,25. Хотя все самки, приносящие потомство от внешних самцов, периодически покидают свое стадо, они проводят вне стада не больше времени, чем самки, которые спариваются внутри стада. Когда популяция подразделена на дискретные колонии или группы, можно построить матрицу миграций. В популяциях человека для созда- ния такой матрицы обычно учитывают место рождения родителей и их детей. Поскольку записи рождений в некоторых популяциях велись в те- чение многих поколений, можно, оценить влияние потока генов между населенными пунктами или регионами в течение длительного времени. В большинстве других популяций доступны только кратковременные дан- ные, что затрудняет оценку изменчивости генного потока во времени. с. F-коэффициенты и другие показатели дифференцированной популяции Для оценки степени дифференциации в подразделениях популяции ис- пользовались разные способы. Наиболее наглядный подход для оценки генетической изменчивости (вариации) в подразделенных популяциях был предложен Райтом (Wright, 1951, 1965b). При этом используются три раз- ных F-коэффициента (это корреляционные коэффициенты, отличающие- ся от F-сгатистик для анализа вариансы). Такие F-коэффициенты нужны для разделения генетической вариабельности (изменчивости) на разные уровни: общий популяционный (Г), субпопуляционный (.S') и индивиду- альный (/). Эти три величины (F;r FlT и F/s) взаимосвязаны следующим образом: l-F/r=(l-F,r)(l-F/s), „ F,T - F,<. FST = f / . P-5) 1-^/s FST- мера генетической дифференциации между субпопуляциями (всегда принимает положительные значения), F и F - меры отклонения от про- порций Харди-Вайнберга внутри субпопуляций и во всей популяции, со- ответственно (положительные значения обозначают дефицит гетерози- гот, а отрицательные - избыток гетерозигот), (Weir, Cockerhan, 1984; Nei, 1986; Neigel, 1997). Общие меры дифференциации пригодны для всех подходов. Развивая эти идеи, Линч и Криз (Lynch, Crease, 1990) показали,
II. Оценка генного потока и структура популяции что нуклеотидное разнообразие вида можно разделить на внутри- и меж- популяционные компоненты. Ней (Nei, 1977, 1987) обнаружил, что эти коэффициенты можно выра- зить в терминах аллельных частот, и наблюдаемой и ожидаемой геноти- пической частот. Предположим, что в данном локусе имеется два аллеля, а в популяции - к субпопуляций. Тогда частота генотипа /12Л, в /-той суб- популяции равна: где F - индекс фиксации в z-той субпопуляции (стр. 230). Это выраже- ние можно преобразовать следующим образом: р _ Qi /Si /I \ . QiO-Qi) Тогда индекс фиксации аллеля во всех субпопуляциях равен: (7.6а) F -Q-ч2 r is _ — , q-q где Q - 'LwiQi - взвешенная частота генотипа А2А2во всей популяции, а q='Lw.q- взвешенная частота аллеля Л, во всей популяции ид2 = Evv’</2- Итак, в каждой субпопуляции w.= 1/ к, если не известно о численности разных субпопуляций. Значимость F можно вычислить, исходя из выра- жения 2.17b: X2=NF;s, (7.6b) где N - количество индивидов в выборке и одна степень свободы. Частота генотипа А2А2 во всей популяции может быть выражена как Q =^~F!T)q2 +FITq Это выражение можно преобразовать: F -Q-t !Т qQ-q)' (Отметьте отличия от выражения 7.6а.) Затем можно определить величи- ну Fsr подставляя F и FIT из выражений 7.6а и 7.6с в выражение 7.5: (7.6с) F -Ч2-*/2 ST q^~q} Это выражение согласуется с обычным выражением для FST,
334 Глава 7. Поток генов и структура популяций F - ST qY~qY (7.7а) где V(q) - варианса частоты аллеля А . Из выражения 2.25а, получаем: X2 = 1NFst, (7.7b) где IN - число гамет в выборке с одной степенью свободы. В таблице 7.4. приведены два числовых примера, иллюстрирующие значение F-коэффициентов. В верхнем примере аллельные частоты в двух субпопуляциях равны, следовательно, нет генетической дифферен- циации между субпопуляциями. Однако, и F]S, и FIT положительны из-за дефицита гетерозигот в субпопуляции 2. В нижнем примере обе попу- ляции соответствуют равновесию Харди-Вайнберга, таким образом, F = 0. Из-за различий частот аллелей между субпопуляциями и F/s, и F!T положительны. ТАБЛИЦА 7.4. Два гипотетических примера для иллюстрации значения F-коэффициен- тов Субпопуляция V, Л!Л2 Ч 1 0,25 0,5 0,25 0,5 2 0,35 0,3 0,35 0,5 FB=0,2 F;r = 0,2 f5T = o,o 1 0,25 0,5 0,25 0,5 2 0,49 0,42 0,09 0,3 Г„=0,0 FIT= 0,0417 Fxr=0,0417 Ней (Nei, 1977) предложил такой анализ для случаев множественного аллелизма. Например, средние F-коэффициенты для множественных ло- кусов можно определить следующим образом: Р _hs-h0 F‘s~njT’ Р _НТ-Н. (7.7с)
II. Оценка генного потока и структура популяции 335 где Но - средняя наблюдаемая гетерозиготность внутри субпопуляции между локусами, Hs - средняя ожидаемая гетерозиготность внутри суб- популяции между локусами, НТ - средняя ожидаемая гетерозиготность в тотальной популяции между локусами. В качестве оценки FST и предполагая соответствие пропорциям Хар- ди-Вайнберга, Ней (Nei, 1973) определил коэффициент генной диффе- ренциации как: Н,-Нк GST= т- -Ч (7.8а) где Hs- средняя субпопуляционная гетеро зиготность при равновесии Харди-Вайнберга и Нт для любого количества аллелей. Ней (Nei, 1973, 1987) отметил, что хотя Gsr - мера относительной дифферен- циации между субпопуляциями, она сильно зависит от степени изменчи- вости (вариации) внутри субпопуляций и в популяции. Это особенно спра- ведливо для высоко вариабельных локусов, таких как микросателлитные локусы, где значение и Н$п Нт может достичь единицы. В результате GST может быть очень мало, даже если популяции имеют неперекрывающие- ся наборы аллелей (Hedrick, 1999b). Это кажется противоречием, так как в случае двух аллелей, когда популяции мономорфны по различным ал- лелям, FST = 1. Однако, GST является мерой пропорциональной степени изменчивости внутри субпопуляций по сравнению с популяцией и не ука- зывает специфичность вовлеченных аллелей. Величину GST может пред- ставить в виде: 6sr=l-^<l-HS5 “ т где 1 - Н - средняя внутрипопуляционная гомозиготность. Из этого оче- видно, что дифференциация не может повысить уровень гомозиготности, вне зависимости от того, какой фактор эволюции действует на изменчи- вость. Очевидно, что при использовании высоко полиморфного маркера, снижающего уровень гомозиготности, максимум GST также должен быть значительно снижен. Джин и Шакрабори (Jin, Chakrabory,1995) получили прогнозируемое изменение GST между субпопуляциями, происходящими от общей пред- ковой (исходной) популяции, которые были полностью изолированы в течение длительного времени. Эта величина приближается к значению: _(^-1)(1-Я,) k-\ + Hs (7.8b)
Глава 7. Поток генов и структура популяций где к - число субпопуляций. В пределе во всех популяциях имеются непере- крывающиеся наборы аллелей, и максимальные генетические расстояния рав- ны бесконечности (например, стандартное генетическое расстояние по Нею), (Nei, 1972). На рисунке 7.7 показано, что для нормальных уровней изменчиво- сти аллоферментных локусов (скажем при Hs = 0,1) максимальные величины GST равны 0,82 и 0,89 для 2 и 10 субпопуляций, соответственно, тогда как для высоко вариабельных локусов (например микросателлитных, при Hs - 0,9) максимальные величины 6)^ равны 0,053 и 0,091 для 2 и 10 субпопуляций. Поскольку величина GST зависит от уровня разнообразия, Ней (Nei, 1973) предложил абсолютную меру генной дифференциации, названную минимальным генетическим расстоянием, которая независима от генно- го разнообразия внутри популяции и равна: — к D =-----(HT-HS). т j 1 ' I э ' • к -1 (7.8с) Ней (Nei, 1987) предположил, что высокая величина Gsr(0,674) для алло- ферментных локусов у сумчатой (кенгуровой) крысы, например, (см. Johnson, Selander, 1971) - это результат низкого генного разнообразия. В 9 популяциях крысы НТ = 0,097 и Hs = 0,012, так что Dm= 0,028, т.е. сход- но по величине со значением, определенным в человеческой популяции (0,019) и у Escherichia coli (0,028). Рисунок 7.7. Пределы 6'. , при различных уровнях внутрипопуляционной генетической изменчивости (Н..). где число субпопуляций к = 2 или 10.
II. Оценка генного потока и структура популяции В некоторых популяциях имеются дополнительные уровни наблюдае- мой структуры. Например, субпопуляции могут быть сгруппированы в регионы или разделены на колонии (Weir, Cockerhan, 1984; Nei, 1987). При таком иерархическом порядке групп, изменчивость может распреде- ляться между различными уровнями. Например, при наличии региональ- ного уровня, в котором могут быть расположены субпопуляции, можно определить, что г. HR-HS Fsr - н (7.9а) п R И F -Нг-Н* bRT~—--------. (7.9b) Эти величины разделяют изменчивость по разнообразию между субпо- пуляциями внутри региона (верхняя строка) и между регионами во всей популяции (нижняя строка). При таком иерархическом разделении мож- но определить уровень наибольшей вариации. Например, у некоторых видов наибольшая степень вариации существует между субпопуляция- ми, тогда как у других видов - между региональными группами (см. при- мер 7.4 с данными по микро сателлитным локусам из трех регионов рас- пространения исчезающего вида рыб, Gila topminnow.) Было показано (Holsinger, Mason-Gamer, 1996), что иерархический анализ можно исполь- зовать и по отношению к нуклеотидному разнообразию. Пример 7.4. Рыбы вида Gila topminnow когда-то были весьма распрост- ранены в реке Джила (Gila River, Аризона), но сейчас живут лишь в не- скольких истоках и в отдаленных местах обитания. Сокращение ареала связано с развитием систем водопользования и с интродукцией западной москитной рыбы (Parker et al., 1999). Хедрик и Паркер (Hedrick, Parker, не опубликованные данные) исследовали степень изменчивости во всех де- вяти естественных популяциях и обнаружили пять разных групп (мета- популяций). В таблице 7.5 дана аллельная частота микросателлитного локуса LL53 для трех региональных групп, включающих две и более по- пуляций. Частоты аллелей в субпопуляциях внутри региона очень сход- ны, но они сильно различаются между регионами. Можно оценить эти различия количественно, определив FSR и FRT из выражений 7.9а и 7.9b. Для этого сначала определим гетерозиготность, соответствующую равновесию Харди-Вайнберга, внутри каждой из семи субпопуляций (данной в крайнем правом столбце). Средняя из этих семи величин Hs = 0,263. Затем рассчитаем среднюю аллельную частоту в каждой
ТАБЛИЦА 7.5. Частота аллелей микросателлитного локуса для сохранившихся естествен- ных популяций рыб из трех региональных групп: ручьев Bylas и Sonoita Creek и протока Sonoita Creek, где минус обозначает отсутствие аллеля Аллели 138 142 144 146 148 150 164 Я Ручьи Bylas Ручей Bylas I — - - 1,000 - - - 0,000 Ручей Bylas II — — 0,115 0,885 - - — 0,204 Средняя частота аллелей - - 0,058 0,942 - - - 0,109 Ручьи Sonoita Creek Ручей Cottonwood - 0,278 0,722 - - - - 0,401 Ручей Monkey - 0,988 - - - 0,012 - 0,024 Средняя частота аллелей - 0,633 0,361 - - 0,006 - 0,469 Проток Sonoita Creek Ущелье Coalmine — 0,725 0,250 — 0,025 — — 0,411 Ручей Sonoita Creek - 0,759 0,241 - - - - 0,366 Водопады Red Rock 0,025 0,700 - - - - 0,275 0,434 Средняя частота аллелей 0,008 0,728 0,164 - 0,008 - 0,092 0,435 Общая средняя частота аллелей для всех популяций 0,004 0,493 0,190 0,269 0,004 0,002 0,039 0,647 региональной группе. Используя эти средние аллельные частоты, мож- но рассчитать гетерозиготность Харди-Вайнберга для каждого регио- на (также в самом правом столбце). Взвешенная средняя этих величин составляет HR = [2(0,109) + 2(0,469) +3(0,435)]/7 = 0,352. Наконец, рас- считаем среднюю аллельную частоту (нижний ряд), и гетерозиготность по Харди-Вайнбергу из этих частот Нт = 0,647. При этих величинах пропорция аллельных различий между субпопуляциями внутри регио- нов равна F = 0,253, а пропорция различий между регионами равна Frt = 0,456. Таким образом, между регионами различия вдвое выше, чем между субпопуляциями внутри групп. Заметьте, что мы рассчи- тывали эти величины в целях иллюстрации и без соответствующих поправок на размер выборки и число групп (для справок см. Neigel, 1997). Как говорилось, у растений генный поток распространяется двумя путями: гаметами (пыльца) и зиготами (семена). Результат генного пото- ка данной интенсивности выше у семян, так как они диплоидны, а пыль- ца - гаплоидна. Однако интенсивность генного потока у пыльцы часто может быть значительно выше и превосходить эту удвоенную разницу:
II. Оценка генного потока и структура популяции FST =--------_ (7.1 Оа) ^ST(m) + FT(p} ~^FsT{m)FsT{p) У папоротников мтДНК наследуется по материнской линии, а хпДНК - по отцовской линии. Изучение мтДНК, хпДНК и ряда аллоферментных локусов (Latta, Mitton,1997) в популяциях сосны, Pinus flexilis, произрас- тающей в северо-центральной части Колорадо, показало довольно высо- кую величину FST(m) = 0,679. В выборке из северной популяции была об- наружена высокая частота типа мтДНК, который не встречается в других популяциях. Но величина Fs = 0,013 оказалась низкой, так как во всех популяциях обнаружилось много одинаковых типов хпДНК. Прогнози- руемая величина FST(выражение 7.10а) равна 0,013, т.е. высокий ожидае- мый уровень генного потока пыльцы приведет к низкой величине FST. Среднее значение для десяти аллоферментных локусов составило 0,016, незначительно отличаясь от ожидаемой величины F Используя общее значение FSJ.n его материнскую компоненту FST(m), Энное (Ennos,1994) показал, что отношение потока генов пыльцы {т^ к потоку генов семян (т) равно: тр _ FsT(m) ^St+^sW ms Fsra-FST{m}) (7.10b) В таблице 7.6 представлены общая и материнская компоненты F для шести разных видов древесных растений и оценки отношений генного потока пыльцы к генному потоку семян. Расширение такого анализа (Ни, Ennos, 1997) выявило шесть различных характеристик генного потока (Wang, 1997; Berg et al., 1998). Согласно современным молекулярным дан- ным предполагают, что распространение генного потока отклоняется либо ТАБЛИЦА 7.6. Общая (для обоих родителей) и материнская компонента F у шести видов древесных растений (одного гибридного вида дуба и пяти видов сосны) и оценка отношения генного потока пыльцы к генному потоку семян (по Ennos, 1994; Latta, Mitton, 1997) Виды Fsr F ST(m) m/m Quercus petraea/Q.robar 0,037 0,88 196 Pinus contorta 0,061 0,66 28 Pradiata 0,13 0,83 31 P.attenuata 0,12 0,86 44 P.muricata 0,22 0,88 24 Pflexilis 0,013 0,68 159
^340 Глава 7. Поток генов и структура популяций в женскую сторону (например, у человека, см. Bamshad et al., 1998; Seielstad et al., 1998), либо в мужскую, как у китов (Lyrholm et al., 1998). III. Структура популяции и генетический дрейф Поток генов поддерживает одинаковые частоты аллелей в разных субпо- пуляциях. Но когда все эти субпопуляции ограничены по размеру, генети- ческий дрейф может привести к случайным межпопуляционным разли- чиям даже при генном потоке. Согласно простейшей модели объединенного действия генного потока и генетического дрейфа, в суб- популяцию с ограниченной численностью мигрируют равные пропорции особей из исходной популяции. Субпопуляции распределяются в про- странстве, поэтому поток генов между ними, в некоторой степени, зави- сит от межпопуляционных расстояний. Такой дистанционно-зависимый поток генов рассматривается в моделях, где особи сгруппированы в дис- кретные колонии или субпопуляции, т.е. в так называемых лестничных моделях. а. Модель материк-остров, или островная модель Рассмотрим объединенное действие генного потока в ограниченного раз- мера популяции с помощью модели, предполагающей, что репликатив- ные островные популяции имеют N индивидов каждая и в каждом поко- лении получают из материковой популяции пропорцию мигрантов, равную т (рисунок 7.8а). Райт (Wright, 1940) назвал такую модель островной, поскольку существует много ограниченных субпопуляций (эквивалент- ных материку), как поставляющих мигрантов, так и получающих их. Если интенсивность потока генов и размер популяций на островах велики, то аллельные частоты в островных популяциях быстро сравняются с часто- тами аллелей на материке. Но если размер популяций на островах мал и/или интенсивность потока генов низка, то ожидаемый генетический дрейф может привести к случайным изменениям аллельных частот. В ре- зультате, аллельные частоты на островах могут значительно различаться друг от друга и от аллельной частоты у мигрантов. Влияние ограниченного размера популяции заключается в том, что аллельные частоты в субпопуляциях дрейфуют по отдельности, тогда как генный поток служит для нейтрализации этого эффекта и поддержания частот аллелей одинаковыми. Можно оценить эти противоположные эф- фекты, определяя равновесную величину индекса фиксации. Предполо- жим, что 1/(27V) - вероятность, что два аллеля идентичны по происхожде- нию в предыдущем поколении (г - 1) и что 1 - 1/(27V) - вероятность, что они происходят от разных аллелей в предыдущем поколении (N - эффек-
III. Структура популяции и генетический дрейф 341 Рисунок 7.8. Две разные популяционные структуры с ограниченным размером популя- ции: материк-остров, или островная модель (а) и одномерная лестничная модель (Ь). тивный размер популяции). Ожидаемую гетерозиготность в поколении t можно найти по формуле: Преобразуя вероятность идентичности аллелей через вероятность, что оба аллеля не мигранты, или (1 - т)2, получим: Если поток генов, приносящий новые вариации уравновешен ограничен- ным размером популяции, уменьшающим вариации, то f-ft =ft_,. Пред- положим, что f равно равновесному индексу фиксации Fe или FST, тогда: (1-ЛП)2 ST 2#-(2#-1)(1-те)2 ‘ (7.11b) Заметьте, что при т = О, F = 1 и при т = 1, FST = 0. Если пренебречь величиной т2, то получим: 1-2да — s 2#-(2#-1)(1-2те)’ и если пренебречь значением 2т в числителе и знаменателе, то имеем: Когда т < 0,01, выражения 7.11b и 7.11с эквивалентны (Waples, 1998). При наличии к эквивалентных субпопуляций, различия между ними оце- ниваются по формуле (Slatkin, 1995):
4Nm[k /(к -1)]2 +1 (7. lid) Показано, что одного мигранта на поколение (Nm = 1) достаточно, что- бы предотвратить генетический дрейф между популяциями. Заметьте, что при Nm = 1, F = 0,2 (выражение 7.11с). Эта достаточно значительная вели- чина и другие выводы позволили предположить, что величина Nm=\ не соответствует естественным популяциям, а для поддержания исчезающих видов требуется более интенсивный поток генов (Mills, Allendorf, 1996). Выражение 7.11с можно преобразовать для оценки числа мигрантов на поколение следующим образом: Nm - 1~FST ^FST (7.11е) Эту формулу широко применяют для оценки числа мигрантов между популяциями. Такое приближение конкретной теоретической модели в состоянии равновесия следует применять только как общий принцип для оценки числа мигрантов (Waples, 1998; Whitlock, McCauley, 1999). Если значение FST мало, то возможно отклонение в оценке Nm. Например, если FST = 0,01, то из выражения 7.11 е следует, что Nm = 24,8. Используя выра- жение 7.11b при N= 50 и FST = 0,01, получаем оценку т = 0,29 и Мл = 14,6, ниже предыдущей почти на 40%. Одно неудобство использования оценок, основанных на изменчивос- ти аллельных частот, состоит в том, что они могут сильно зависеть от истории популяций и быть в неравновесном состоянии. Кроу и Аоки (Crow, Aoki, 1984) показали, что время, необходимое для достижения GST поло- вины равновесности, приблизительно равно: 1п(2) (2т +1 / 2А) ’ (7.12а) Например, если т = 0,01 и N= 50, то для прохождения популяцией поло- вины пути до состояния равновесия требуется 17 поколений. Однако, окон- чательное достижение равновесных частот более медленное (Crow, Aoki, 1984). Заметьте, что приближение к равновесию происходит быстрее, чем возрастание величин т и N. Кроме того, эффективный размер популяции зависит от ее подразде- ленности. Райт (Wright, 1943) показал, что в островной модели эта зависимость описывается формулой: V, ^Nmk1 kN 1- F i < ST (7.12b)
III. Структура популяции и генетический дрейф Если численность мигрантов (Nm) велика или значение ^гмало, то Ne ~ kN, как следует ожидать для случайно скрещивающейся популя- ции. Однако, если генный поток мал (4Nm <1), то эффективный размер популяции может превысить величину kN. Например, при 4Nm = 0,25 или FST= 0,8, Ne ~ 5kN, потому что низкий уровень потока генов позволяет каждой субпопуляции изменяться независимо. Для прогнозирования распределения аллельных частот между остро- вами Райт (Wright, 1940) разработал комбинированный метод оценки эф- фектов генного потока и генетического дрейфа. Предположим, что часто- та аллеля А, у мигрантов постоянна и равна qm. Для большого числа островных популяций средняя аллельная частота равна qm. В зависимос- ти от размера популяций и интенсивности генного потока распределение частоты аллеля между островными популяциями (островами) может ва- рьировать. К примеру, если N и т велики, то аллельные частоты на всех островах будут приближаться к qm, распределяясь вокруг значения qm. Форма распределения аллельных частот между островами зависит от ве- личин 4Мп<? и 4/Vm (1 - q^. Если обе эти величины значительно больше 1, то островные частоты аллелей будут очень близки друг к другу и к аллей- ным частотам на материке. Действительно, если 4Nm » 1 (m»±N)~ т.е., в каждом четвертом поколении более одного мигранта (Nm - число миг- рантов), то между островными популяциями фактически нет дифференци- ации (например, при Nm = 50 на рисунке 7.9). Если 4Nmq и 4Nm (1 - qm) меньше 1, и значения qm близки к 0,5, то распределение аллелей между островами приобретает U-образную форму (большинство островных по- пуляций становятся фиксированными или почти фиксированными либо по аллелю Af, либо по аллелю Л,). Эти распределения представляют со- бой стабильные генно-частотные распределения, поскольку частота ал- Рисунок 7.9. Равновесное распределение частот аллелей при разных значениях Nm и qm = 0,5 (по Wright, 1969).
G44 Глава 7. Поток генов и структура популяций леля у мигрантов постоянна, и посредством генного потока происходит реинтродукция аллелей в популяции, которые временно стали фиксиро- ванными из-за действия генетического дрейфа. Ь. Лестничная модель Если поток генов ограничен соседними (ближайшими) популяциями, то он напоминает ступеньки лестницы. Такая одномерная лестничная мо- дель представлена на рисунке 7.8b. Линейной лестничной моделью мо- гут служить естественные популяции водоемов в водоразделе или в при- ливной полосе вдоль морского побережья. Популяции по краю места обитания (скажем, на озерном мелководье) могут служить кольцевой ле- стничной моделью, а популяции в оазисах пустынь или в лесных посад- ках на сельскохозяйственных угодьях представляют собой примеры дву- направленной лестничной модели. Маруяма (Maruyama, 1970, см. также Wang, Caballero, 1999) показал, что эффективный размер популяции в та- кой линейно подразделенной популяции при наличии сильного генного потока равен: Ne~kN, (7.13а) т.е. соответствует эффективному размеру случайно скрещивающейся по- пуляции. Если поток генов мал (2Nm < k/л?), то: Это выражение не включает эффективный размер популяции (N). Напри- мер при т = 0,1 и к = 10, IV = 50,7. В отличие от островной модели, где значения N достаточно велики, в лестничной модели (при ограниченном генном потоке) рассматриваются популяции с меньшим эффективным размером, чем случайно скрещивающиеся популяции. Пример 7.5. Дикий овес (Avena fatua), произрастающий в центральной Калифорнии, генетически полиморфен по нескольким морфологическим локусам (Jain, Marshall, 1967). Растения этого вида распространены во многих фруктовых садах в виде небольших колоний в радиусе около мет- ра от стволов деревьев. В течение двух лет Джейн и Рей (Jain, Rai, 1974) изучали популяции овса вокруг деревьев чернослива в двух фруктовых садах. Оценки потока генов между колониями, окружающими каждое дерево (деревья росли на расстоянии 6 метров друг от друга) были равны не более 1%. Кроме того, исследованные популяции были малочислен- ны: от 17 до 191 растения. С учетом вариабельной численности популя- ций в течение двух лет, самоопыления и высокой вариансы продукции
III. Структура популяции и генетический дрейф 345 ТАБЛИЦА 7.7. Частота рецессивного генотипа серой окраски цветочных чешуй у дико- го овса вокруг деревьев в саду чернослива за два года наблюдений (по Jain, Rai, 1974) Деревья - координаты Год Деревья - координаты 1 2 3 4 5 1 1970 0,971 0,400 0,037 0,374 0,000 1971 0,774 0,048 0,000 0,404 0,004 2 1970 0,053 0,360 0,068 0,021 0,000 1971 0,091 0,562 0,174 0,000 0,079 3 1970 0,068 0,090 0,205 0,118 X 1971 0,011 0,072 0,136 0,057 X 4 1970 0,076 0,118 0,843 X X 1971 0,185 0,150 0,823 X X 5 1970 0,381 0,049 0,021 0,000 0,034 1971 0,333 0,070 0,560 0,040 0,039 х - Дерево потеряно семян между растениями, оценка эффективного размера локальной попу- ляции колебалась между 14,6 и 40,3. Данные по локусу, детерминирую- щему окраску цветочных чешуй приведены в таблице 7.7 в виде выбо- рочной матрицы колоний. Заметьте, что даже между соседними колониями существует значительная вариабельность аллельных частот, а также от- носительно высокая корреляция аллельных частот по годам (г =0,92 для целого сада). Оценки эффективного размера популяции, про- порции генного потока и самооплодотворения показывают, что наблюда- емая вариация между колониями согласуется с ожидаемой вариацией для большой популяции, сильно подразделенной на множество колоний. с. Метапопуляция Термин метапопуляция иногда используют для описания любой попу- ляции, имеющей пространственную подразделенность, т.е. метапопуля- ция включает различные популяционные структуры. Однако, в традици- онном определении (Levins, 1969), субпопуляции существуют в дискретных местах обитания и претерпевают вымирание или реколони- зацию (заселение) особями из других субпопуляций. В какое-то время некоторая доля территории метапопуляции в зависимости от соотноше- ния процессов вымирания и реколонизации, может быть не занятой. Скорость вымирания или заселения может сильно влиять на эффек- тивный размер популяции, степень генетической изменчивости в мета-
346 Глава 7. Поток генов и структура популяций популяции и на распределение величины генетической изменчивости по субпопуляциям (Slatkin, 1977; Hedrick, Gilpin, 1997; Whitlock, Barton, 1997). На рисунке 7.10 показаны результаты моделирования гетерозиготности в простой метапопуляции, состоящей из трех территорий (участков), на каждой из которых живет по 500 особей (Hedrick, Gilpin, 1997), причем гетерозиготность исходно высока на всех трех участках. В поколении 48 (когда популяция на участке 2 вымирает), этот участок вновь заселяется в поколении 51 посредством одной оплодотворенной самки с участка 3, с последующей редукцией гетерозиготности. Следующее значительное событие происходит, когда пустой участок 1 реколонизируется популя- цией основателей с участка 2 (генетическая изменчивость у них отсут- ствует). Наконец, когда популяция на участке 2 вымирает в поколении 71, изменчивость в метапопуляции также отсутствует, хотя на участке 1 ос- тается еще 500 особей, которые впоследствии колонизируют два других участка, и вся популяция в этот момент гомозиготна. Темп потери генетической изменчивости в модели метапопуляции за- висит, например, от заселения пустых участков группой особей с другой территории (мода пула распространителей при колонизации) или смешан- ной группой особей со всех занятых территорий (мода пула мигрантов), (Slatkin, 1977). На степень генетической изменчивости может влиять чис- ло основателей при реколонизации, темпы вымирания и заселения, раз- мер популяции на определенном участке и интенсивность генного пото- ка, направленного на данную территорию. Было показано (Hedrick, Gilpin, 1997), что, с учетом реколонизации от одной оплодотворенной самки и неограниченного размера популяции внутри каждого участка (исследо- Участок High Н Low Н 2 High Н ч High Н; ! н=0 I---------1________I_________I__________I_________I О 20 40 60 80 100 Поколение Рисунок 7.10. Изменение гетерозиготности (Н) со временем в модели популяции, зани- мающей три участка (по Hedrick, Gilpin, 1997). Короткие вертикальные черточки на пра- вом конце горизонтальных линий обозначают вымирание особей на данной территории, а стрелки - реколонизацию.
III. Структура популяции и генетический вали 20 участков в отсутствие потока генов за исключением момента ре- колонизации), ожидаемый эффективный размер метапопуляции близок к 150. Этот низкий эффективный размер объясняется малым числом осно- вателей, включенных в каждое событие реколонизации. Поскольку ныне живущие особи индивиды могут происходить от немногих индивидов в предыдущих поколениях, уровень FSJ. может быть мал. С другой стороны, как показано в примере 7.6, наблюдаемая величина FST в недавно колони- зированных популяциях может быть выше, чем в более старых популя- циях. Более детальное теоретическое обсуждение значения Ne и FS1. в ме- тапопуляциях можно найти в работах Whitlock, Barton (1977); Wand, Cabarello (1999) и Nunney (1999). Пример 7.6. Динамика метапопуляций сильно зависит от источника ре- колонизации пустой территории и от его генетической изменчивости. Если колонизаторы выбираются случайно со всех других занятых участков (мода пула мигрантов), то следует ожидать большую генетическую из- менчивость, чем при выборке из одной колонии (мода пула распростра- нителей). Уайтлок и МакКоули (Whitlock and McCauley, 1990) предполо- жили, что тип колонизаторов может находиться в любой точке континуума между двумя этими модами. Они определили ф как вероятность, что два колонизатора могут происходить с одной территории (при ф = 0 это экви- валентно моде пула мигрантов, а при 0=1- моде пуля распространите- лей). Кроме того, 1 ( 1 F' =------+ ф 1------FST, ST 2Nr 2N. ST где W число основателей в группе, реколонизирующей участок, aFST и F'ST измерены в стабильных популяциях и на недавно колонизированных тер- риториях, соответственно. Если даны оценки N F^ и F’ST, то значение ф можно определить из предыдущего уравнения. Антонович с соавторами (Antonovich et al., 1994) исследовали метапо- пуляцию на примере смолевки белой (Silene alba) - двуполого растения семейства Гвоздичных с коротким периодом вегетации, для которого ха- рактерны высокие уровни вымирания и колонизации. МакКоули с сотруд- никами (McCauley et а/., 1995) оценили величину FST в 11-ти стабильных популяциях и величину F'ST - в 12-ти недавно колонизированных попу- ляциях по семи аллоферментным локусам (рисунок 7.11). Они обнаружи- ли, что изменчивость по шести из семи локусов в 12-ти недавно колони- зированных популяциях была самой высокой, в среднем, FST= 0,126 и F'ST = 0,197. Средняя оценка числа колонизаторов составляет 4,2, а из
и структура популяций Рисунок 7.11. Оценки величины Fstb 12-ти недавно колонизированных (F'sr) и в 11-ти стабильных (F ) популяциях Silene alba, определенные по частоте аллелей семи поли- морфных аллоферментных локусов (заштрихованные кружки), а также комбинированная оценка по этим локусам (не заштрихованный кружок). Заметьте, что в шести из семи локусов величинаF’ST больше, чем F,T (по McCauley et al., 1995). предыдущего выражения 0 = 0,73. Очевидно, что смешение индивидов из разных групп у основателей, устанавливающих эти новые популяции, весьма ограничено, и большинство основателей, вероятно, происходит из одной или из нескольких исходных популяций. IV. Генный поток и отбор В одной и той же популяции может наблюдаться значительный генный поток и отбор, поэтому необходимо учитывать их совместное влияние на частоты аллелей, которое весьма разнообразно и приводит к сложным последствиям (Barton, Clark, 1990). В этом разделе мы обсудим только элементарные комбинации потока генов и отбора. Совместное действие потока генов и отбора особенно значительно при межвидовой гибридиза- ции (Harrison, 1993; Arnold, 1997), (исследование гибридной зоны двух видов оленя с использованием ряда различных подходов, см. в работе Goodman et al., 1999). В некоторых случаях наблюдается корреляция между тенденцией к миграции и относительной приспособленностью мигрантов. Например,
IV. Генный поток и отбор 349 у сурков, полевок и других грызунов, молодые самцы, по-видимому, миг- рируют более часто. У общественных животных таким особям необходи- ма территория для спаривания и выращивания потомства, поэтому у сам- цов, не имеющих подходящей территории, вероятность оставить потомство мала и, следовательно, очень низкая величина приспособлен- ности. Среди животных одного возраста и пола также существует корре- ляция между генотипом и тенденцией к миграции. Однако в дальнейшем мы будем считать, что корреляция между отдельными генотипами и по- током генов отсутствует. а. Модель материк-остров Вернемся к модели материк-остров и исследуем действие отбора на ал- лельную частоту в островной популяции. Предположим, что изменение частоты аллеля на острове зависит от совместного эффекта потока генов и отбора. Тогда А? = A^-s. + А<7,„, гдеА<у5 иА<?т - изменения частоты, обусловленные отбором и потоком генов, соответственно. Представим, что гетерозиготы имеют промежу- точную приспособленность и что относительные приспособленности ге- нотипов А Ар А ]Л2 и равны, соответственно, 1, 1 -5 и 1 -2s. Тогда это выражение приблизительно равно: bq = -sq(\-q)-m(q-qm) = = sq2 ~(т + s)q + mqm (Li, 1976). Если равновесие существует при А<у=О, то изменения частоты аллеля Л, не происходит. Равновесную частоту для островной популяции находят, решая квадратное уравнение: qe = T7-[(m + 5)±((w-l-5)2 -Amsqm )' *]. (7.14а) 2s Если значения 5 положительны, то отбор благоприятствует аллелю А а если значения 5 отрицательны - в пользу аллеля Аг Рассмотрим три зави- симости относительных величин потока генов и отбора: т « |.s|, т = |^| и т » |sj, т.е. когда интенсивность потока генов значительно меньше, рав- на или значительно выше абсолютной величины отбора. Поскольку зна- чение т возрастает, действие отбора подавляется потоком генов, и в ост- ровной популяции генетическая дифференциация отсутствует. Это показано в таблице 7.8, где qm = 0,4, а поток генов и отбор отражают три зависимости, описанные выше. Если т = |^|, то выражение 7.14а упроща- ется до формулы:
ва 7. Поток генов и структура популяций ТАБЛИЦА 7.8. Равновесные аллельные частоты при разных уровнях потока генов и дей- ствии отбора (qm = 0,4), (по Li, 1976) т « |s| т = И т > > |s| т 0,01 0,01 5 5 0,15 0,15 S -0,15 0,15 —т т -0,01 0,01 0,961 0,026 0,632 0,225 0.416 0,384 <7e=(<7j1/2 или (7.14b) когда 5 отрицательно (верхняя строка) или положительно (нижняя стро- ка). Как показано в таблице 7.8, при т = |х| или т « |.s| отбор приводит к значительной степени дифференциации (с учетом равновесия в остров- ной популяции). Когда т » |sj, отбор действует на аллельную частоту в гораздо меньшей степени, и равновесная частота аллелей в островной популяции очень близка к аллельной частоте у мигрантов. Допустим, что аллельная частота у мигрантов равна нулю (qm = 0,0). Например, какой-нибудь признак имеет преимущество на острове, но не- благоприятен в основной популяции или происходит интрогрессия (про- никновение) особей из популяции распространенных подвидов в популя- цию с редким подвидом. Предположим, что отбор на острове уравновешивает снижение аллельной частоты, обусловленное потоком генов, так что приспособленности генотипов А}А , А^А2 и А^А2 равны 1, 1 + hs и 1 + s, соответственно. Таким образом, изменение аллельной час- тоты, обусловленное отбором, равно: Az? _ spq[q + h(\-2q)] \ + 2pqhs + q1 2 s ' и тотальное изменение аллельной частоты 1 + 2pqhs + q~ s В примере 7.7 эти формулы использованы для прогнозирования резуль- тата интродукции (переселения) техасских пум в последнюю естествен- ную популяцию флоридских пантер.
IV. Генный поток и отбор 351 Пример 7.7. Флоридская пантера (Felis concolor coryi) - исчезающий под- вид горного льва, который представлен изолированной популяцией в юго- западной части Флориды и включает не более 50-ти диких особей. Фло- ридская пантера несколько отличается по фенотипу от других горных львов (у пантер плоский череп, грива по середине спины и характерный зави- ток на конце хвоста, см. Belden, 1986). По-видимому, у пантер снижена приспособленность, что обусловлено большим количеством аномальной спермы, высокой долей неопустившихся семенников у самцов и, возмож- но, другими врожденными нарушениями (O’Brien et al., 1990). В резуль- тате, было принято решение интродуцировать техасских пум - ближай- ший обширный популяционный источник - во флоридскую популяцию для «генетического восстановления» высокой приспособленности в по- пуляции. Планировалось переселить самок техасских пум (у самцов тен- денция к передвижению гораздо выше, чем у самок) в таком количестве, чтобы уровень потока генов в первом поколении был бы 0,20, и после этого 0,025 (около одного животного) на поколение (Seal, 1994). Хедрик (Hedrick, 1995с) оценил потенциальный эффект интродукции, предполагая, что флоридские пантеры фиксированы либо по аллелю, сни- жающему приспособленность, либо по аллелю, который дает им преиму- щество в приспособленности, и что техасские пумы имеют противополож- ные аллели (считалось, что флоридские пантеры адаптированы к жизни в болотистой местности, где были обнаружены последние животные). На рисунке 7.12а показаны частоты аллеля Л, у флоридских пантер с учетом потока генов из Техаса и приспособленностей генотипов А АуА2 и А^А2, равных 1, 1,2 и 1,2 (адаптивное преимущество у флоридских пантер), 1, 1 и 1 (только поток генов) или 1, 1 и 0,5 (низкая приспособленность у флорид- ских пантер), соответственно. Для адаптивного аллеля h = 1, но значение h может приближаться к нулю и приводить к динамике частоты аллеля, сход- ной с той, что показана на рисунке 7.13. Видно, что частота аллеля с низкой приспособленностью значительно снижается за десять поколений, тогда как частота адаптивного аллеля остается высокой даже через десять поко- лений. Ожидаемые относительные приспособленности этих двух локусов показывают (рисунок 7.12b), что для вредного локуса приспособленность быстро возрастает, а для адаптивного локуса она только несколько сниже- на. При комбинации этих локусов приспособленность быстро возрастет, и что при данном уровне потока генов любые адаптивные аллели не будут вытеснены интродукцией мигрантов из Техаса. Интродукцию начали в 1996 году с переселения 8 диких самок из Те- хаса во Флориду. К началу 1999 года у этих самок уже родились 15 котят.
1, 1.2, 1.2 Рисунок 7.12. Изменение частоты аллеля Аг (аллеля флоридской пантеры) через десять поколений при потоке генов 0,2 в первом поколении и 0,025 - в дальнейших поколениях (а). Отбор вызывает снижение приспособленности аллеля И, (1, 1, 0,5), адаптивное пре- имущество (1, 1,2, 1,2) или отсутствует (1, 1, 1). Изменение относительной приспособ- ленности через десять поколений при двух разных типах отбора и при их комбинации (Ь), (по Hedrick, 199с). Влияние интродукции на приспособленность флоридской популяции пока еще не оценивалось, но теоретически приспособленность может увели- читься. Когда h = 0,5, то гетерозиготы промежуточны по приспособленности, что описывается уравнением: Л * SP4 Aq = —mq -1-------. 2(1 + sq) Значение Ag = 0 показывает, что стабильное равновесие в популяции су- ществует при условии, что: s - 2т qe =------- 5(1 + 2т)' (7.15а) Когда h #0,5 и Ад = 0, имеем квадратное уравнение: s(l - 2h)(m + l)g2 + s(2hm -1 + 3h)q + m-sh = Q. Возможно единственное решение этого равенства при значениях аллель- ной частоты между нулем и единицей. Однако, когда значение h близко к нулю, могут быть два решения. Если h = 0,0 (полная рецессивность), то это выражение имеет вид:
IV. Генный поток и отбор 353 s(m + l)g2 — sq + т = О и его решения таковы: 5±[у2 -4s(m + l)m]12 2s(m +1) (7.15b) Равновесие с меньшей величиной qe нестабильно, а равновесие с более высокой величиной - стабильно. На рисунке 7.13 показаны отдельные и совмещенные кривые изменения аллельной частоты при наличии потока генов и отбора (5 = 0,2, т = 0,04). На комбинированной кривой Ад для потока генов и отбора (пунктирная линия), точка нестабильного равнове- сия в популяции соответствует аллельной частоте, равной 0,28, а стабиль- ного равновесия - аллельной частоте, равной 0,68. В общем, равновесная частота в островной популяции представляет собой функцию величины селективного преимущества и уровня доми- нантности в этой популяции и интенсивности потока генов. Если предпо- ложить, что 5 = 0,2, то равновесная аллельная частота в островной попу- ляции показана на рисунке 7.14 с учетом доминантности (й = 1,0), аддитивности (й = 0,5) и рецессивности (й = 0,0) признака. Равновесные частоты трех уровней доминантности, отражающих разные величины Ад, обусловлены отбором. Но при высоком потоке генов благоприятный при- Рисунок 7.13. Изменение аллельной частоты в результате отбора (Л<7,)и в результате по- тока генов (Д<7„) в модели материк-остров, где _v = 0,2, h = 0 и т = 0,04. Пунктирная линия показывает объединенный эффект отбора и потока генов, а кружки обозначают равновес- ные аллельные частоты. 23-- 7660
Рисунок 7.14. Равновесная аллельная частота при балансе между отбором и потоком ге- нов для трех уровней доминантности. При h = 0, существует два равновесия: стабильное, обозначенное короткими пунктирами, и нестабильное, обозначенное точками. знак полностью исчезает из островной популяции при любом уровне до- минантности. Это исчезновение признака при благоприятствующем ал- лелю отборе, впервые было отмечено Холденом (Haldane, 1948). Как ука- зано выше, при рецессивности благоприятного аллеля в популяции возникает либо стабильное, либо нестабильное равновесие. В примере на рисунке 7.14 оба эти равновесия исчезают, когда т> 0,0475. Пример 7.8. На некоторых островах озера Эри наблюдается высокий по- лиморфизм окраски полос у водяных змей (Nerodia sipedon). Найдены формы с регулярными полосами (как змеи, обнаруженные в континен- тальных областях США и Канады), а также чисто серые формы без полос (рисунок 7.15). Кемин и Эрлих (Camin, Ehrlich, 1958) предположили, что такой полиморфизм - результат баланса между отбором против полоса- тых форм, живущих на плоских известняковых скалах островов, из-за хищничества чаек, цапель и других птиц, и потоком генов на острова из континентальных популяций, где змеи имеют полосатую окраску. В более поздней работе предполагалось, что наследование полосатос- ти может быть исходно определено одним вариабельным локусом (King, 1993), и что полосатая форма доминирует над неполосатой. Оценки со- временных частот рецессивного аллеля (отсутствие полос) на различных островах колеблются от 0,53 до 0,86 со средним значением, равным 0,73
IV. Генный поток и отбор 355 Рисунок 7.15. Различная окраска водяных змей из озера Эри. Видна форма с регулярны- ми полосами, исходно обнаруженная на континенте, и форма без полос, обнаруженная на островах (по King, Lawson, 1997). (King , Lawson, 1995). При изучении животных, разводимых в неволе и отпускаемых на свободу, Кинг и Лаусон (King, Lawson, 1995) оценили, что селективное преимущество неполосатых особей на островах колеб- лется в пределах между 0,11 и 0,28, а исходя из вариации частот аллофер- ментных аллелей между островами значение IV m с континента близко к 12,8. Предполагая, что N равно оценке взрослых водяных змей на остро- ве, они получили приблизительную оценку потока генов, т = 0,01. Используя эти величины s при т = 0,1 и выражение 7.15b, можно оце- нить ожидаемую аллельную частоту рецессивного аллеля (отсутствие полос) на островах. Если s = 0,11, то нестабильное равновесие существу- ет при аллельной частоте, равной 0,101 и стабильное - при частоте 0,890, а если у = 0,28, то нестабильно равновесие будет при аллельной частоте, равной 0,037, а стабильное - при частоте 0,953. Для двух уровней отбора стабильные равновесные частоты будут несколько выше, чем наблюдае- мые частоты, т.к. значения s могут быть ниже, а значенияи т - выше, чем их оценки. Возможно также, что популяции пока не пришли к состоянию равновесия, и нестабильность может увеличить время достижения рав- новесия (см. King, Lawson). Этот пример показывает, как можно оценить различные эволюционные факторы и затем применить их в теоретичес- ком контексте для объяснения наблюдаемой генетической изменчивости.
[Г356 Глава 7. Поток генов и структура популяций Ь. Дифференцирующий отбор и клинья в структурированной популяции Считается, что различие субпопуляций по аллельной частоте, или кли- нальная изменчивость - это результат действия дифференцирующего от- бора в различных территориальных структурах популяции. Такая про- странственная изменчивость аллельной частоты может быть временно стабильной или изменяться со временем, приводя либо к стабильному, либо к временному клину. Более того, клинья в аллельных частотах мо- гут быть ступенчатыми, с сильным изменением аллельных частот на ко- ротком расстоянии, или градуальными, когда изменение частоты аллеля в клине происходит плавно (Endler, 1977; Barton, Hewitt, 1985). Для иллюстрации и стабильного, и временного клиньев представим популяцию с к субпопуляциями. Допустим, что в популяции до появле- ния генного потока действует вариабельный отбор по выживаемости в преадультивный период (до достижения взрослого возраста). Таким об- разом, частота аллеля А, в /-той субпопуляции после отбора равна: Я; + ?>22.,), (7.16а) где wlly, w12.z и w22y - относительные приспособленности генотипов А А А Д2 и АД, в субпопуляции j, a q - частота аллеля Л, в субпопуляции у: =p2jw^j+2P/qJwn.j Аллельная частота после появления потока генов в z-той субпопуляции равна: к Я,-^тА1 . (7.16b) 7=1 где т - параметр потока генов, как определено ранее. В зависимости от величин относительной приспособленности и исходных аллельных час- тот в субпопуляциях могут появиться либо временный, либо стабильный клинья. Пример 7.9 иллюстрирует временный клин изменчивости для аллеля серповидноклеточной анемии в Либерии и стабильный клин - для аллеля талассемии в Сардинии. Пример 7.9. Два интересных примера объединения результатов потока генов и отбора относятся к распределению аллеля серповидноклеточной анемии в ряду племенных популяций Либерии и к распределению аллеля талассемии в небольших городах центральной части Сардинии (см. рисунок 7.16). Ливингстон (Livingstone, 1969) использовал модель, в ко-
IV. Генный поток и отбор Рисунок 7.16. Наблюдаемые частоты аллеля серповидноклеточное™ в некоторых племе- нах в Либерии (а) и аллеля талассемии на острове Сардиния (b), (по Livingstone, 1969). торой большая часть потока генов между группой из 40 популяций рас- пределялась между соседними популяциями (80%) и другими ближай- шими популяциями. Предполагалось, что приспособленность у гомози- гот по серповидноклеточной анемии и талассемии равна нулю, приспособленность другой гомозиготы равна 1,0. Приспособленность гетерозигот варьирует в разных популяциях, отражая преимущество ге- терозигот в обоих локусах в районах распространения малярии. В попу- ляциях с первой по тридцатую приспособленность гетерозигот по локусу серповидноклеточности была равна 1,25, а в популяциях с 31-й по 40-ю она была равна 1,0. Приспособленность гетерозигот по локусу талассе- мии варьировала от 1,25 в концевых популяциях (с 1-й по 8-ю и с 33-й по 40-ю) и была снижена до 1,0 (при наличии нескольких пиков) в централь- ных популяциях (с 16 по 25).
Эти результаты показаны на рисунке 7.17 и согласуются с распределе- ниями аллелей, наблюдаемыми в популяциях Африки и Сардинии (см. рисунок 7.16). В популяциях с 1-й по 5-ю частота аллеля серповиднокле- точности низкая. Прохождение клина через эти популяции (по мере по- вышения частоты аллеля) соответствует реальным изменениям аллель- ной частоты в либерийских племенах. Например, кривая аллельной частоты после 20-ти поколений сходна с наблюдаемой в Либерии в насто- ящее время. По этой модели стабильный, ступенчатый клин появляется около тридцатой популяции. Моделирование клина талассемии, начатое ближе к наблюдаемой величине, показывает более мягкий градиент ал- лельных частот из-за градуальных изменений приспособленностей. Эти модели удовлетворительно объясняют наблюдаемое распределе- ние аллельных частот, но результаты различных комбинаций потока ге- нов, отбора и других факторов также могут быть согласованы с наблюде- ниями. По мнению Ливингстона, небольшая интенсивность потока генов из дальних субпопуляций очень важна при определении скорости пере- движения и формы клина, тогда как интенсивность потока генов между соседними изолятами важна для определения формы стабильных клинь- ев. Ливингстон (Liningstone, 1989) использовал аналогичные модели, включающие мутации и множественный аллелизм гемоглобиновых ло- Рисунок 7.17. Моделирование частоты аллеля серповидноклеточности (а) и аллеля та- лассемии (b), (по Livingstone, 1969).
IV. Генный поток и отбор 359 кусов с резистентностью к малярии для исследования общего распреде- ления полиморфных вариантов. И темп распространения клина, и длина стабильного клина в неогра- ниченной популяции являются функциями интенсивности потока генов и отбора. Фишер (Fisher, 1937) показал, что скорость распространения клина при репродукции особей в популяции (если Р/2 - стандартное от- клонение расстояния между родителем и потомком) пропорциональна величине (P7s)1/2. Слэткин (Slatkin, 1973) показал, что при стабильности клина (аллель имеет преимущество 5 на одной территории и невыгоден (-5) - на другой территории) глубина клина приблизительно равна (V/\)12. Согласно модели пространственного отбора Ливена (см. главу 4), особь может с равной вероятностью как перейти в другую нишу (субпопуля- цию), так и вернуться в родительскую нишу (субпопуляцию). В терминах матрицы миграций это означает, что т = \/к для всех значений i и j, где к - число ниш (субпопуляций). При ограниченном потоке генов и различ- ных соотношениях разнообразных факторов окружающей среды можно воспользоваться матрицей миграций (Christiansen, 1974). При таком рас- ширении условия для стабильного полиморфизма являются функцией элементов матрицы миграций и пропорций различных факторов окружа- ющей среды (величины с.). Результат ограниченного потока генов состо- ит в распространении условий для стабильного полиморфизма и, в мень- шей степени - в распределении по всем нишам равного потока генов. На рисунке 7.18 представлены два примера, где т = т = т21. В этих случаях в двух нишах величина приспособленности благоприятствует или аллелю А (в нише 1 приспособленность для генотипов А^, А}А2и А^2 равна, соответственно, 1,2, 1,0 и 0,8), или аллелю А (в нише 2 приспособ- ленность генотипов А{Ар А{А2и А^2 равна, соответственно, 0,8, 1,0 и 1,2). В примере на рисунке 7.18а с = с, = 0,5 и стабильный полиморфизм су- ществует даже при значении т равном 0,5 (гармоническая средняя пре- имущества гетерозигот). При больших значениях т аллельные частоты в двух нишах становятся более сходными и приближаются к 0,5 (т стремится к 0,5). Когда поток генов мал, существуют общие (средние) равновесные аллельные частоты, равные 0,5, но в двух отдельных субпопуляциях ал- лельные частоты совершенно разные. На рисунке 7.18b (с2 = 0,625 и = 0,375) стабильный полиморфизм отсутствует при т равном 0,5. Ал- лельные частоты в двух субпопуляциях при низком потоке генов также сильно различаются. При возрастании потока генов средняя аллельная частота приближается к 1,0 (потому что не существует стабильного поли- морфизма при т = 0,28), хотя аллельные частоты в субпопуляциях стано- вятся близкими по величине. Другими словами ограниченный поток ге-
360 Глава 7. Поток генов и структура популяций Рисунок 7.18. Общее равновесие аллельных частот (пунктирная линия) и равновесие внутри двух ниш при дифференцирующем отборе и ограниченном потоке генов, где ниши существуют в равных пропорциях (с, = с, = 0,5) (а), и где более распространена ниша 2 (с2 = 0,625 и с, = 0,375) (Ь). нов между субпопуляциями (нишами) создает стабильный полиморфизм, исчезающий при возрастании потока генов. Задачи 1. Предположим, что в модели материк-остров qm = 0,т = 0,05 и д0 = 0,8. Постройте график, показывающий, как частота аллеля изменяется на острове с течением времени. 2. Используя матрицу миграций (таблица 7.2) и исходные аллельные частоты 0,575, 0,567 и 0,505 в субпопуляциях Nuer, Dinka и Shilluk, соответственно, найдите ожидаемые аллельные частоты в следую- щих трех поколениях. 3. Предположим, что аллельные частоты аллелей А и А2 равны 0,2 и 0,8 в одной субпопуляции и 0,4 и 0,6 - в другой субпопуляции. До- пустим, что в каждой популяции соблюдаются пропорции Харди- Вайнберга, и что размеры субпопуляций равны. Какова гетерозигот- ность после смешивания этих субпопуляций? 4. Предположим, что qA = 0,2, qs = 0,6 и qH = 0,3, каково значение Ml Если на протяжении 10-ти поколений происходило смешение суб- популяций, то каково значение т 1 Какие допущения важны для этих расчетов? 5. Определите F-коэффициенты из данных в таблице 7.4. 6. Предположим, что в двух субпопуляциях имеется по пять различ- ных аллелей в равных пропорциях. Какова величина G'v/? Объясни- те свой ответ.
Задачи 7. Определите величины FSR и FRT для данных, представленных в таб- лице 7.5. Объясните свои результаты. Какие дополнительные дан- ные нужны для оценки результатов при доступности любой инфор- мации? 8. Предположим, что оценки FST(m} и F равны 0,05 и 0,5. Найдите ожидаемое значение F^n объясните полученные результаты. Допу- стим, что оценки FST/m} и F равны 0,5 и 0,05. Найдите ожидаемое отношение потока генов пыльцы к потоку генов семян и объясните результаты. Допустим, имеются оценки FST(m) и F в данном поко- лении, основанные на полиморфизме мтДНК и Y-хромосом, соот- ветственно. Всегда ли эти оценки достоверны при определении зна- чения FST? 9. Результаты, представленные в примере 7.5, можно объяснить с по- мощью модели, которая предполагает наличие разных видов отбора растений овса под разными деревьями. Предложите два эксперимента по выявлению различий между этой моделью и моделью, в которой отсутствует отбор. 10. Сравните и объясните результаты, полученные из выражений 7.11b и 7.11 с при Л' = 500 и /и = 0,1 или т = 0,001. 11. Уайтлок и МакКоули (Whitlock, McCauley, 1999) в качестве примера рассматривают две субпопуляции с равными пропорциями аллель- ных частот при Nm = 0,1 и Nm = 10. Какова ожидаемая величина FrJ для двух отдельных величин Nm? 12. Вычислите равновесные аллельные частоты, данные в таблице 7.8. 13. Принесет ли интродукция пум из техасской популяции в популя- цию флоридских пантер положительные результаты? Продумайте свой ответ и предложите другие подходящие для сохранения этого вида способы. 14. Используя данные из примера 7.8, определите равновесные аллель- ные частоты при 5 = 0,11 и 0,28. Как лучше объяснить различия между этими предсказанными и наблюдаемыми величинами? 15. Соответствуют ли теоретические предсказания (рисунок 7.17) опи- санию наблюдаемых величин (рисунок 7.16)? Обоснуйте свой от- вет. Каким образом можно изменить теоретическую модель в слу- чае ее несоответствия наблюдаемым результатам?
ГЛАВА 8 МУТАЦИИ Такие (неадаптивные) признаки позволяют Вашим оппонентам счи- тать благоприятные изменения крайне редкими или даже невозмож- ными. Этот аргумент многие считают очень сильным. Думаю, было бы лучше покончить со всеми подобными проявлениями приобретен- ных признаков, настаивая на том, что изменчивость характерна для всех видов (я уверен в истинности этого факта). Поэтому благоприят- ные для данного момента изменения всегда под рукой. Из письма Альфреда Уоллеса (Alfred Wallace) к Чарльзу Дарвину Влияние различных мутаций, затрагивающих типичный ген, также раз- нообразно. Очень немногие из них быстро становятся эволюционно адаптивными, многие - вредными. Некоторые мутации нейтральны, т.е. безразличны для отбора. Мутации, вредные или выигрышные в большой популяции, в малой популяции могут быть нейтральными из- за случайного дрейфа взвешенных коэффициентов отбора. Эффект му- тации во многом зависит от последовательности ДНК, где она локали- зована. Он максимален в экзонах и значительно меньше проявляется при мутациях в избыточных генах или в генах, работа которых требу- ется организму в редких случаях. Дрейк с соавт. (Drake et al., 1998) Мутации чрезвычайно важны для эволюционной генетики и эволю- ции, поскольку они являются источником генетической изменчивос- ти популяции. Мутации могут затрагивать как единичные нуклеоти- ды, так и несколько нуклеотидов, часть гена, хромосому или ее учас- ток и целые хромосомные наборы (кариотипы). Мы сосредоточим свое внимание на мутациях в пределах гена, которые приводят к появле- нию новых аллелей или новых нуклеотидных последовательностей. Причиной мутации может стать ошибка репликации ДНК или инсер- ция транспозона, разрыв хромосомы или нерасхождение хромосом в мейозе и многое другое. Определенные типы мутаций индуцируются некоторыми химическими веществами - мутагенами или радиацией. К примеру, этилметансульфонат (ЭМС) вызывает замещение цитози- на тимидином, а ультрафиолетовое излучение - образование тимиди- новых димеров с последующей вставкой во время репликации ДНК некомплементарного нуклеотида. Гамма- и Х-лучи часто вызывают одно- и двунитевые разрывы молекул ДНК. Мы рассмотрим спонтан- ные мутации, которые происходят без видимых причин. Но не следу- ет забывать, что мутагены окружающей среды могут сильно повышать
Глава 8. Мутации 363 уровень мутаций в конкретной популяции. Такие факторы, как ульт- рафиолет, фоновая радиация и химические загрязнители среды могут оказывать на уровень мутаций весьма заметный эффект, влияя на ес- тественный уровень популяционной изменчивости. Мутация в единичном гене может по-разному влиять на последо- вательности ДНК и белков. Иногда мутация представляет собой про- стое замещение одного основания в молекуле ДНК, такие замены де- тально рассмотрены в главе 9. Делеции или инсерции одного нуклео- тида могут привести к сдвигу рамки считывания, а значит к измене- нию кодонов при транскрипции. В результате из-за появления стоп- кодона, синтезируется только небольшая часть белкового продукта, кодируемого этой последовательностью, а это приводит к дефектно- му белку. Мутации в микро- и в минисателлитных локусах, состоя- щих из повторов, приводят к уменьшению или к увеличению таких повторяющихся единиц на одну или более. Зачастую трудно определить приспособленность новых мутантов. Ви- димые мутации, которые индуцируются ЭМС, гамма-облучением или другими мутагенами, приводят к снижению приспособленности. Ана- логично влияют на жизнеспособность и многие спонтанные мутации. Интересно, что высокий процент спонтанных видимых мутаций у D.melanogaster - это результат инсерций мобильных элементов (см. пример 8.1). Многие спонтанные мутации, изменяя нормально работа- ющий ген, оказывают вредный эффект. Однако многие из них, локали- зуясь в некодируемых участках ДНК, могут быть нейтральными или почти нейтральными по сравнению с мутациями, которые приводят к нуклеотидным изменениям, нарушающим аминокислотную последова- тельность белкового продукта или транскрипцию. Пример 8.1. Мобильные элементы представляют собой участки ДНК, способные к автономному перемещению и репликации. Они найдены у большинства эукариотических организмов и составляют более по- ловины генома кукурузы, около 10-15% генома D.melanogaster (Kidwell, Lish, 1997). При гибридном дисгенезе у самцов в потомстве от некоторых скрещиваний наблюдаются хромосомные рекомбинации (отсутствующие в норме) и возрастает уровень мутаций и стерильно- сти. Оказалось, что это обусловлено наличием мобильных элементов в геноме одного из родителей таких самцов и отсутствием их в геноме другой родительской линии. В 1970-х годах было замечено, что в ге- номе мух из старых лабораторных линий мобильные элементы I и Р отсутствуют, а в геноме новых они имеются. Кидвелл (Kidwell, 1983) измерил частоту встречаемости I- и P-элементов в геномах линий, ко-
торые содержались в лабораторных условиях с 1920-х по 1970-е годы (рис. 8.1). Старые линии не содержат этих мобильных элементов, но к 1940-м годам концентрация /-элемента увеличилась почти на полови- ну, а к 1970-м годам - почти на 100%. Увеличение концентрации P-элемента началось в 1950-е годы и к 1970-м годам достигло 87,5%. Для объяснения этих результатов было предложено две гипотезы. Р- и / -элементы сравнительно недавно попали в геном D. melanogaster из геномов других видов и быстро распространились в разных лини- ях. Возможно, что старые линии D.melanogaster потеряли мобильные элементы в процессе длительного лабораторного разведения. По мне- нию некоторых исследователей, инвазия двух различных мобильных элементов за столь короткое время эволюции маловероятна (Engels, 1997). Однако родственные P-элементу последовательности были об- наружены у других видов дрозофилы, например у D.willistoni (Daniels et al., 1990). Последовательность P-элемента у этого вида отличается от полной последовательности D.melanogaster всего на один нуклео- тид из 2907 пар оснований. Считается, что эти два вида дрозофилы дивергировали 60 миллионов лет тому назад. Поэтому очень близкое Время происхождения линии Рисунок 8.1. Оценочная доля линий, содержащих в своем геноме I- (вверху) и Р- (внизу) элементы, обнаруженные с помощью гибридного дисгенеза при исследовании коллекции лабораторных линий, собранных в 1920-е — 1970-е годы (по Kidwell, 1983). Буква R озна- чает линии, в геноме которых отсутствует /-элемент, М - линии без P-элемента. Цифрами обозначено количество линий каждого типа.
сходство между P-элементами этих видов говорит о возможности го- ризонтального переноса, причем реципиентным видом послужила D.melanogaster, поскольку изменчивость P-элементов у этого вида намного ниже, чем в пределах генома D.willistoni. Несмотря на повсе- местную распространенность современной D.melanogaster, расселе- ние этого вида из западной Африки произошло, по-видимому, отно- сительно недавно за счет деятельности человека. D.willistoni - более молодой вид, обнаруженный, в основном, в Центральной и Южной Америке. Поэтому тесное совместное существование этих видов ста- ло возможным лишь в двадцатом веке. Механизм горизонтального переноса в данном случае неизвестен, но предполагается участие в нем паразитических клещей и вирусов. Для исследования распространенности Р-элементов в эксперимен- тальной популяции P-элементы вводили путем скрещиваний в линии, их несодержащие, и наблюдали за изменением частоты встречаемос- ти P-элемента в этих линиях (Kidwell et al., 1988, Good et al., 1989). К примеру, у мух из двух линий с первоначальной 5%-ной концентрацией Р-элемента в хромосомах к десятому поколению почти 100% хромо- сом содержали Р-элемент (Good et al., 1989) Иначе говоря, Р-элемент способен быстро распространяться по геному и в популяции. Такое возможно благодаря транспозициям - перескокам P-элементов все в новые и новые локусы, в то время как прежние его копии остаются функциональными. На рисунке 8.2 показано гипотетическое распределение значений приспособленности у новых спонтанных мутантов (для наглядности предположим, что каждый аллель имеет среднюю или предельную при- способленность). Это распределение, в основном, бимодальное. Не- которые из мутаций настолько вредны, что приводят к смерти или низкой жизнеспособности (темная область слева). Другая группа му- таций, преимущественно однонуклеотидные замещения, мало влияет на жизнеспособность (темная область справа). Такие мутации счита- ются нейтральными или близкими к нейтральным. К третьей неболь- шой, но важной, группе мутаций (светлая область справа) относятся выгодные мутации, повышающие относительную приспособленность. Считается, что мобильные элементы могут генерировать множество адаптивных мутаций (Kidwell, Lisch 1997). Однако Ней (Nei, 1987) полагает, что возможности адаптивных мутаций ограничиваются толь- ко адаптивными изменениями. Эксперименты с E.coli показали, что такие адаптивные изменения зависят от редких полезных мутаций (Elena et al., 1996). Относительные размеры этих групп мутаций весь-
8. Мутации относительная приспособленность Рисунок 8.2. Гипотетическое распределение мутаций по относительной приспособлен- ности, где w - средняя приспособленность в популяции. ма условны. По оценке Мукаи с соавторами (Mukai et al., 1972) слабое влияние на жизнеспособность оказывают в 10-20 раз больше мута- ций, чем мутации, приводящие к летальному исходу (см. стр 562). Дупликации или делеции генов и генная конверсия очень важны для понимания эволюции генома (более подробно см. Li,1997). Ряд генов, например гистоновые, глобиновые, гены главного комплекса гистосовместимости (МНС, рРНК, тРНК), представлен в виде муль- тигенных семейств - группы гомологичных, часто тесно сцепленных генов со сходными функциями. Увеличение копийности таких генов - это результат дупликации путем неравного кроссинговера или други- ми путями. Ота и Ней (Ota, Nei, 1994а) предположили, что такие муль- тигенные семейства могут эволюционировать по типу рождения и смерти, т.е. постоянно добавляя или теряя гены. Дуплицированные гены либо дивергируют, либо остаются сходными в результате гомо- генизации, или согласованной эволюции. Важными факторами та- кой эволюции являются генная конверсия и неравный кроссинговер. При генной конверсии часть нуклеотидной последовательности одно- го аллеля замещается гомологичной последовательностью другого ал- леля. У дрожжей уровень генной конверсии некоторых генов равен, в среднем, 5% (Fogel et al., 1978). Оценки генной конверсии, получен- ные при исследовании человеческих сперматозоидов, на несколько по- рядков выше, чем уровень точковых мутаций в локусе HLA (Zangenberg et al., 1995). Ота (Ohta, 1980) предложил модель для исследования эво-
I. Изменение аллельной частоты под действием мутаций люции мультигенных семейств, содержащих тандемные повторы ге- нов, в которых может произойти и генная конверсия, и неравный крос- синговер. (.Изменение аллельной частоты под действием мутаций Для оценки влияния мутаций на генетическую изменчивость предпо- ложим, что каждый локус имеет два вида аллелей - аллель дикого типа и вредный. Оба вида таких аллелей очень неоднородны. Согласно те- ории нейтральности, которую мы рассмотрим в следующей главе, боль- шинство вариантов нуклеотидных последовательностей гена (аллелей) нейтральны по отношению друг к другу. Вредные аллели могут быть также неоднородными, что подтверждается на примере генов, обус- ловливающих наследственные болезни человека (McKusick, 1998) или морфологические варианты у D.melanogaster (Lindsley, Grell, 1992). Допустим, что мутация обратима и может изменять ген от дикого типа к вредному и обратно, т.е. возможны прямая и обратная мутации. Обычно прямые мутации происходят намного чаще обратных, посколь- ку они нарушают функцию гена (см. пример 8.2 по оценке скорости прямых и обратных мутаций у мышей). Дефект нормального аллеля можно исправить путем обратной мутации, вероятность которой мала из-за ограниченности мутаций, компенсирующих данный дефект. Но при сдвиге рамки считывания эта мутация легко компенсируется вто- рой мутацией сдвига рамки. Если мутация обусловлена инсерцией мо- бильного элемента, то реверсия (возврат к дикому типу) может про- изойти с большей вероятностью, несмотря на сохранение в геноме ча- сти последовательностей мобильного элемента. Пример 8.2. Поскольку мутации в отдельных локусах происходят до- вольно редко, для адекватной оценки скорости мутирования (темпа возникновения мутаций) необходимы широкомасштабные эксперимен- ты (техника этих экспериментов обсуждается на стр. 330). Крупное исследование прямых и обратных мутаций было проведено на генах окраски шерсти у мышей (Schlager, Dickie, 1971). За шесть лет в двух разных лабораториях были изучены спонтанные мутации по локусам nonagouti, brown, albino, dilute u leaden у семи миллионов мышей. Оценочная скорость мутирования по каждому локусу и по всем локу- сам приведена в таблице 8.1. Общий уровень прямых мутаций по этим локусам был равен 11,2 X 10 6, а общий уровень обратных - 2,5 X 10 \ т.е. скорость прямых мутаций выше скорости обратных.
ТАБЛИЦА 8.1. Уровень спонтанных мутаций в пяти локусах окраски шерсти у мышей (по Schlager, Dickie, 1971) Локус Число проверенных гамет Число мутаций Уровень мутаций (х/(7 б) 95%-ные довери- тельные интерва- лы (Х10Д Мутации по локусам дикого типа (прямые) Nonagouti 67,395 3 44.5 9.2-130.1 Brown 919,699 3 3.3 0.7-9.5 Albino 150,391 5 33.2 10.8-77.6 Dilute 839,447 10 11.9 5.2-21.9 Leaden 243,444 4 16.4 4.5-42.1 Всего 2,220,376 25 11.2 7.3-16.6 Доминантные мутации (обратные) Nonagouti 8,167,854 34 4.2 2.9-5.8 Brown 3,092,806 0 0 0-1.2 Albino 3,423,724 0 0 0-1.1 Dilute 2,307,692 9 3.9 1.8-11.1 Leaden 266,122 0 0 0-13.9 Всего 17,236,978 43 2.5 1.8-3.4 Недавно были суммированы данные экспериментов по действию на мышей облучения (Russell, Russell, 1996). У 1485036 мышат в по- томстве после облучения было выявлено 69 видимых прямых мута- ций в семи рецессивных маркерных генах. Оценочный уровень соста- вил 6,6 X 10 6 мутаций на локус. Этот уровень ниже оценок, приведен- ных в таблице 8.1. Однако, если включить в список мутаций мутантов с мозаичной окраской шерсти, то оценка составит 11,0 х 10~6 мутаций на локус, что очень близко к оценкам в предыдущей работе (Schlager, Dickie, 1971). а. Прямые и обратные мутации Для исследования влияния мутаций на генетическую изменчивость предположим, что скорость мутирования от аллелей дикого типа?^ к вредным аллелям А2 равна и (прямая мутация), а скорость мутирова- ния от вредного аллеля к дикому типу (обратная мутация) равна г. Тогда изменение частоты аллеля Л, за счет мутаций будет равно вели- чине: Aq=up-vp = u-q(u + v). (8.1а)
I. Изменение аллельной частоты под действием мутаций Пустьр - доля аллелей, мутирующих от Л, к Л2 со скоростью и, a q - доля аллелей, мутирующих от А2 к со скоростью г. Это линейная зависимость аллельных частот, когда максимальные положительные значения достигаются при q = О (Д<? = и), а максимальные отрицатель- ные - при q = 1 (Аг? = -г). Поскольку значения миг, как правило, малы, ожидаемое изменение частот аллелей за счет мутаций также мало. На рисунке 8.3 показана такая зависимость при одинаковой скорости пря- мой и обратной мутаций, равной 10 5. Если скорость обратной мута- ции на порядок ниже и равна 10 6, то скорость прямой мутации сохра- няется на уровне I0 5. Как видно из рисунка 8.3, баланс между темпами прямых и обрат- ных мутаций может привести к устойчивому равновесию. Значения равновесных частот можно получить, приравнивая уравнение 8.1а к нулю и решая его для q, так что (8.1b) м Qe=—~ и + V Если темпы возникновения прямой мутации выше, чем обратной (м>г), то частота вредных аллелей окажется выше частоты аллелей дикого типа. В действительности этого не происходит из-за очищающего от- бора, который снижает частоту вредных аллелей (см. стр. 372). Рисунок 83. Изменение аллельных частот за счет мутаций при значениях м= 10 5 и v-10 5 или 10 6. Темными кружками обозначены равновесные частоты аллелей.
370 Глава 8. Мутации Насколько эффективно изменяют мутации частоту аллелей в ряду поколений? Предположим, что величина v мала и сравнима с и, тогда частота аллеля А через поколение, имеющее мутации, будет равна: РгР0-иР0=^-и)р0. Обобщая для t поколений, получим: р(=(1-и)'р0. (8.1с) Отсюда видно, что для снижения частоты аллеля дикого типа вдвое (р: = 1 /2/?0) при значении и = I0 5 потребуется около 70000 поколений. Таким образом, изменение аллельных частот, обусловленное только мутациями, очень мало, даже при относительно высоких темпах пря- мого мутирования в отсутствие обратных мутаций. Ь. Судьба единичных мутаций При появлении новой мутации она представлена в популяции един- ственной копией. К примеру, если все особи в популяции имеют гено- тип А{АГ то после мутирования появляется одна особь с генотипом А\АГ В результате скрещиваний с особями генотипа А}А{ новая мута- ция может быть либо потеряна (выживает только потомство с геноти- пом А^), либо сохранится у немногих гетерозигот потомства. При наличии одного поколения от таких скрещиваний 50% потомства бу- дут гомозиготами ААи через одно поколение мутантный аллель по- теряется. Если выживет только одна особь с генотипом А{А2, то есть вероятность, что в следующее поколение попадет одна копия аллеля Аг Вероятность утраты в потомстве аллеля А2 (два потомка с геноти- пом А 1Л]) равна (1/2) • (1/2) =1/4, вероятность сохранения одной копии аллеля А2 равна 1/2, а вероятность сохранения двух копий (два потом- ка с генотипом AfA2) равна 1/4. Таким образом, частота мутантного аллеля может уменьшаться, оставаться неизменной или увеличивать- ся, в зависимости от генотипов и численности потомства. Допустим, что в каких-то семьях к потомков (стр. 297), и распреде- ление численности этих семей соответствует распределению Пуассо- на. Численность популяции достаточно большая и постоянная: к = 2. В таблице 8.2 приведены частоты семей с разным количеством потом- ков и вероятность утраты нового аллеля А2 в семье определенного раз- мера. Вероятность утраты этого аллеля (все потомки с генотипом А At) в семье с численностью потомства, равной к, составит (1/2/. Суммируя произведения частоты мутантного аллеля в семье опре- деленного размера и вероятности утраты этого аллеля можно опреде- лить общую вероятность утраты мутантного аллеля в популяции. Ве- роятность потери нового аллеля через одно поколение равна:
I. Изменение аллельной частоты ТАБЛИЦА 8.2. Распределение Пуассона для численности семей с А=2 и вероятность утраты аллеля Аг связанная с различными размерами семей Численность потомков 0 1 2 3 к Частота аллеля е-л 2е~2 г-.-г 2к —е * 2! 3! к! Вероятность утраты аллеля А2 1 1 2 Ф2 Ф3 ф‘ = е‘2У — = е'2 1 + 1+ — + — +• ]=е~2е = е~'. I 2! 3! J Таким образом, новая мутация утрачивается через поколение с ве- роятностью примерно 0,368. Однако частота оставшихся мутантных аллелей еще очень мала и новая мутация может быть утрачена в сле- дующем поколении. Действительно, ко второму поколению новую му- тацию может утратить более половины потомков (таблица 8.3). Для сравнения в таблице 8.3 указана вероятность утраты мутантного ал- леля с низкими селективными преимуществами (мы рассмотрим бла- гоприятные мутации на стр. 386). Заметьте, что между вероятностью утраты аллеля с незначительным селективным преимуществом и ве- роятностью утраты нейтральной мутации нет никакой разницы. Из-за ТАБЛИЦА 8.3. Вероятности утраты мутантного аллеля и выживаемости нового мутанта при нейтральности мутации или при ее 1 %-ном селективном преимуществе (по Fisher, 1930) Поколение Нейтральность 5 = 0.01 Утрата Выживаемость Утрата Выживаемость 1 0.368 0.632 0.364 0.636 2 0.532 0.468 0.526 0.474 3 0.626 0.374 0.620 0.380 4 0.688 0.312 0.681 0.319 5 0.732 0.268 0.725 0.275 15 0.887 0.113 0.878 0.122 127 0.985 0.015 0.973 0.027 00 1.0 0.0 0.98 0.02
большого размера популяции вероятность фиксации нейтральной му- тации практически равна нулю. Однако вероятность фиксации мута- ции с селективными преимуществами равна 0,02, примерно в два раза выше значения его селективного преимущества. II. Баланс мутаций и отбора Отбор - это основная сила, препятствующая росту частоты вредных аллелей. У человека, например, многие индивиды, отягощенные рецес- сивными наследственными заболеваниями, не смогли бы дожить до взрослого возраста без интенсивной медицинской помощи (McKusick, 1998). Мутантные самцы Drosophila с измененными глазами сильно проигрывают при спаривании, а рецессивные хлорофилльные мутации у растений не позволяют им дожить до репродуктивного периода. Та- кой очищающий отбор удерживает частоту вредных и летальных алле- лей на довольно низком уровне. Однако вредные аллели в тысячах ге- нов могут иметь достаточно большое значение и поддерживаются ба- лансом мутаций и отбора. Далее мы рассмотрим совместное влияние мутаций и отбора на примере двух аллелей, один из которых мутант- ный (А2) и обусловливает снижение жизнеспособности. а. Рецессивные мутации Когда вредный аллель рецессивен, величина изменения аллельной ча- стоты за счет отбора равна: как это указано на стр. 125. Примерное увеличение частоты мутант- ного аллеля равно: = ЧР, при условии, что скорость обратного мутирования мала по сравне- нию со скоростью прямого мутирования (и). Поскольку прямое и об- ратное мутирование влияют на частоту аллеля прямо противополож- но, они сбалансированы, так что в некоторой точке верно равенство: =0, или
II. Баланс мутаций и отбора 373 При малых значениях q2 знаменатель справа приблизительно равен единице. Тогда это уравнение можно решить для равновесных частот гомозиготного по рецессивному аллелю генотипа: q2=u/s (8.2а) и для равновесных аллельных частот: 4 = (uls^. (8.2b) Рассмотрим баланс между отбором и мутациями на примере qmu и qs при низкой частоте аллеля А . На рисунке 8.4 приведены эти значения при и = 105 и 5 = 0,2. Заметьте, что при низкой аллельной частоте значение qmu приближается к 10 5, a q = 0,0 при q = 0,0 и по мере роста значения q становится отрицательной величиной. В данном случае рав- новесная частота равна: (10 5/0,2)12 = 0,0071, в этой точке &qm + &q ~ 0, как показано темным кружком на результи- рующей кривой среднего графика. В случае рецессивного летального аллеля х = 1,0 и равновесие ал- лельных частот и частот генотипов достигается при скорости мутиро- вания и и и12, соответственно. Равновесная частота аллелей растет в результате либо высокого темпа мутирования, либо низкой селектив- ной невыгодности. Если темп мутирования за счет некоторых мутаге- нов увеличился в десять раз, то равновесная частота генотипов также увеличится в десять раз. Так например, летальное прежде заболевание - фенилкетонурия (s = 1) сейчас хорошо лечат (5 = 0,1), и равновесная частота генотипов в данном случае также выросла на порядок. Условие равновесия мутаций и отбора можно получить, не прибе- гая к соотношениям генотипов по закону Харди-Вайнберга. Измене- ние частоты рецессивного аллеля равно: &Ч = Ч\ - Чо = H/2 + Q(l-s) sQ(l-g) 1-sQ д° 1-sQ При совместном действии аналогичных мутаций и отбора изменение аллельных частот составит: д. = M(i _ q) _ = 1-50 1-50 В данном уравнении выражение в скобках равно нулю, или: и - sQ(u + 1) = 0.
Мутации Рисунок 8.4. Изменение аллельной частоты за счет мутаций и отбора против рецессив- ных аллелей. Средний график представляет собой результирующую кривую изменений частот на нижнем и верхнем графиках, темный кружок указывает равновесную частоту. Решая уравнение для частот генотипа А.}А2 получим: _ и Qe~ s(u + \y Если u«s, то приближенное значение Qe равно: Qea~. (8.2с) С учетом пропорций Харди-Вайнберга значение этого выражения рав- но значению уравнения 8.2а. Такой подход можно использовать и при изучении влияния на рав- новесную частоту инбридинга вследствие баланса мутаций и отбора. Допустим, что частота генотипа А2А2 изменилась за счет инбридинга и ее значение можно выразить уравнением (глава 5): Q = я2 +fq(l - я) = О -Ля2 +/я, подставив значение Q в выражение 8.2с, получим: (1 -Ля2 +/Я = uts. Запомните, что равновесная частота генотипов является функцией толь- ко скорости мутирования и отбора против рецессивных аллелей. Одна- ко, равновесная аллельная частота - это функция коэффициента инбри- динга, отбора и мутаций. Равновесную аллельную частоту можно оп- ределить, решив предыдущее квадратное уравнение относительно зна- чений f ии s, так что
11. Баланс мутаций и отбора 2(1-/) (8.3а) В данном случае приближенное значение равновесной частоты равно (Haldane, 1940; Morton, 1971): q-u/fs, (8.3b) где величина qe очень мала по сравнению с / Равновесные значения получены при условии, что величина q2 в предыдущих уравнениях относительно мала. Из приведенных вычислений следует, что равновесная частота ал- лелей падает по мере увеличения степени инбридинга. Это показано на рисунке 8.5 для нескольких коэффициентов инбридинга и значе- ния и = 10 5. Дело в том, что при инбридинге отбору подвергается боль- ше вредных рецессивных мутаций, и равновесная частота начинает падать. Допустим, при коэффициенте отбора 5 = 0,5 равновесная ал- лельная частота в отсутствие инбридинга (коэффициент инбридинга / = 0,0) в десять раз больше, чем при/= 0,05, тогда как частота гомози- гот (встречаемость рецессивного заболевания) для этих значений оди- накова. Из этого следует, что степень инбридинга в популяции с рав- новесными аллельными частотами по мере роста числа близкород- ственных скрещиваний быстро падает. В таком случае, может наблю- даться временное сокращение рецессивно наследуемых заболеваний (затрагивающее, возможно, сотни поколений), пока мутации не вер- нут популяцию к равновесным аллельным частотам. Рисунок 8.5. Изменение равновесной частоты мутантного аллеля при разных уровнях отбора и трех различных величинах инбридинга (и=10 5).
Глава 8. Мутации Показано (Lande, Schemske, 1985), что при инбридинге с уровнем родства больше нескольких процентов гетерозиготность по равновес- ному рецессивному аллелю оценивается как: Н 1 (8.3 с) ( & ) Для летальных аллелей, когда 5=1, такая равновесная гетерозигот- ность уменьшается до значения: Очевидно, что равновесная гетерозиготность обратно пропорциональ- на уровню инбридинга. При 5=1 и любом уровне отбора значение Н ~ 4м. При более редких близкородственных скрещиваниях равно- весная гетерозиготность выше. Допустим, при 5 = 0,1 и 5 = 0,1 или 5 = 1 значения равновесной гетерозиготности приближаются к 364м и к 40м, соответственно. Приближенное значение равновесной частоты аллеля А2 равно: 5s +1 - 5 3 м u(2Ss + 2 — 5) —ё------Г _ ~ -----ё----- (8.3d) Ss ) s Ss При небольшом уровне близкородственных скрещиваний равновесная аллельная частота в популяции свободно скрещивающихся между со- бой особей заметно падает. При и = IO45 и 5 = 0,1, например, q = 0,00316, когда 5 = 0 и q = 0,000192, когда 5 = 0,1, т.е. наблюдается уменьшение аллельной частоты более, чем в 16 раз. Ь. Доминантные мутации Если вредный аллель наследуется доминантно, то изменение его час- тоты под действием отбора составит: Че ~ \q = - sp24 как это показано на стр. 130. Изменение аллельной частоты вслед- ствие мутации описано выше, поэтому условие баланса между отбо- ром и мутациями имеет вид: ир = - sp1 Ч \-s(\-p2Y Это выражение можно упростить и записать следующим образом:
II. Баланс мутаций и от sq - sq2 и-----------------;--- 1 - s(2q - 2q2 + q ) При значениях q2, приближающихся к нулю, получим: sq 1 - 2sq и и - 2squ=sq. Если произведение qu близко к нулю, то приближенная равновесная частота для аллеля А2 равна: и Яе=~. (8.4а) Частота мутантного фенотипа при значениях ре,близких к единице, равна (мы учитываем только гетерозигот, поскольку частота гомози- гот АгАг крайне низкая и они по-видимому, легальны): H=2peqe ~2u!s. (8.4b) с. Промежуточное доминирование и груз мутаций При промежуточном характере доминирования значение равновесной аллельной частоты сильно зависит от уровня доминирования. Допус- тим, что общее изменение аллельной частоты равно: ^Я = ^Яти + где &q и — изменения частоты аллеля под действием мутаций и отбора, соответственно. При промежуточном доминировании, когда относительная приспособленность гетерозигот равна 1- hs, предыду- щее выражение принимает вид: \q = up- spq[h - (2/г - 1)<у]. При Д<у=О получаем квадратное уравнение: 5(1 - 2h)q2 +shq - и=0, которое решается следующим образом: -sh + [s2h2 +4us(l-2h)]I/2 2s(l-2h) (8.5а) При значениях Л»0 величина qe очень мала, и приближенная равно- весная частота равна (Morton, 1971):
Глава 8. Мутации qe ~ u/hs. (8.5b) Это уравнение иллюстрируется рисунком 8.6, где показаны три значе- ния коэффициента отбора при и = 10 5. С ростом величины h равно- весная частота быстро падает. Допустим, при 5 = 0,1 значения равно- весных частот для рецессивного (й = 0) и доминантного аллеля (й = 1) составят 0,00316 и 0,00001, соответственно. При й = 0,01 равновесная аллельная частота рецессивного аллеля уменьшится до 0,00092, т.е. более чем на 70% от предыдущей величины. Повышение степени го- мозиготности по вредным рецессивным аллелям обусловливает инб- редную депрессию, или понижение жизнеспособности, как это опи- сано в следующем примере. Пример 8.3. Было показано (Karkkainen et al., 1996), что частота леталь- ных аллелей в популяциях сосны обыкновенной, Pinus sylvestris, на севе- ре Финляндии достоверно ниже частоты деталей на юге. Исследователи предположили, что уменьшение инбредной депрессии на 34% в север- ных популяциях по сравнению с южными связано либо с более высоким уровнем самоопыления, либо с более строгим отбором вредных аллелей на севере, чем на юге. Сосна обыкновенная распространена на всей тер- ритории Финляндии, достигнув за последние 8000 лет (около 100 поко- лений деревьев) и ее северных областей. Поэтому эволюционные изме- нения в данных популяциях произошли в сравнительно короткие сроки. h Рисунок 8.6. Изменение равновесной частоты при разных уровнях доминирования и трех коэффициентах отбора (и НО 5)-
HI. Мутации в конечной популяции Для того, чтобы определить, как влияет на снижение уровня инб- редной депрессии степень самоопыления или отбора, была предложе- на модель, включающая инбридинг, отбор и мутации (Hedrick et al., 1999b). Оказалось, что относительно небольшое увеличение степени самоопыления (инбридинга) - от 0,083 на юге до 0,146 на севере или усиление отбора против гетерозигот от h = 0,02 на юге до 0,054 на севере, может уменьшить инбредную депрессию на 34%. Кроме того, такие изменения могут уменьшить и частоту гетерозигот, которая пря- мо пропорциональна количеству деталей, появившихся за 100 поко- лений сосны. На рисунке 8.7 показано ожидаемое уменьшение инб- редной депрессии на протяжении 100 поколений, если за точку отсче- та принять уровень инбредной депрессии на юге. Очевидно, что уве- личение степени самоопыления или увеличение уровня доминирова- ния может уменьшить степень инбредной депрессии до уровня, на- блюдаемого в популяциях на севере (пунктирная линия) в течение этих 100 поколений. Снижение инбредной депрессии может быть связано и с уменьшением за этот период скорости мутирования. Однако име- ются данные о том, что уровень самоопыляемости и интенсивность отбора в популяциях на севере выше, чем на юге при равнозначных темпах мутирования. Поэтому более правдоподобно объяснение это- Рисунок 8.7. Изменение гетерозиготности сосны обыкновенной в южных популяциях Финляндии, начиная от равновесных значений, и ожидаемое в результате отбора против гетерозигот (изменения степени доминирования), мутаций и самоопыления (по Hedrick et al., 1999).
7380 Глава 8. Мутации го явления, предложенное финскими исследователями (Karkkainen et al., 1996). Как показано на стр. 378, генетический груз (груз мутаций) умень- шает приспособленность особей в популяции по сравнению с приспо- собленностью особей, имеющих оптимальный генотип. Если АХАХ - это оптимальный в данных условиях генотип, то величина генетичес- кого груза равна: L = 1 - w = sq(2ph + q). (8.6а) Для рецессивных мутаций, когда й=0, L=sq2. Как следует из выраже- ния 8.2а, при равновесии u=sq\ поэтому L-и. При полном доминиро- вании, когда h=\, численность особей с генотипом АгАг очень мала, поэтому L=2pqhs. Используя значение равновесной частоты из выра- жения 8.4b, равное 2u/s, получим величину генетического груза, рав- ную 2и. Таким образом, в зависимости от уровня доминирования ве- личина генетического груза находится между значением темпа мути- рования и удвоенного значения темпа мутирования. Удивительно, что зависимость приспособленности от мутаций связана с темпом мути- рования, а не с уровнем отбора (Haldane, 1937). Если предположить, что значения приспособленности по разным локусам не зависимы друг от друга, то величину общей приспособ- ленности можно найти умножением величин приспособленности от- дельных генотипов (см. стр. 486-487). Если приспособленность гено- типа по локусу i равна , то — _ —п и общий генетический груз L = 1 - w. Кроу и Кимура (Crow, Kimura, 1970) показали, что общий генетический груз мутаций в популяции составляет: Z, = C£U|, (8.6b), где С - постоянная величина больше 1 и меньше 2, а и. — скорость мутирования в локусе i. Например, при наличии 10000 локусов, со скоростью мутирования 10 5 и С = 2 величина £ = 0,2. III. Мутации в конечной популяции Как говорилось выше, в бесконечной популяции новая мутация мо- жет утрачиваться в тех случаях, когда не попадает к потомству. Кроме того, вероятность сохранения такой мутации зависит от размера по-
III. Мутации в конечной популяции 381 пуляции. Действительно, вероятность сохранения мутации в популя- ции ограниченного размера значительно ниже, чем в бесконечной, даже если такая мутация имеет селективные преимущества. а. Нейтральность Как следует из обсуждения механизмов поддержания изменчивости на молекулярном уровне (глава 9), теория нейтральности основана на совместном действии мутаций и генетического дрейфа при отсутствии дифференцированного отбора. Прежде чем познакомиться с этой тео- рией, предположим, что в популяции, состоящей из особей с геноти- пом А7А1, появился новый мутантный аллель А} (раньше мы обознача- ли мутантный аллель как А2). Исходная частота мутантного аллеля равна: 1 Ро ~ 2N' Допустим, что эти два аллеля нейтральны по отношению друг к дру- гу. Из характеристики генетического дрейфа в конечной популяции (глава 6) мы знаем, что вероятность фиксации нового мутантного ал- леля равна его исходной частоте в популяции, т.е. / ч 1 и(р) ----, 2N (8.7а) а вероятность утраты нового аллеля равна фиксации аллеля дикого типа: u(q) = 1—— 2JV где и(р) и u(q) - вероятности случайной фиксации или утраты нового аллеля Аг Таким образом, пока популяция относительно мала, новые нейтральные мутации практически всегда утрачиваются. Фиксация и утрата нового мутантного аллеля могут произойти в совершенно разные отрезки времени. Поскольку изменение аллель- ной частоты, приводящее к утрате мутации, очень мало: от 1/(2?V) до нуля, то среднее время утраты мутантного аллеля также мало. При фиксации нового мутантного аллеля изменение его частоты должно быть более значительным: от 1/(2?V) до единицы, а время фиксации - более длительным. Варианты случайной фиксации и утраты четы- рех мутантных аллелей в небольшой популяции показаны на рисун- ке 8.8.
Рисунок 8.8. Изменение аллельной частоты во времени, обусловленное генетическим дрейфом и несколькими мутациями. Один мутантный аллель ( темные кружки) случайным образом зафиксировался в популяции, а другие (светлые кружки) - были утрачены. Кимура и Ота (Kimura, Ohta, 1971) определили среднее время фик- сации и утраты нового нейтрального аллеля в популяции (см. главу 6). При низкой частоте аллеля, как в случае новой мутации, время его фиксации составит: W=4#, (8.7b) а время утраты этого аллеля равно: Г0(р) = 2^1п(2#). (8.7с) При N=N отношение времени фиксации к времени утраты аллеля рав- но 2/[ln(27V)]. Допустим, что # = 500, тогда для фиксации аллеля по- требуется, в среднем, в 145 раз больше времени, чем для его утраты из популяции. Поскольку фиксация занимает много времени, аллели, наблюдаемые в популяции в этот период, полиморфны, однако такой полиморфизм скорее временный, или транзиентный, чем постоянный. Мутации, происходящие в локусах со множеством аллелей увели- чивают число (разнообразие) этих аллелей, а генетический дрейф - уменьшает. Равновесие, обусловленное балансом мутаций и генети- ческого дрейфа, описывается в модели множества аллелей или бес- конечного числа аллелей, когда каждая мутация рассматривается как новый уникальный аллель (Kimura, Crow, 1964). Предположим, что ожидаемая гетерозиготность в поколении t равна:
III. Мутации в конечной популяции 383 г ill1! ft ~-* 1- 2N 2N е X е / Пусть и - скорость появления новых мутаций в данном локусе. Веро- ятность идентичности мутаций в локусе равна вероятности того, что оба аллеля немутантные, или (1- к)2, поэтому ------* 1------Л-i 2^ [ 2Ne /' (1-«)2. При равновесии между мутациями, дающими новые аллели, и раз- мером конечной популяции, в которой эти мутации элиминируются, ft~ft_x=fe- Преобразуя, как в уравнении 7.11с, получим: ~ 4Neu +1 • (8’8а) Поскольку доля гетерозигот в популяции равна Н = 1 -то равновес- ная гетерозиготность по множеству нейтральных аллелей равна: Обратите внимание, что это выражение отличается от предыдущих уравнений изменчивостью аллельных частот, в то время как их рас- пределение остается более или менее постоянным. Допустим, что скорость мутации равна 10 5 или 10“7, тогда ожидае- мую равновесную гетерозиготность можно вычислить, пользуясь урав- нением для популяций с разной эффективной численностью (рисунок 8.9). Если N = 104, равновесная гетерозиготность близка к нулю при и = 10“7и равна 0,286 при и = 10“5. При значениях 4Nu, близких к единице, гетерозиготность приближается к 0,5. При значениях 4Nu » 1 величина гетерозиготности зависит от темпов мутирования, поэтому значения Не довольно высоки. При значениях 4Nu « 1 основным фак- тором, влияющим на гетерозиготность, служит генетический дрейф, поэтому значения /7 малы. Для характеристики мутаций в мини- и микросателлитных локу- сах часто используются примеры изменчивости аллоферментных ло- кусов, которая описывается в модели пошаговых мутаций (stepwise mutation model, SMM), допускающей мутации только в соседних, но не в одном и том же локусе (Ohta, Kimura, 1973).
1.0 Рисунок 8.9. Равновесная гетерозиготность согласно модели множества аллелей в попу- ляциях с разными эффективными размерами при и = 10 5 и и = 10 7. В микросателлитных локусах, где разные аллели содержат раз- личные повторы последовательностей ДНК, этой модели соответ- ствует утрата или появление новых повторов. Равновесная гетеро- зиготность в таких случаях равна: Не 1 (8Neu +1)|/2 ’ (8.8с) При 4Nu =1 равновесная гетерозиготность для таких мутаций соста- вит 0,423, т.е. 85% от величины гетерозиготности в предыдущей моде- ли. При малых значениях 4Neu значение равновесной гетерозиготности очень близко к разнице между его оценками по одной и другой моде- лям. Использование уравнений 8.8b и 8.8с для оценки изменчивости молекулярных маркеров у гепарда продемонстрировано на примере 8.4. Пример 8.4. При систематическом исследовании генетической измен- чивости у гепарда в сравнении с другими крупными представителями кошачьих обнаружен низкий уровень изменчивости, что говорит о вы- сокой вероятности вымирания гепардов (O’Brien et al., 1983, 1985, 1987). Гетерозиготность по 47 аллоферментным локусам составила у
гепарда всего 0,0072 (таблица 8.4). Кроме того, была выявлена низкая изменчивость повторяющихся последовательностей ДНК в генах глав- ного комплекса гистосовместимости (Yuhki, O’Brien, 1990). Однако еще в двух исследованиях (Menotti-Raymond, O’Brien, 1993,1995) было по- казано, что уровень изменчивости последовательностей мтДНК, мини- и микросателлитной ДНК у гепарда выше, чем у других крупных ко- шек (табл. 8.4). Возможно, что такой низкий уровень изменчивости объясняется эффектом «бутылочного горлышка», действующим в по- пуляциях гепарда. Различные уровни изменчивости в этих двух типах локусов, по-видимому, связаны с разными темпами мутирования (Hedrick, 1996). Допустим, в аллоферментных локусах и = 10 6, а в мини- и микросателлитных и = 10~3. Тогда равновесная гетерозигот- ность соответствует двум различным величинам эффективной числен- ности популяции, представленным в таблице 8.4. Значения равновес- ной гетерозиготности для аллоферментных локусов получены с по- мощью уравнения 8.8b, а для мини- и микросателлитных - с помо- щью уравнения 8.8с. Хедрик предположил, что малая эффективная чис- ленность популяции может быть обусловлена динамическими попу- ляционными процессами (гипотеза метапопуляций). С учетом этих процессов, теоретическая гетерозиготность аллоферментных локусов низка и сходна с наблюдаемой, а мини- и микросателлитных локусов - значительно выше и также сходна с наблюдаемой. Для того, чтобы определить роль эффекта «бутылочного горлышка» или метапопуля- ции, необходим дальнейший молекулярный анализ генетической из- менчивости у гепарда. ТАБЛИЦА 8.4. Наблюдаемая гетерозиготность по трем типам локусов у гепарда, пумы и льва, а также теоретические значения равновесной гетерозиготности при двух значениях эффективной численности популяций Аллоферменты Минисателлиты Микросателлиты Наблюдаемая Гепард 0,0072 0,435 0,39 (0,56)* Пума 0,018-0,067 0,579 0,61 Лев 0,037 0,481 0,66 Теоретическая А = 200 0,0008 0,380 А = 2000 0,0079 0,757 *В скобках указана наблюдаемая гетерозиготность за исключением трех мономорфных локусов у гепарда, в то время как у пум, львов и домашних кошек они были полиморфны.
b. Отбор Если в популяции имеется благоприятная мутация и отбор действует на этот локус в различных генотипах, то для определения частоты включения новой мутации в генотипы популяции, можно вычислить вероятность фиксации мутантного аллеля (см. стр. 308). Если мута- ций несколько и значения приспособленности для особей с генотипа- ми А}Ар А\А2 и Лу^равны, соответственно, 1+s, 1 + ys и 1, то вероят- ность фиксации (уравнение 6.16b) составит: и(р) = ~---- 1 — е В случае единственной мутации p=\/(2N) и | /У)? 2.V l-e'2'v При благоприятной мутации (s > 0) и ее небольшом селективном пре- имуществе получим уравнение Фишера (Fisher, 1930): Если N=N, а величина s вдвое меньше значения в уравнении Фишера, то имеем: (8.9а) где s* - селективная разница между мутантным аллелем и аллелем дико- го типа. Сказанное верно при постоянной численности популяции, если ее численность то растет, то падает, то изменяется и вероятность фикса- ции мутантного аллеля (Otto, Whitlock, 1997). Допустим, вероятность фиксации такого аллеля в популяции при скорости роста численнос- ти, равной г, приближается к значению: и\-^~ | = 2(s *+г). 2W (8.9b) Когда численность популяции растет, вероятность сохранения благо- приятной мутации в первых поколениях растет, поэтому повышается и вероятность фиксации мутантного аллеля. Если в популяции действуют разные типы отбора, то важно учиты- вать совместное действие мутаций и генетического дрейфа. Во-пер-
III. Мутации в конечной популяции 387 вых, ожидаемая частота леталей и других мутаций с вредным эффек- том в небольшой конечной популяции ниже, чем в бесконечной попу- ляции, поскольку отбор приводит к снижению частоты и к последую- щей утрате таких аллелей в результате генетического дрейфа. Други- ми словами, конечная популяция с небольшой численностью очища- ется от вредных заметных мутаций (Nei, 1968; Crow, Kimura, 1970). Во-вторых, при 2М<1 (s<\!(2N) генетический дрейф влияет на аллель- ную частоту сильнее, чем отбор, а сохранившиеся мутации прибли- жаются к нейтральным (Kimura, 1983). Было показано (Lunch, Gabriel, 1990; Lande, 1994), что в малых популяциях вредные, селекционно невыгодные мутации составляют менее 1/(22V) и фиксируются в слу- чаях, когда они нейтральны. В результате, со временем приспособ- ленность особей падает, и численность популяции снижается. Поэто- му вредные мутации с более выраженным действием становятся эф- фективно нейтральными и сохраняются в популяции с большей веро- ятностью. Этот обратный процесс называется растворением мутаций и теоретически может привести к вымиранию малочисленной попу- ляции (Lynch et al., 1995). Не вполне ясно, какую роль играет этот процесс в природных популяциях, поскольку вероятность вымирания таких малочисленных популяций довольно высока (Lande, 1995). Не- давно было теоретически (Lande, 1998) и экспериментально (Burch, Chao, 1999) доказано, что обратные и компенсаторные мутации могут смягчить эффект растворения мутаций. Многие хромосомные мутации, влияющие на мейоз у гетерозигот, снижают их плодовитость. В результате, чистая приспособленность гетерозиготных особей может оказаться более низкой, чем у гомози- гот или у особей, гомозиготных по новой хромосомной мутации. По- скольку исходная частота такой мутации мала, ниже частоты гетеро- зигот при неустойчивом равновесии, отбор всегда снижает частоту мутантных особей. Однако, многие близко родственные виды разли- чаются по составу хромосом и это может привести к преимуществу одних кариотипов перед другими. Уайт (White, 1978) выделил четыре фактора, каждый из которых или в комбинации с другими факторами могут обусловить фиксацию того или иного кариотипа (хромосомно- го варианта). К таким факторам относятся: генетический дрейф, мей- отический дрейф, селективное преимущество нового гомозиготного генотипа и инбридинг. Теоретическое исследование этих факторов (Bengtsson, Bodmer, 1976; Lande, 1979а; Hedrick, 1980b; Barton, Rouhani, 1991) не прояснило их роли в природных популяциях.
IV. Оценка скорости мутирования Оценка скорости мутирования затруднена из-за редкости мутаций. Для получения достоверных оценок темпов мутирования требуется очень большое количество наблюдений, например проверка миллионов мы- шей (см. таблицу 8.1), (Schlager, Dickie, 1971; Russel, Russel, 1996). Даже при обнаружении новой мутации важно убедиться в ее истинности и в отсутствии контаминации (например, в результате случайного скрещи- вания с другим мутантом). Кроме того, важно различить мутации в раз- ных локусах, сходные по своему фенотипическому проявлению. В та- ких случаях, до определения аллельной принадлежности мутаций они объединяются в общий фенотипический класс. Прямой подход к оцен- ке скорости мутирования состоит в подсчете новых мутаций, возника- ющих на фоне известных родительских генотипов. При наличии мута- ций, отрицательно влияющих на жизнеспособность, используется не- прямой подход. В этом случае дается общая оценка темпов мутирова- ния при условии равновесия между мутациями и отбором. а. Доминантные и кодоминантные мутации Для доминантных и кодоминантных мутаций широко используется пря- мой метод оценки скорости мутирования в одном поколении. В этом случае известны генотипы родителей и выявлено, что они не несут до- минантных или кодоминантных мутаций. Если у их потомства появля- ется мутация в доминантном или кодоминантном аллеле, то она навер- няка возникла заново. Поскольку каждому потомку достается две гаме- ты, потенциально несущие мутацию, то скорость мутирования равна: " = (8.10а) где х - количество мутантов в потомстве, состоящем из N исследован- ных особей. Этот метод (Schlager, Dickie, 1971), (см. пример 8.1) по- зволяет оценивать скорость появления обратных мутаций в несколь- ких локусах одновременно. Он используется для оценки скорости му- тирования при различных доминантно наследуемых заболеваниях. К примеру, в одной из больниц Копенгагена для выявления ахондропла- зии (доминантно наследуемой карликовости) было исследовано 94075 детей (Stern, 1973). У десяти детей обнаружили признаки ахондроп- лазии, причем у двоих родители были также больны. Таким образом, у восьми детей мутация возникла заново, поэтому оценка скорости мутирования составит: й = 8/[(2)(94075)] = 4,2 х 10 7
IV. Оценка Аналогичный подход можно использовать для оценки темпов му- тирования E.coli и других гаплоидных организмов, хотя в данном слу- чае потенциальным мутантом может оказаться любая клетка. Для гап- лоидных организмов и гамет и = — N (8.10b) где N - число исследованных клеток. Ряд наследственных болезней человека связан с мутациями в три- нуклеотидных повторах (Sutherland, Richards, 1995). К ним относятся синдром ломкой Х-хромосомы и хорея Гентингтона. При исследова- нии 475 мужских гамет было обнаружено всего 3 мутации (0,06%), в то время как скорость мутирования разных аллелей, обусловливаю- щих хорею Гентингтона, составляет от 92 до 99% (Leeflang et al., 1995). Пример 8.5 иллюстрирует применение этого метода для оценки отно- сительной скорости мутирования в минисателлитных локусах у чело- века после радиоактивного облучения и в контрольной группе. Пример 8.5. Из экспериментов давно известно, что высокий уровень радиации вызывает мутации, чаще хромосомные разрывы. Однако до- вольно мало подтверждений тому, что ионизирующая радиация уве- личивает скорость мутирования всех генов в клетках зародышевой ли- нии. Более точную оценку скорости мутирования дают исследования мутаций в минисателлитных локусах с высоким базовым уровнем му- таций. Они позволяют обнаружить статистически достоверное увели- чение скорости мутирования в относительно небольших выборках. Увеличение скорости мутирования минисателлитных локусов в клет- ках зародышевой линии, связанное с облучением, было показано, на- пример, у мышей (Duprova et al., 1993). Авария на Чернобыльской атомной электростанции 26 апреля 1986г. привела к огромному выбросу радиоактивных элементов. Для оценки влияния этого выброса на скорость мутирования в клетках зародыше- вой линии человека Дупрова с соавторами (Duprova et al., 1996) ис- следовали темпы мутирования по пяти минисателлитным локусам у детей, родившихся от облученных в результате чернобыльской ава- рии родителей. Эти данные сравнивали с результатами исследования детей от необлученных родителей из английских семей (контрольная группа). В 1491 пробе минисателлитной ДНК (при электрофорезе дают отдельные полосы на геле) от детей из контрольной группы обнару- жено 23 мутации, а в 1615 пробах от детей облученных родителей - 49 мутаций (таблица 8.5), т.е. статистически достоверное увеличение
Глава 8. Мутации ТАБЛИЦА 8.5. Оценочная скорость мутирования по пяти минисателлитным локусам у детей из семей, облученных вследствие чернобыльской аварии, (Е) по сравнению с контрольной группой (С). Р - вероятность, определенная с помощью критерия Фишера (по Duprova et al., 1996) Локус Контроль Облучение Отношение Е/С Р Число проб Скорость .мутаций Отношение .мутиро- вания Число проб Скорость .мутаций Отношение .мутиро- вания D1S7, D7S21 387 9 0,023 281 11 0,039 1,68 0,179 Другие р-ны 33.15 1516 10 0,007 1103 17 0,015 2,34 0,029 D1S8 164 3 0,018 150 1 0,007 0,36 0,545 D2S90 164 11 0,067 150 20 0,133 1,99 0,045 Всего* 1491 23 0,015 1615 ' 49 0,030 1,97 0,004 * Общее число семей, проверенных по мутациям во всех указанных пробах. частоты мутаций в 1,97 раза. Большинство мутаций в обеих исследу- емых группах касалось некоторых повторяющихся последовательно- стей, т.е. радиация увеличивает скорость мутирования, а не индуци- рует появление различных типов мутаций. Исследованные белорус- ские семьи были сгруппированы на получивших большую дозу облу- чения и на получивших меньшую дозу. Между этими группами также обнаружены достоверные различия в скорости мутирования: 0,026 и 0,039, соответственно, при Р = 0,041. Похожее исследование детей из семей, подвергшихся атомной бом- бардировке, было проведено в Японии (Kodaira et al., 1995). В отличие от результатов Дупровой с соавт. (Duprova et al., 1996), скорость мутирова- ния по этим же минисателлитным локусам в облученных и контрольных японских семьях была приблизительно одинаковой. В 1111 пробах ми- нисателлитной ДНК, полученных от детей из облученных семей, обна- ружено 12 мутаций (скорость мутирования 0,011). В 1041 пробе, полу- ченной от детей из контрольной группы, обнаружено 13 мутаций (ско- рость мутирования 0,012), (Satoh, Kodaira, 1996). В работе Дупровой и соавт. (Duprova et al., 1996) в качестве контрольной группы использова- лись английские семьи. По мнению Сато и соавторами (Satoh, Kodaira, 1996), для надлежащей оценки влияния чернобыльской аварии на ско- рость мутирования у человека необходим более адекватный контроль. Когда генотипы родителей неизвестны, для оценки скорости мути- рования в случае доминантных вредных мутаций используют другой (непрямой) метод. Предполагается, что частота мутантного аллеля
IV. Оценка скорости мутирования 391 близка к равновесной, а частота гетерозигот (Н) задана уравнением 8.4b. Его можно записать в следующем виде: , sH и = ^, (8.10с) где й - оценка скорости мутирования. Для доминантных мутаций эти оценки случайны, поскольку частота этого аллеля в популяции не мо- жет быть равновесной и оценка величины 5 (при 5 < 1) затруднена. Ь. Рецессивные мутации Оценивать скорость мутирования для рецессивных мутаций несколь- ко труднее, чем для доминантных. Прямой метод оценки темпов му- тирования в одном поколении состоит в скрещивании гомозигот по доминантному аллелю с гомозиготами по рецессивному с последую- щим исследованием потомков с рецессивными признаками (Russel, Russel, 1996). Такое потомство должно быть гетерозиготным и оценка скорости прямой мутации равна: . х и = — V В знаменателе стоит величина N, поскольку только одна из гамет может мутировать от доминантного аллеля к рецессивному. Однако такие му- тации не всегда обнаруживаются тотчас, т.к. в предыдущем поколении они могли возникнуть у гомозигот по доминантному аллелю. В зависи- мости от системы скрещиваний, которая используется для поддержа- ния инбредных линий, вводятся специальные поправки (Falconer, 1949). Поскольку Х-сцепленные рецессивные аллели экспрессируются у особей мужского пола, то аналогичный метод применим и для ана- лиза Х-сцепленных мутаций в человеческих популяциях. При нали- чии родословных можно предполагать с той или иной вероятностью мутации в половых клетках родителей или в гаметах у предыдущих поколений. Такой метод позволил оценить скорость мутирования по целому ряду Х-сцепленных аллелей, обусловливающих наследствен- ные болезни человека (Vogel, Motulsky, 1997). Как показано в главе 1, у дрозофилы можно проверить наличие или отсутствие деталей в отдельных хромосомах. В таблице 8.6 представ- лены некоторые результаты оценки скорости появления спонтанных летальных мутаций в хромосоме I (Х-хромосоме) и хромосоме II у D.melanogaster (Crow, Temin, 1964). Скорость появления мутаций в хромосоме II почти в два раза выше, чем в Х-хромосоме. Это согласу-
ется с фактом, что хромосома II содержит генов почти в два раза боль- ше, чем Х-хромосома. Хромосома II включает около 40% всего гено- ма D.melanogaster, поэтому скорость появления леталей в одном по- колении в перерасчете на гаплоидный геном составит примерно 0,013. При непрямом методе оценки скорости появления вредных рецес- сивных мутаций используется уравнение 8.2с. Тогда скорость возник- новения прямых мутаций составит: u = sQ, (8.11а) где Q - частота пораженных гомозигот по вредному рецессивному алле- лю. Однако использовать аналогичный подход для оценки скорости по- явления вредных доминантных аллелей проблематично. Дело в том, что относительная приспособленность гетерозигот сильно зависит от равно- весных частот генотипов. Даже при слабой невыгодности гетерозигот, допустим, 1 %, предыдущее уравнение дает неточные результаты. Клековски и Годфрей (Klekowski, Godfrey, 1989) исследовали ско- рость возникновения рецессивных хлорофилльных мутаций у само- опыляющихся растений мангровых зарослей, которые прорастают из семян прямо на материнском растении. Анализируя потомство, они оценили частоту гетерозиготных материнских растений и определили скорость появления хлорофилльных мутаций в целом геноме (около 300 генов) у растений из двух популяций, равную 6,6 х 10 ’. ТАБЛИЦА 8.6. Скорость возникновения спонтанных летальных мутаций в хромосоме II и в Х-хромосоме D.melanogaster из природных популяций и лабораторных линий (по Crow, Temin, 1964) Число исследованных хромосом Число полученных леталей Скорость возникновения мутаций Хромосома II Природа (3 исследования) 19,997 115 0,0058 Лаборатория (7 исследований) 38,499 179 0,0046 Всего 58,496 294 0,0050 Х-хромосома Природа (6 исследований) 271,050 669 0,0025 Лаборатория (14 исследований) 346,719 898 0,0026 Всего 617,769 1567 0,0025 с. Оценка накопления мутаций У некоторых модельных организмов, которые в течение многих поко- лений поддерживаются в виде чистых лабораторных линий, происхо-
IV. Оценка скорости мутирования 393 дящих от одной особи, можно оценить темпы накопления мутаций. Скорость мутаций по определенному локусу оценивается как число наблюдаемых мутаций, деленное на число аллельных поколений (про- изведение числа поколений, числа линий и числа исследуемых алле- лей или локусов). У D.melanogaster линии-накопители мутаций обычно создаются с помощью модифицированного метода идентификации де- талей (см. стр. 54). При исследовании аллоферментного состава та- ких линий среди 3 миллионов вероятных мутаций было выявлено всего 4 мутации и оценочная скорость мутирования составила 1,28 х 10 й. В примере 8.6 приведены оценки скорости мутирования для микроса- теллитных локусов. Линии-накопители мутаций используются и для оценки уровня вредных мутаций. Пример 8.6. Оценки скорости мутирования по микросателлитным ло- кусам у млекопитающих довольно высоки и варьируют от 10 2 до 10 ' на локус в одном поколении (Dallas, 1992; Weber, Wong, 1993). Одна- ко, два недавних исследования линий-накопителей мутаций у D.melanogaster говорят о более низкой скорости мутирования в мик- росателлитных локусах дрозофилы (таблица 8.7). Исследование 49 ди- нуклеотидных повторов в 321930 аллельных поколениях позволило обнаружить три мутации, отличающиеся от исходного аллеля всего на один повтор (два нуклеотида), (Schug et al., 1998). Исследование 24 локусов, из которых 22 были динуклеотидными, а 2-тринуклеотид- ными повторами, в 1428000 аллельных поколениях выявило 9 мута- ций (Schlotterer et al., 1998). Все эти 9 мутаций были локализованы на хромосоме, содержащей 28 динуклеотидных повторов в локусе DROYANETSB, и отличались от исходного аллеля повторами -12, -6, -5,-1 (2 мутации), повтором +1 (2 мутации) и повторами +3 и +4. В этих исследованиях использовались практически не перекрывающие- ся локусы и средняя скорость мутирования составила 0,69 х 105, что значительно ниже оценок темпа мутирования по микросателлитным локусам у млекопитающих. Исключением является аллель локуса DROYANETSB, содержащий 28 динуклеотидных повторов, один из са- мых протяженных микросателлитных аллелей D.melanogaster. Здесь скорость мутирования составила 3,0 х ЮЛ Вероятно, низкий общий темп мутирования (и низкая изменчивость) микросателлитных локу- сов у D.melanogaster связан со сравнительно низкой повторяемостью последовательностей ДНК в этих локусах по сравнению с микроса- теллитными локусами у млекопитающих. О снижении численности повторов говорит обнаруженное сокращение аллеля из 28 повторов в среднем, на 1,8 повтора (Wierdl et al., 1997).
Глава 8. Мутации ТАБЛИЦА 8.7. Оценки скорости мутирования по микросателлитным локусам D.melanogaster, полученные при исследовании двух линий-накопителей мутаций. Оценки даны для двух аллелей локуса DROYANETSB, включающих 28 и 15 динуклеотидных повторов (по Schlotterer et al., 1998) Исследование Локус Число мутаций Аллельные поколения й(х 105) Schug et al. DMV1951 1 6,570 15,2 DMZ5K25Z 1 6,570 15,2 DM86 1 6,570 15,2 46 др.локусов 0 302,220 0 Всего 3 321,930 0,93 Schlotterer et al. DROYANETSB-28 9 29,750 30,3 DROYANETSB-15 0 29,750 0 23 др.локусов 0 1368,500 0 Всего 9 1428,000 0,63 Оба исследования 12 1749,930 0,69 d. Факторы, влияющие на скорость мутирования Измерять скорость мутирования крайне сложно, поскольку для полу- чения точных результатов требуются огромные выборки. Кроме того, темпы мутирования зависят не только от факторов среды, но и от пола, возраста организма, от количества пройденных клеткой митозов и от работы отдельных генов (Crow, 1997b; Drake et al., 1998). Влияние возраста матери на частоту возникновения мутаций про- слеживается на признаках, ассоциированных с изменчивостью числа хромосом в кариотипе человека: частота синдрома Дауна, например, повышается с увеличением возраста матерей. Для ряда генных мута- ций показано увеличение их частоты с увеличением возраста отца, т.е. новые мутации попадают к потомству от отца (Vogel, Motulsky, 1997; Crow, 1997b). Происхождение новой мутации от одного из ро- дителей можно определить с помощью молекулярных маркеров. К при- меру, все 57 независимых новых мутаций, обусловливающих харак- терную для синдрома Аперта деформацию костей черепа и конечнос- тей, оказались отцовского происхождения (Moloney et al., 1996). С увеличением возраста родителей резко повышается и среднестатис- тическая частота ахондроплазии - одной из форм карликовости (Risch et al., 1987). Обе болезни, по-видимому, обусловлены простыми тол- ковыми мутациями. Молони с сотрудниками (Moloney et al., 1996), изучившие 57 больных синдромом Аперта, обнаружили трансверсии С-G в различных смежных сайтах ДНК. При исследовании 16 пациен-
IV. Оценка тов с ахондроплазией (Shiang et al., 1994), были выявлены замены GGG на AGG или CGG в единственном сайте, кодирующем глицин, заме- щенный в результате мутации аргинином. Кроу (Crow, 1997b) предпо- ложил, что частота точковых мутаций у мужчин, особенно пожилых, выше, чем у женщин, поскольку при формировании мужских гамет половые клетки претерпевают больше делений. В пользу такого предположения говорят результаты исследования частоты синонимичных нуклеотидных замен в интронах гена CHD, локализованного на половых Z- и W-хромосомах птиц (Ellegren, Fridolfsson, 1997). Оказалось, что у самцов частота этих мутаций в четыре раза выше, чем у самок. Поскольку генотип самцов ZZ, а са- мок - ZW, то 2/3 всех Z-хромосом находятся у самцов, а W-хромосо- мы - только у самок. Поэтому можно ожидать, что более высокая ча- стота возникновения мутаций у самцов приведет к более высоким тем- пам мутирования гена CHD, локализованного на Z-хромосоме, чем гена на W-хромосоме, что подтвердилось в эксперименте. При сравнимой скорости мутирования в разных таксонах часто об- наруживаются большие различия в частоте мутаций на поколение по- ловых клеток (Drake et al., 1998). К примеру, скорость мутирования в поколении у человека оказалась на два порядка выше, чем у нематоды C.elegans (таблица 8.8). Для адекватного сравнения Дрейк с сотруд- никами стандартизировали эту величину в отношении эффективного размера генома и числа делений половых клеток (Drake et al., 1998). У C.elegans, например, функционирующие гены составляют около 0,225 от всего генома, а в линии зародышевых клеток проходит около 9,1 делений на поколение половых клеток (половое поколение). Оказа- лось, что частота мутаций у четырех видов (таблица 8.8) в расчете на эффективный геном и число клеточных делений очень сходна, варьи- руя от 0,004 до 0,014 (крайняя правая колонка в таблице 8.8). ТАБЛИЦА 8.8. Частота мутаций на стандартизированный геном [эффективная длина генома (G) / общая длина генома (G) ] и количество делений половых клеток на поколение (реиликации/поколение), (по Drake et al., 1998) Виды Ge/G Реп./Пок. Частота мутаций Половое поколение Репликация клеток G Ge G Gc C.elegans 0,225 9,1 0,16 0,036 0,018 0,004 D.melanogaster 0,094 25 1,5 0,14 0,058 0,005 Мышь 0,030 62 30 0,9 0,49 0,014 Человек 0,025 400 64 1,6 0,16 0,004
Так называемые гены-мутаторы могут повышать общую частоту му- таций во многих локусах. Часто такие гены либо кодируют ферменты, участвующие в репликации или репарации ДНК, либо служат сайта- ми связывания этих ферментов с молекулой ДНК. Очевидно, что ошиб- ки в работе этих ферментов приводят к мутациям (см. пример 8.7, по- казывающий, что у мух, гомозиготных по нуль-аллелю, кодирующе- му фермент для репарации ДНК, частота мутаций в микросателлит- ных локусах резко повышается). Высокая частота мутаций, как правило, вредных, понижает приспо- собленность особей в популяции. Когда изменяются условия среды или истощается генетическая изменчивость популяции, то усиление измен- чивости за счет новых мутаций может оказаться полезным (см. пример 8.7 о повышении изменчивости у штамма E.coli, несущего аллель гена- мутатора, при попадании бактерий в новую среду обитания). Если на- копления новых мутаций не происходит, приспособленность популя- ции может уменьшаться вследствие низкой адаптивной изменчивости в новых условиях обитания. Теоретическое исследование факторов, вли- яющих на скорость мутирования, показывает динамику изменения час- тоты мутаций до оптимальных значений (Kimura, 1967; Leigh, 1970; Drake et al., 1998). Однако изменение частоты мутаций и соответствую- щее изменение приспособленности должно быть достаточно медлен- ным, так что оптимальные значения достигаются лишь со временем. Вероятно, оптимальная скорость мутирования - это возможный мини- мум частоты мутаций, достигнутый без особых затрат энергии за счет усовершенствования репарации ДНК, например. Пример 8.7. Белок MutS кишечной палочки E.coli узнает ошибочно спа- ренные нуклеотиды и участвует в репарации таких ошибок. Мутации в генах mutS и mutL повышают частоту точковых мутаций и нестабиль- ность простых повторов в молекуле ДНК (Strand et al., 1993). Такая сис- тема репарации эволюционно консервативна и обнаружена у многих эука- риот, начиная от грибов и кончая человеком. Мутации родственных бел- ков дрожжей также приводят к нестабильности простых повторов. По- добные мутации, обусловливающие нестабильность повторяющейся ДНК в геноме человека, могут быть связаны с развитием некоторых видов рака. Флорес и Энгельс (Flores, Engels, 1999) клонировали гены spellchecker 1 (spell} D. melanogaster, гомологичные гену mutS E.coli и создали ли- нии мух с делецией в данном участке ДНК. Затем они сравнили между собой ряд линий, гомозиготных по делециям участка spell в восьми микросателлитных локусах и контрольные линии, гетерозиготные по данной делеции. Число мутаций, наблюдаемое через 10-12 поколений
Задачи таких мух, а также приближенная скорость мутирования по локусу spell у гомозигот по нуль-аллелям (делециям) и контрольных гетерозигот показаны в таблице 8.9. В контроле было обнаружено только три мута- ции, в то время как в линиях, гомозиготных по нуль-аллелю spell, вы- явлено 189 мутаций. Скорость мутирования у гомозигот на два порядка выше, чем в контроле. Около 90% мутантных аллелей отличались от родительских аллелей только на один повтор. Уровень мутаций в конт- роле оказался выше, чем наблюдали другие исследователи (Schrug et al., 1998; Schlotterer et al., 1998), (см. таблицу 8.7), что указывает на участие в репарации ДНК двух копий гена spell. Повышение частоты мутаций не обязательно приводит к росту при- способленности. Это было показано на примере штаммов бактерий E.coli, растущих в культуре (Сох, Gibson, 1974). Эти штаммы размно- жались с одинаковой скоростью и отличались друг от друга только по наличию гена-мутатора. На рисунке 8.10 показано изменение соотно- шения численности бактерий с геном-мутатором и бактерий дикого типа во времени. Как видно из рисунка 8.10b, иногда численность бактерий дикого типа быстро растет. Однако в опытах 10 и 11 преимущество в численности было на стороне штамма с геном-мутатором. Этот штамм состоит из «липких» мутантных бактерий, которые прилипают к стек- лянным стенкам культуральных флаконов и размножаются более актив- но, чем бактерии дикого типа. Положительное влияние гена-мутатора на адаптивную изменчивость бесполых организмов зависит от накоп- ления полезных мутаций и от других факторов (de Visser et al., 1999). ТАБЛИЦА 8.9. Мутации в восьми микросателлитных локусах у гомозигот по нуль- аллелю (делении) гена spellchecker 1 (spell) и у гетерозигот в контроле, N - численность выборки Локус Гомозиготы no нуль-аллелю Контрольные гетерозиготы Число мутаций N Частота мутаций* Число мутаций N Частота мутаций* elfl (CAG)7 0 378 0 0 192 0 mam (CAG)7 1 188 0.005 0 190 0 sev (AC)14 3 97 0.031 2 98 0.020 35 F (AT)17 18 192 0.094 0 190 0 w(AT)13 9 92 0.098 1 96 0.010 Ulal (AT) 15 44 380 0.116 0 192 0 tenA (AT)14 14 94 0.149 0 95 0 AbdB (CA)26 100 378 0.265 0 192 0 Всего 189 1629 0.116 3 1245 0.002 * В первых поколениях линии не были изолированными, поэтому указаны приближенные значения.
Рисунок 8.10. Изменение соотношения численности бактерий E.coli с геном-мутатором и бактерий дикого типа в двух опытах (по Сох, Gibson, 1974). Задачи 1. Предложите эксперименты для проверки гипотезы о сравнительно недавнем внедрении Р- и /-элементов в геном D.melanogaster. 2. Каково значение равновесной частоты при и = 10 6 и v = 10 7? Нарисуйте график изменений величины q при данной скорости мутирования. Допустим, что и = 10ft, a v = 0. Через сколько поколений частота аллеля Л2 возрастет от 0,01 до 0,05? 3. Какова вероятность утраты новой мутации в первом поколении, если все семьи в популяции состоят из 2 индивидов? Какова вероятность утраты нового аллеля в первом поколении, если у половины семей нет потомства, а у половины - четыре потомка? Сравните полученные результаты с распределением Пуассона и объясните различия. 4. Предположим, что и = 1 О'6, а х = 0,4. Какова ожидаемая частота аллеля Л,? Нарисуйте график изменений аллельной частоты в пределах от 0,0 до 0,01. 5. Считается, что мутагены среды, повышающие частоту мутаций, и совершенствование ухода за больными генетическими заболеваниями увеличивают частоту появления индивидов с рецессивно- наследуемыми болезнями. Какой из этих факторов важнее и почему? 6. Равновесную частоту аллеля А2 при инбридинге, мутациях и отборе можно вычислить с помощью уравнений 8.3а и 8.3b. Допустим, что
Задачи f= 0,02, а и = 10 5, пользуясь этими выражениями, определите значения 7(.при 5 = 0,1, 0,2 и 0,5. 7. Каковы значения равновесной гетерозиготно сти и аллельной частоты при 5' = 0,25, 5 = 1 и и = 10 5? Какова равновесная гетерозиготность при случайных скрещиваниях в популяции, почему различаются полученные величины? 8. Равновесную частоту аллеля А2 при отборе мутаций и признаков с неполным доминированием можно определить с помощью уравнений 8.5а и 8.5b. Допустим, что 5 = 0,1 или 0,5, h = 0,8 и и = 10 й. Пользуясь этими уравнениями, найдите значения qe. Каков груз мутаций при сочетании полученных величин? 9. Сколько времени потребуется для фиксации или утраты статис- тически нейтрального мутантного аллеля при # = 2000 и # = 100? С чем связано различие полученных значений? 10. Предположим, что AN и = 0,1, 1 и 10. Пользуясь моделью множества аллелей и моделью пошаговых мутаций, определите значения равновесной гетерозиготности и объясните результаты. 11. Можно ли использовать данные, представленные в примере 8.4, для прогнозирования вымирания популяции гепардов или для подтверждения эффекта «бутылочного горлышка»? Предложите другие примеры, подтверждающие или опровергающие Ваш ответ. 12. Какова вероятность фиксации благоприятной мутации при 5 = 0,1, #=100, #=20,100 и 200? Объясните полученные результаты. 13. Считаете ли Вы, что пример 8.5 доказывает: авария на Черно- быльской АЭС повысила частоту мутаций у облученных лиц? Какие ещё данные можно использовать для более точной оценки влияния этой аварии на скорость мутирования? 14. При исследовании летальной болезни, наследуемой доминантно, среди 200000 птиц было выявлено 20 новых мутаций. Какова оценочная скорость мутирования? По данным статистики частота этого заболевания равна 0,00001. Какова оценочная скорость мутирования, исходя из статистических данных? Почему возможны различия между значениями скорости мутирования? 15. Среди миллиона мышат - потомков от скрещивания гомозигот и гетерозигот по доминантному аллелю гена окраски шерсти, было обнаружено 10 рецессивных мутантов. Какова оценочная скорость мутирования по этому локусу? В природных популяциях мышей рецессивные мутанты (гомозиготы по рецессивному аллелю) отсутствуют. Чем это объяснить?
ГЛАВА 9 МОЛЕКУЛЯРНАЯ ГЕНЕТИКА ПОПУЛЯЦИЙ И ЭВОЛЮЦИЯ В течение многих лет биохимики и молекулярные биологи рассматривали эволюци- онные исследования как агрегат диких спекуляций, ничем не подкрепленных пред- положений и неупорядоченных методологий. Так как эволюционная оценка никогда не была точной, введение молекулярных методов, несомненно, превратило эволю- цию в «тяжелую» науку, где применяемые параметры могут быть измерены, рас- считаны и вычислены из эмпирических данных, а теории могут быть сверены с реальностью. Догадки в эволюционных исследованиях теперь служат той же цели, что в физике: это количественные рабочие гипотезы, направленные на улучшение экспериментальной работы, проверку, усовершенствование или опровержение тео- рии. .. Эволюционные исследования достигли того, что сэр Уильям Черчилль в 1831г. называл настоящим прорывом во всех естественных науках: выражением научных утверждений «не обще и неопределенно, но со всеми возможными прогнозами мес- та, веса и меры». Вэн-Хсиунг Ли и Дэн Грор (Wen-Hsiung Li, Dan Graur, 1991) Основные теории молекулярной эволюции - модель нейтральности Кимуры, модель малой вредности Оты и модели балансирующего и эпизодического отбора Гиллес- пая - согласуются, по крайней мере, с некоторыми данными по аллоферментному анализу и структуре ДНК. Ни одна из этих моделей, однако, не может рассматри- ваться для всех доступных эмпирических наблюдений. Мы считаем, что необходи- ма исчерпывающая теория, в которой учитываются действующие одновременно сильные и слабые силы, зависящие от сцепления генов и от размера популяции. Мартин Крайтман и Хироши Акаши (Martin Kreitman, Hiroshi Akashi,1995) Молекулярная генетическая изменчивость, также как аллельная измен- чивость и изменчивость нуклеотидной последовательности, обеспечива- ет фундаментальное описание генетической изменчивости в организме. Силы, которые влияют на степень и характер молекулярной изменчивос- ти - отбор, инбридинг, генетический дрейф, поток генов, мутации и ре- комбинации - те же, что влияют на генетическую изменчивость, хотя их относительные эффекты могут быть различны. Мы используем примеры молекулярной изменчивости для иллюстрации действия этих факторов на генетическую изменчивость. Последние технические достижения в об- ласти молекулярной генетики, особенно определение последовательнос- ти нуклеотидов, дали огромную информацию и еще больше такой ин-
I. Нейтральность и прогнозы молекулярной изменчивости 401 формации накопится в последующие годы. Анализ структуры последова- тельностей ДНК с точки зрения эволюционных перспектив привел к бы- стро развивающейся сфере молекулярной филогенетики, основная цель которой - реконструкция эволюционных отношений между генами и ви- дами. Детальная разработка этой технически сложной области современ- ной науки принадлежит Ли (Li, 1997), Нею и Кумару (Nei, Kumar, 2000). Другой основной задачей молекулярно-эволюционных исследований яв- ляется эволюция генома. Мы не обсуждаем этот важный аспект молеку- лярной эволюции, но рекомендуем детальное обсуждение генной дубли- кации, мультигенных семейств, эволюции через транспозицию, геномной организации и смежных проблем, представленное Ли (Li, 1975). Степень молекулярной изменчивости была впервые определена при исследовании аллоферментов у человека (Harris, 1966) и D.pseudoobscura (Lewontin, Hubby, 1966). В обоих случаях была обнаружена значительная генетическая изменчивость. В 1970-х и 1980-х годах последовали сотни работ по исследованию степени вариабельности аллоферментов у раз- ных организмов. Высокая степень обнаруженной генетической изменчи- вости не согласовывалась с классической точкой зрения на генетическую изменчивость, когда вариабельной считается лишь малая доля генов. Для объяснения значительной генетической изменчивости Кимура (Kimura, 1968) разработал теорию нейтральности. По этой теории на генетичес- кую изменчивость исходно влияют мутации, обусловливающие изменчи- вость, и генетический дрейф, элиминирующий ее, в отсутствие диффе- ренцирующего отбора. Эта элегантная теория стала краеугольным камнем для понимания эволюции, а также предложила нуль-гипотезу для изуче- ния степени и характера молекулярной генетической изменчивости. В этой главе мы рассмотрим принципы теории нейтральности, тесты отбо- ра молекулярных данных, построение филогенетических деревьев, ана- лиз отцовства, и методы идентификации личности. I. Нейтральность и прогнозы молекулярной изменчивости Обнаружение значительной степени молекулярной изменчивости в локу- сах, кодирующих белки, привело к противоположной версии, касающей- ся факторов этой изменчивости. Первоначально мнения соответствовали двум теориям: теория, которая считает большую часть вариантов след- ствием некоторой формы балансирующего отбора, и теория нейтрально- сти (neutrality), которая считает, что большая часть молекулярных вари- антов имеет равную приспособленность относительно друг друга. В последние два десятилетия стало ясным, что эмпирические данные со- гласованы с теорией нейтральности (см. обзор Кимуры (Kimura, 1983) и
Cl02 Глава 9. Молекулярная генетика популяций и эволюция Нея (Nei, 1987), что говорит о малой вероятности широкого распростра- нения балансирующего отбора. Но прежде чем мы обсудим теорию ней- тральности, вернемся к вопросу о взаимосвязи балансирующего отбора и поддержания молекулярной изменчивости. а. Балансирующий отбор Когда Левонтин и Хабби (Lewontin, Hubby, 1966) открыли значитель- ную степень внутрипопуляционной генетической изменчивости, они предположили, что эта изменчивость поддерживается балансирующим отбором, и это соответствовало мнению Добжанского (Dobzhansky, 1955). Балансирующий отбор может принимать множество разнообразных форм, и со времени открытия молекулярной изменчивости некоторые исследователи действительно считали, что все эти формы вносят вклад в селективное поддержание молекулярных вариантов. В главах 3 и 4 обсуждается ряд моделей отбора, которые могут привести к поддержа- нию генетической изменчивости и могут влиять на степень генетичес- кой изменчивости. Все они могут быть названы формами балансирую- щего отбора. Наиболее простое объяснение наличия большого количества молекулярных вариантов состоит в том, что эти варианты поддерживаются преимуществом гетерозигот в каждом из полиморф- ных локусов. Однако Левонтин и Хабби (Lewontin, Hubby, 1966) проде- монстрировали, что модель преимущества гетерозигот с мульти- пликативной приспособленностью между локусами в большинстве популяций приводит к чрезвычайно низкой приспособленности, что ука- зывает на неприемлемость такой простой модели. Для проверки этого аргумента предположим, что средняя приспособ- ленность при равновесии для z-ого диаллельного локуса с преимуществом гетерозигот равна: w, - \-sxp2 -s2q2, где s, и .5,- селективный вред (невыгодность) двух гомозигот. При неза- висимости мультипликативной шкалы с т локусами средняя приспособ- ленность по всем таким локусам равна: W = W/”, (9.1) Каждое w, меньше единицы, поэтому, если количество таких локусов велико, то произведение приспособленностей отдельных локусов быстро достигает нуля. Например, если 5, = s2 = s, приводящее к равновесию, так что ре = qe = 0,5 и w, = 1 - у 5, то выражение 9.1 имеет вид:
I. Нейтральность и прогнозы молекулярной изменчивости 403 Если таких локусов 1000 и s = 0,02, то w было бы приблизительно равно 0,00004 - действительно очень низкая величина. Если отбор дей- ствует на жизнеспособность особей, не достигших половозрелости, то эта величина приспособленности говорит, что только 1 из 25000 зигот дожила бы до взрослого возраста. После того, как Левонтин и Хабби опубликовали эти выводы, другие исследователи (King, 1967, Sved et al., 1967, Milkman, 1967) одновременно предположили, что большое значение могут иметь взаимные исключения при эпистазе и формы усеченного отбора. Другими словами, при отборе на жизнеспособность приспособленности в разных локусах могут не ком- бинировать мультипликативно (эпистаз). В таких моделях можно было бы избежать очень низкой популяционной приспособленности многочис- ленных гомозигот. Эти выводы сделаны для двухаллельных локусов, а многие локусы имеют более двух аллелей. Как мы видели на стр. 151, условия поддержа- ния в популяции более, чем двух аллелей через гетерозиготное преиму- щество требуют, чтобы величины относительных приспособленностей были достаточно хорошо сбалансированы. Действительно, Левонтин и др. (Lewontin et al., 1978) показали, что условиям поддержания всех алле- лей удовлетворяет только малая доля случайно образованных приспособ- ленностей с множественными аллелями. Например, даже при «полном гетерозисе», когда все гетерозиготы вынуждены быть более приспособ- ленными, чем все гомозиготы, при наличии пяти аллелей только 10% от множества приспособленностей приводят к поддержанию всех аллелей в популяции. Спенсер и Маркс (Spencer, Marks 1988, 1991) использовали подход, который последовательно вводит мутантные аллели в стабильное множество аллелей. Они обнаружили, что количество аллелей, которое можно было бы поддерживать, несколько больше, чем обнаружено Ле- вонтином и др. (Lewontin et al.), но что распределение этих аллелей во многих случаях не отличается от ожидаемого, согласно теории нейтраль- ности (см. стр. 432). Другое предположение, сделанное Левонтином и Хабби (Lewontin, Hubby, 1966) - аллели в каждом локусе независимы один от другого, т.е. нет гаметического неравновесия. Однако, как показали Франклин и Ле- вонтин (Franklin, Lewontin, 1970), при преимуществе сцепленных локу- сов у гетерозигот сильные ассоциации аллелей в разных локусах могут быть образованы даже без эпистаза (см. обсуждение в главе 10). Такие
Г404 Глава 9. Молекулярная генетика популяций и эволюция ассоциации могут привести к высокой частоте только двух комплемен- тарных типов гамет. В результате, если две такие мультилокусные гаметы находятся в равновесии Харди-Вайнберга, то половина популяции будет гетерозиготна по всем локусам и иметь высокую относительную приспо- собленность. Даже при разделении на несколько почти комплементарных мультилокусных гамет, такие ассоциации могли бы поддерживать высо- кую среднюю приспособленность. Для поддержания молекулярной изменчивости важны и другие типы балансирующего отбора. Например, частотно-зависимый отбор считает- ся ответственным за поддержание аллоферментных вариантов (Kojima, 1971). Привлекательность этой модели состоит в том, что все генотипы могут иметь одинаковую относительную приспособленность при равно- весии, что означает отсутствие генетического груза (см. стр. 171). Наибо- лее отстаиваемой гипотезой балансирующего отбора считается мнение Гиллеспая о том, что за поддержание аллоферментных вариантов отвеча- ет отбор, варьирующий во времени и/или пространстве (Gillespie, 1978; 1991). В этой ситуации теоретические условия для полиморфизма шире, чем для преимущества гетерозигот (см. стр. 197). При ограниченном по- токе генов или при отборе по месту обитания эти условия становятся даже менее жесткими. Однако, согласно этой и другим моделям, в кото- рых влияние отбора на локусы мало, сохранение полиморфизма стано- вится более трудным. Для изучения интенсивности отбора, поддерживающего генетическую изменчивость, особенно изменчивость аллоферментов, используется ряд различных экспериментальных подходов (обзор см. в работах Eanes, 1987; Gillespie, 1991; Lewontin, 1991; Watt, 1992; Mitton, 1998; Eanes, 1999). Мно- гообещающий подход - изучение специфических биохимических свойств аллоферментов, которые могут согласовываться с действием балансиру- ющего отбора. В этих исследованиях активность экстрактов аллофермен- тов измеряли in vitro в различных условиях окружающей среды: при раз- ных температурах, концентрациях солей, концентрациях субстрата и т.д. (Eanes, 1999). Действительно, некоторые аллоферменты различаются по ряду биохимических свойств in vitro, но селективное значение этих раз- личий в естественных популяциях часто остается неясным. Возможно, что трудно выявить селективные различия в одном локусе, и что действие отбора очевидно тогда, когда исследуется ряд локусов одновременно. Лернер (Lerner, 1954) предположил, что естественный от- бор действует в пользу особей с повышенной гетерозиготностью: чем больше гетерозиготность локусов, тем выше относительная приспособ- ленность. Такие корреляции гетерозиготность - приспособленность опи- саны во многих исследованиях (см. пример 10.7), а Дэвид (David, 1997)
I. Нейтральность и прогнозы молекулярной изменчивости недавно сделал вывод, что эти корреляции не так сильны. Для прямого изучения этой ассоциации Мукаи (Mukai, 1977) провел большой экспе- римент по измерению относительной жизнеспособности и плодовитости у самок из популяции D.melanogaster, где взрослые особи были гетерози- готными по различному количеству аллоферментных локусов. Он не об- наружил никаких значимых различий в жизнеспособности и в плодови- тости мух, гетерозиготных по различному числу таких локусов на второй хромосоме, даже при статистической силе, способной выявить различия в несколько процентов (таблица 9.1). Обнаружение существенной молекулярной изменчивости стимулиро- вало обширные исследования в области теоретического анализа баланси- рующего отбора и экспериментального изучения отбора. Стало очевид- ным, что при воздействии и сохранении молекулярной изменчивости более важны факторы, отличные от балансирующего отбора. В последующем, при развитии этой концепции мы рассмотрим основные факторы теории нейтральности - генетический дрейф и мутации, влияющие на количе- ство и характер молекулярной генетической изменчивости. Позже в этой главе мы обсудим некоторые статистические и теоретические методы ис- следования степени отбора по молекулярным вариантам. ТАБЛИЦА 9.1. Средняя жизнеспособность и средняя плодовитость особей, гетерозигот- ных по различному числу аллоферментных локусов на второй хромосоме D.melanogaster (Mukai, 1977) Количество гетерозиготных локусов Средняя жизнеспособность Средняя плодовитость 0 1,000 1,000 1 0,999 ±0,008 0,989 ±0,011 2 1,001 ±0,010 1,009 ±0,013 2 или более 1,000 ±0,009 1,009 ±0,013 3 или более 0,984 ±0,019 1,006 ±0,021 Ь. Теория нейтральности Теория нейтральности предложена Кимурой (Kimura, 1968) для объясне- ния молекулярно-генетической изменчивости и базируется на теории, которую он разработал в предшествующем десятилетии. В противопо- ложность большинству мнений, он предположил, что отбор играет вто- ростепенную роль в поддержании молекулярных вариантов, и что разные
406 Глава 9. Молекулярная генетика популяций и эволюция молекулярные генотипы имеют почти одинаковые относительные при- способленности, т.е. они нейтральны по отношению один к другому. Ко- нечно, это не означает, что разные аллельные формы не имеют функции, но чаще они функционально эквивалентны. Кимура предположил, что большинство молекулярных вариантов, которые становятся полиморф- ными, исходно подвергаются действию мутаций, образующих новый ва- риант, и генетическому дрейфу, приводящему к действительной фикса- ции этих вариантов. Величина селективной нейтральности зависит от того, какие измене- ния в аллельных частотах исходно определяются генетическим дрейфом. Если s - селективный отбор между двумя аллелями в локусе, и если 5 < 1/(2JV), то аллели нейтральны по отношению один к другому. Это определение означает, что аллельные частоты могут быть эффективно нейтральны в маленькой, а не в большой популяции. Теория нейтрально- сти не говорит, что аллельные замены, ответственные за признаки эво- люционной адаптации, нейтральны. Она предполагает, что большинство аллельных замен не имеет селективного преимущества над теми, кото- рые замещаются. Для описания этого процесса иногда используется тер- мин «недарвиновская» эволюция. Следует подчеркнуть, что многие но- вые мутации никогда не становятся полиморфизмами, потому что они быстро элиминируются из популяции в результате их вредного действия в комбинации с генетическим дрейфом. Когда мутации и генетический дрейф являются единственными фак- торами, действующими на генетическую изменчивость (нет селективных различий между генотипами), ожидаемая равновесная гетерозиготность в популяции для модели неограниченного числа аллелей будет равна: н _ 4Neu _ е е 4Neu + 1 0 + Г где в -4Neu (Kimura, Crow, 1964). Поскольку образование новых мута- ций, в общем, происходит достаточно медленно, а размеры популяций у большинства видов относительно велики, то эффект генетического дрейфа мал и для достижения равновесной гетерозиготности требуется значи- тельное время. Конечно, малые размеры популяции когда-то в прошлом снизили гетерозиготность ниже равновесия, ожидаемого из-за большой численности современной популяции. Эта теория прогнозирует, что когда 4Nu возрастает, величина гетерози- готности также возрастает (см. рисунок 8.9). Таким образом, нейтраль- ность предсказывает, что возрастание либо эффективного размера популя- ции, либо скорости мутирования приводит к возрастанию степени гетерозиготности популяции. Недавние исследования микросателлитных
I. Нейтральность и прогнозы молекулярной изменчивости 407 локусов, у которых более высокая скорость мутирования, чем у аллофер- ментных локусов, показывают, что гетерозиготность по этим локусам так- же выше, что согласуется с прогнозом теории нейтральности. Другой ре- зультат также соответствует этим прогнозам. Было обнаружено (Nei, Graur, 1984), что между гетерозиготностью аллоферментных локусов и общей оценкой размера популяции у разных видов существует положительная корреляция. Но наблюдаемый уровень гетерозиготности был меньше 0,25, что гораздо ниже, чем предсказано, так как эффективный размер популя- ции у разных видов отличается по величине и диапазону на более чем пять порядков. Более точную проверку влияния размера популяции на гетеро- зиготность дает сравнение генетической изменчивости внутри вида для аутосомных, Y-сцепленных и Х-сцепленных локусов. Если скорость мути- рования одинакова для разных локусов, то более низкий эффективный раз- мер популяции для Y-сцепленных и Х-сцепленных локусов (см. главу 6) показал бы, что Y-сцепленные и Х-сцепленные локусы имеют более низ- кую гетерозиготность, чем аутосомные локусы. Нахмен с сотрудниками (Nachman et al., 1998) суммировали доступные исследования человека и обнаружили, что после стандартизации оценки по разным типам локусов были, в целом, согласованы (таблица 9.2). Однако, обнаружилась суще- ственная вариация по семи Х-сцепленным интронам, которая коррелиро- вала с частотой рекомбинации в этом районе Х-хромосомы. В примере 9.1 исследована гетерозиготность для большого ряда Х-сцепленных и ауто- сомных микросателлитных локусов у человека и показано, что эта измен- чивость согласуется с прогнозами теории нейтральности. МОТУ КИМУРА (1924 - 1994) Моту Кимура был выдающимся преемником теоретического наследия Холдена, Фишера и Райта (Crow, 1995), автором широко известной теории нейтральности молекулярной эволю- ции. Одним из его первых достижений (Kimura, 1954) было исследование относительных эффектов генетического дрейфа и отбора - предмета жарких споров между Фишером и Райтом. Кимура долго сотрудничал с Джеймсом Кроу, кульминацией их сотрудничества явилась книга по теории популяционной генетики (Crow, Kimura, 1970). Когда Кимура пред- ложил теорию нейтральности, было много критических откликов, и он потратил много вре- мени и сил, защищая перспективы своей теории. В настоящее время эта теория принята так широко, что приоритет Кимуры в ее создании часто не отмечается. Помимо его вклада в открытие и разработку теории нейтральности, Кимура является автором многих статей в разнообразных областях теоретических проблем популяционной генетики, включая сцепле- ние, количественные методы, половое размножение и структуру популяций. Многие работы Кимуры изданы репринтно (Kimura, 1994) с комментариями Наойюки Такахата. Кимура стал, вероятно, наиболее цитируемым эволюционным биологом в Японии (Nei, 1995). Он основал Национальный институт генетики в Мишиме, ставший мировым центром теорети- ческой популяционной генетики. Ряд его коллег - Такео Маруйяма, Томоко Ота, Фумио Тайджима и Наойюки Такахата - также внесли значительный вклад в фундаментальную разработку популяционной генетики.
Глава 9. Молекулярная генетика популяций и эволюция ТАБЛИЦА 9.2. Краткое представление нуклеотидного разнообразия по девяти исследо- ваниям (из Nachman etal., 1998). Для стандартизации величин относительно аутосом оцен- ки по Y-хромосоме умножены на 4, а оценки по Х-хромосоме умножены на 4/3 Локус Хромосома Размер выборки Длина (пл.) 7Г(%) ТС ста (%) ндартизированное v ' 49 локусов Аутосомы 2 8537 0,110 0,110 Интрон Zfy Y 38 729 0,000 0,000 Район YAP Y 16 2638 0,037 0,148 Район Sry Y 5 18300 0,008 0,031 Ь-глобин 11 349 2670 0,180 0,180 Lpl 8 142 9700 0,200 0,200 Интрон Pdhal X 8 1769 0,113 0,151 Интрон Zfx X 29 1151 0,040 0,053 Интроны 7 локусов X 10 11365 0,063 0,084 Пример 9.1. Для нейтрально эволюционирующих генов ожидаемая рав- новесная величина генетической изменчивости является функцией ско- рости мутирования и эффективного размера популяции. Как мы обсуж- дали на стр. 295, эффективный ожидаемый размер популяции для Х-сцепленных генов или гена гапло-диплоидного организма равен | от соответствующей величины для эквивалентного гена в диплоидном орга- низме или в аутосомном локусе. Сравнения между диплоидными и гап- ло-диплоидными организмами могут включать межвидовые различия (Hedrick, Parker, 1997), но при сравнении между аутосомными и Х-сцеп- ленными генами в одном организме можно избежать смешения с другими неизвестными факторами. Диб и др. (Dib et al., 1996) представили гетерозиготность для 5264 микросателлитных локусов у человека, которые можно использовать как маркеры в геноме человека. На рисунке 9.1 дана гетерозиготность для 216 Х-хромосомных сайтов известной локализации (Hedrick, Parker, 1997). Очевидно, что существует некоторая кластеризация уровней гетерози- готностей по хромосоме: локусы, расположенные ближе к концам хромо- сомы, не имеют значимо более низкой гетерозиготности, как в Х-хромо- соме D.melanogaster. Это неудивительно, так как частота рекомбинаций на концах Х-хромосомы человека не снижена. Величина гетерозиготнос- ти по 22 аутосомам находится в пределах от 0,69 до 0,73, а средняя по 5048 аутосомным локусам равна 0,70 (обозначено пунктирной линией на рисунке). Средняя для 216 Х-хромосомных локусов равна 0,65, т.е. ниже, чем для любой из аутосом.
I. Нейтральность и прогнозы молекулярной изменчивости Рисунок 9.1. Гетерозиготность по 216 микросателлитным локусам на Х-хромосоме чело- века, показанная на карте Х-хромосомы (Hedrick, Parker, 1997). Горизонтальные сплошные и пунктирные линии обозначают среднюю гетерозиготность для 216 Х-сцепленных генов и 5048 аутосомных генов, соответственно. Если скорость мутирования для Х-сцепленных и аутосомных генов одинакова, то с учетом различий в эффективных размерах популяций для X- и аутосомного (А) локусов, отношение 6Х/6А приблизительно равно 0,75. Для модели неограниченного числа аллелей преобразование выра- жения 8.8b приводит к уравнению: 0 = -^. 1-^ Используя средние гетерозиготности, оценки 0 для Х-хромосомы и ауто- сом равны 1,857 и 2,333, с отношением 0,796. Для модели пошагового мутирования (stepwise-mutation) преобразование выражения 8.8с дает 1 т-1 . 0 = - В этом случае оценки 0для Х-хромосомы и аутосом равны 3,58 и 5,06 с отношением 0,708. Другими словами, отношения оценок из двух мутаци- онных моделей явно близки друг другу (в скобках указано ожидаемое
отношение с учетом эффективного размера популяции). Это подкрепля- ет гипотезу, что изменчивость микросателлитных локусов первоначаль- но поддерживается балансом мутаций и генетического дрейфа. Мутации в этих локусах можно рассматривать при смешении моделей неограни- ченного числа аллелей и пошагового мутирования. Как отмечается в главе 8, теория нейтральности позволяет сделать ряд простых предсказаний о генетической изменчивости. Например, ожидае- мая вероятность фиксации и ожидаемое время фиксации нового нейт- рального мутанта равны 1/(2JV) и 4N, соответственно (выражения 8.7а и 8.7b). Кимура (Kimura, 1968) показал также, что теория нейтральности согласуется с молекулярными часами, т.е. с постоянной скоростью заме- щений молекулярных вариантов. Для иллюстрации предположим, что генетический дрейф и мутации детерминируют изменения частот молекулярных вариантов, так что ско- рость аллельных замещений можно представить следующим образом. Пусть скорость мутирования в новый аллель будет и, так что в популя- ции размером 2N будет 2Nu новых мутантов на поколение. Так как веро- ятность фиксации нового мутанта равна 1/(22V), при равновесии аллелей, скорость аллельных замещений является произведением числа мутантов, образованных за поколение, и вероятности их фиксации, или: ( 1 k=-2Nu --- к = и. (9.2а) Другими словами скорость аллельного замещения в этой простой модели есть постоянная величина и равна скорости мутирования в локусе. Заметь- те, что скорость замещения не зависит от эффективного размера популя- ции. Эта независимость появляется потому, что в более маленькой популя- ции меньше мутантов, т.е. величина 2Nu меньше, но исходная частота мутантов выше, что увеличивает вероятность фиксации, - 1/(2Аг) -, на ту же величину, на какую снижается количество мутантов. В любой модели мутирования при скорости замещения, равной скоро- сти мутирования и (ожидаемое время между нейтральными замещения- ми) равно 1/и. (Это можно понять, подбрасывая монету для определения среднего числа подбрасываний, пока в первый раз не выпадет «орел»: в результате имеем 1, деленную на вероятность «орла», т.е. | или 2.) Дру- гими словами, время между замещениями, также как и скорость замеще- ния являются функцией только скорости мутирования и не зависят от размера популяции. Например, если скорость мутирования равна и = 10“9 на нуклеотид за поколение, то ожидаемое время между новыми замеще-
I. Нейтральность и прогнозы молекулярной изменчивости 41 I ниями равно 109 поколений. Используя эту нейтральную скорость заме- щений, можно также прогнозировать степень дивергенции между двумя нуклеотидными последовательностями через t поколений. Ожидаемое количество различий в одном из сайтов этой последовательности соста- вит: K=2ut, (9.2b) где коэффициент 2 необходим, поскольку замещение сайтов может про- изойти в последовательностях у особей из обеих сравниваемых родос- ловных (для удобства далее время часто будет измеряться в годах, а не в поколениях). Вероятность фиксации нового мутантного аллеля, имеющего селек- тивное преимущество, приблизительно равна 2s (выражение 8.9а). Ана- логично, скорость аллельных замещений составит: k = 2Nu(2s) = = 4Nus. (9.2с) Очевидно, что если 4№ »1, то скорость замещений мутантов, имеющих селективное преимущество, будет значительно выше, чем скорость заме- щения нейтральных мутантов. С другой стороны, почти нейтральная модель Оты (Ohta, 1973), в которой происходит отбор против умеренно вредных аллелей, предсказывает, что скорость замещений понижается с увеличением размера популяции. Эта зависимость появляется, потому что умеренно вредные варианты могут быть эффективно нейтральными в меньшей по размеру популяции, т.е. .v < 1/(27V), тогда как в большой по размеру популяции против них действует отбор. Действительно, эффек- тивность отбора по измененным кодонам, по-видимому, зависит частич- но от размера популяции (Akashi, 1995; 1999), что согласуется с моделью Оты. Одним из поводов для создания этой модели стала необходимость расчета результатов наблюдения, что скорости аминокислотных замен в течение непродолжительного времени более постоянны, чем на протяже- нии поколения. с. Молекулярные часы В конце 1960-х годов накопились данные об аминокислотных последо- вательностях белков, которые свидетельствовали, что мутации в эво- люции этих последовательностей происходят с постоянной скоростью (King, Jukes, 1969). Если такое регулярное замещение нуклеотидов су- ществует, то различия в аминокислотной или нуклеотидной последова- тельностях могут служить в качестве молекулярных часов, показывая момент времени, когда два вида дивергировали от общего предка. Ки- мура (Kimura, 1968) считал, что идея молекулярных часов согласуется с
412 Глава 9. Молекулярная генетика популяций и эволюция гипотезой нейтральности молекулярных вариантов относительно друг друга (см. выше). Другими словами, если замена молекулярных вариан- тов во времени является функцией генетического дрейфа и мутаций, то она приведет к относительно регулярным оборотам (заменам) молеку- лярных вариантов во времени. До разработки современной методики секвенирования ДНК для опре- деления скорости замещений нуклеотидов и сравнения последователь- ностей ДНК разных организмов использовали молекулярные данные по аминокислотным последовательностям белков. Поскольку сейчас значи- тельно легче секвенировать ДНК, чем определить аминокислотную пос- ледовательность, последние обычно узнают исходя из нуклеотидных пос- ледовательностей. Рассмотрим более простой подход, используемый для определения скорости замещения в белках, и затем обсудим оценку ско- рости замещения для последовательностей ДНК. Предположим, что у двух видов известно число различий в гомоло- гичной аминокислотной последовательности определенного белка. Пусть N - число аминокислот, которые можно сравнивать у этих видов и кото- рое исключает любые инсерции или делеции (мы касаемся только амино- кислотных замен), и пусть daa - пропорция различающихся сайтов между двумя последовательностями. Когда аминокислоты в определенной пози- ции различны, это показывает, что в течение эволюции вида, произош- ла, по крайней мере, одна аминокислотная замена. Мы можем оценить Каа - среднее число аминокислотных замен на сайт при условии незави- симости этих замен в разных сайтах. Из распределения Пуассона следует, что вероятность отсутствия замены в любом сайте равна: Рг(0 замещений) = е~к“, а вероятность одной или более замен равна: Рг(> Замещения) = 1 - е~к““. Если доля сайтов, в которых последовательности различны, равна: d = 1 - е~Ка°, аа 7 то оценка числа аминокислотных замен на сайт составит: ^ = -Ь(1-<а) (9.3а) (Zuckerlandl, Pauling, 1965) с вариансой ^"> = 0^ (’-ЗЬ) (Kimura, 1969). Стандартная ошибка здесь равна корню квадратному ва- риансы. Заметьте, что пропорция различающихся сайтов, daa, всегда мень-
I. Нейтральность и прогнозы молекулярной изменчивости 413 ше, чем Каа, так как Каа скорректирована для множественных изменений в сайте. Скорость замен в аминокислотном сайте за год равна: (9.3с) где Т - число лет со времени дивергенции (расхождения) двух видов от их общего предка. В примере 9.2 рассчитана скорость аминокислотных замен в последовательностях молекул гемоглобина, и представлены не- которые более ранние данные, иллюстрирующие молекулярные часы. Пример 9.2. Аминокислотные последовательности в молекулах белков ряда организмов сравнивали вскоре после появления концепции молеку- лярных часов. Были секвенированы последовательности а-цспей моле- кул гемоглобина. У человека и карпа эти последовательности различа- лись по 68 из 140 сайтов, d = 68/140 = 0,486. Таким образом, К = 0,665 ± ± 0,082, и поскольку время дивергенции человека и карпа около 450 мил- лионов лет (Kumar, Hedges, 1998), kaa = 7,4 х 10 lf. Рисунок 9.2. Количество аминокислотных замен для трех белков, имеющих разные скоро- сти замещений. На горизонтальной оси отмечено время от момента дивергенции между различными организмами в миллионах лет (по Dickerson, 1971).
414 Глава 9. Молекулярная генетика популяций и эволюция Дикерсон (Dickerson, 1971) сравнил аминокислотные последователь- ности в молекулах фибринопептидов, гемоглобина и цитохрома с у орга- низмов, которые дивергировали в разное время (рисунок 9.2). Для моле- кул одинаковых организмов скорость аминокислотных замен (калибровка молекулярных часов) высока для фибринопептидов, средняя - для гемог- лобина и низкая - для цитохрома с. Кимура (Kimura, 1979) оценил скоро- сти аминокислотных замен, каа, как равные 9,0x10 9, 1,4x10 9 и 0,3x10 9 для фибринопептидов, гемоглобина и цитохрома с, соответственно. Хотя для каждого типа молекул скорости сильно различаются, по-видимому, существует одинаковая исходная скорость аминокислотных замен. Дикер- сон (Dickerson, 1971) считает, что различия между молекулами обуслов- лены различной ролью трехмерной структуры этих молекул. Например, гистон IV, у которого очень низкая величина каа = 0,006x10 9, тесно кон- тактирует с молекулой ДНК, так что почти вся аминокислотная по-сле- довательность является критической для функционирования его мо- лекулы в трехмерной структуре. С другой стороны, для связывания фибринопептида важна лишь малая часть молекулы. Для оценки среднего числа замещений на сайт был предложен ряд мето- дов (см. Nei, Kimura, 2000). Дейхофф и сотрудники (Dayhoff et al., 1978) срав- нили молекулы нескольких белков и определили вероятность замены амино- кислоты на любую другую из 19-ти. Затем они построили матрицу 20x20, которая дает вероятности всех возможных переходов, и которую можно ис- пользовать для прогноза изменений аминокислотных последовательностей (Nei, Kumar, 2000). Эти вероятности указывают, что замены между амино- кислотами, сходными по биохимическим свойствам, гораздо более вероят- ны, чем замены между сильно различающимися аминокислотами. Большая часть данных получена на сегодняшний день по нуклеотид- ным последовательностям, однако необходимо знать и меру скорости заме- щения нуклеотидов в молекулах ДНК. Поскольку нуклеотидов только че- тыре, важно учитывать обратные мутации, такие как А —э Т —э А. Наиболее простой способ определения среднего числа нуклеотидных замещений на сайт состоит в предположении, что замещения четырех типов нуклеоти- дов происходят случайно со скоростью, равной а между любой парой нук- леотидов (Jukes, Cantor, 1969). Таким образом, вероятность сохранения в ДНК конкретного нуклеотида до момента времени t равна: Рг = 1 - За, потому что существуют три типа замен, которые образуют различные нуклеотиды (За - общая скорость мутирования). Вероятность сохране- ния этого нуклеотида до момента времени t + 1 равна:
I. Нейтральность и прогнозы молекулярной изменчивости 415 Рг +1 = (1 - За) Рг + а (1 - Рг). Первый член этого уравнения - это вероятность, что нуклеотид останется неизменным с момента времени t до момента времени t + 1, а второй член - допущение для вероятности обратной мутации. В этом случае, в момент времени t нуклеотид будет отличаться от исходного (1 - Рг), но с вероят- ностью а он может измениться в результате обратной мутации, вернув- шись к исходному типу нуклеотидов. Это выражение может быть записа- но следующим образом: Рг + j - Рг = - 4а Рг + а. Для удобства, предположим, что время непрерывно, так что следую- щее дифференциальное уравнение приблизительно равно уравнению раз- ницы дискретного времени, записанному выше: d Рг . _ -----= -4а Рг,+а dt---‘ ' Это выражение может представить в виде: Pr(=Hi^w. Вероятность, что две последовательности, разошедшиеся (дивергировав- шие) в момент времени /, сохраняют одинаковый нуклеотид, равна: Ргг=| + {е-8,и, потому что общее время в родословной, в течение которого замены мог- ли бы произойти, равно 2/. Если вероятность, что нуклеотидные сайты различны, равна d = 1 - Рг, то: и, логарифмируя обе части, получим: . Л 4d А 8а/ = - In 1---- I з )- Ожидаемое число замещений на сайт в родословной равно За/ (За - скорость мутирования), и поскольку сравниваются две родословных, то К = 6а/. Тогда оценка числа замен равна: ? Т (9.4а) (Jukes, Cantor, 1969), где d - это пропорция различающихся нуклеотид- ных сайтов. Варианса этой оценки приблизительно равна:
Глава 9. Молекулярная генетика популяций и эволюция d(l-d} ~ А(1-4<7/3)2 (9’4Ь) (Kimura, Ohta, 1972). Тогда оценка скорости замен на нуклеотид за год равна: , к к = ^, (9.4с) где Г - то же, что и ранее. Предположение о равновероятности всех типов нуклеотидных замен, вытекающее из экспериментальных данных, как известно, не верно. Дело в том, что существует два типа замен нуклеотидов: транзиции, при кото- рых пиримидин замещает пиримидин (С Т) или пурин замещает пу- рин (А <-> G), и трансверсии, при которых пурин замещает пиримидин или наоборот. Частота транзиций обычно выше, чем частота трансвер- сий - иногда она на порядок выше по величине в мтДНК. Для согласова- ния разных частот мутирования при транзициях и трансверсиях Кимура (Kimura, 1980) предложил модель с двумя параметрами, при которой час- тота транзиционной мутации равна а, а частота трансверсионной мута- ции равна Р (рисунок 9.3). Во избежание оценки двух параметров Фель- зенштайн (Felsenstein,1995) предположил, что отношение транзиция/ транверсия, а/Д, известно из других данных. Был предложен ряд более искусных способов, включающих использование оценок частот всех за- мещений в нуклеотидной матрице 4x4. Однако, когда ожидаемое число замен на сайт меньше 0,5, все эти способы дают одинаковые оценки за- мен (Nei, Kimura, 2000). Пример 9.3 дает частоты замен для глобиновых генов у кролика и мыши. Пурины Рисунок 9.3. Частоты нуклеотидных замен для транзиций (а) и трансверсий (Р) согласно модели двух параметров Кимуры (Kimura, 1980).
I. Нейтральность и прогнозы молекулярной изменчивости Пример 9.3. Имеется большое количество данных о последовательности ДНК, но для иллюстрации расчета числа нуклеотидных замен использу- ется лишь небольшая их часть. Ней (Nei, 1987) суммировал исследован- ные ряды различных пар нуклеотидов для 139 гомологичных кодонов ге- нов а-глобина у кролика и /3 "^-глобина у мыши (таблица 9.3). Пары нуклеотидных сайтов для двух последовательностей были разделены на категории: идентичные (одинаковые нуклеотиды в обеих последователь- ностях), транзиционные (последовательности, имеющие разные пурины или пиримидины) или трансверсионные (когда в одной последователь- ности - пурин, а в другой - пиримидин), их также идентифицировали по первой, второй и третьей позиции в кодонах. Для первой позиции в кодо- не число нуклеотидных различий равно 60, т.е. пропорция различающих- ся сайтов равна d = 60/139 = 0,432. Из выражения 9.4а, оценка числа нуклеотидных замен составит: К - 0,64 ± 0,10. Оценочное число замен ниже для второй позиции: К = 0,42 ± 0,07, и выше для третьей позиции: К = 0,88 ± 0,14. С помощью метода двух параметров Кимуры Ней вычис- лил также оценки, при которых транзиции и трансверсии поддержива- лись как отдельные категории. Оценки для первой и второй позиции кодона были идентичны, но для третьей позиции оценка была выше при К = 0,92 ±0,16. Когда число замен больше, чем 0,5, метод Жаке-Кантора (Jukes-Cantor) недооценивает число замен, а способ двух параметров Ки- муры дает лучшую оценку (см. обсуждение в работе Nei, Kumar, 2000). ТАБЛИЦА 9.3. Сравнение десяти возможных сочетаний пар нуклеотидов между после- довательностями ДНК а - глобиновых генов кролика и /3 - глобиновых генов мыши, разделенных по позициям в кодоне (по Nei, 1987) Тип пары Всего Позиция АА Идентичные Транзиции Трансверсии ТТ СС GG AG ТС АТ АС TG CG Первая 18 8 19 34 15 9 8 10 8 10 139 Вторая 32 35 20 7 11 5 4 11 2 12 139 Третья 1 4 35 27 5 30 2 3 12 20 139 Молекулярные часы - важное понятие, которое помогает обнаружить взаимосвязи между видами. Как мы отмечали в примере 9.2, молекуляр- ные часы идут с различной скоростью для разных генов, очевидно, из-за разного давления отбора для разных молекул. В результате, гены, имею- щие быстро идущие часы, используются при сравнении близко родствен-
Глава 9. Молекулярная генетика популяций и эволюция ных таксонов, тогда как гены с медленными часами можно использовать для отдаленно родственных организмов. К тому же, у разных организмов может быть разная скорость нейтрального мутирования, которая в свою очередь может привести к разной частоте замен. Частота нуклеотидных замен у некоторых вирусов, например, может на шесть порядков превы- шать частоту замен у эукариот. Было обнаружено (Buonagurio et al., 1986) что в течение 50 лет в генах NS вируса гриппа наблюдается постоянная частота замен, равная 1,9x103 нуклеотидов в год. Иокояма с сотрудника- ми (Yokoyama et al., 1988) исследовали замены в генеpol вируса иммуно- дефицита человека (HIV) и оценили частоту замещений как 0,5х10~3 нук- леотидов в год. Они использовали эти данные для гипотезы о появлении этого вируса у человека лишь несколько десятилетий назад. Если часы действуют случайно, то их следует описывать с помощью уравнений Пуассона, при которых среднее количество замен и варианса их количества должны быть равны. Однако, вскоре после разработки тео- рии нейтральности Ота и Кимура (Ohta, Kimura, 1971а) оценили, что для трех белков варианса была, в среднем 1,75, от ее среднего значения. Гил- леспай (Gillespie, 1989) обнаружил, что для некоторых молекул отноше- ние вариансы к среднему может быть очень велико и, при более консер- вативном взвешивании, оценил отношение для 20 белков как 6,95 и 4,54 -для трансверсий и транзиций, соответственно. Гиллеспай (Gillespie, 1991) предположил, что эта сверхдисперсия в молекулярных часах является ре- зультатом варьирования периодов отсутствия изменений и периодов бы- стрых замен. Такахата и Ота (Takahata, 1991; Ohta, 1995) предложили альтернативные объяснения. Как ни странно, молекулярные часы сохраняют время на основе лет вместо поколений, хотя частота мутаций у многих эукариот, по-видимо- му, более тесно связана с поколениями (Drake et al., 1998). По этой при- чине молекулярная эволюция будет продолжаться более медленно в ро- дословных с долгоживущими поколениями. Для оценки общей частоты замен в разных родословных разработан тест относительной частоты, который не зависит от времени дивергенции (Sarich, Wilson, 1973, см. также другой метод оценки в работе Tajima, 1993). Например, для опре- деления частоты замен в родословных видов 1 и 2 необходимо иметь ме- нее родственный вид 3, как внегрупповой контроль (рисунок 9.4). На этом рисунке узел А обозначает точку, где виды 1 и 2 дивергировали, а количество замен между любыми двумя видами предполагается равным сумме количества замен вдоль соединяющих их ветвей на дереве, или: ^13 — А\ АЗ ’ ^23 ~ А2 + АЗ ’
I. Нейтральность и прогнозы молекулярной изменчивости ^12 d Ai + d А2. Эти выражения можно решить для получения оценок: , _ dn + dl} — d23 Al 2 , _ dn + d23 — d13 A2 2 , _ dl3 + d23 — dl2 u ЛЗ ~ Рисунок 9.4. Филогенетическое дерево для иллюстрации теста относительной частоты, в котором исследуется скорость эволюции в родословной видов от узла А (дивергенция пред- кового вида; к виду 1 и от узла А до вида 2. Вид 3 - внегрупповой вид. ТАБЛИЦА 9.4. Оценочное число нуклеотидных замен г^на 100 сайтов между обезьянами Старого Света (вид 1), человеком (вид 2) и не относящимися к этой группе обезьянами Нового Света (3). При 1%-ном уровне значимости частоты в родословных человека, <7,,, значительно ниже, чем частоты для родословных обезьян Старого Света, dtJ, и для всех трех групп данных (по Li, 1997) Сравниваемые нуклеотиды dn di3 “^23 dn~d23 Псевдогены 8871 6,7 11,8 10,7 Интроны 8478 7,1 14,7 13,9 0,8** Фланкирующие 936 7,9 14,9 П,7 3,2** последовательности
Г420 Глава 9. Молекулярная генетика популяций и эволюция Время, прошедшее с момента, когда виды 1 и 2 имели общего предка, по определению, одинаково, поэтому мы можем сравнить частоты замен в этих двух родословных, сравнивая dAI ndA, Если частоты одинаковы, тогда dAt ndA2 должны быть одинаковы; т.е. dAi -dA2 = 0. При вычитании выражения для d2J из выражения для d., получим: " ^13 “ ^23- (9.5) Поэтому можно сравнить частоты замен для видов 1 и 2, сравнивая оцен- ки между этими видами и видом 3. Существовал спор, происходило ли замедление молекулярных замен в родословной гоминид (люди и человекообразные обезьяны), со времени их отделения от обезьян Старого Света (см. дискуссию в работе Easteal et al., 1995). Для исследования этого вопроса Ли (Li, 1997) суммировал число нук- леотидных замен в трех типах некодирующих последовательностей ДНК у обезьян Старого Света, человека и не связанных с ними обезьян Нового Света и провел тест относительной частоты (таблица 9.4) для всех трех типов последовательностей. Оценочная частота в линиях происхождения человека была значительно ниже, чем в линии происхождения обезьян Ста- рого Света. Иногда эти различия относят к более долгоживущим поколени- ям в родословной человека, чем обезьян Старого Света. d. Коалесценция и генные деревья При определении изменчивости последовательностей ДНК в популяции исследуют выборку аллелей. Каждый из этих аллелей может иметь раз- личную историю: происходить от одинакового предкового аллеля преды- дущего поколения или от одинакового аллеля в поколении, жившем мно- го лет назад. Точка, в которой находится общий предок этих двух аллелей, называется точкой коалесценции (объединения). Если вернуться ко вре- мени основания популяции, то все аллели в выборке соединятся в един- ственный общий предковый аллель (см. обзор Fu, Li, 1999). Для иллюстрации процесса коалесценции на рисунке 9.5 показан гипо- тетический пример происхождения пяти выбранных аллелей. В популяци- онной генетике в большинстве случаев прогнозируются генетические из- менения в будущих поколениях. Следуя вниз по рисунку 9.5, (вперед во времени), можно наблюдать эффект генетического дрейфа: некоторые ал- лели теряются (средние аллели в первом поколении), а некоторые аллели возрастают по частоте (аллель справа). После пяти поколений остается только правый аллель, а другие четыре исходных аллеля утрачиваются. Теория коалесценции предпочтительнее прослеживания всех индиви- дов в популяции каждого поколения. Но при этом нужно исследовать те аллели, которые являются исходными для выбранных в настоящем поко-
I. Нейтральность и прогнозы молекулярной изменчивости лении аллелей. Следуя вверх по рисунку 9.5 (обратно во времени), мож- но видеть, что пять аллелей, выбранных в поколении 5, происходят от четырех аллелей в поколении 4, т.е. наблюдается коалесценция, так как два аллеля в поколении 5 происходят от одного и того же предкового аллеля в поколении 4. Если продолжить подниматься по рисунку, то чис- ло предковых аллелей либо уменьшится из-за дополнительных случаев коалесценции, либо останется таким же в каждом поколении, пока в по- колении 0 не останется только один предковый аллель. В этом гипотети- ческом примере предполагается, что на аллели действует только генети- ческий дрейф. Мы не учитываем никакие мутации, поэтому все исходные аллели в выборке действительно идентичны. Если происходит мутация, то наблюдаемые аллели, имеющие общего предка, могут различаться по последовательностям. Поколение О 1 2 3 4 Аллель 5 (настоящее) Рисунок 9.5. Гипотетический пример, иллюстрирующий происхождение пяти аллелей, выбран- ных в настоящем поколении. Следуя по рисунку сверху вниз (от прошлого к настоящему) можно видеть эффекты генетического дрейфа, приводящего к фиксации единственного аллеля в поко- лении 5. Если следовать снизу вверх (от настоящего к прошлому), то наблюдается коалесцен- ция пяти выбранных аллелей в предковом аллеле (справа в поколении 0). Здесь п - число пред- ковых аллелей, от которых происходят пять аллелей в настоящем поколении. При включении данных о последовательности ДНК в генные дере- вья, которые показывают эволюционные взаимосвязи между последова- тельностями, можно найти для них общую предковую последовательность. Различные последовательности как бы сходятся в этой предковой последо- вательности. Перед тем, как мы познакомимся с теорией, лежащей в осно- ве процесса коалесценции, изучим гипотетическое генное дерево, которое иллюстрирует эту теорию графически. Рисунок 9.6 представляет собой
422 Глава 9. Молекулярная генетика популяций и эволюция генное дерево, в котором имеется пять выбранных аллелей, существую- щих в настоящем поколении (основание дерева), (по Hudson, 1990). По мере движения к предкам число предковых аллелей, представленных в настоя- щем поколении, уменьшается. Мы не учитываем мутирование, поэтому предковые аллели означают идентичность по происхождению (как обсуж- далось в главе 5). Первая коалесценция в этом примере происходит для аллелей 2 и 3. После четырех случаев коалесценции все аллели в настоя- щем поколении происходят от одного предкового аллеля. Не противоречит ли это результатам анализа родословных, где число предков для данного индивида возрастает по мере того, как мы идем обратно во времени, и для t поколений, существует 2' предков? При коалесценции прослеживаются толь- ко отдельные аллели, которые передаются между поколениями, а потом- кам каждое поколение передается только один из двух аллелей родителя. Рисунок 9.6. Пример генного дерева для пяти выборочных аллелей. Большие кружки обо- значают случаи коалесценции (по Hudson, 1990). Г - время, при котором существует i алле- лей, интервалы между кружками пропорциональны ожидаемому времени коалесценции, как дано в выражении 9.6с. Теперь познакомимся с основами теории коалесценции (Tajima, 1983; Hudson, 1990). Вероятность, что два аллеля происходят от одного и того же предкового аллеля в предыдущем поколении, равна 1/(2Л'), а вероятность, что они произошли от разных, предковых аллелей в предыдущем поколе- нии, будет равна 1 - 1/(2Л'). Вероятность, что три аллеля произошли от
I. Нейтральность и прогнозы молекулярной изменчивости 423 трех предковых аллелей в предыдущем поколении - это вероятность, что первые два аллеля имеют разное происхождение, т.е. 1 - 1/(22V), умножен- ная на вероятность, что третий аллель имеет происхождение, отличное от двух первых, т.е. (2N - 2)/2.У = 1 - 2/(2N). Тогда вероятность, что п выбо- рочных аллелей имеют п отдельных предковых аллелей в предыдущем по- колении равна: = (9.6а) Эта вероятность относится к каждой паре последовательных поколений, поэтому вероятность, что п выборочных аллелей имели п отдельных пред- ков t поколений назад равна [Рг(и)]1. Представим, что два аллеля имеют одинаковый предковый аллель, т.е. они сходятся t +1 поколений назад. Вероятность, что два аллеля сходятся в любом поколении, равна 1/(22V). Предположив, что эти аллели не со- шлись в течение предшествующих t поколений, получим вероятность ко- алесценции: , ( 1 \ 1 Pr(2)'[l-Pr(2)]= 1-----— 2W J 2W Распространяя это на п выборочных аллелей, имеющих п - 1 предковых аллелей t +1 поколений назад, имеем: Рг(л)'[1-Рг(л)] = [гИ1—-11 — у 2W JJ 2/V (9.6b) Из этого распределения видно, что ожидаемое время, в течение кото- рого имеется п отдельных линий происхождения аллеля (если время из- мерено в 2N поколениях и единственным фактором, влияющим на ал- лели, является генетический дрейф), равно: Ж) = _4N_ п(п — 1)' (9.6с) На рисунке 9.6 показано, что ожидаемое время, в течение которого име- ются пять, четыре, три и две линии происхождения аллеля, равно 2N/\ О, 2N/6,2N/3 и 2N, соответственно. Другими словами, при уменьшении числа линий происхождения аллеля ожидаемое время возрастает. Ожидаемое время для коалесценции всех п выборочных аллелей равно: е(0 = £Ж) = 441-Л. ,=2 I « J
(I24 Глава 9. Молекулярная генетика популяций и эволюция Например, ожидаемое время коалесценции пяти аллелей равно 3,2N по- колений. Считается, что последовательности дивергируют вследствие мутиро- вания, т.е. вниз по генному дереву во времени, происходит накопление последовательностями различий, полученных при мутировании. Пред- полагают, что мутации происходят независимо у разных индивидов и в разных поколениях. Поэтому мутации накапливаются со временем вдоль линий происхождения, и последовательности дивергируют друг от дру- га. Таким образом, чем больше различий между последовательностями, тем дольше ожидаемое время возврата их к общему предку. Предполо- жим, что Т - это сумма длин ветвей генного дерева, т.е. общее время, в течение которого могла бы появиться мутация. Тогда 1=2 Если скорость мутирования в одном поколении равна и и в = 4Nu, то общее ожидаемое количество мутаций, которое равно ожидаемому числу полиморфных сайтов, равно: E(S) = 2NuT = п-1 | = (9.6d) Например, если п = 5, то Т = 25/V /3 поколений. Если мы измеряем время в единицах в течение 2N поколений, то E(S) = в (25/12). Для иллюстрации рассмотрим модель мутирования (см. Hudson, 1990). Допустим, что имеется дерево, представленное на рисунке 9.7. Две мута- ции, обозначенные на рисунке, возникли случайным образом. Предполо- жим, что предковый аллель - это А , а мутация на левой ветви дерева привела к новому аллелю А2 (для выборочного аллеля 1). Выборочные аллели 2 и 3 в линиях происхождения не мутировали, поэтому они оста- лись аллелями Ау а выборочные аллели 4 и 5 мутировали в аллель Ау Тогда для пяти выборочных аллелей, частоты аллелей Ау А2 и А, равны 0,4, 0,2 и 0,4, соответственно. В этом случае можно получить выборку аллелей, которая отражает равновесное нейтральное распределение, т.е. выборка определяется только генетическим дрейфом и мутациями. Этот метод анализа коалесценции был разработан с учетом рекомбинаций, по- тока генов и отбора (Kaplan et al., 1991) и применяется для оценки попу- ляционных параметров (Fu, Li, 1993).
II. Доказательства отбора и проверка теории Выборочные аллели 1 Аллель Aj А, А, A3 A3 Рисунок 9.7. Одно генное дерево для пяти выборочных аллелей, показанных на рисунке 9.6. Поперечные штрихи обозначают мутации. Предковый (исходный) аллель обозначен как а произошедшие после первой и второй мутаций аллели - А2 и Аг Выборка пяти аллелей содержит два аллеля At, один аллель А2 и два аллеля Ау II. Доказательства отбора и проверка теории нейтральности Для проверки теории нейтральности Ней и его сотрудники провели интен- сивный анализ данных по изменчивости аллоферментных локусов (Nei, 1987). Они обнаружили, что «теория нейтральности может объяснить общие особенности полиморфизма белков, особенно, если принимаются в расчет эффект «бутылочного горлышка» и отбор против умеренно вред- ных признаков». Результаты сравнения различных типов локусов (на- пример аллоферментных и ПДРФ-маркеров) в популяциях (Pogson, Zouros, 1994) или между популяциями (Karl, Avise, 1992) отчасти подтверждают роль балансирующего отбора в изменчивости аллоферментов. Однако в последние годы большее внимание концентрировалось на выявлении и определении интенсивности отбора молекулярных вариантов. Анализ изменчивости последовательностей позволил определять очень низкие уровни отбора, или «слабый отбор» в популяции (Wayne, Simonsen, 1998).
Cl26 Глава 9. Молекулярная генетика популяций и эволюция Действительно, кумулятивный эффект отбора во многих поколениях, про- сматриваемый в последовательностях, помогает документировать селек- тивные эффекты, величина которых обратно пропорциональна эффек- тивному размеру популяции (Akashi, 1999). а. Использование кодонов Считается (King, Jukes, 1969) что синонимичные мутации могут быть ней- тральными по отношению к отбору, поскольку они не приводят к значи- тельным изменениям кода и к соответствующим аминокислотным заме- нам. При случайных мутациях и нейтральности синонимичных замен, все кодоны для одной и той же аминокислоты должны быть представле- ны в равных пропорциях. Однако, существуют обширные свидетельства неравного использования кодонов для одной и той же аминокислоты. Например, на рисунке 9.8а дана частота использования кодона для раз- личных кодонов лейцина в активно экспрессирующемся гене у Е. coli и у дрожжей, Saccharomyces cerevisiae (две пары кодонов у каждого вида уз- наются одной и той же транспортной РНК). Очевидно, у каждого из этих видов предпочтение отдается одному из кодонов: CUG у Е. coli и UUG - у дрожжей. Икемура (Ikemura, 1982) показал, что использование опреде- ленного кодона положительно коррелирует с относительным числом под- ходящих видов тРНК. В качестве иллюстрации на рисунке 9.8b показана относительная многочисленность четырех видов тРНК для кодонов лей- цина. Наиболее многочисленны тРНК для кодона CUG у Е. coli и тРНК для кодона UUG у дрожжей. Отклонение в частоте использования кодона можно измерить как наблюдаемую частоту кодона относительно ожидае- мой, согласно предположению о равном использовании кодонов (Sharp et al., 1986). Тогда лейциновый кодон у Е. coli CUG используется с часто- той, равной 5,54, а кодон CUA - только с частотой 0,04 (Sharp et al., 1988). Для генов, экспрессия которых не так высока, разные кодоны ис- пользуются в более равных соотношениях. Одно из измерений величины отклонения частоты кодонов в общей последовательности - эффективное число кодонов (Wright, 1990). Это число колеблется от 20 (когда каждую аминокислоту кодирует только один кодон) до 61 (когда для каждой аминокислоты используется равное число кодонов). На рисунке 9.9 показано распределение этих чисел в большом ряду генов D.melanogaster и E.coli (Powell, Moriyama, 1997). У обоих ви- дов имеется значительное отклонение частоты использования кодонов, со средней величиной 46,2 для D.melanogaster и 45,0 - для E.coli, и ши- роким распределением по генам. Хотя для появления отклонений в ис- пользовании кодонов достаточно действия отбора, так как он более ва-
10 Г => 1.о ф CUG CUA CUC UUG CUA CUC UUG UUA + + + + CUU UUA CUG CUU 20 25 30 35 40 45 50 55 60 Рисунок 9.8. Частота использования кодонов для аминокислоты лейцина у высоко экс- прессирующихся генов (а) и частоты различных лейциновых тРНК (Ь) у E.coli (слева) и дрожжей (справа) (по Li, Graur, 1991). 20 25 30 35 40 45 50 55 60 Эффективное число кодонов Рисунок 9.9. Распределение смещения в использовании кодонов, измеренное эффектив- ным числом кодонов для 1133 генов D.melanogaster (а) и 1586 генов E.coli (b) (по Powell, Moriyama, 1997).
428 Глава 9. Молекулярная генетика популяций и эволюция жен, чем генетический дрейф, необходимо, чтобы величина 5 несколько превышала величину MN. Когда эффективный размер популяции велик, например 104 или больше, то величина .v может быть достаточно мала. Хартл с сотрудниками (Hartl et al., 1994) оценили частоту использования кодонов для гена gnd у E.coli и определили значение s = 7 х 10 9. Ь. Синонимичные и несинонимичные нуклеотидные замены Как мы видели, ожидаемая скорость замен для нейтральных нуклеотид- ных сайтов равна скорости мутирования. Синонимичные замены (тран- зиции) в сайтах, локализованных в некодирующих регионах (в интронах или в третьей позиции кодирующих триплетов) обычно нейтральны или подвержены слабому отбору. При действии очищающего отбора вредные мутанты элиминируются и скорость замен в мутантных сайтах становит- ся ниже, чем в нейтральных. С другой стороны, если существует отбор новых мутантов, то скорость замен мутантных сайтов может быть выше, чем нейтральных (положительный дарвиновский отбор). Количествен- ное измерение относительных скоростей синонимичных и несинонимич- ных замен на сайт говорит о значении нейтральности и различных типов отбора в эволюции популяции. Для расчета скоростей синонимичных (ds) и несинонимичных (dN) за- мен воспользуемся методом Нея (Nei, Gojobori, 1986), (для этих оценок Ли и др. (Li et al., 1985) используют символы Ks и KN; для сравнения разных методов см. работу Nei, Kumar, 2000). Пусть f. - доля синонимич- ных замен от всех изменений в сайте, исключая нонсенс-мутации, где индекс i обозначает позицию нуклеотида в кодоне. Число потенциально синонимичных (5) и несинонимичных (п) замен на кодон составит: 3 s - и п = 3 -s. (=1 Для определения числа замен полезно иметь копию расшифровки гене- тического кода (см. таблицу 1.1) и версию генетического кода, которая вклю- чает Т вместо U. Например, для кодона лейцина ТТА, s = 0,333 + 0 + 0,333 = = 0,667, потому что все нуклеотидные замены во второй позиции приво- дят к несинонимичным заменам, и одна из трех замен сразу в первой и третьей позициях приводит к синонимичной замене. Когда нуклеотидная замена приводит к стоп-кодону, эта замена не учитывается. Рассмотрим кодон аргинина CGA, который четырехкратно вырожден по третьей пози- ции. Для первой позиции изменение С —> А синонимично, С —> G - неси- нонимично и С —> Т приводит к стоп-кодону. Тогда s = 0,5 + 0 + 1,0 = 1,5.
II. Доказательства отбора и проверка теории нейтральности Таблица 9.5 дает число потенциально синонимичных сайтов для 61 раз- ных аминокислотных кодонов (3 стоп-кодона при этом не учитываются). Общее потенциальное количество синонимичных (5) и несинонимич- ных (N) замен можно определить по формуле: с s = Ysj и N=3C-S, 7=1 (9.7а) где s - количество потенциально синонимичных сайтов для /-того кодона и С - количество кодонов. Таким образом, величины S и N используются для двух сравниваемых последовательностей. ТАБЛИЦА 9.5. Количество потенциально синонимичных сайтов (.?) в генетическом коде Вторая позиция Т C A G ТТТ (0,333) TCT(l,0) TAT (1,0) TGT(0,5) ТТС (0,333) TCC(l,0) TAC(l,0) TGC (0,5) Т ТТА (0,667) TCA(l,0) TAA (Стоп) TGA(Cron) TTG (0,667) TCG(l,0) TAG (Стоп) TGG(0,0) СТТ(1,0) CCT(l,0) CAT (0,333) CGT(l,0) СТС (1,0) CCC(l,0) CAC (0,333) CGC(l,0) с СТА (1,333) CCA (1,0) CAA (0,333) CGA(1,5) Первая CTG (1,333) CCG(l,0) CAG (0,333) CGG (1,333) позиция АТТ (0,667) ACT (1,0) AAT (0,333) AGT (0,333) ATG (0,667) ACC (1,0) AAC (0,333) AGC (0,333) А АТА (0,667) АСА (1,0) AAA (0,333) AGA (0,833) ATG(0,0) ACG(l,0) AAG (0,333) AGG (0,667) GTT(l,0) GCT(l,0) GAT (0,333) GGT(l,0) GTC(l,0) GCC(l,0) GAC (0,333) GAC (1,0) G GTA(l,0) GCA (1,0) GAA (0,333) GGA(l,0) GTG(l,0) GCG(l,0) GAG (0,333) GGG(l,0) Теперь необходимо рассчитать наблюдаемые количества синонимич- ных и несинонимичных нуклеотидных замен между двумя последователь- ностями. Последовательности сравниваются кодон за кодоном, использу- ются три типа сравнения: различия в первом, втором и третьем
430 Глава 9. Молекулярная генетика популяций и эволюция нуклеотидных сайтах. Очевидно, для многих кодонов в большинстве ге- нов различия ограничиваются только одним сайтом. Но для некоторых генов, например МНС (главного комплекса гистосовместимости), и при сравнении последовательностей отдаленно родственных организмов, не- которые кодоны могут различаться по двум и даже по трем нуклеотид- ным сайтам. Хотя для учета всевозможных замен необходимы все элемен- ты матрицы 64 х 64, мы покажем, как можно вычислить замены в одном и двух нуклеотидах. Допустим, что имеется только одно нуклеотидное различие и опреде- лим, синонимично оно или несинонимично. Например, в кодонах ТТТ (Phe) и ТТС (Phe) существует только одно синонимичное различие. Пред- полагая, что sd и nd - наблюдаемые количества синонимичных и несинони- мичных различий, для этого кодона получим, что 5, = 1 и и . = 0. При двух нуклеотидных заменах между кодонами в разных последова- тельностях возможны два варианта. Например, если кодоны CGT (Arg) и CGA (Arg), то возможны замены : CGT (Arg) <-> AGT (Ser) <-> AGA (Arg) и CGT (Arg) <-> CGA (Arg) о AGA (Arg). В первом случае имеется две несинонимичные замены, а во втором - две синонимичные замены. Если мы предположим, что эти два варианта равно- вероятны, то среднее количество наблюдаемых синонимичных различий, sd, будет равно 1,0, а количество несинонимичных различий, nd, будет также равно 1,0. Если вариант включает стоп-кодон, он не учитывается. При трех различиях между кодонами существует шесть различных вариантов (см. Nei, Kumar, 2000). Общее количество наблюдаемых синонимичных и несинони- мичных различий есть сумма различий для всех кодонов, или: с с sd = Hsdj wNd= Y”dj. (9.7b) 7=1 7=1 Пропорции синонимичных и несинонимичных различий можно опре- делить следующим образом: Sd N. Ps~~viPn-~. (9.7с) Л 7V Для оценки количества синонимичных (с/5) и несинонимичных (с/Д замен на сайт воспользуемся выражением 9.4а и методом Жаке-Кантора (Jukes- Cantor), вводя ps и р для d. Хотя эта аппроксимация не поддерживается во всех случаях, Ота и Ней (Ohta, Nei, 1994b) показали, что в большин- стве случаев она обеспечивает хорошие оценки.
II. Доказательства отбора и проверка теории нейтральности Изучение последовательностей для большинства генов дает оценки си- нонимичных и несинонимичных оценочных скоростей, согласующиеся с очищающим отбором, т.е. dN< ds. Например, Ли (Li, 1997) обнаружил, что в 47 генах человека и грызунов отношение несинонимичных к синони- мичным заменам было 0,21, а для 32 генов D.melanogaster и D.pseudoobscura, отношение было 0,12. С другой стороны, гены МНС обычно имеют более высокую скорость несинонимичных, чем синонимичных замен. (Пример 9.4 показывает, как вычислить скорости замен, используя вышеописанный способ. Видно, что отношение dN/ds для последовательностей МНС у ис- чезающего вида, лошади Пржевальского, больше 1.) Пример 9.4. Лошадь Пржевальского, Eguus przewalskii - единственный сохранившийся вид лошади, отличный от домашней лошади (Boyd, Houpt, 1994). Раньше она была широко распространена в Евразии, а теперь, как полагают, в природе вымирает; последнее подтвержденное наблюдение диких животных было в 1960-х годах. Искусственно поддерживаемая по- пуляция, которая сейчас насчитывает более 1200 особей, живущих в под- ходящих условиях обитания по всему миру, произошла от 13-ти живот- ных. В последние годы лошади Пржевальского были выпущены в резервации (заказники) в Монголии и Китае с целью восстановления ди- ких популяций. Хедрик с соавторами (Hedrick et al., 1999а) исследовали изменчивость экзона 2 гена DRB МНС класса II у 14 лошадей Пржевальского, которые были широко представлены у 13 основателей. Они заключили (на основе нескольких цепей доказательств), что было два гена DRB класса II, один с четырьмя аллелями и один - с двумя. Это малое количество аллелей согла- суется с малым количеством основателей и меньше, чем число соответ- ствующих аллелей у домашних лошадей (Hedrick et al., 1999а) и коров (Mikko, Anderson, 1995). Для иллюстрации расчета скорости замен в табли- це 9.6 даются последовательности 10 из 78 изученных кодонов, для двух аллелей первого локуса, Eqpr DRB*1 и Eqpr DRB*5. Три различия в кодо- нах между этими аллелями (всего пять нуклеотидных различий) оказались несинонимичными и были обнаружены в кодонах 52, 56 и 57 этой 10- кодонной последовательности. Из выражения 9.7b и величины sf рассчи- танной из таблицы 9.6, S = 9,67 и N= 20,33. Из выражения 9.7b и величин в таблице 9.6, Sd = 0,5 и Nd = 4,5. Тогда из выражения 9.7с ps = 0,052 и pN= 0,221 и тогда из выражения 9.4а ds = 0,054 и dN = 0,262, так что отно- шение dN/ds = 4,85. Сначала Хьюдж и Ней (Hughes, Nei, 1988) обнаружили, что в кодонах из антиген-связывающих сайтов человеческого МНС, отно- шение dN/ds значительно выше, чем единица, и затем почти такие же высо- кие отношения выявили для генов МНС других организмов.
Глава 9. Молекулярная генетика популяций и эволюция ТАБЛИЦА 9.6. Нуклеотидная последовательность 10 кодонов, имеющих различия в экзо- не 2 (подчеркнуто во второй последовательности) между двумя аллелями, Eqpr DRB* 1 и Eqpr DRB*5, гена МНС у лошади Пржевальского (Hedrick et al., 1999а) и величины, ис- пользованные для оценки скоростей синонимичных и несинонимичных замен Кодон 48 49 50 51 52 53 54 55 56 57 Eqpr DRB*1 CGG GCG GTG ACC AAG CTG GGG CGG ACG GAC Eqpr DRB *5 CGG GCG GTG ACC GAG CTG GGG CGG CGG AGC 5 1,33 1,0 1,0 1,0 0,33 1,33 1,0 1,33 1,0 0,33 Г 0 0 0 0 0 0 0 0 0,5 0 nd 0 0 0 0 0 0 0 0 1,5 2 с. Тест Эвенса-Ваттерсона Из модели неограниченного числа аллелей следует (выражение 8.8а), что ожидаемая равновесная гомозиготность равна: / =-------• 4Л> + 1 Эвене (Ewens, 1972) показал, что при нейтральном равновесии ожидае- мое количество различных аллелей п в выборке размером 2N равно: 2У-1 а ’ (9-8) где 0 = AN и. Если величина 0 очень мала, то ожидаемое количество раз- личных аллелей превышает единицу на очень малую величину. Когда 0 велика, то п достигает значения 2N, и почти каждый выборочный аллель будет отличаться от ранее выбранных аллелей. ТАБЛИЦА 9.7. Аллельные частоты и наблюдаемая гомозиготность, соответствующая равновесию Харди-Вайнберга, Off), в трех разных гипотетических выборках численнос- тью 200 особей с четырьмя аллелями Выборка Аллельные частоты A A< 0(0 1 0,35 0,30 0Д0 0,15 0,275 2 0,775 0,18 0,04 0,005 0,635 3 0,965 0,025 0,005 0,005 0,932
II. Доказательства отбора и проверка теории нейтральности 433 Исходя из этих двух отношений, Ваттерсон (Watterson, 1978) разрабо- тал тест для определения, согласуется ли гомозиготность в выборке раз- мером 2.V с л разными аллелями, с ожидаемой гетерозиготностью при нейтральности. Этот тест не нуждается в оценке AN и, потому ожидание зависит только от двух известных величин - размера выборки и количе- ства разных аллелей. Для иллюстрации этого теста в таблице 9.7 показа- но гипотетическое распределение четырех аллелей, наблюдаемых в вы- борке численностью 200 особей. В выборке 1 частоты аллелей более сходные, чем ожидаемые при нейтральности, в выборке 2 они близки к нейтральности, и в выборке 3 частота большинства частых аллелей выше, чем ожидаемая при нейтральности. Для теста, разработанного Ваттерсо- ном (Watterson, 1978), сравним наблюдаемую по Харди-Вайнбергу гомо- зиготность для этих выборок с гомозиготностью, ожидаемой при нейтральности. В этом случае 0= 0,58 и 2А = 200. Гомозиготность, ожидаемая, согласно соотноше- нию Харди-Вайберга, равна 0,633 и ожидаемое количество аллелей равно 4 (заметьте, что этот тест не сравнивает наблюдаемые частоты генотипов с ожидаемыми по Харди-Вайнбергу). В результате наблюдаемая гомозигот- ность гораздо ниже, чем ожидание для выборки 1, гораздо выше для выбор- ки 3 и близка к ожидаемому для выборки 2. В примере 9.5 представлены некоторые данные, показывающие применение этого теста для анализа ло- куса HLA у человека и для аллоферментных локусов у D.pseudoobscura. Пример 9.5. Тест гомозиготности Ваттерсона (Watterson, 1978) исполь- зуется для определения, согласуются ли наблюдаемые распределения ал- лельных частот в различных локусах с прогнозами нейтральности. Пер- вый пример, показавший, что распределение аллельных частот более ровное, чем ожидаемое, и наблюдаемая гетерозиготность выше, чем ожи- даемая, был описан для локусов HLA-A и HLA-В главного комплекса гис- тосовместимости человека (Hedrick, Thompson, 1983). Исследовались 22 популяции, в 25 из 44 наборов данных было получено значимое отклоне- ние от нейтральности в направлении большей сходности аллельных час- тот, несмотря на относительно низкую статистическую силу этого теста. Исследуя потенциальные эффекты различных эволюционных факторов, авторы сделали вывод, что наиболее вероятной причиной, вызывающей этот эффект, является балансирующий отбор. Марков и сотрудники (Markow et al., 1993) изучили распределение этих двух локусов у индей- цев - в маленьком племени (<600), населяющем изолированный каньон в Большом Каньоне Аризоны. В выборке из 122 индивидов (2N = 244),
434 Глава 9. Молекулярная генетика популяций и эволюция были обследованы четыре и восемь аллелей для HLA-A и HLA-B, соответ- ственно (таблица 9.8). Для обоих локусов аллельное распределение было более ровное, чем ожидаемое из нейтральности, и средняя наблюдаемая гомозиготность составила только 63% от ожидаемой согласно нейтраль- ности, хотя эти различия и не были статистически значимыми. Отклоне- ние от нейтральности в этом случае также может определяться баланси- рующим отбором. Поскольку это маленькая изолированная популяция, то генетический дрейф, вызывающий потерю редких аллелей, мог ими- тировать эффект балансирующего отбора. Недавно Саламон и соавторы (Salamon et о/., 1999) изучили распределение частот аминокислотных за- мен в специфических сайтах для локусов HLA класса II в 26 различных популяциях и обнаружили множество примеров статистически значимых отклонений от нейтральности. ТАБЛИЦА 9.8. Аллельные частоты (наблюдаемая и ожидаемая согласно принципу Хар- ди-Вайнберга), гетерозиготность и статистически значимый уровень для двух локусов HLA в популяции индейцев племени гавасупаи (Havasupai), (по Markow et al., 1993) HLA-A HLA-B Аллель Частота Аллель Частота А2 0,537 B5v 0,119 А24 0,189 В27 0,037 АЗО 0,004 В35 0,164 А31 0.270 В39 0,061 В48 0,422 В51 0,086 В60 0,102 В61 0,008 С»(/) = 0,397 O(f) = 0,242 £(/) = 0,616 £(/) = 0,397 Р = 0,13 Р = 0,12 Кейт и соавторы (Keith et al., 1985) изучили частоты аллелей гена ксан- тиндегидрогеназы в 89 линиях D.pseudoobscura, собранных в винодель- нях Калифорнии. Они обнаружили 15 различных аллелей, с частотами 0,584, 0,101, 0,090, 0,045 (2 аллеля), 0,022 (2 аллеля) и 0,011 (8 аллелей). В этом случае, значение О(/) было 0,366, тогда как согласно нейтрально- сти ожидается только 0,169. Статистический тест позволил этим иссле- дователям отклонить теорию нейтральности. В этом случае, распределе- ние было отлично от нейтральности, в противоположность данным по
II. Доказательства отбора и проверка теории нейтральности 435 HLA, с более высокой гомозиготностью, чем ожидаемое для данного ко- личества аллелей. Другими словами, наиболее обычный аллель был бо- лее частым, а единичных копий аллелей наблюдали больше, чем ожида- лось по теории нейтральности. Такое распределение согласуется с очищающим отбором, элиминирующим вредные аллели, которые непре- рывно образуются при мутировании. d. Тесты Хадсона-Крайтмана-Агвейда и МакДональда-Крайтмана Теория нейтральности прогнозирует и скорость нуклеотидных замен во времени, и значение полиморфизма в популяции. Как скорость эволюци- онных изменений, так и полиморфизм исходно зависят от скорости мути- рования, поэтому локусы с высокой скоростью мутирования сильнее от- личаются между видами, а также имеют высокую гетерозиготность внутри вида. Используя эту концепцию, Хадсон с сотрудниками (Hudson et al, 1987) предложили тест (так называемый тест ХКА, или тест Хадсона- Крайтмана-Агвейда), выявляющий отбор на основе прогнозов теории нейтральности о положительной корреляции изменчивости между и внут- ри видами. Для использования теста ХКА необходимы данные, по край- ней мере, о двух различных генетических локусах у двух разных видов, тогда внутривидовую изменчивость и межвидовую дивергенцию можно сравнивать по различным локусам. Ожидаемые величины внутри- и меж- видовых измерений, согласно модели неограниченного числа сайтов, яв- ляются функцией времени t с момента дивергенции двух видов, относи- тельных эффективных размеров популяций двух видов и величины q для каждого гена (Hudson et al., 1987; Kreitman, Hudson, 1991). В примере 9.6 приводятся данные по гену алкогольдегидрогеназы Adh у Drosophila и по гену, обусловливающему характер ветвления у кукурузы и родственного злака теосинте. Пример 9.6. Рассмотрим нуклеотидную изменчивость в двух случаях, ког- да тест ХКА противоречит теории нейтральности. Во-первых, на примере гена Adh показана высокая генетическая изменчивость этого полиморфно- го локуса у D.melanogaster (Kreitman, 1983), тогда как в двух соседних рай- онах, 5'-фланкирующем и 3'-фланкирующем районе Adh-dup изменчивость значительно меньше. На рисунке 9.10 представлена диаграмма наблюдае- мых и ожидаемых средних попарных различий между аллелями Adhfvt Adhs среди более, чем 4500 нуклеотидов в этом локусе (Kreitman, Hudson, 1991). Для вычисления в каждой позиции нуклеотида учитываются различия по 100 молчащим сайтам. Наибольшее различие между наблюдаемой и ожи- даемой изменчивостью обнаружено в регионе вокруг аминокислотной за- 28*
Ci36 Глава 9. Молекулярная генетика популяций и эволюция мены в позиции 1490. Попарные тесты ХКА для трех регионов продемон- стрировали, что существует 5%-ный уровень значимости между 5'-флан- кирующим регионом и Adh локусом и 2%-ный уровень - между Adh и Adh- dup локусами. Статистическое отклонение от нейтральности является результатом более высокой, чем ожидается, внутривидовой изменчивости для локуса Adh и согласуется с балансирующим отбором аминокислотных замен (Kreitman, Hudson, 1991). Другой пример генетической изменчивости касается локуса ветвле- ния теосинте (teosinte branched 1, или tb 1 у кукурузы) (Wang et al., 1999). Сравнение изменчивости 5'-регуляторного, нетранскрибируемого райо- на (NTR) и кодирующего района tb 1 у кукурузы и у ее предковой формы теосинте показано на рисунке 9.11. Диаграмма показывает величину раз- нообразия нуклеотидного состава последовательности длиной 300 п.н. у обоих видов. Наибольшее различие между видами касается 97%-ного сни- жения изменчивости у кукурузы в районе NTR. Тест ХКА показывает, что это снижение высоко значимо (на 0,4%-ном уровне) для сравнения NTR и кодирующего регионов. Одомашнивание - отбор по признакам, интересующим человека, вероятно, сократило размах генетической из- менчивости локусов, влияющих на эти признаки. Вариант NTR, обнару- женный у кукурузы, приводит к укорочению боковых побегов и к появ- лению «ушек» наверху листовых влагалищ. Согласно прогнозу направляющего отбора, который приводит к уменьшению изменчивости вследствие одомашнивания, район NTR у кукурузы практически моно- морфен, тогда как этот локус у дикорастущего теосинте высоко вариа- бельный. Это же относится и к соседнему кодирующему локусу tb 1. 8-i 6 - Наблюдаемые 4 - Ожидаемые 2 - 0 -1500 -500 500 I------ 1500 2500 3500 Adh Adh-dup Рисунок 9.10. Диаграмма наблюдаемой и ожидаемой генетической изменчивости в 5'- фланкирующем регионе, гене Adh и гене Adh-dup у Drosophila (Kreitman, Hudson, 1991). Ожидаемые величины основаны на модели отсутствия отбора и рассчитаны, исходя из межвидовой дивергенции. Стрелки обозначают аминокислотный полиморфизм.
II. Доказательства отбора и проверка теории нейтральности 500 Ьр Рисунок 9.11. Диаграмма полиморфизма гена teosinte branched 1 для кукурузы и теосин- те (Wang et al., 1999). МакДональд и Крейтман (McDonald, Kreitman,1991) предложили про- стейший статистический тест, основанный на принципах, одинаковых для синонимичных и несинонимичных сайтов в кодирующем регионе гена. Если наблюдаемые замены нейтральны, тогда отношение заместитель- ных (несинонимичных) к синонимичным различиям между видами долж- но быть таким же, как отношение заместительных к синонимичным по- лиморфизмам внутри вида. В таблице 9.9а представлены данные по кодирующему региону Adh у D.melanogaster, D.simulans и D.yakuda. Здесь отношение замещений к синонимичным заменам равно 7/17 = 0,41, тогда как отношение заместительных к синонимичным полиморфизмам равно только 2/42 = 0,05. Авторы предположили, что увеличение числа замеще- ний является результатом фиксации мутаций, имеющих селективное пре- имущество. Сойер и Хартл (Sawyer, Hartl, 1992) оценили, что для этого достаточно селективного преимущества величиной лишь 1,5 х 10"6 (Eanes et al., 1993) описывают сходную, но более крайнюю ситуацию для гена глюкозо-6-фосфат дегидрогеназы (G6pd) у Drosophila. ТАБЛИЦА 9.9. Количество замещений (несинонимичных замен) и синонимичных замен при фиксированных межвидовых различиях и внутривидовом полиморфизме в локусе Adh у Drosophila (а), (по McDonald, Kreitman, 1991) и в гене ND3 мт ДНК у человека и шимпанзе (b), (по Nachman et al., 1996) (А) (Ь) Фиксированный Полиморфный Фиксированный Полиморфный Замещение 7 2 4 8 Синонимичная 17 42 31 10 замена
438 Глава 9. Молекулярная генетика популяций и эволюция С другой стороны, Нахмен с сотрудниками (Nachman et al., 1996, см. также Rand, Kann, 1996) обнаружили, что для субъединицы 3 НАДН- дегидрогеназы (ND3) в выборке 61 человека и 5 шимпанзе межвидовое отношение заместительных к синонимичным различиям ниже, чем внут- ривидовое (таблица 9.9b). В этом случае отношение между видами равно 0,13, а внутри видов - 0,8. При исследовании доступных данных по дру- гим генам мтДНК наблюдалось сходное увеличение внутривидовых заме- стительных полиморфизмов. Это согласуется с гипотезой, что большин- ство белковых полиморфизмов мтДНК - умеренно вредные и элиминируются до того, как они станут фиксированными. е. Тест Таджимы Как отмечалось в главе 2, один из способов количественного определе- ния нуклеотидной изменчивости - это измерение нуклеотидного разно- образия д(см. выражение 2.23b). Согласно модели неограниченного чис- ла сайтов, количество нуклеотидных сайтов достаточно велико, чтобы каждая новая мутация появлялась в сайте, который раньше не мутировал (Kimura, 1969) и ожидаемое значение л при нейтральности, равно: Е(тг) = 0, (9.9а) где в = 4Nu. Другая мера нуклеотидной изменчивости - количество сай- тов, сегрегирующих для различных нуклеотидов, S: E(S) = а0, где а = '1 / i в выборке из п аллелей. Это выражение можно преобразо- вать для получения О'. S в=~. (9.9b) При равновесии нейтральности эти две оценки (хотя они и отражают разную информацию) должны быть одинаковыми. Оценка, зависящая от значения разнообразия, дана в выражении 9.9а (назовем ее Она сход- на с измерением гетерозиготности и почти не зависит от наличия редких аллелей, тогда как оценка сегрегирующих сайтов (назовем ее 05) учиты- вает все вариабельные сайты и может сильно зависеть от редких аллелей. Таджима (Tajima, 1989) разработал тест для сравнения этих двух оценок, 6л- 0s (см. также Fu, Li, 1993). Если популяция находится в состоянии нейтрального равновесия, то результаты теста статистически равны нулю. Однако, если некоторые из аллелей - умеренно вредные, то это не должно сильно влиять на величи- ну я, но значение S увеличится. В результате оценка 0л должна быть
III. Молекулярная филогенетика 439 меньше, чем оценка 0^ и разница между ними будет отрицательной. Пре- имущество гетерозигот или недавний эффект «бутылочного горлышка» должны снижать величину S, и тогда оценка убудет больше, чем оценка 0? а разница между ними будет положительна. Если популяция возраста- ет от равновесного положения, тогда S будет расти быстрее, чем л, и разница между оценками будет отрицательной. Однако статистическая сила этого теста может ограничиваться за счет вкладов отбора и демогра- фических событий, которые трудно дифференцировать (Simonsen et al., 1995; Fu, 1997). III. Молекулярная филогенетика Сходства и различия молекулярной организации различных организмов могут быть использованы для выяснения эволюционных взаимосвязей. Считается, что организмы, имеющие много одинаковых молекул, близко- родственны, а те, которые имеют совершенно разные молекулы, родствен- ны только отдаленно. Такие предсказания были бы более точными, если бы различия в молекулярной структуре между видами являлись только функцией времени от момента дивергенции между видами, т.е., если эво- люция этих последовательностей управляется нейтральностью. С помо- щью данных о последовательностях ДНК у многих организмов определя- ются филогенетические взаимосвязи между видами или другими таксонами, которые нельзя выяснить при использовании других подхо- дов. Данные о последовательности ДНК отражают истинные филогене- тические взаимосвязи лучше, чем морфологические признаки, потому что структура последовательностей менее зависима от действия отбора. Более того, различия между филогенетическими деревьями, образован- ными исходя из молекулярных данных и из других характеристик, дают нам возможность оценить эффект действия отбора на другие признаки. Хотя детальные методы конструирования филогенетических деревьев, исходя из молекулярных данных, выходят за рамки этой книги (см. обзор Felsenstein, 1988 и Nei, 1996; анализ в работе Nei, Kumar, 2000), мы позна- комимся с несколькими распространенными подходами. Методология по- строения дерева зависит от того, какую информацию передают филоге- нетические деревья, и какой вклад они вносят в популяционную генетику (Hillis et al., 1994; Papadopoulos et al., 1999). Филогенетические деревья состоят из узлов и ветвей, соединяющих узлы. Наружный, или терми- нальный узел обозначает таксон вне рассмотрения, тогда как внутренние узлы соединяют родственные таксоны. Часто длины ветвей имеют шкалу для представления степени дивергенции между таксонами, которые они соединяют. Характер ветвления филогенетического дерева называют то- пологией. Деревья могут быть разделены на такие категории, как укоре-
(Г440 Глава 9. Молекулярная генетика популяций и эволюция пившиеся деревья, если подразумевается наличие общего предка и, сле- довательно, данное эволюционное направление, и неукоренившиеся деревья, при этом предполагается отсутствие данных о предках. Для пре- доставления корня неукоренившемуся дереву, обычно необходима вне- шняя группа - таксон, который по палеонтологическим или другим дан- ным отделился раньше, чем исследуемый таксон. Несколько модельных исследований по определению возможностей различных подходов для создания деревьев с известной топологией (Sourdis, Nei, 1988; Hillis, 1996) продемонстрировали, что при хорошем статистическом доверии в топо- логии выбранного дерева, все главные методы работают хорошо и дают вполне сравнимые результаты. Генетические различия между локусами, популяциями или видами позволяют определить биологически значимый путь. Расположение та- ких групп, которые обычно имеют корень или предковый тип с одной стороны и ветви или эволюционно отклонившиеся типы с другой сторо- ны, может обнаружить предполагаемого предка или недавно отклонив- шиеся типы. Основная трудность состоит в построении правильной то- пологии расположения ветвей для данного порядка групп, особенно, когда таких групп множество. Поскольку количество групп возрастает, количе- ство различных коренных топологий возрастает очень быстро; для 3 групп существует 3 различных топологии, для 4 групп - 15, для 5 групп - 105 и для 10 групп - более 34 миллионов возможных коренных топологий (Felsenstein, 1978). Очевидно, для изучения различных деревьев при боль- шом количестве групп необходим компьютер и важен эффективный спо- соб обнаружения наиболее подходящего дерева. Перед рассмотрением методов построения филогенетических деревьев, важно провести дифференциацию между генными деревьями и видовы- ми деревьями (Pamilo, Nei, 1988; Nei, Kumar, 2000). Генное дерево строит- ся согласно данным о последовательности ДНК данного гена, суммирован- ных из вариантов последовательности внутри вида и вариантов гомологичных последовательностей у разных видов. Видовое (популяци- онное) дерево представляет историю эволюции группы видов. В видовом дереве расщепление одного вида на два вида обозначает время происхож- дения видов. Когда генное дерево строится, исходя из гена, выбранного у различных видов, такое дерево может полностью не согласоваться с видо- вым деревом. Например, если гены полиморфны внутри дивергировавших видов, тогда время дивергенции в генном дереве может быть больше время дивергенции видов. К тому же, картина ветвления в генном дереве может отличаться от ветвления в видовом дереве. Мы представим три разных метода конструирования филогенетических деревьев. Невзвешенный парно-групповой метод (НПГМ) первоначаль-
III. Молекулярная филогенетика но предложили Сокал и Снит (Socal, Sneath, 1963). Он позволяет анализи- ровать морфологические данные. НПГМ легок для понимания, но он пред- полагает постоянную скорость эволюции во времени для всех линий про- исхождения. Метод объединения соседей (ОС), разработанный Сейто и Неем (Saitou, Nei, 1987), основан на принципе минимальной эволюции. Оба эти метода называются методами матриц расстояний (дистанционных матриц) и зависят от измерения генетического расстояния между всеми парами изучаемых таксонов. Третий метод использует максимальную пар- симонию (экономию), (пример приведен на рисунке 1.8). Это способ по- строения деревьев с наименьшим количеством мутаций, необходимых для организации таксона. Другой метод, который мы не обсуждаем, но кото- рый широко используется - метод максимального правдоподобия (Felsenstein, 1981), когда правдоподобие наблюдения данной группы после- довательностей максимизируется для каждой топологии дерева, и отбира- ется топология с высшим максимальным правдоподобием. а. Невзвешенный парно-групповой метод (НПГМ) НПГМ использует информацию о расстояниях (иногда называемую фе- нетикой), тогда как метод максимальной экономии использует состояния признака (иногда называемые кладистикой). В традиционной таксоно- мии сторонники этих двух подходов часто вели яростные споры. Для мо- лекулярных данных, в основе которых нежат различия нуклеотидного со- става наиболее приемлемы подходы, использующие методологию состояний признака. Но поскольку некоторые нуклеотидные сайты не- информативны (см. ниже), они исключаются из состояний признака. Ди- станционные подходы объединяют информацию о всех вариабельных сай- тах (Saitou, Nei, 1986). Для построения филогенетического дерева введем ряд операционных таксономических единиц (ОТЕ), обозначенных 1, 2, 3, ..., которые мо- гут быть популяциями, видами или другими биологическими группами. Предположим, что генетическое расстояние между этими группами из- мерено с учетом аллельных частот, нуклеотидных замен, рестриктных карт геномных последовательностей и других данных, так что доступна матрица попарных генетических расстояний, где D - генетическое рас- стояние между группами i и j. Допустим, имеется четыре ОТЕ и генети- ческие расстояния, приведенные в таблице 9.10а. Теперь можно органи- зовать эти ОТЕ в виде биологического пути, который отразил бы биологические взаимосвязи на основе величин генетических расстояний. Используя НПГМ, начнем с кластеризации двух групп, которые име- ют наименьшее генетическое расстояние, объединяя их в одну новую ОТЕ. Затем вычислим новые оценки генетических расстояний между этой но-
Глава 9. Молекулярная генетика популяций и эволюция вой единицей и другими оставшимися единицами, взяв среднее арифме- тическое их расстояний. Предположим, что существует четыре различ- ных ОТЕ, и что популяции 1 и 2 имеют наименьшее генетическое рассто- яние из всех сравниваемых единиц. Эти две популяции можно объединить в новую единицу (12). Тогда генетические расстояния между этой едини- цей и единицами 3 и 4 равны: ^9(12)3 2 (^13 + ^23 ) и (9.Ю) ^(12)4 — 2 (^14 + ^24 ) • ТАБЛИЦА 9.10. Генетическое расстояние между всеми парами из четырех групп (а) и между тремя группами после кластеризации групп 1 и 2 (Ь) (а) 1 2 (b) 3 (12) 3 2 d,2 - - 3 ^(12)3 - 3 - 4 ^(12)4 D3i 4 D3i Мы получили новую матрицу величин расстояний, использующую три оставшиеся ОТЕ, (12), 3 и 4; эта матрица представлена в таблице 9.10b. Предположим, что Z>34 - наименьшее оставшееся генетическое расстоя- ние, так что формируется второй кластер 3 и 4. Последнее действие в этом простом примере - вычисление среднего расстояния между двумя кластерами, которое равно -Ц|2)(34) = 4~С^13 + -^14 +^23 +-^24) = = 2"(-£\12)3 + -^(12)4 )• Полезно показать цифровые данные так, чтобы длины ветвей имели конкретные значения, и филогенетическое дерево можно было построить в масштабе. В таблице 9.11 представлены данные о последовательности мтДНК, полученные из работы Нея и Кумара (Nei, Kumar,2000, цитиро- ваны результаты из исследования Brown et al., 1982). Эти данные по пяти приматам, включая человека, были получены для определения взаимо- связей между видами. Величины расстояний основаны на пропорции раз- личных сайтов в последовательности длиной 895 п.н. Эта последова- тельность была преобразована для измерения количества замен между
III. Молекулярная филогенетика ТАБЛИЦА 9.11. Оценочные количества нуклеотидных замен в последовательности мтДНК длиной 895 п.н. у пяти видов (данные из Brown, 1982; и оценка из Nei, Kumar, 2000) (1)Человек (2) Шимпанзе (3) Горилла (4) Орангутанг (2) Шимпанзе 0,095 - - - (3) Горилла 0,113 0,118 - - (4) Орангутанг 0,183 0,201 0,195 - (5) Гиббон 0,212 0,225 0,225 0,222 последовательностями по формуле, сходной с выражением 9.4а, но до- пускающей различные скорости замен для транзиций и трансверсий, и называемой моделью двух параметров (Kimura, 1980) (см. рисунок 9.3). Обратите внимание, что £>12 (расстояние между человеком и шимпан- зе) - наименьшее значение расстояния из всех сравниваемых величин. При кластеризации 1 и 2 расстояния между этим кластером и другими тремя таксонами рассчитываются, используя выражение 9.10, и получа- ется редуцированная матрица, показанная в таблице 9.12а. Величина - наименьшее значение расстояния в этой матрице, поэтому формирует- ся новый кластер 123. Расстояния между этим кластером и таксонами 4 и 5 рассчитаны и представлены в таблице 9.12b. Поскольку расстояние меж- ду 123 и 4 наименьшее, эти таксоны формируют новый кластер. В табли- це 9.12с дано расстояние между кластером (1234) и 5. ТАБЛИЦА 9.12. Количество нуклеотидных замен и значения D, между пятью видами приматов из таблицы 9.11 (а) после кластеризации видов 1 и 2, (Ь) - после кластеризации вида 3 с кластером (12), (с) - после кластеризации вида 4 с кластером (123), используя алгоритм НПГМ (а) (12) 3 4 (Ь) (с) (123) 4 (1234) 3 0,115 - - 4 0,194 - 5 0,222 4 0,192 0,195 - 5 0.222 0,222 5 0,218 0,225 0,222 Филогенетическое дерево для этих данных приведено на рисунке 9.12а, где номера обозначают длины ветвей. Заметьте, что длины ветвей равны половине генетического расстояния между двумя группами, потому что эволюционные изменения, как предполагают в НПГМ, случаются с рав- ной частотой во всех линиях происхождения. Например, расстояние меж-
Глава 9. Молекулярная генетика популяций и эволюция ду человеком и шимпанзе равно 0,095, но длина ветви с момента их раз- деления от общего предка равна половине (0,048) длины каждой ветви. Расстояние от кластера человек-шимпанзе до гориллы равно 0,115 (таб- лица 9.12а). Взяв половину от этого значения, 0,058, получаем время до их общего предка и расстояние до расхождения человек-шимпанзе, рав- ное 0,058 - 0,048 = 0,010. Подобный подход можно использовать для вы- числения других расстояний в дереве. (а) НПГМА (б) ОС 0.048 0.010(90 0.039 I 00^8 100 0.058 0.096 0.124 Человек Шимпанзе Горилла Орангутанг Гиббон 0.042 o.oosryj- — 0.039 |~1 0.054 100 0.060 0.097 0.125 Человек Шимпанзе Горилла Орангутанг Гиббон Рисунок 9.12. Деревья, построенные по методу НПГМ (а) и ОС (Ь) с помощью данных о мтДНК, представленных в таблице 9.11. Цифры обозначают длины ветвей, а жирные циф- ры - бутстрепные доверительные значения для соответствующих узлов (Nei, Kumar, 2000), см. стр. 446. Ь. Метод объединения соседей Метод объединения соседей (ОС) используется для расчета расстояний с учетом молекулярных данных. В отличие от метода НПГМ, этот метод может объединить разные скорости эволюции в разных линиях проис- хождения. ОС может использовать сходные с НПГМ подходы, но сумма длин ветвей в дереве минимизируется пошаговым способом. Предполо- жим, что дерево имеет форму звезды без кластеризации (рисунок 9.13а). Сначала нужно определить общую длину этого дерева, когда все пары таксонов потенциально являются ближайшими соседями (Nei, Kumar, 2000). Если таксоны 1 и 2 - ближайшие соседи, то общая длина равна _2Г-7?,-/?2 Рп 12 2(2V-2) 2 ’ где N - количество ОТЕ и T = YD-j vR}=fDXi. •j г (9.11a) Вычисляют все значения S и определяют наименьшее, и новый узел А, который соединяет таксоны i и j. Длины ветвей от этого узла А до таксонов i и j равны:
III. Молекулярная филогенетика 445 Рисунок 9.13. Последовательные деревья, используемые для конструирования дерева методом объединения соседей, где (а) - исходное дерево в виде звезды, (Ь) - дерево после первого шага и (с) - окончательное дерево. ЬА, = [(W - 2)D. + R, - R, ] А' 2(N-2) v ' J и Тогда расстояние между новым узлом и оставшимися к таксонами равно: DM=±(Dik+DJk-Dv). (9.11с) Вся последовательность повторяется, пока не останется только четыре таксона, и можно будет вычислить длины оставшихся ветвей. Для иллюстрации вычислений используем данные из таблицы 9.11. Во-первых, можно определить величины Т = 1,789, Rt = 0,603, R2 = 0,639, /?, = 0,651, R4 = 0,801 и R5 = 0,884. Подставляя эти значения в выражение 9.11а для различных пар таксонов, получим ряд величин S (таблица 9.13а). Наименьшее значение между таксонами 4 и 5, поэтому между эти- ми таксонами имеется узел А (см. рисунок 9.13b). Это исходное объеди- нение отличается от объединения при алгоритме НПГМ. Дело в том, что величина, исследуемая на минимальность методом НПГМ - это мини- мальное расстояние между таксонами, а методом ОС - минимальная об- щая длина ветвей для дерева (при этом пара таксонов - ближайшие сосе- ди). Длины ветвей из выражения 9.11b равны Ь14 = 0,097 и ЬА5 = 0,125.
446 Глава 9. Молекулярная генетика популяций и эволюция Новые расстояния между узлом А и другими таксонами можно вычис- лить из выражения 9.11с, они представлены слева в таблице 9.136. Те- перь процесс определения новых значений S повторяется с этими новы- ми расстояниями (вычисляются новые значения Т и R на основе этих расстояний, см. справа в таблице 9.13b). Когда остается четыре таксона, то при использовании ОС равновероятны два кластера: АЗ и 12. Новый узел В образуется, соединяя А и 3, длина ветви от таксона В до 3 равна bBi = 0,060. Новый узел С образуется, соединяя 1 и 2, длина ветви от С до 1 равна ЬС1 = 0,042 и от С до 2 равна Ьа = 0,053. Наконец, дерево можно изобразить в масштабе, не включая узлы, как на рисунке 9.12b. Заметьте, что в этом случае топология такая же, как и при использовании метода НПГМ, и длины ветвей также очень сходны. ТАБЛИЦА 9.13. Ряды, используемые методом объединения соседей, для данных, пред- ставленных в таблице 9.11 по всем пяти таксонам (а) и после объединения 4 и 5 таксонов (Ь). Жирным шрифтом обозначены наименьшие значения (а) \ 1 2 3 4 2 0,437 - - - 3 0,444 0,440 - - 4 0,454 0,457 0,452 - 5 0,455 0,455 0,453 0,427 (Ь) D У Stj А 1 2 А 1 2 1 0,087 - - 1 0,205 - - 2 0,102 0,095 - 2 0.207 0,202 - 3 0,099 0,113 0,118 3 0,202 0,207 0.205 Когда таксонов много, то появляется множество топологий дерева и поэтому определение уровня статистического доверия для различных частей дерева становится критическим. Наиболее обычный подход - оп- ределение уровня статистического доверия в конкретном узле дерева с помощью расчета бутстрепных значений (Felsenstein, 1985). Бутстреп- пинг (bootstrapping) - это подход, который перевыбирает исходные дан- ные для получения уровней значимости. В этом случае выборка полу- чается случайной, филогенетическое дерево изображается для этой выборки, и изучают дерево, определяя, какие кластеры ОТЕ оно содер- жит. Обычно этот процесс повторяется много раз, скажем 1000, и про-
III. Молекулярная филогенетика 447 цент случаев, в котором данный кластер представлен, обозначается на дереве. Например, бутстрепные значения в таблице 9.12 (из Nei, Kumar, 2000) обозначают, что для обоих деревьев кластер человек-шимпанзе- горилла высоко обеспечен (в 100% перевыбранных деревьев содержал- ся этот кластер). Кластер человек и шимпанзе обеспечен (90%) для де- рева, построенного методом НПГМ и несколько ниже - для дерева, построенного методом ОС (71%). с. Максимальная экономия Метод максимальной экономии (парсимонии) идентифицирует дерево (или деревья), которое включает наименьшее количество мутаций, необходи- мых для объяснения различий между изучаемыми группами (Fitch, 1977). Такие деревья часто очень информативны. Однако, как видно из просто- го примера, можно построить несколько деревьев с одинаковым мини- мальным количеством мутаций. К тому же, обнаружение наиболее эко- номичного дерева не гарантирует, что это дерево правильное: если скорости замен варьируют вдоль разных линий происхождения, эконо- мия может не привести к правильной топологии дерева. Для построения дерева методом максимальной экономии сначала нужно идентифицировать информативные сайты, которые поддержи- вают одно филогенетическое дерево через другое. В качестве иллюст- рации используем четыре таксона с последовательностями, данными в таблице 9.14. Для четырех таксонов возможны три неукоренивших- ся дерева (рисунок 9.14а), и нужно определить, является ли одно из этих деревьев наиболее экономичным объяснением представленных данных, чем другие. Следуя по этим сайтам шаг за шагом можно видеть, что сайт 1 не информативен, потому что все последовательности идентичны по Т и поэтому не требуют замен. Сайт 2 также не информативен, потому что единственная мутация в ветви, ведущей к таксону 1, для любого из трех деревьев дает эту же картину. В сайте 3 существуют три различных нук- леотида, но он также не информативен. Рисунок 9.14b показывает, что для построения всевозможных деревьев необходимы минимум две заме- ны. С другой стороны, сайт 5 - информативный (рисунок 9.14с). В этом случае, дерево А требует только одной замены между двумя внутренними узлами дерева, тогда как деревья В и С требуют по две замены. Сайт 6 также информативен, и для него дерево С требует только одну замену, тогда как деревья А и В требуют двух. Итак, для информативности сайта он должен иметь минимум два разных нуклеотида, и каждый из этих нуклеотидов должен быть представлен, по крайней мере, дважды.
Глава 9. Молекулярная генетика популяций и эволюция ТАБЛИЦА 9.14. Гипотетические последовательности в семи нуклеотидных сайтах из че- тырех различных таксонов, иллюстрирующие метод максимальной экономии. Информа- тивные сайты обозначены знаком * Сайт Таксон 1 2 3 4 5* 6* 7* 1 Т т с G Т G А 2 Т с т Т Т т А 3 т с А С С т С 4 т с А А с G С (а) Общее Дерево А Дерево В Дерево С (Ь) Сайт 3 (с) Сайт 5 Рисунок 9.14. (а) Три возможных неукоренившихся дерева при наличии четырех таксонов. Примеры наименьшего количества замен (обозначены штрихами) для каждого дерева с нуклеотидными последовательностями для сайта 3 (Ь) и сайта 5 (с). Нуклеотиды в терми- нальных узлах даны для каждого таксона (см.таблицу 9.14). Для построения дерева с помощью метода максимальной экономии сна- чала идентифицируют информативные сайты и затем рассчитывается ми- нимум замен для каждого из этих сайтов, необходимых для любого возмож- ного дерева. Минимальное количество замен во всех информативных сайтах затем суммируется для каждого дерева. Наиболее экономичным считается дерево с наименьшим количеством замен. В примере, данном выше, для информативных сайтов дерево А требует 4, дерево В требует 6 и дерево С требует 5 замен. Таким образом, на основе этих данных дерево А - наибо- лее экономичное (соответствует требованию метода максимальной эконо-
III. Молекулярная филогенетика 449 мии). По этому принципу можно строить и более сложные деревья (см. рисунок 1.8 и пример 9.7, который анализирует данные о последователь- ностях у человека). Пример 9.7. Место происхождения современного человека долго было предметом противоречивых обсуждений. Когда анализ молекулярных ва- риантов мтДНК выявил, что современные люди в недавнем прошлом по- явились «из Африки» (Cann et al., 1987), это открытие широко оспарива- лось и критиковалось. Канн с сотрудниками сделали свой вывод на основании данных по рестрикционным фрагментам от 147 различных индивидов из 5 популяций. Когда 133 различных типа мтДНК были раз- мещены на филогенетическом дереве, старейшая ветвь состояла из груп- пы африканского происхождения. С учетом независимых скоростей му- тирования мтДНК время существования общего предка мтДНК, или «мтДНК Евы», было оценено периодом около 200000 лет назад (Cann et al., 1987; Vigilant et al., 1991), хотя это открытие статистически и не было подтверждено (Hedges et al., 1992). Альтернативная гипотеза заключается в том, что современные люди по- явились в нескольких регионах Старого Света. Поскольку данные о струк- туре мтДНК отражают историю только одного гена, важны также и данные по структуре ядерных генов. Харрис и Хей (Harris, Неу, 1999) изучили изменчивость последовательности Х-сцепленного гена PDHA1 (субъеди- ницы Е1 а-пируват дегидрогеназы) длиной 4200п.н. в выборке 16 мужчин африканского происхождения и 19 мужчин неафриканского происхожде- ния. В общем, они обнаружили 25 полиморфных сайтов, но уровень гене- тической изменчивости в «африканской» выборке был гораздо выше, чем в «неафриканской» (таблица 9.15). В «африканской» выборке было 23 по- лиморфных сайта и оценка 0 равна 6,9. В «неафриканской» выборке было только два полиморфных сайта и оценка в составила лишь 0,57. Один по- лиморфный сайт (сайт 544) был фиксированным различием между восе- мью «африканскими» и тремя «неафриканскими» гаплотипами, что ука- зывает на историческое подразделение между «африканцами» и «неафриканцами». Высокое перекрывание гаплотипов между «африканс- кими» образцами и наличие в трех из них гаплотипа С, наиболее близко родственного гаплотипам из «неафриканских» образцов свидетельствует о маленькой «африканской» популяции. На рисунке 9.15 показано наиболее экономичное дерево для этих гап- лотипов (В1 не включен, потому что сайт 3306 не используется при пост- роении дерева) и показано, что африканские образцы присутствуют на обеих сторонах наиболее глубокого узла, тогда как неафриканские образ- цы ограничены с одной стороны. Наиболее вероятно, что источником
Глава 9. Молекулярная генетика популяций и эволюция ТАБЛИЦА 9.1S. Полиморфные нуклеотиды в гаплотипах для Х-сцепленного гена PDHA1 человека и количество каждого гаплотипа, наблюдаемого в четырех африканских (Ба - банту; Се - сенегальцы; Хо - хойзан; Пи - пигмеи) и в четырех неафриканских популяциях (Фр - французы; Ки - китайцы; Be - вьетнамцы; Мо - монголы) (по Harris, Неу, 1999) Позиция нуклеотида 1 1 1 1 111 22222223 3 3 3 44 1456702334591112449134612 5947903053732366187800800 Гаплотип 7442152069361506795967889 Африканские Неафриканские Шимпанзе CGGGTTATGCCGAGAATACGGCGCC Ба Се Хо Пи Фр Ки Be Мо А —ACCC--TGT--AC-CC--Т- - ----- 2 1 1 В --ACCC--TGT—АС-С---Т- ----5 5 4- В1 —АССС — TGT — АС-С-А — Т- - - - - 1 - - - С --ССС — TGT — АС-С-Т- 1 2 - 2 - - - - D А---С —*-Т----Т--Т---- 1 - 1 - - - - Е ТА---С---------Т — Т-1 ----- - - F -А---СС--------ТА---- - 1 ----- - G -А-----С------G — Т--С-Т 1 ----- - - Н -А-----СС—*---G — Т С— - 2 - - - - - - I -А---С--*А-----Т-А-С-- 1 _ 2 - - - - - j _д---С--*------Т------- - 1 - - - - - * обозначает пропуск (расхождение) в последовательности, родственной с шимпанзе. предковой последовательности является африканская популяция. Исполь- зуя последовательность шимпанзе, Харрис и Хей оценили, что время ди- вергенции PDHA1 на филогенетическом дереве человека составляет около 1,9 миллионов лет назад. Хотя эти данные не всегда согласуются с данными по мтДНК, объединение информации о структуре мтДНК, PDHA1 и других ядерных генов поможет дать всестороннее представле- ние о происхождении человека. IV. Анализ отцовства и идентификация личности Долгое время определение различий между индивидами (например меж- ду идентичными и неидентичными близнецами) было оновано на прин- ципах классической генетики (Vogel, Motulsky, 1997). Эти принципы ис- пользовались при исследовании различных инбредных линий множества сельскохозяйственных культур (Gorman, Kiang, 1977) и пород (Blott et al., 1999). После открытия маркеров групп крови у человека, стала возмож-
IV. Анализ отцовства и идентификация личности Гаплотип Неафри- Африканский канский Рисунок 9.15. Дерево максимальной экономии для гена PDHA1 и для сайтов, представ- ленных в таблице 9.15. Сайты, имеющие отдельные мутации, обозначены на соответствую- щих ветвях (по Harris, Неу, 1999). ной более точная идентификация личности, в частности анализ предпо- лагаемого отцовства. С открытием высоковариабельных маркеров у ряда организмов генетические исследования стали дополнительным способом идентификации индивидуальных различий, например в судебно-меди- цинской экспертизе при определении виновности подозреваемых лиц. Наиболее известный случай в США - судебный процесс по делу об убий- стве, в котором обвинялся О. Дж. Симпсон. Хотя многие считали доказа- тельства на основе анализа ДНК свидетельствующими против него (Weir, 1995), Симпсон был реабилитирован. а. Анализ отцовства В прошлом, в случаях спорного отцовства (отец ребенка неизвестен или оспаривается) для исключения отцовства или оценки вероятности отцов- ства конкретного лица использовали анализ групп крови, аллоферментов или типирование по локусу HLA. Затем появились более точные методы
[Г452 Глава 9. Молекулярная генетика популяций и эволюция анализа с помощью высоковариабельных маркеров, например последова- тельностей микросателлитной ДНК или ПДРФ-маркеров. Для иллюстрации анализа отцовства рассмотрим локус, который пред- ставлен в популяции только двумя аллелями. Когда используется только один ген, трудно исключить отцовство, поскольку потенциальными отца- ми могут быть многие лица, имеющие неразличимые аллели. Пример ком- бинаций генотипов мать-ребенок и исключающих отцовство генотипов дан в таблице 9.16 для двухаллельного, кодоминантного локуса, такого как MN группы крови или аллоферментный локус. Имея генотипы матери и потомка, можно исключить конкретные генотипы как отцовские. Если ге- нотипы и матери, и ребенка А Д отец может быть либо A Af, либо А А2, и отцовский генотип А,,А2 может быть исключен. В случае двухаллельного локуса можно исключить не более одного генотипа, а когда и мать, и ребе- нок гетерозиготны, не может быть исключен ни один отцовский генотип. Получим вероятность исключения отцовского генотипа для простей- шего случая двухаллельной кодоминантной системы. Таблица 9.16 дает вероятность исключения для каждой комбинации мать-потомок. Напри- мер, когда и мать, и ребенок имеют генотип А{Ар генотип ЛуГ. который имеет частоту р2, может быть исключен. Объединенная вероятность ком- бинации мать-ребенок и отцовского генотипа тогда будет р* р2. Можно рассчитать вероятности для всех возможных комбинаций мать-ребенок, и сумма этих вероятностей будет общей вероятностью исключения дан- ного локуса. Если сложить эти вероятности, то получится общая вероят- ность для Л-того локуса, равная т> 3 2.4 .2 3.3 2. 4.2 3_ = Р\Р1 +PlP2 +PlP2 +PlPl +PlPi +PlPl~ = PiP2[(Pi+ Р2У -(.P1P2 +PiPl)] = = PiP2^-P\P1)- (9.12a) Максимальная вероятность исключения отцовства бывает при р, =р2 = 0,5 и Рг; = 0,1875. Когда аллели существенно различаются по частоте, то вероятность исключения мала, потому что частый (распространенный) аллель распределяется между многими индивидами в популяции. Когда одновременно используется несколько маркеров, то общая веро- ятность исключения отцовства может быть значительно повышена. Веро- ятность исключения ложного отцовства для т независимых генов равна: т Рг = 1-П(1-Р17) (9.12b) А-=1 (Chakraborty et al., 1974). Если имеется 10 двухаллельных локусов с рав- ными аллельными частотами, то ожидаемая вероятность исключения от-
IV. Анализ отцовства и идентификация личности ТАБЛИЦА 9.16. Возможные генотипы и частоты аллелей (в скобках) в двухаллельном, кодоминантном локусе при различных комбинациях мать-ребенок и исключенные отцов- ские генотипы Мать Ребенок Исключенный отцовский генотип Вероятность исключения а.а1(р2) А,А,(Р,) А2А2(РИ Р\ Pi А, А2(р2) а>Чр2Л pIpi А,А,(Р,/2) А2А2(РЬ РуРг А, А2 А, А2 (1/2) - - ЛД;(^2/2) АА^Р.) Pl Р2 АА2 ( р1 ) A, A,(pt) А2А2( р1 ) Р,Р2 АА2(р2) ЛЛ<а2) р2р1 цовства равна 0,875. Но если таких локусов 100 (например в случае од- нонуклеотидных полиморфизмов), (Wang et al., 1998), то эта вероятность будет равна 9,6 х 10~10. При относительно малом количестве пригодных для такого анализа двух- аллельных локусов вероятность исключения отцовства не очень высока. Одно из разрешений этой проблемы - использование высоковариабельных локусов, например гаплотипов HLA или гипервариабельных ПДРФ-марке- ров и микро сателлитной ДНК. Если в локусе п аллелей, тогда: Рг* = Хр,.(1-р,)2 -|ZZ^2<4-3^ ~3р^ <=l i=l iVl (Weir, 1996), и если частота каждого аллеля равна \ i п, то: _ , 2и3 + п1 - 5п + 3 Рг* =1----------5------• п Допустим, имеется 20 локусов с равными частотами аллелей, тогда веро- ятность исключения отцовства равна 0,898, что выше, чем в предыдущем примере. Для наглядности рассмотрим пример из таблицы 9.17, где представле- ны генотипы двух локусов HLA матери, ребенка и двух предполагаемых отцов (Terasaki, 1978). Оба гена HLA-A и HLA-В имеют большое количе- ство аллелей, и гаплотипы, состоящие из этих аллелей можно считать одной единицей, так как вероятность кроссинговера между ними в одном поколении достаточно мала. Очевидно, что гамета матери должна содер- жать гаплотип А1-58, а гаплотип гаметы отца - А11- 512. Предполагае- мый отец 1 не образует таких гамет, поэтому он может быть исключен.
ТАБЛИЦА 9.17. Гипотетические двухлокусные HLA-генотипы матери, ребенка и двух предполагаемых отцов Предполагаемый отец А1 1 517 2 426 В1 Мать АЗ 514 АН В12 АЗ BW44 - АП 512 Al В8 Al В8 (Ребенок) Следовательно, при отсутствии других кандидатов отцом является вто- рой индивид. Если же имеются другие кандидаты на отцовство, то этот вывод не может быть окончательным, а вероятность - точной. На рисунке 9.16 суммированы вероятности отцовства, полученные при анализе гаплотипов HLA-A и HLA-В в 590 случаях спорного отцовства. Полученное распределение вероятностей вполне бимодально: вероятность в одной группе равна 0,0 (отцовство исключено), и вероятность в другой группе варьирует между 0,85 и 1,0. Из всех изученных случаев (Terasaki, 1978), в 25% вероятность отцовства исключена, поскольку равна 0,0 и в 64% вероятность отцовства превышала 0,9. При более детальной иден- тификации аллелей локуса HLA с использованием других последователь- ностей ДНК и большого числа локусов HLA, вовлеченных в гаплотипы, вероятность исключения отцовства заметно возрастает. HLA-гаплотипы использовали также для определения других предполагаемых родствен- ных связей, например поиска прародителей (дедушек и бабушек) у поте- рявшихся аргентинских детей (см. пример 9.8). Пример 9.8. Как отмечалось, до появления других высоковариабельных маркеров для определения отцовства у человека широко применялись вариабельные Ж/1-гаплотипы. При необходимости применение этого подхода можно расширить и для других родственников. Главным стиму- лом для такого расширения стала произошедшая за период 1975-1983 годов пропажа, по крайней мере, 9000 аргентинцев. Среди них было мно- го детей, которые были насильно увезены армией или полицией, или родились у находившихся в заключении женщин. Во многих случаях ро- дители этих детей были среди пропавших аргентинцев, большинство из которых оказались убитыми. Многие из таких детей жили в семьях воен- ных, которые называли себя их биологическими родителями, а в действи- тельности похитили их у заключенных в тюрьмы матерей.
IV. Анализ отцовства и идентификация личности 455 Обоснованная вероятность отцовства Рисунок 9.16. Вероятность отцовства, вычисленная для 590 случаев спорного отцовства при использовании системы HLA (по Terasaki, 1978). Если все четверо прародителей живы, а ребенок имеет гаплотип, кото- рого нет ни у одного из них, то прародительство может быть исключено. Но если гаплотипы ребенка представлены также и у прародителей, то мож- но определить вероятность прародительства (родства). При редкости ис- следуемых гаплотипов в популяции вероятность прародительства может быть вполне высокой. На рисунке 9.17 представлена родословная юной аргентинки Паолы Эвы Логарес - жертвы похищения, подобранной поли- цейским и его женой (Diamond, 1987). В этом случае оба предполагаемых родителя умерли или пропали, ЖЛ-гаплотипы ребенка были обнаружены у предполагаемых прародителей. Один ее HLA гаплотип, А2 - В5, был пред- Семья Логарес 2,5 24,35 25,18 24,40 Семья Гринспен [ 1,5 I 2,35 129,35! 29,27 Клаудио Эрнесто Логарес Моника Гринспон □ 29,35 2,35 Полицейский и его жена Паола Эва Логарес 1,5 2,5 Рисунок 9.17. Родословная (Diamond, 1987), показывающая, как с помощью HLA-гаплоти- пов определено прародительство Паолы Эвы Логарес. (Штрихи обозначают умерших.) Полицейский и его жена отказались от теста на родительство. Для простоты гаплотип А2 - В5 обозначен как 2,5 и т.д.
ставлен у ее дедушки со стороны отца. Генотип ее дедушки со стороны матери (реконструированный через его других детей) содержал другой гап- лотип, А1 - В5. На основании этих данных и вероятности прародительства более 0,999, высоко вероятно, что Паола Эва Логарес - внучка семей Лога- рес и Гринспон. Для определения отцовства можно использовать также маркеры Y-хромосомы, которые наследуются по отцовской линии (патрилиней- но). Для определения материнства можно было бы использовать мтДНК, однако высоковариабельные ядерные маркеры обычно более информа- тивны (Avise, 1994). Поскольку в Y-хромосоме человека рекомбинации не происходит, мультилокусные гаплотипы можно использовать для оп- ределения предка в предыдущих поколениях. Например, относительная гомогенность гаплотипов Y-хромосом у еврейских раввинов (священни- ков) (Thomas et al., 1998) означает, что они происходят от единственного предка, жившего около 2000 - 3000 лет назад. Гаплотипы Y-хромосомы использовали для изучения предполагаемого отцовства президента То- маса Джефферсона у детей одной из его рабынь (см. пример 9.9). Пример 9.9. Одним из наиболее известных примеров определения от- цовства стало использование молекулярных маркеров для оценки отцов- ства Томаса Джефферсона - второго президента Соединенных Штатов, как возможного отца детей одной из его рабынь, Салли Хеммингс (Foster et al., 1998). Подозревали, что Томас Джефферсон являлся отцом, по край- ней мере, двух ее детей: первого сына Томаса (Вудсона), родившегося в 1790, и последнего сына Эстона (Хеммингса), родившегося в 1808. Если Томас Джефферсон был их отцом, тогда мужские потомки этих сыновей (результат неразорванной, от мужчины к мужчине, линии происхожде- ния) должны были иметь такую же Y-хромосому, как Джефферсон, за исключением мутаций. Поскольку у Томаса Джефферсона не было выживших прямых мужс- ких потомков, для установления отцовства использовались Y-гаплотипы его дяди со стороны отца, Филда Джефферсона. В первом ряду таблицы 9.18 показаны информативные аллели двухаллельного маркера, пяти мик- росателлитных локусов и минисателлитного локуса у пяти потомков Фил- да Джефферсона. Кроме того, было исследовано шесть других биаллель- ных маркеров и шесть других микросателлитных локусов. Один из этих пяти потомков отличался от других по одному повтору в микросателлит- ном локусе, вероятно в результате мутации. Во втором и третьем рядах даны Y-гаплотипы потомков двух сыновей Салли Хеммингс, отцом кото- рых подозревали Джефферсона. Y-гаплотип Эстона оказался идентич-
IV. Анализ отцовства и идентификация личности ТАБЛИЦА 9.18. Y- гаплотипы информативных локусов, полученные от мужских потом- ков или потомков родственников по мужской линии президента Томаса Джефферсона, пос- леднего и первого сыновей его рабыни Салли Хеммингс и сыновей сестры Джефферсона (Foster et al., 1998). Тип маркера Биаллельный 1 Микро- сателлит Мини- сателлит 2 3 4 5 Президент Томас Джефферсон 0 15 4 9 10 15 Эстон (последний сын Салли Хеммингс) 0 15 4 9 10 15 л Томас (первый сын Салли Хеммингс) 1 14 5 10 13 13 А Самуель или Питер Карр 1 14 5 10 13 13 А} (сыновья сестры Джефферсона) ным гаплотипу Джефферсона. Вероятность, что это могло быть случай- ностью, очень низка, поскольку «джефферсоновский» тип Y-хромосомы был найден только в этой линии происхождения и не обнаружен ни у одного из 670 других выборочных европеоидных мужчин (Foster et al., 1998). Единственной вероятной альтернативой президенту Джефферсо- ну как отцу мог быть другой родственник с «джефферсоновским» типом Y-хромосомы. Абби и Маршалл (Abbey, 1999, Marshall, 1999) предполо- жили, что отцом Эстона мог быть младший брат президента Джефферсо- на, Рэндольф или любой из пяти сыновей Рэндольфа, с «джефферсонов- ским» типом Y-хромосомы. С другой стороны, Y-генотип мужских потомков первого сына Салли Хеммингс, Томаса (Вудсона), отличается от «джефферсоновского» типа Y-хромосомы по семи маркерам, указы- вая, что Томас Джефферсон, не являлся его отцом. Также утверждалось, что один из сыновей сестры Джефферсона, Самуель или Питер Карр, мог быть отцом первого сына Салли. В последней строке дан тип Y-хромосо- мы родственников, имеющих Y-хромосому Карров; он подходит типу То- маса (Вудсона), за исключением минисателлитного локуса. Ь. Идентификация личности Высоковариабельные маркеры широко используются для идентификации личности (или получения доказательств) в судебных целях (Weir, 1995b). Применение ДНК-технологий при расследовании преступлений помога- ет в идентификации преступников из большого числа подозреваемых и в реабилитации ранее осужденных лиц. Так произошло в случае О.Дж. Симпсона, который был обвинен в убийстве своей жены, Николь Симп-
Г458 Глава 9. Молекулярная генетика популяций и эволюция сон, и Рональда Голдмана. Образцы ДНК этих трех лиц сравнили с образ- цами ДНК пятен крови, обнаруженных на месте преступления. Медико- генетические методы теперь широко используются для расследования торговли мясом животных, принадлежащих к исчезающим видам. В ре- зультате анализа генетических маркеров мясо одного животного - охра- няемого гибрида голубого кита (блювала) и финвала, убитого около Ис- ландии в 1989г., было обнаружено на японском китовом рынке (Ciprano, Palumbi, 1999). В общем, мультилокусное генотипирование высоковари- абельных локусов можно использовать для определения индивидов из различных групп (Davies et al., 1999). Предположим, что соотношения Харди-Вайнберга таковы, что часто- та генотипа в локусе к у гомозигот равна Р = р2, а у гетерозигот - Рк = 2р.р., Тогда для всех исследованных локусов, (если они статистичес- ки не зависимы) частота мультилокусного генотипа равна произведению: т = (9.13а) к Применение этого подхода подтверждает, например, что известная овца Долли получена при клонировании тканей молочной железы ее матери (см. пример 9.10). Использование такого подхода к идентификации индивидов поставило ряд вопросов (Lewontin, Hartl, 1991), которые обсуждались на двух совеща- ниях Национального Исследовательского Совета (National Research Council) (NRC, 1992; 1996). Во-первых, выражение 9.13а предполагает соответствие пропорциям Харди-Вайнберга в каждом локусе и отсутствие ассоциаций между локусами (т.е. нет неравновесия по сцеплению; см. главу 10). Дей- ствительно, большинство популяций человека близко к пропорциям Хар- ди-Вайнберга и к равновесию по сцеплению (между несцепленными ло- кусами). С другой стороны, если используется множество локусов, то значение Р быстро становится маленьким. Сходные расчеты позволили об- винителю по делу Симпсона Марсии Кларк прийти к выводу: «вероят- ность, что случайный человек мог бы оставить профиль (ДНК), обнару- женный на воротах в задней части дома в Банди, равняется 1 из 57 миллиардов» (Weir, 1995b). Учитывая, что на Земле только 5 миллиардов человек, такая низкая вероятность, действительно, исключает предполо- жение о совершении этого преступления каким-либо другим человеком. Пример 9.10. Первое клонированное взрослое млекопитающее, овца Дол- ли, была получена при переносе ядра соматической клетки из ткани мо- лочной железы шестилетней овцы финской дорсетской породы. Поскольку возник вопрос, не была ли Долли получена из клеток эмбриона или заро-
IV. Анализ отцовства и идентификация личности дышевых клеток, у Долли и в популяции дорсетских овец в Шотландии было исследовано 9 полиморфных микросателлитных локусов (Ashworth et al., 1998). В таблице 9.19 даны генотипы Долли и частоты этих геноти- пов в выборке из 44 дорсетских овец с учетом соответствия этих частот пропорциям Харди-Вайнберга. Поскольку генотип Долли по некоторым из этих локусов очень редок, общая вероятность, что ее генотип (и генотип ее матери) получен от другой местной финской дорсетской овцы, равна только 8,9 х 10 '°. Из этого исследования следует, что происхождение Дол- ли от другой финской дорсетской овцы вследствие ошибки эксперимента крайне маловероятно. Более того, вероятность, что Долли была получена из зародышевой клетки своей матери, оплодотворенной неизвестным ба- раном (при этом половина ее аллелей была бы как у Долли), приблизи- тельно равна 10Л Используя ДНК-фингерпринт с несцепленными мини- сателлитными локусами, Сэнджер с сотрудниками (Singer et al., 1998) определили, что вероятность происхождения Долли от другой местной финской дорсетской овцы равна 106. В общем, эти результаты подтверж- дают, что Долли была получена из клетки молочной железы ее матери. Другая проблема таких исследований заключается в сравнении генотипа индивида с генотипами правильной субпопуляционной группы. В случае с Долли (см. пример 9.10) такой группой была выборка овец той же породы в том же стаде. Различия аллельных частот в разных субпопуляциях этничес- кой группы могут быть весьма значительными. Когда определенный инди- вид (особь) сравнивается с представителями своей этнической группы, пар- ность может быть выше. Однако некоторые исследователи считают, что слабая ТАБЛИЦА 9.19. Генотип овцы Долли по девяти микросателлитным локусам и частота генотипов у овец финской дорсетской породы (по Ashworth et al., 1998) Локус Количество аллелей в популяции финских дорсетов Генотип Долли Частоты генотипов в популяции финских дорсетов TGLA53 7 151/151 0,302 SPS115 4 248/248 0,048 TGLA126 7 118/126 0,082 TGKA122 9 190/190 0,005 ЕТНЗ 4 104/106 0,206 ЕТН225 4 148/150 0,025 FCB11 6 124/126 0,036 MAF209 4 109/121 0,194 FCB128 5 208/208 0,240
[Г460 Глава 9. Молекулярная генетика популяций и эволюция подразделенность популяции на субструктуры не имеет большого значения для таких сравнений. Компромисс между этими мнениями был достигнут с помощью модификации выражения 9.13а, или предельного принципа (National Research Council, 1992). При этом максимальная аллельная частота равна 0,10, или верхнему 95%-ному пределу наивысшей частоты аллеля, наблюдаемой в нескольких расовых группах популяции. Не все исследователи считают этот компромисс приемлемым (Weir, 1993; Devlin et al., 1993). Поэтому на втором совещании (National Research Council, 1996) было предложено использовать для определения вероятности парно- сти другие модификации этой формулы. Когда известна структура популя- ции, ожидаемую частоту генотипов определяют следующим образом: Р'= П [Р- + Р, О - Р. Щ VP.Pj (1 - ^57 )], (9.13b) т п где первый член с правой стороны уравнения используется для т гомози- гот, а второй - для п гетерозигот. FST здесь обозначает степень субструкту- ры между основными расовыми группами популяции. Если значение FST больше нуля, то для гомозигот 2р. > р2. + р (1 - р) FST, а для гетерозигот 2р.р. > 2p.p(\-F^). Желательно, чтобы вероятности сравнивались со зна- чением (9.13с) ш п которое всегда больше величины, заданной Р’. Кроме общего подхода для определения вероятностей, совещание постановило, что все значения вероятностей следует сопровождать соответствующими 95%-ными дове- рительными интервалами, а при наличии значительного инбридинга и популяционных субструктур пользоваться другими формулами. Задачи 1. Определите среднюю приспособленность в популяции, имеющей 100 ло- кусов в равновесии с селективной невыгодностью (вредностью) s =s2=0,05, с учетом мультипликативной приспособленности по этим локусам. 2. Предположим, что гетерозиготность мышей по Х-сцепленным мик- росателлитным локусам равна 0,58, и, что для аутосомных микроса- теллитных локусов она равна 0,65. Используя рассуждения в при- мере 9.1, определите, согласуются ли эти величины с величинами, прогнозируемыми моделью неограниченного числа (множества) ал- лелей или моделью пошаговых мутаций? 3. Объясните, почему по модели нейтральности скорость аллельных за- мен не зависит от размера популяции. Если скорость аллельных за- мен равна I0 5, то каково ожидаемое время между новыми заменами?
Задачи 461 4. Предположим, что аминокислотная последовательность генов гло- бина в двух организмах различается по 30 из 100 сайтов, и что оце- ночное время с момента дивергенции составляет 200 миллионов лет. Каково значение К , его стандартная ошибка и k 2 5. Допустим, что нуклеотидные последовательности в двух гомоло- гичных генах двух организмов различаются по 200 из 500 сайтов, и, что оценочное время с момента их дивергенции равно 5 миллионов лет. Каково значение К, его стандартная ошибка и к‘? 6. Суммируйте данные для трех позиций кодонов в таблице 9.3 и рассчи- тайте общее количество нуклеотидных замен. Чем полученные резуль- таты отличаются от вычисленных для каждой позиции отдельно? 7. Объясните, почему выражение 9.5 верно. 8. Какова вероятность, что два аллеля сошлись (коалесцировали) 10 поко- лений назад в популяции с размером N = 50? Каково ожидаемое время в популяции с N = 5, когда имеются 10, 5 и 2 линии происхождения? 9. Имея последовательность из пяти кодонов CATAGGTCAATGTGT, определите количество потенциально синонимичных сайтов, не пользуясь таблицей 9.5. Если две последовательности имеют два кодона ССТТТТ и САТТСС, то каково среднее число наблюдаемых синонимичных различий. 10. В выборке 2N= 100 три аллеля наблюдаются с частотами 0,48, 0,35 и 0,17. Какова наблюдаемая гетерозиготность, согласно равновесию Харди-Вайнберга? Отличается ли она от гомозиготности, ожидаемой согласно теории нейтральности? (Решите уравнение 9.8 для п = 3). 11. Каковы ожидаемые величины для замен, данных в таблице 9.9? Срав- ните наблюдаемые и ожидаемые значения и объясните различия. 12. Постройте дерево, показанное на рисунке 9.12а с помощью метода НПГМ и данных из таблицы 9.11. 13. Предположим, что определены первые три таксона, представлен- ные в таблице 9.14, а четвертый таксон замещен на другой, имею- щий последовательность ATATTGC. Определите информативные сайты и постройте наиболее экономичное дерево. 14. Предположим, что имеется два аллеля с частотами 0,82 и 0,18. Ка- кова вероятность исключения отцовства? Почему она так низка? Ка- кова вероятность исключения отцовства, если имеется 20 идентич- ных локусов? 15. Из данных таблицы 9.19, рассчитайте вероятность мультилокусного генотипа для Долли. Можете ли Вы придумать другое объяснение, кроме того, что она была произведена клонированием. Почему у Долли тот же генотип по тем же локусам, что и у ее матери?
ГЛАВА 10 МУЛЬТИЛОКУСНЫЕ МОДЕЛИ Приспособленность в одном локусе, вырванная из контекста ее взаимодействия, почти также относится к реальным проблемам эволюционной генетики, как изу- чение психологии индивида, изолированное от его общественного контекста, мо- жет служить пониманию социополитической эволюции человека. В обоих случа- ях контекст и взаимодействие это не просто второразрядные эффекты, которые следует наложить на первичный монодиальный анализ. Контекст и взаимодей- ствие составляют сущность. Ричард Левонтин (Richard Lewontin) (1974) Для каждой сложной задачи существует простое решение, и оно обычно непра- вильное. Х.Л.Менкен (H.L.Mencken) Мы предположили в более раннем обсуждении, что передача аллелей дан- ного локуса не зависит от аллелей других локусов (независимая сорти- ровка - ассортативность), и что приспособленность генотипов в данном локусе не зависит от приспособленностей генотипов в других локусах. Эти упрощения были использованы во многих эволюционных контекстах и, может быть, во многих случаях были правильны. Однако, анализ ин- тенсивной генетической изменчивости на молекулярном уровне, осо- бенно вариаций нуклеотидных последовательностей внутри генов, пред- полагает зависимость генетических вариантов друг от друга. В этой главе речь идет о разных нуклеотидных локусах, но такие же подходы можно использовать при исследовании изменчивости различных нуклеотидных сайтов. К тому же, оказалось, что существуют паттерны генетической изменчивости по хромосомам, т.е. для некоторых участков хромосом ха- рактерна более высокая частота рекомбинаций и более высокая изменчи- вость, чем для других участков. Чтобы определить потенциальные силы, действующие на различные локусы или различные сайты, нужно прогно- зировать сохранение и динамику генетической изменчивости с учетом взаимодействия нескольких локусов, в частности частоты рекомбинаций между локусами. По мере получения новых данных о последовательнос- тях, понимание сложностей мультигенных (мультилокусных) систем бу- дет иметь все большее значение для интерпретации этих данных. Более того, детальное исследование нуклеотидных последовательностей помо-
I. Понятие о гаметическом неравновесии 463 жет понять структуру и организацию генома, а также влияние на геном различных эволюционно-генетических факторов. С картированием генома человека возрос интерес к обнаружению ге- нетических вариантов, вызывающих наследственные болезни. Был пред- ложен метод определения степени статистической ассоциации между боль- шим количеством однонуклеотидных полиморфизмов (single nucleotide polymorphisms, SNPs) и индивидами как пораженными заболеванием, так и здоровыми в контрольной группе (Kxuglyak, 1999). Различия между эти- ми двумя группами в вариантах маркерных локусов указывают на воз- можную локализацию варианта, вызывающего заболевание. Авторы пер- вых больших исследований (Cargill et al., 1999; Halushka et al., 1999) разработали основные молекулярные методы для этого подхода и показа- ли, что для локализации полиморфизма необходима очень высокая плот- ность маркеров, и что потенциальные варианты заболеваний могут быть специфичны для определенных популяций. Когда генетическая изменчивость в двух или более локусах рассматри- вается одновременно, то недостаточно знать аллельную частоту каждого локуса. Вместо этих величин нужно использовать мультилокусные гамети- ческие частоты, так как возможна гаметическая ассоциация аллелей внут- ри гаметы. При рассмотрении мультилокусных систем центральное место занимают эволюционные факторы, которые влияют на гаметические час- тоты и гаметическое неравновесие (gametic disequilibrium) (часто назы- ваемое неравновесное сцепление, или неравновесие по сцеплению; linkage disequilibrium) - неслучайную ассоциацию аллелей в разных ло- кусах гамет. Как мы увидим, все эволюционные факторы - отбор, инбри- динг, генетический дрейф, генный поток и мутирование - могут влиять на гаметические частоты и неравновесие. Кроме того, степень гаметического неравновесия зависит от частоты рекомбинации между локусами. После обсуждения эволюционных сил, влияющих на неслучайные ассоциации между локусами, мы познакомимся с некоторыми методами оценки гаме- тического неравновесия. Неравновесие по сцеплению (в случайно скрещивающейся популяции) обычно наблюдается только для очень тесно сцепленных локусов или нуклеотидных сайтов. Основными факторами, обеспечивающими нерав- новесие по сцеплению для таких локусов являются, по-видимому, гене- тический дрейф и мутирование, тогда как рекомбинация между локусами встречается очень редко. Генетическое расстояние, при котором поддер- живается неравновесие, вероятно варьирует в зависимости от генетичес- кого региона, но у человека оно обычно не превышает нескольких тысяч пар нуклеотидов (Kruglak, 1999; Huttley et al., 1999).
Глава 10. Мультилокусные модели Взаимодействие между приспособленностью в одном локусе и при- способленностью в других локусах характеризует величина приспособ- ленности для каждого мультилокусного генотипа. При обсуждении муль- тилокусного отбора мы изучим эпистаз - взаимодействие величин приспособленностей в разных локусах, и исследуем это явление для га- метического неравновесия и эволюционного процесса. I. Понятие о генетическом неравновесии Вскоре после открытия принципа Харди-Вайнберга, Вайнберг (Weinberg, 1909) отметил, что в случайно скрещивающейся популяции аллели двух локусов достигают случайной ассоциации только асимптотически (при- ближенно). Вскоре после этого (Jennings 1917, Robbins 1918) была опре- делена действительная мода приближения к равновесным частотам для двухлокусной модели. Поскольку скорость приближения к случайной ас- социации снижена сцеплением, эту неслучайную ассоциацию назвали неравновесным сцеплением (Lewontin,Kojima,1960). Однако, этот термин не вполне точен, поскольку вовлеченные локусы могут быть и не сцепле- ны (т.е. находиться на разных хромосомах), но неравновесны по сцепле- нию. Так как мы касаемся неслучайной ассоциации внутри гамет, на ко- торое может влиять сцепление, а также и другие факторы, мы используем термин гаметическое неравновесие [сокращение термина гаметическое фазовое неравновесие - gametic phase disequilibrium, Кроу и Кимура (Crow, Kimura, 1970)]. ТАБЛИЦА 10.1. Гаметы, аллели и их частоты для двухлокусной двухаллельной модели Гамета Частота Аллель Частота Аф, Г Ф Pl=Xl + Х2 Х2 А2 Р.~Х,~Г X, вх Ру=хх+ху Х4 Р<=Х2 + Х4 Предположим, что большая, случайно скрещивающаяся популяция с дискретными поколениями сегрегирует по двум аллелям в локусе А, ска- жем Ах и А2 и двум аллелям в локусе В: Вх и В2 Частоты четырех возмож- ных гамет, значения х, и частоты четырех аллелей даны в таблице 10.1. Заметьте, что р, и q} использованы для обозначения частоты А ий,, соот- ветственно, р} + р2 = 1, qx + q2 = 1 и Zx. = 1. Если ассоциация между алле- лями внутри гамет случайна, то частота каждой гаметы равна произведе- нию частот аллелей, которые она содержит:
I. Понятие о гаметическом неравновесии 465 x2=Ptq2, хз хд =т- Частоту гамет можно определить, исходя из аллельных частот. Если ассо- циация этих аллелей в гаметах неслучайна, то их гаметические частоты - это функции ожидаемых частот и отклонения (D), обусловленного неслу- чайной ассоциацией аллелей внутри гаметы (таблица 10.2): х, =plql +D, Х2 =Р&2-0’ Х3=^1“£>’ (10Л) Х4 =W2 +D- Из этих уравнений очевидно, что можно полностью охарактеризовать двухлокусную, двухаллельную систему в случайно скрещивающейся по- пуляции, зная или три гаметические частоты (скажем хрх и ху потому что х4 = 1 - х - х - х3) или частоту аллеля в обоих локусах и ассоциацию между ними (скажем ру q, и D). Оба эти подхода требуют трех парамет- ров вместо двух, таких как р. и q., что необходимо, если аллели в двух локусах не ассоциированы. ТАБЛИЦА 10.2. Частоты четырех возможных типов гамет при наличии в каждом из двух локусов двух аллелей л, а2 5, \=р^+п x^p^-D qt Xl=PAl-D X4=P2<12+D <6 P, P2 1 Отклонение, D - это параметр гаметического неравновесия Левонти- на и Коджимы (Lewontin, Kojima, 1960) и мера отклонения от случайной ассоциации между аллелями в разных локусах, как определено уравне- нием: D=xx-pYqx (10.2а) или наблюдаемая частота аллеля минус ожидаемая частота при случай- ной ассоциации аллелей в гамете А151 При подстановке рх и q. из табли- цы 10.1 можно записать это выражение в виде:
Й66 Глава 10. Мультилокусные модели D = х,х4 - хгхг (10.2b) Из выражения, записанного таким образом, ясно, что D - это произведе- ние частот гамет в фазе притяжения минус произведение частот гамет в фазе отталкивания. Термины притяжение и отталкивание (coupling and repulsion) происходят от родительских гаметических типов в дигибрид- ном скрещивании. Здесь они употребляются для комбинации аллелей с одинаковыми (притяжение) или разными (отталкивание) индексами. Как степень гаметического неравновесия и частота двулокусных гамет изменяются со временем? Для определения этих изменений через одно по- коление, воспользуемся таблицей 10.3, где приведены десять возможных ге- нотипов, их биномиальные частоты и пропорции различных типов потом- ков, которые они производят. Генотипов десять, потому что существует два типа двойных гетерозигот притягивающихся (ЛД//4252) и отталкивающихся генотипов. Отметим, что генотипы Ар/А^ продуцируют толь- ко гаметы А,В. и что генотипы A]BJAyB2 образуют уЛД и уА,В2 гамет. У двойных гетерозигот в результате рекомбинации образуются гаметы, отлич- ные от родительских гамет. Например, гаметы ДД и А2В, могут получиться в результате рекомбинации от индивидов с генотипом А ХВХ/А^В2. Частота ре- комбинации между локусами А и В обозначается символом с и принимает значения от 0, в отсутствии рекомбинации, до 0,5, при независимой комби- нации. Так как частота индивидов с генотипом АХВ}/А2В2 в популяции равна 2Х|Х4, а пропорция рекомбинантных гамет равна с, то получим пропорции гамет с генотипами А.В., и А2В., показанные в пятом ряду таблицы 10.3. Мы можем найти частоту гамет в следующем поколении, суммируя каждую колонку (ряд). Например, частота гамет А{ВХ равна: х'[ = Х2[ + XjX2 + Х,Х3 + (1 - с) Х[Х4 + CXjXj = =х1(х1 + Х2 + Х3 + х4) - c(XjX4 - х/3) = = х1-сГ)0, (10.3а) где £>0 - исходное значение генетического неравновесия. Частоты других гамет могут быть получены таким же образом и даны внизу таблицы 10.3. Значение D через одно поколение составит: =х'1х'4-х,Х3 = = (*! - С^0)(Х4 “ С£>О) “ (Х2 + С£)О)(Х3 + С£>о)- Упрощая, получим: =(1-с)Г>0. Это простое возвратное отношение принимает вид: D={\-cyD№ (10.3b) где Dt - значение D в i-том поколении.
I. Понятие о гаметическом н ТАБЛИЦА 10.3. Частоты особей разных генотипов, и ожидаемая пропорция гамет, обра- зованных в их потомстве. Каждый из локусов имеет два аллеля Генотипы Частоты Гаметы потомства AA A2B, A2B2 АЫАЛ XA - - - АЫАзВ1 2x,x2 X\X2 X,X2 - - A,B2/A,B2 x2 - - Afi№ 2x,x3 v3 - V3 - A,B,/A2B2 2X1X4 (1 -С>|Х4 CX,X4 cx,x4 (1 -c)xtx4 A>B2iA2Bl 2хЛ CX2Xy (1 -e)x2x3 (1 -c)x2xy CX2X3 AfiJA^ 2хЛ - - X2X4 A2B\^A2B\ XA - - x'\ - А^АЛ, 2хзхз - - V4 V4 a2b2/a2b2 - - - 1 > '1 = Х! 'A X'2=X2+CD. X'3=X3+CD<2 X'4 = x. - cD0 Заметьте, что изменение гаметических частот может происходить толь- ко через рекомбинацию у двойных гетерозигот. С биномиальными про- порциями генотипов только 2(Х[Х4 + х2х3) гамет являются потенциальны- ми рекомбинантами. При рекомбинации у простых или двойных гомозигот получаются одинаковые гаметы. D имеет значение 0,25, когда образуются только гаметы в фазе притя- жения, х( = х4 = 0,5. Рисунок 10.1 - пример изменения неравновесия во времени при Z>0 = 0,25; он показывает, как уровень рекомбинации влияет на геометрическое падение гаметического неравновесия. При отсутствии сцепления (с = 0,5) большая часть неравновесия теряется за пять поколе- ний, тогда как при тесном сцеплении значительная пропорция от исход- ного неравновесия остается еще и через 25 поколений. Например, при с = 0,001 через 25 поколений теряется только около 2,5% величины не- равновесия. Примыкающие или близко расположенные молекулярные маркеры рекомбинируют так, что какая-то доля неравновесия остается в течение многих поколений. Чтобы определить, сколько времени потребуется для снижения D до данной величины D*, можно решить уравнение 10.3b для ряда поколений: _ In у " 1п(1-с) ’ (10.3с)
Рисунок 10.1. Снижение гаметического неравновесия для разных частот рекомбина- ции (с). гдсу = D*/D и t - количество поколений, пока неравновесие не достигнет величины D*. Например, если частота рекомбинации между локусами равна 10% (с = 0,1), то время снижения исходного неравновесия наполо- вину (х = 0,5) равно 6,6 поколений, а время 95%-ного снижения неравно- весия составит 28,4 поколения. Частота рекомбинации, с, обычно оценивается как пропорция реком- бинантных гамет, образованных родителем с известным (или подразуме- ваемым) составом гамет. Когда два локуса близки друг к другу, число еди- ниц генетической карты между локусами равно 100с. Однако, когда локусы довольно далеки, между ними могут произойти множественные реком- бинации, приводя к уменьшению явных нерекомбинантов. Частота рекомбинации может варьировать в результате ряда факторов (см. пример 10.1 для данных, показывающих значительную вариацию ча- стоты рекомбинаций в сперме от различных индивидов). Кроме того, ча- стота рекомбинаций зависит от пола. У самцов некоторых организмов, таких как Drosophila или Bombyx, рекомбинации не происходят, а у чело- века уровень рекомбинации у женщин может быть на 70% выше, чем у мужчин (Morton, 1991). Для согласования этих различий с может быть замещена на величину C = (c/+cJ/2’ где cf и ст значения рекомбинации у женщин и мужчин, соответственно. У организмов, где рекомбинация происходит только у одного пола, ско-
I. Понятие о гаметическом неравновесии 469 рость приближения к равновесию равна половине скорости приближе- ния у организмов с рекомбинацией у обоих полов. Для Х-сцепленных генов и гапло-диплоидных организмов (нет рекомбинации у самцов) темп снижения более сложный, так как гаметические частоты у разных полов могут различаться (Bennet, Oertel, 1965). Пример 10.1. Степень рекомбинации может изменяться в результате ряда факторов (Robinson, 1996). Рекомбинация часто варьирует между двумя полами: обычно более высокая рекомбинация у самок, чем у самцов. На- пример, в теломерных и центромерных участках Х-хромосомы у D.melanogaster скорость рекомбинации на миллион пар нуклеотидов зна- чительно ниже, чем в остальных участках хромосомы (Charlesworth, 1996). К тому же, по-видимому, существуют горячие точки рекомбинации, когда скорость рекомбинации на миллион пар нуклеотидов сильно повышена (Shiroishi et al., 1993). Отбор по рекомбинации может изменить скорости рекомбинации (см. Brooks, 1988), а ряд факторов окружающей среды мо- жет влиять на уровни рекомбинации (Robinson, 1996). Ю и соавторы (Yu et al., 1996), при исследовании больших образцов спермы у каждого из пяти мужчин, показали, что может быть значитель- ная индивидуальная изменчивость в скорости рекомбинации (таблица 10.4). Действительно, они обнаружили двукратное различие в скорости рекомбинации между донором 5001 (0,112) и донором 5043 (0,051), у каж- дого обследовалось большое количество отобранной спермы. Чтобы оп- ределить, является ли различие в скорости рекомбинации у этих двух мужчин закономерным, они исследовали два других маркера на хромосо- ме 19. В 336 сперматозоидах от каждого донора оценочная скорость ре- комбинации для донора 5001 была 0,202 ± 0,045 и для донора 5043 была 0,175 ± 0,036. Снова у донора 5001 скорость рекомбинации была выше, но это различие статистически незначимо. Хотя индивидуальные скорос- ти рекомбинации для отдельных особей и полов можно усреднить, такие высокие индивидуальные вариации частоты рекомбинаций могут иметь большое значение, особенно для тесно сцепленных генов. Хотя величина D как мера гаметического неравновесия удобна с ал- гебраической точки зрения, она варьирует как функция частот составля- ющих аллелей. Максимум и минимум, равные 0,25 и -0,25, имеют место только при равенстве аллельных частот, и они меньше, когда аллельные частоты не равны 0,5. Например, если аллели A j и В}, Л2 и В2 при х, = 0,1 и х4 = 0,9 полностью ассоциированы, то D = 0,09. Поэтому были предло- жены другие, хотя и не идеальные, меры гаметического неравновесия (Hedrick 1987b; Lewontin, 1988).
Глава 10. Мультилокусные модели ТАБЛИЦА 10.4. Оценка скорости рекомбинации (с) между двумя микросателлитными маркерами D6S291 и D6S109 на хромосоме 6 у пяти мужчин - доноров спермы (Yu et al., 1996). N- количество обследованной спермы, стандартная ошибка (ст.о.) оценки скоро- сти рекомбинации дана в скобках Донор N с (ст. о.) 5001 743 0,112 (0,012) 5012 190 0,109 (0,024) 5033 1312 0,066 (0,007) 5043 808 0,051 (0,008) 5048 127 0,071 (0,024) Общая 3180 0,076 Левонтин (Lewontin, 1964а) предложил параметр D', который равен: ,)=Д^- (Ю.4а) ^тах где Z) - максимальное значение D, возможное для данного набора алле- лей в двух локусах. D равно меньшему из p,q2 или р q (если D положи- тельно) или меньшему из p{q{ или p?qv (если D отрицательно). Преиму- щество этой величины в том, что она измеряется в пределах от -1,0 до 1,0, независимо от аллельных частот в двух локусах. Квадрат коэффициента корреляции (10.4Ь) 2 D2 г =-------- PdWli использовался Хиллом и Робертсоном (Hill, Robertson 1968) для измерения гаметического неравновесия (также используется коэффициент корреля- ции, и г - квадратный корень выражения 10.4b с тем же знаком, что и D). Когда в обоих локусах аллельные частоты одинаковы, г2 принимает значе- ния в пределах от 0,0 до 1,0, и г принимает значения от -1,0 до 1,0. Когда в двух локусах аллельные частоты различны, пределы значений г2 и г несколь- ко ниже. Поскольку и D', и г - функции D (знаменатели этих значений не изменяются, если отбор или другие факторы не воздействуют на аллель- ные частоты), они также снижаются экспоненциально, равно как D, т.е. как функция (1 - с)'. В примере 10.2 показано наблюдаемое снижение величи- ны D' для двух аллоферментных локусов у D.melanogaster. Пример 10.2. Для наблюдения снижения ассоциаций между аллелями маркерных локусов внутри хромосомы Клэгг с сотрудниками (Clegg et
I. Понятие о гаметическом неравновесии al., 1978b; 1980) провели эксперименты на D.melanogaster. На рисунке 10.2 показан пример для аллелей двух аллоферментных локусов Idh и Pgm, располагающихся на второй хромосоме на расстоянии 16.2 единиц карты. В этом случае наблюдаемое неравновесие между поколениями 10 и 15, измеренное через О', близко к нулю, тогда как прогнозированное теоретическое снижение (обозначено ровной линией) оказалось значи- тельно ниже. Существенно, что полная и быстрая рандомизация аллелей в маркерных локусах проходила в более быстром темпе, чем прогнозиро- валось теорией нейтральности. Авторы объяснили различия между тео- ретическим прогнозом и экспериментальными наблюдениями тем, что неизвестные локусы, подвергающиеся отбору, находятся в равновесии с маркерными локусами (в эксперименте с Drosophila). Последующий ана- лиз (Clegg, 1978; Asmussen, Clegg, 1982) продемонстрировал, что скорость снижения равновесия для нейтральных локусов обычно ускоряется отбо- ром в ассоциированных с ними локусах. Рисунок 10.2. Наблюдаемое снижение гаметического равновесия (£>') между двумя алло- ферментными локусами и теоретическое снижение равновесия в отсутствие отбора (по- казано ровными линиями (по Clegg et al., 1980). Даны по два репликата (копии) гамет полного притяжения и полного отталкивания.
Глава 10. Мультилокусные модели В таблице 10.5 даны значения гаметического неравновесия для несколь- ких комбинаций гаметических частот. Заметьте, что значение D сильно зависит от гаметических частот и при р, г 0,5, либо qt 0,5, его макси- мальное значение сильно снижено. С другой стороны, D' принимает зна- чения в тех же пределах, независимо от аллельных частот. Когда аллель- ные частоты в двух локусах различны, то диапазон значений г2 и г также зависит от аллельных частот. Например, когда pt = 0,1 и q.t = 0,5 (внизу таблицы 10.5), максимальные значения Dur2 равны только 0,05 и 0,111, соответственно, тогда как максимальное значение D' равно 1,0. ТАБЛИЦА 10.5. Различные значения гаметического неравновесия при разных частотах гамет Аллельные частоты Гаметические частоты Параметры гаметического неравновесия xl Х2 хз Х4 D г2 Г D’ 0,5 0,0 0,0 0,5 0,25 1,0 1,0 1,0 0,4 0,1 0,1 0,4 0,15 0,36 0,6 0,6 px=qx = 0,5 0,25 0,25 0,25 0,25 0,0 0,0 0,0 0,0 0,1 0,4 0,4 0,1 -0,15 0,36 -0,6 -0,6 0,0 0,5 0,5 0,0 -0,25 1,0 -1,0 -1,0 0,9 0,0 0,0 0,1 0,09 1,0 1,0 1,0 pf = qt = 0,9 0,85 0,05 0,05 0,05 0,04 0,198 0,445 0,444 0,81 0,09 0,09 0,01 0,0 0,0 0,0 0,0 0,0 0,9 0,1 0,0 -0,09 1,0 -1,0 -1,0 Р, = ч2 = 0,9 0,05 0,85 0,05 0,05 -0,4 0,198 -0,445 -0,444 0,09 0,81 0,01 0,09 0,0 0,0 0,0 0,0 = 0,1, 0,1 0,0 0,4 0,5 0,05 0,111 0,577 1,0 = 0,5 0,05 0,05 0,45 0,45 0,0 0,0 0,0 0,0 Асмуссен и сотрудники (Asmussen et al., 1987) исследовали значение ассоциации между цитоплазматическим геном (либо мтДНК, либо хлДНК) и ядерным геном (см. также Basten, Asmussen, 1997). В простейшем слу- чае для двух цитоплазматических аллелей, М и Мг, и двух ядерных ге- нов, А и ,1,, ядерно-цитоплазматическое неравновесие между аллелями равно: Dc =
I. Понятие о гаметическом неравновесии 473 где %! - частота гаметы МХАХ и т}- частота митохондриального аллеля М}. Поскольку цитоплазматические и ядерные гены не сцеплены, то ядерно- цитоплазматическое неравновесие быстро снижается с той же скоростью, что у несцепленных ядерных генов и через t поколений останется у'от исходного неравновесия. Однако измерение ядерно-цитоплазматическо- го неравновесия у недавно полученных гибридов можно использовать для определения типов скрещиваний и для обратных скрещиваний в связи с наследованием цитоплазматических генов по материнской линии (см. пример 10.3 о гибридах древесных лягушек.) Пример 10.3. Ассоциация между аллелями мтДНК или хлДНК и ядер- ными генами особенно полезна при идентификации типов гибридных скрещиваний между группами, такими как тип 1 самка х тип 2 самец, или наоборот, из-за разного наследования цитоплазматических (обычно ма- теринского) и ядерных (от обоих родителей) генов. Лэм и Эвайс (Lamb, Avise 1986) изучили мтДНК и аллоферментные варианты у предполагае- мых гибридов двух видов древесных лягушек, Hyla cineras и H.gratiosa, которые часто скрещиваются в одних и тех же прудах. Обычно, самцы H.cineras зовут самок с возвышенных мест (кочек) на берегах прудов, а самцы H.gratiosa - с поверхности воды, и самки собираются в эти пруды для спаривания. Однако в некоторых местах обитания нет возвышенных мест (кочек), поэтому самцы H.cineras зовут самок на уровне земли на берегу и, по-видимому, спариваются с самками обоих видов, H.cineras и H.gratiosa, когда они направляются в пруды. H.cineras и H.gratiosa диагностически различаются по нескольким мтДНК-полиморфизмам рестрикционных сайтов и по аллелям несколь- ких аллоферментных локусов. Например, для мтДНК и локуса альбумина, чистые H.cineras имеют генотип МсАсАс и чистые H.gratiosa - MgAgAg, где индексы с и g обозначают аллели двух локусов. В таблице 10.6 даны час- тоты шести различных генотипов в выборке из 142 особей, считающихся по происхождению гибридами (163 особи, оказавшиеся чистыми видо- выми типами исключены из данных, представленных у Asmussen et al., 1987). Так как существует генотипическая ассоциация между мтДНК и локусом альбумина, рассчитаны три значения неравновесия, по одному для ассоциации каждого генотипа с Л/(Asmussen et al., 1987). Эти значе- ния, которые равны наблюдаемым генотипическим частотам минус ожи- даемые частоты (внизу таблицы 10.6), показывают, что существует избы- ток чистых видовых типов, Мс Ас Ас и М Ag А . К тому же, существует избыток генотипа MgA(A (D2 отрицательно), что ожидается из скрещива- ний между самцами H.cineras и самками H.gratiosa и подтверждается на- блюдениями за их поведением.
Глава 10. Мультилокусные модели ТАБЛИЦА 10.6. Частоты генотипов для аллелей мтДНК и локуса альбумина у трех лягу- шек-гибридов между Hyla cineras и H.gratiosa (по Lamb, Avise, 1986) Альбумин А А С с АА < g А А g g мтДНК ч 0,162 0,077 0,035 0,274 м 0,141 0,380 0,202 0,725 0,303 0,457 0,239 Dt = 0,162 - (0,274)(0,303) = 0,079 Г),- 0,077 - (0,457)(0,274) = -0,048 £>, = 0,035 - (0,239)(0,274) = -0,030 II. Гаметическое неравновесие, инбридинг, генетический дрейф, генный поток и мутации Когда в популяции наблюдается гаметическое неравновесие, его часто приписывают какому-либо типу мультилокусного отбора. Это предполо- жение не верно, потому что на гаметическое неравновесие может дей- ствовать ряд факторов. Как будет показано в следующем разделе, реком- бинация влияет на скорость (темп) достижения гаметического равновесия, хотя и не является непосредственной причиной такого неравновесия. Сход- ным образом, инбридинг или репродуктивная система также могут за- медлить приближение к гаметическому равновесию. Помимо мультило- кусного отбора, гаметическое неравновесие обусловливают и другие факторы, например генетический дрейф, генный поток, мутации и гене- тический хичхайкинг (hitchhiking). Сначала мы обсудим эти факторы (кро- ме генного потока, который будет рассматриваться позже), а затем вер- немся к обсуждению мультилокусного отбора. а. Инбридинг или репродуктивная система Когда степень инбридинга невелика, то он действует на скорость наруше- ния гаметического неравновесия таким же образом, как сцепление генов. Однако, сходство воздействий сцепления и инбридинга (самооплодотво- рения) на асимптотическую скорость нарушения неравновесия не гово- рит о процессе в целом. Основы этих двух воздействий совершенно раз- личаются в том, что при низкой частоте рекомбинаций небольшое число рекомбинантов формируется из двойных гетерозигот. С другой стороны, высокой уровень инбридинга в форме самооплодотворения ведет к ре- дукции (уменьшению) пропорции двойных гетерозигот, из которых впос- ледствии формируются рекомбинанты.
II. Гаметическое неравновесие и инбридинг 475 Вейр с соавторами (Weir et al., 1972) вывели асимптотическую ско- рость нарушения (снижения) гаметического неравновесия в зависимости от пропорций самооплодотворения (5) и рекомбинации (с): (10.5а) где Л = 1 - 2с, так что пропорции самооплодотворения и рекомбинации соизмеримы, т.е. диапазон их значений меняется от 0,0 до 1,0. Чтобы по- казать эквивалентность этих величин при 5 = 0 (случайное скрещивание), воспользуемся выражением 10.5а: D(+1 = 4(1 + Л)Д. Если два гена сортируются (группируются) независимо друг от друга, то с = 0,5 (Л = 0) и Г>,+1 = 4(1+ 5)0,. Если имеется и частичное самооплодотворение, и сцепление, то совмест- но они могут снизить темп нарушения неравновесия почти до остановки, как показано на рисунке 10.3 при с = 0,1. При тесном сцеплении генов и высокой частоте самооплодотворения полупериод нарушения неравно- весия чрезвычайно длителен, например при 5 = 0,99 и с = 0,01 для сниже- ния неравновесия наполовину требуется 3570 поколений. Влияние частичного самооплодотворения на запаздывание снижения гаметического неравновесия зависит также от исходных генотипических частот, которые не включены в выражение 10.5а. Например, если D = 0,25, то все индивиды в популяции могут иметь генотипы АХВ{/А2В2, или половина из них имеет генотипы А{В /А{В\ и половина - генотипы А2В2!А2В2, (как показано на рисунке 10.3), или возможны пропорции: 0,25 A^BJA^B^, 0,50 А В}/А^2 и 0,25 А2В2!А2В2. При случайных скрещиваниях эти соотношения достигают пропорций Харди-Вайнберга за одно поко- ление, но при высокой доле самооплодотворения для достижения инб- редного равновесия требуется несколько поколений. Это нарушение га- метического неравновесия описывается выражением 10.5а. К тому же, соотношения генотипов по двум локусам при инбредном равновесии нельзя представить как просто произведение пропорций ге- нотипов по одному локусу (Haldane, 1949). Действительно, инбридинг приводит к избытку и двойных гетерозигот, и двойных гомозигот и к недостатку двухлокусных, простых гетерозигот по сравнению с одно- локусными (этот эффект был назван неравновесной идентичностью [Weir, Cockerman, 1973]). Считают (Bennett, Binet, 1956), что этот эф-
Рисунок 10.3. Нарушение (снижение) гаметического неравновесия при различных про- порциях самооплодотворения (5), когда с = 0,1. фект измеряется степенью различия (cZ) между равновесной частотой двойных гетерозигот и произведением двух равновесных однолокусных гетерозиготностей. На рисунке 10.4 показаны эти различия для разных значений S и с. Очевидно, что наибольший избыток двойных гетерозигот наблюдает- ся при тесном сцеплении и самооплодотворении в пределах от 0,6 до 0,8. Для несцепленных локусов и при низких уровнях инбридинга этот избы- ток невелик. Когда инбредные и неинбредные индивиды скрещиваются случайным образом, возникают новые ассоциации генотипов. Более того, если у инбредных индивидов более низкая гетерозиготность и более низ- кая приспособленность, чем у аутбредных особей, подверженных инб- редной депрессии, то это может привести к ассоциации гетерозиготности и приспособленности (Ledig et al., 1983; Hedrick, 1990b; см. также Charlesworth, 1991). У некоторых видов часть потомства образуется бесполым путем (апо- миктически) и в этом случае нет возможности для рекомбинации. Если предположить, что А - доля потомства от бесполого размножения и (1 - А) - доля потомства от случайных скрещиваний, то значение асимп- тотического снижения гаметического неравновесия, как и при случайных скрещиваниях (Hedrick, 1990b), равно: D, =[l-c(l-<Z)0. (10.5b)
II. Гаметическое неравновесие и инбридинг Рисунок 10.4. Различия (d) между равновесными частотами двойных гетерозигот и про- изведения равновесных однолокусных гетерозиготностей для нескольких уровней реком- бинации и степеней самооплодотворения (Hedrick, 1990). При А = 0 Dt = (1 - с)! Do, при А = 1,0 изменений гаметического неравнове- сия не происходит. Если два локуса сортируются случайно (с = 0,5), тогда значения А эквивалентны по эффекту: (1 - 2с). Однако, если исходные частоты генотипов не соответствуют соотношениям Харди-Вайнберга, тогда темп нарушения гаметического равновесия будет изменяться. Ь. Генетический дрейф Мультилокусные модели для популяций с ограниченной численностью показали, что неслучайные ассоциации могут возникать между аллелями в различных локусах в результате генетического дрейфа. Влияние гене- тического дрейфа становится более значительным, если скорость реком- бинаций между локусами (или нуклеотидными сайтами) очень низка. Для простоты рассмотрим четыре типа гамет в двухлокусной, двухаллельной модели как четыре аллеля в одном локусе. В результате, генетический дрейф от поколения к поколению в ограниченной популяции изменяет частоту гамет так же, как в однолокусной, четырехаллельной модели. Эти случайные колебания аллельных частот в небольшой по численности по- пуляции почти целиком зависят от неслучайных ассоциаций между алле- лями в различных локусах. Когда рекомбинация происходит между дву- мя локусами, эффект генетического дрейфа менее заметен. Во многих популяциях при заданном изменении аллельной частоты в одном локусе, обусловленном генетическим дрейфом, ожидаемое значение неравнове-
Глава 10. Мультилокусные модели сия, обусловленное дрейфом в двух локусах, равно нулю. Однако в лю- бой отдельной популяции обусловленное генетическим дрейфом гамети- ческое неравновесие может быть очень большим и либо отрицательным, либо положительным по знаку. Чтобы показать влияние на гаметическое неравновесие ограниченного размера популяции, используют квадрат коэффициента корреляции, г2. При эффективной численности популяции Ne и величине рекомбинации между двумя локусами, равной с, ожидае- мое значение г2 приблизительно равно: £(r2)J1-C)2+c2+l 2Nec(2-c) N’ (10.6а) где N- размер выборки (Weir, Hill, 1980). С уменьшением с величина N растет, и это выражение принимает вид: (Hill, Robertson, 1968; Ohta, Kimura, 1969). Из этого уравнения видно: если значение N с велико, то значение Е(Е) достигает 0,0, и если N с мало, то Е{Е) достигает 1,0; для промежуточных значений Nc Хилл (НШ,1976) показал, что выражение 10.6b несколько снижает истинное значение Е(Е). Тем не менее, это уравнение можно использовать для минимальной оцен- ки влияния численности популяции на среднее значение г2. Например, если .V с равно 1,0 (скажем Ne = 100, с = 0,01), то ожидаемое значение г2 равно 0,20. Даже когда действительная численность популяции относи- тельно велика, значительное неравновесие в предыдущих поколениях может быть обусловлено эффектом основателя или эффектом «бутылоч- ного горлышка». Нарушение гаметического равновесия замедляется при инбридинге, сцеплении генов и при действии некоторых других факто- ров. Если гены не сцеплены (с = 0,5), то выражение 10.6а принимает вид: £(Г2)= J_ + _L 5NN и оценка эффективной численности популяции равна: 3(r2-1/N)’ (10.6с) По мнению Хилла (Hill, 1981), такая оценка для одного локуса совершен- но не точна, но при наличии нескольких локусов, допустим десяти, точ- ность оценки возрастает (Waples, 1991).
11. Гаметическое неравновесие и инбридинг 479) Слэткин (Slatkin, 1994) показал, что при некоторых условиях популя- ция, имеющая стабильный размер, будет неравновесна по сцеплению меж- ду близко сцепленными локусами, тогда как в быстро растущей популя- ции неравновесие гораздо ниже. Он предположил, что в стабильной популяции более вероятны мутации на внутренних ветвях генной генеа- логии, тогда как в растущей популяции генная генеалогия больше напо- минает звезду, и мутации происходят на концевых ветвях. Как только по- пуляция начинает расти, так генетический дрейф становится менее эффективным, и после этого происходит коалесценция (схождение, см. главу 9). Однако, общая картина более сложная, поэтому прогнозы Слэт- кина даны только для нового неравновесия по сцеплению; неравновесие, которое уже существовало в начале роста популяции останется. В приме- ре 10.4 обсуждаются данные по разным популяциям людей, которые со- гласуются с этими прогнозами. Пример 10.4. Интенсивные попытки по картированию генома привели к обнаружению большого количества вариабельных локусов (Dib et al., 1996). Исследование значения неравновесия по сцеплению между этими маркерами может дать оценку фонового уровня неравновесия в данной популяции, так что можно достоверно оценить уровень неравновесия между маркерным локусом и фенотипом заболевания. Например, Лаан и Паабо (Laan, Paabo, 1997) исследовали неравновесие между тесно сцеп- ленными парами семи микросателлитных локусов в участке длиной 4 сМ Х-хромосомы человека (Xql3) в выборках мужчин из четырех групп: са- амы (лапландцы) из Швеции (N= 54), финны (N= 80), эстонцы (N= 45) и шведы (N = 41). В таблице 10.7 дана вероятность значимого неравнове- сия по сцеплению (использовали точный критерий Фишера, см. стр. 513). В саамской выборке были значимы 18 из 21 пары локусов, тогда как в остальных выборках значимо только одно из трех сравнений. В эстонс- кой и шведской выборках у каждого мужчины были разные Х-гаплотипы, а в финской выборке разные Х-гаплотипы были у 75 из 80 мужчин. С другой стороны, в выборке 54 саамов только 32 Х-гаплотипа, но они от- личаются друг от друга больше, чем гаплотипы внутри других групп. Это различие, по-видимому, не является результатом более низкого разнооб- разия у саамов: общее разнообразие у них равно 0,688, в сравнении с 0,738, 0,734 и 0,717 у финнов, эстонцев и шведов, соответственно. Попарные различия последовательностей мтДНК показали, что вы- борка саамов согласуется с ожидаемым в стабильной популяции, тогда как данные мтДНК из других трех выборок показывают, что недавно эти популяции расширились (эта интерпретация согласуется также с истори- ческими и другими данными). На основе теории Слэткина (Slatkin, 1994)
Глава 10. Мультилокусные модели авторы заключили, что более высокое неравновесие, обнаруженное у са- амов обусловлено относительной стабильностью их популяции. Однако, анализируя эти данные, Фраймер с сотрудниками (Freimer et а/., 1997) по- казали, что наиболее значительный фактор, влияющий на уровень исход- ного неравновесия - это изменчивость, обнаруженная в разных геном- ных участках внутри и между популяциями. Они предложили идентифицировать факторы, ответственные за такие результаты, с боль- шой осторожностью (см. также Lonjou et al., 1999). ТАБЛИЦА 10.7. Вероятность значимого неравновесия по сцеплению в выборках их че- тырех популяций в парах из семи близко сцепленных микросателлитных локусов (полное название локуса начинается с DXS) на Х-хромосоме человека (с - скорость рекомбинации между парами локусов), (по Laan, Paabo, 1997). Вероятности, обозначенные жирным шриф- том, значимы при 0,05-ном уровне без поправки на множественное сравнение Р Локусная пара С Саамы Финны Эстонцы Шведы 995-983 0,04 0,01 0,51 0,31 0,59 995-986 0,025 0,00 0,73 0,83 0,43 995-8092 0,024 0,10 0,12 0,73 0,42 995-8082 0,023 0,00 0,13 0,24 0,49 8037-983 0,02 0,30 0,68 0,10 0,92 1225-983 0,02 0,00 0,63 0,52 0,48 995-1225 0,02 0,00 0,15 0,59 0,56 995-8037 0,02 0,12 0,87 0,62 0,22 8082-983 0,017 0,00 0,56 0,73 0,08 8092-983 0,016 0,00 0,31 0,15 0,75 986-983 0,015 0,00 0,83 0,47 0,40 1225-986 0,005 0,00 0,39 0,69 0,45 8037-986 0,005 0,00 0,62 0,74 0,26 8037-8092 0,004 0,00 0,18 0,07 0,03 1225-8092 0,004 0,00 0,28 0,12 0,68 8037-8082 0,003 0,01 0,24 0,62 0,03 1225-8082 0,003 0,00 0,00 0,00 0,00 8082-986 0,002 0,00 0,09 0,14 0,62 8092-986 0,001 0,00 0,33 0,10 0,33 8082-8092 0,001 0,00 0,04 0,06 0,10 8037-1225 0,000 0,09 0,84 0,49 0,24
II. Гаметическое неравновесие и инбридинг 481 с. Поток генов Поток генов, или гибридизация между двумя популяциями также может вызвать гаметическое неравновесие. Во-первых, поток генов в состоянии понизить значение неравновесия по сцеплению. Если наблюдается поток генов из популяции с одинаковыми аллельными частотами, но с более низким неравновесием по сцеплению, то скорость нарушения (падения) неравновесия будет повышена. Крайний пример образования неравнове- сия - популяция, произошедшая от скрещивания между двумя популяци- ями, фиксированными по разным аллелям: А{А{В{В} хА^В^В.,. Значение неравновесия в потомстве максимально, так что D = 0,25. Общее выраже- ние, дающее значение неравновесия, когда две популяции (х и у) смеши- ваются в пропорциях тх и т (тх = 1 - mJ составит: D = mxmy(pXx -ph,)(qVx - у), (10.7а) где р1х и р1у - частоты аллеля А [ и q}x и qiv - частоты В{ в популяциях х и у, соответственно (Cavalli-Sforza, Bodmer, 1971). Из этого выражения следует, что ни в одной родительской популяции нет гаметического не- равновесия. Для появления сильного гаметического неравновесия аллельные час- тоты в обоих локусах в двух популяциях должны быть разными, а разли- чие в аллельных частотах должно быть значительным. Если разница ал- лельных частот в обоих локусах равна 0,2 и тх = т = 0,5, то значение D (при смешении популяций) равно только 0,01. Более того, Праут, Ней и Ли (Prout, 1973; Nei, Li, 1973) показали, что общее неравновесие в к суб- популяциях равно: £> = D + COK(p„?1), (10.7b) где __ к D = ^miDi i=i - значение среднего неравновесия в популяции, взвешенной по ее вкладу (ти), по к субпопуляциям, и COV(px, q.) - коварианса между частотами аллелей А и В,. Для появления гаметического неравновесия при смеше- нии к субпопуляций, либо аллельные частоты в локусах должны быть ковариантны, либо субпопуляции должны быть в гаметическом неравно- весии. Для двух субпопуляций это выражение имеет вид: D = mxDx +™yDy +mxmy(pix -ply)(qix-qiy). (10.7c)
482 Глава 10. Мультилокусные модели Если нет неравновесия ни в одной субпопуляции (Dx = D = 0,0), то это выражение сокращается до уравнения 10.7а. Эффект подразделенности популяции приводит к снижению темпа на- рушения (падения) неравновесия по сцеплению (D Ф 0, D стремится к нулю асимптотически, поскольку субпопуляции могут иметь разные ал- лельные частоты). Частота гетерозигот (и двойных гетерозигот) в субпо- пуляциях меньше, чем в одной большой популяции (эффект Воланда), и это состояние снижает возможность образования рекомбинантных гамет. Как показали Ней и Ли (Nei, Li, 1973) для двух популяций, темп наруше- ния неравновесия равен 1 - с (пропорция при отсутствии рекомбинаций), или (1 -- 2т)2, где т - степень генного потока в другую популяцию. Дру- гими словами, если генный поток между популяциями мал, он может оп- ределить темп снижения неравновесия. Например, если два локуса не сцеп- лены (с = 0,5) и если т < 0,141, то снижение гаметического неравновесия зависит от подразделенности большой популяции на субпопуляции. Бар- тон и Хьюитт (Barton, Hewitt, 1985) предложили использовать значения неравновесия при исследовании клинальной изменчивости. Наблюдае- мые значения неравновесия, возникающие при смешении популяций, были использованы для оценки источника происхождения лососевых рыб (Waples, Smouse, 1990).Для выявления сцепления между локусами в не- давно смешанной популяции также предложено использовать значения неравновесия (Chakraborty, Wiess, 1988). d. Мутации Сами по себе мутации обусловливают низкие значения гаметического неравновесия. Но мутация вместе с потоком генов и рекомбинацией яв- ляется источником новых гаметических типов в популяции. Частота но- вых гамет, продуцируемых в результате мутации, в свою очередь может увеличиться за счет генетического дрейфа или отбора, и эта комбинация факторов может вызвать дальнейшее гаметическое неравновесие. Допустим, что популяция сегрегирует по двум аллелям, В и В2, в ло- кусе В и что она мономорфна по аллелю Ах в локусе А. Если происходит мутация от аллеля Л j к А2, то гаметические частоты равны частотам, пред- ставленным в таблице 10.8. Новые мутанты появляются на хромосоме, содержащей либо аллели Bt, либо аллели В,, так что существует два воз- можных ряда гаметических частот. Поскольку предполагается только один мутантный аллель, исходная аллельная частота равна р2 = 1/(27V), где N- размер популяции. Тогда образованное гаметическое неравновесие, из- меренное как D, равно или -qJ(2N), или qx/(2N), в зависимости от того, на какой хромосоме (5, или ВД появилась мутация. Эти исходные значения малы, пока мало значение N. Однако, если гаметическое неравновесие
II. Гаметическое неравновесие и инбридинг измерено с учетом величины ГУ, которая дает пропорцию неравновесия, максимально возможного с данными аллельными частотами, тогда гаме- тическое неравновесие максимально равно либо -1,0, либо 1,0, в зависи- мости от того, в каком аллеле (5, или В,) появилась мутация. Это высшая стандартизованная ассоциация, которую используют для поиска ассоциа- ций аллелей заболеваний с маркерными локусами (de la Chapelle, Wright, 1998). Так например, высокое неравновесие в африканских гаплотипах /3-глобина при серповидноклеточной анемии использовали для поиска трех независимых мутаций в аллеле, обусловливающем серповидноклеточную анемию (см. пример 10.5). ТАБЛИЦА 10.8. Гаметические частоты и гаметическое неравновесие до и после мута- ции в локусе А (аллель А мутировал в аллель А2) Гаметические частоты D D' AtA2 AtB, A2Bt ЛВ2 До мутации После мутации q2 - - 0,0 0,0 Мутант по аллелю В qx —- <6 2N 1 2N - 41 2N -1,0 Мутант по аллелю В2 q< q2~’2N - 1 2N 9i 2N 1,0 Пример 10.5. Наиболее частый пример балансирующего отбора у чело- века, на который ссылаются - это мутация, приводящая к заболеванию серпивидноклеточной анемией в районах эндемичного распространения малярии (Allison, 1964). Однако происхождение и распространение этих мутантов продолжает быть в центре внимания исследователей. Изучение в начале 1980-х основных гаплотипов, содержащих мутацию, обуслов- ливающую серповидноклеточную анемию, показало сильное неравнове- сие по сцеплению между сайтами рестрикции (Antonarakis et al., 1982; Pagnier et al., 1984). К тому же, как оказалось, три основных гаплотипа «серповидноклеточности» распределены в Африке очень локально, так что 100% так называемого бенинского гаплотипа «серповидноклеточнос- ти» сосредоточено в Бенине, 83% гаплотипа CAR - в Центральной Афри- канской Республике и 81% сенегальского гаплотипа - в Сенегале (Flint et al., 1993). Эти открытия привели к гипотезе, что мутация «серповиднок- леточности» возникала в Африке независимо три раза в разных гаплоти- пах и на разных территориях.
484 Глава 10. Мультилокусные модели Черблоун с сотрудниками (Cherbloune et al., 1988) исследовали 5'- рай- он гена /3-глобина и нашли различия в повторяющейся генной последова- тельности, а также десять вариабельных нуклеотидных позиций, различа- ющихся между тремя гаплотипами. На рисунке 10.5 показана предполагаемая взаимосвязь между этими гаплотипами по восьми нуклео- тидам, включая исходную последовательность, которую постулировали, исходя из генома шимпанзе. Заметьте, что три «серповидноклеточных» гап- лотипа различаются не менее чем по четырем нуклеотидам. Вероятно, гап- лотипы, содержащие мутацию «серповидноклеточности», возникли срав- нительно давно. Поскольку малярия, как считают, является основной селективной силой только в течение последних нескольких тысяч лет, то гаплотипы, каждый из которых содержит одинаковую мутацию «серповид- ноклеточности», могли появиться гораздо раньше. Это наблюдение согла- суется с трицентрическим источником мутации «серповидноклеточности» в Африке. Считается, что такие гаплотипы связаны с конверсией генов и с обменом короткими последовательностями внутри кодирующей последо- вательности гена, а также с поддерживанием различий между фланкирую- щими ген последовательностями (Livingstone, 1989; Flint et al., 1993). Предок -1073 -1069 -780 -710 T A T T ТАДТ CTCG GIG (Vai) Центральная (Р9) QATT CQCA GTG Африканская (Vai) Республика Бенин (Р1*) TQAT CTAG GAG (Glu) nepeflanafnon-p5) TGAQITAGGIG Сенегал (P9) (Vai) Рисунок 10.5. Последовательность восьми вариабельных нуклеотидов в 5'- участке гена [3-глобина и предполагаемая взаимосвязь трех гаплотипов «серповидноклеточности» с мутациями (подчеркнуты), (по Cherbloune et al., 1988). Отмечены кодоны, в которых име- ется мутация «серповидноклеточности», приводящая к замене глутаминовой кислоты на валин. Маловероятно, что недавняя мутация вызовет создание гаметического неравновесия между аллелями в различных локусах, потому что мутации
III. Мультилокусный отбор 485 - гораздо менее частые события, чем рекомбинации, изменяющие гено- тип новых гамет. Однако, когда скорость рекомбинации низка (как для тесно сцепленных локусов или нуклеотидных сайтов внутри локусов), неравновесие по сцеплению, вызванное мутацией, может быть очень зна- чительным. Также маловероятно, чтобы последовательные мутации все- гда возникали в ассоциации с одним аллелем. Однако при появлении не- сущих мутацию гамет их частота или возрастет, или снизится до нуля при генетическом дрейфе. Этот процесс будет следовать той же динамике, что и трехаллельная система в отсутствие отбора, пока в результате рекомби- нации не образуется другая гамета. Как обсуждается в следующих двух разделах, на гаметические частоты может влиять мультилокусный отбор или генетический хичхайкинг (см. ниже) - потенциально очень важные факторы для новых мутантных аллелей. III. Мультилокусный отбор Раньше считали, что мультилокусный отбор ответственен за образование большей части наблюдаемого гаметического неравновесия. Было выпол- нено большое число теоретических исследований с целью понять влия- ние мультилокусного отбора на генетическую изменчивость. Действитель- но, эти исследования показали, что гаметическое неравновесие возникает и сохраняется под действием мультилокусного отбора. Мы рассмотрим простые, но биологически значимые модели гаметического неравнове- сия. Поскольку локусы (сайты), в последовательностях ДНК могут быть очень тесно сцепленными, мультилокусные модели имеют большое зна- чение, когда полиморфные сайты подвержены действию отбора. а. Приспособительный эпистаз Прежде чем исследовать действие мультилокусного отбора, нужно опре- делить средние значения рассматриваемых мультилокусных приспособ- ленностей. Сравнение приспособленностей любых двух генотипов, кото- рые различаются только по одному локусу, дает относительную приспособленность в одном локусе на постоянном генетическом фоне. Если это значение приспособленности одинаково для всех генотипов, то приспособленность в данном локусе не зависит от остального генома. Независимость может быть определена на шкале с помощью либо разно- сти приспособленностей, либо отношения различных приспособленнос- тей (см. ниже), и при ее сохранении считается, что между двумя данными локусами нет эпистатического взаимодействия. Если сравнение приспособленностей проводят по шкале отношений, то это означает, что приспособленность двухлокусного генотипа может возрасти как произведение значений, определенных для каждого одноло-
486 Глава 10. Мультилокусные модели кусного генотипа. Считается, что любое распределение приспособленно- стей, которое отклоняется от этих условий, демонстрирует эпистаз на мультипликативной шкале. Концепция мультипликативной независимо- сти весьма привлекательна, особенно при обсуждении отбора и диффе- ренциальной выживаемости. Допустим, у насекомых 90% особей с гено- типом A ]Л] переживают стадию гусеницы (и развиваются дальше), и 80% особей с генотипом В1В[ переживают стадию куколки. Тогда общая веро- ятность выживания особи с генотипом Л относительно полностью жизнеспособного генотипа определяется умножением этих пропорций (мультипликативно) и равна (0,8)(0,9) = 0,72. Если генотипы сравнивают по разности приспособленностей, то эти значения можно определить для каждого однолокусного генотипа, и при- способленность каждого двухлокусного генотипа равна сумме значений однолокусных компонент. Любое отклонение от этого аддитивного взаи- модействия называют эпистазом на аддитивной шкале. Концепция адди- тивной независимости имеет свое основание в количественной генетике. В этом случае можно рассматривать отбор по таким характеристикам, как дифференциальная плодовитость так, что на продукцию яиц или семян влияют два локуса, обусловливающие большую продукцию яиц или се- мян за весь период жизни особи. Например, генотип Л1Л) может добав- лять два семени, а 5,5, - три семени, и в среднем, генотип А1А1В1В1 дает на пять семян больше других генотипов. Для определения действия эпистатических сил отбора на аллельные ассоциации, нужно знать меру эпистатического взаимодействия (отсут- ствие независимости приспособленности). Сначала рассмотрим модель гаплоидного отбора, где двухлокусные относительные приспособленно- сти генотипов А ХВХ, А,В2, А2В{ и А2В2 даны как wp w2, и w4, соответ- ственно. Степень аддитивного эпистаза равна: Е = w,-w2-w3 + w4. (10.8а) Если приспособленности аддитивны, то Е = 0, иначе Е Ф 0. Аналогично, для мультипликативного эпистаза (Felsenstein, 1965): Е'= Inwj -1пи'2 -InW, +lnw4= = lnp^i I % % (10.8b) В таблице 10.9 приведены четыре разных уровня эпистаза, которые мы обсуждаем ниже. Для диплоидных организмов величины эпистаза анало- гичны (Felsenstein, 1965). Заметьте, что значения приспособленности, ко- торые удовлетворяют условиям Е = 0 и Е' 0, очень сходны.
ТАБЛИЦА 10.9. Значение приспособленностей для гаплоидной модели с четырьмя раз- личными уровнями эпистаза г7 = 0,0 г7 = 0,1 г7 = -o,i £ = 0,0 W, 1,44 1,44 1,44 1,44 W2 1,2 1,142 1,262 1,22 1,2 1,142 1,262 1,22 W4 1,0 1,0 1,0 1,0 Ь. Направляющий отбор в двух локусах В большинстве мультилокусных теоретических исследований обращает- ся много внимания на эффекты сцепления и отбора, а также на стабиль- ность полиморфного равновесия. Направленный отбор, при котором час- тота некоторых аллелей возрастает до фиксации, также подвержен влиянию сцепления. Поэтому гаметическое неравновесие обычно возни- кает во время замещения аллелей и исчезает, когда происходит фиксация благоприятных аллелей. Для иллюстрации этого явления рассмотрим двухлокусную, двухал- лельную гаплоидную модель. Предположим, что частота гаплоидных ге- нотипов после мейоза равна частоте, данной внизу в таблице 10.3. При соответствующей дифференциальной выживаемости генотипов их час- тоты после отбора равны: X] - wjx, -cD)lw, х2 = и'2(х2 +cD)/w , x3 = w3(x3+cD)/w, (10.9а) х4 = w4(х4 -cD)/w, где 4 W = W,-X,. . (=1 Фелзенштайн (Felsenstein, 1965) показал, что направленный отбор, дей- ствующий на два локуса, ведет к гаметическому неравновесию того же знака, как компоненты мультипликативного эпистаза в случае гаплоид- ного организма. Таким образом, отбор благоприятных аллелей /^иВ, та- кой, что Е' > 0 и возникает положительное гаметическое неравновесие, а отбор с Е' < 0 ведет к отрицательному неравновесию. Это можно проил- люстрировать, сравнивая изменения в гаметическом неравновесии для
488 Глава 10. Мультилокусные модели рядов приспособленностей, представленных в таблице 10.9. Ряд в первой колонке предполагает наличие селективного преимущества, равного 0,2 для обоих аллелей А. и и отсутствие эпистаза на мультипликативной шкале (Х = 0,0). Ряды во второй и третьей колонках имеют одинаковые разности в приспособленностях между гаметами в фазе притяжения, но также и эпистаз: Е' = 0,1 и -0,1, соответственно. Последний ряд - отсут- ствие эпистаза на аддитивной шкале (£ = 0,0). Допустим, что Do = 0,/»] = 0,1, q} = 0,1, с = 0,01 и значения приспособ- ленности соответствуют данным из таблицы 10.9. Тогда гаметическое неравновесие и аллельные частоты изменяются во времени, как представ- лено в таблице 10.6. На рисунке 10.6а при Е' = 0,1 значение D в поколе- нии 14 возрастает до 0,073, а при Е' = -0,1 в поколении 15 значение D Рисунок 10.6. Образование гаметического неравновесия (а) и изменения аллельных час- тот (Ь) для четырех рядов приспособленностей у гаплоидного организма, данных в табли- це 10.9, где Е’ и Е обозначают степень эпистаза. Исходные значения: р, = q{ = 0,1, Z>0 = 0,0, ис = 0,01.
III. Мультилокусный отбор 489 снижается до -0,076. При Е' = 0,0, неравновесие, вызванное отбором, от- сутствует, но при Е = 0,0 имеется некоторое отрицательное неравновесие. Как показано на рисунке 10.6b, меняется и скорость изменения аллель- ных частот. Эти различия обусловлены тем, что при низких частотах диф- ференцирующий отбор происходит, в основном, между генотипами в фазе отталкивания и генотипом А2В2, а при высоких частотах он проявляется между этими генотипами и генотипом А Д. Рассмотрим, например, ситу- ацию, когда Е' = 0,1. Первоначально отбор снижается, потому что при- способленности генотипов А'В2 и A2Bf равны только 1,142 по сравнению с 1,0 у генотипа А Д. Однако, когда частоты аллелей Л, и 5, высоки, отбор действует, в основном, на генотипы в фазе отталкивания и генотип AtBt, приспособленность которого равна 1,44. Разность приспособленности здесь больше, поэтому аллельные частоты изменяются быстрее. Фелзенштайн (Felsenstein, 1965) показал также, что при положитель- ном неравновесии, вызванном эпистатическим отбором, тесное сцепле- ние повышает скорость изменения аллельных частот. Если отбор приво- дит к отрицательному неравновесию, то тесное сцепление понижает скорость изменения аллельных частот. Если имеется положительный эпи- стаз, то положительное неравновесие позволяет отбору действовать глав- ным образом на гаметы А]В1 и А2В2 более эффективно. Чем больше гамет А{В2 и А2В. существует в популяции, тем выше «интерференция» с отбо- ром. Так как тесное сцепление понижает рекомбинацию, оно увеличива- ет эффективность направленного отбора, понижая эту интерференцию. Но если отбор обусловливает отрицательные значения D (Е' < 0), то для утраты гамет с генотипами ЧД и А2Д необходимо ослабленное вслед- ствие рекомбинации сцепление аллелей. Эти результаты верны и для ана- логичной диплоидной модели. с. Основные двухлокусные полиморфизмы Ранее мы отмечали, что при отсутствии отбора и других факторов гаме- тическое неравновесие исчезает. Для сбалансированных полиморфизмов, где поддерживаются промежуточные значения аллельных частот и, сле- довательно, гетерозиготность высока, можно ожидать быстрого сниже- ния неравновесия. Таким образом, при равновесии аллели в разных локу- сах будут эффективно рандомизированы из-за влияния рекомбинации. С другой стороны, при эпистазе, можно ожидать, что действие отбора в пользу некоторых комбинаций аллелей по сравнению с другими повысит их ассоциацию в популяции. Какой тип отбора требуется для противосто- яния рекомбинации? Если отбор очень сильный, то такие ассоциации в природных популяциях редки (или необязательно обусловлены отбором). Если условия, необходимые для поддержания рандомизации, обычны, то
полиморфизмы со значительными межлокусными ассоциациями, встре- чаются в природе чаще. Для понимания взаимодействия между отбором и рекомбинацией рассмотрим некоторые выводы из теоретических ис- следований двухлокусных моделей равновесия при случайном скрещи- вании. Сначала воспользуемся общей двухлокусной двухаллельной схемой приспособленностей для диплоидов, как дано в таблице 10.10а. Индексы генотипических приспособленностей отражают компоненты двухлокус- ных гамет. Для простоты предполагают, что приспособленности двух двой- ных гетерозигот равны, т.е. w|4 = му, = w Тогда имеем: 4 = YxJwa и 4 W = ^,X,W, частота гаметы после отбора равна: X, =[xi2W|1 + X,X2W]2 +Х,Х3Х13 + (1 - c)X|X4W14 +cx2x3w23]/w = = [x](x,M'll +x2w12 + x3M'13 + X4M'|4)-cwh(x}x4 -x2x3)]/w = = (x]W| -cwhD)/w. Подобным образом получают частоты других гамет: Х| = (х,vv, - cwhD) / w, х2 = (x2vv2 + cwhD)!w, ТАБЛИЦА 10.10. Общая картина приспособительной выживаемости (а) и симметричная выживаемость (Ь) для двухлокусной двухаллельной диплоидной модели (а) М лд2 а^2 WH W33 BtB2 W12 W!4 = W23 W34 в в И’ И’ (Ь) М лд2 яд. а ь а ь 1 ь а ь а
х'3 = (x3w3 + cwhD)l w, (10.9b) x' = (x4 w4 - cwhD) / w. Когда x' = x, для всех гамет, популяция находится в равновесии. Обобщенные результаты этих уравнений соответствуют однолокусной мультиаллельной теории, потому что случай двух аллелей в двух локусах при отсутствии рекомбинации (с = 0) идентичен однолокусной модели с четырьмя аллелями. Можно предположить, что результаты, полученные при тесном сцеплении аллелей не слишком отличаются от результатов при с = 0. В общем, два типа отбора обычно приводят к полиморфному равновесию: отбор, который приводит к равновесию с D = 0 (невзирая на значение с), и отбор в пользу возрастания некоторых двухлокусных гаме- тических типов и понижения других типов, приводящий к гаметическо- му неравновесию. Очевидно, рекомбинация важна только при последнем типе отбора. В этом случае рекомбинация восстанавливает меньшее ко- личество благоприятных гамет. Таким образом, поддерживается полимор- физм всех существующих гаметических типов. Если частота рекомбина- ции выше критического уровня, то полиморфизм исчезает или наступает равновесие с D = 0. Можно сделать несколько других выводов. Во-первых, для любой двух- локусной двухаллельной модели выживаемости при тесном сцеплении аллелей существует, самое большее, два стабильных полиморфных рав- новесия. Так например, в двухлокусной модели (см. рисунок 10.7 и Wright, 1969) имеется не более двух адаптивных и полиморфных пиков (одно равновесие при D > 0 и одно - при D < 0). Во-вторых, из-за роста частоты рекомбинаций равновесная средняя приспособленность понижается. Эта тенденция имеет значение, поскольку отбор благоприятствует элимина- ции определенных хромосомных типов, тогда как рекомбинация проти- водействует этому. Таким образом, снижение частоты рекомбинаций по- зволяет отбору повышать среднюю приспособленность популяции, увеличивая частоту определенных гамет. Некоторые модели приспособленности представляют как биологичес- кий, так и общий интерес. Во-первых, при отсутствии эпистаза на адди- тивной шкале гарантируется один стабильный полиморфизм с D = 0, ког- да имеют преимущество гетерозиготные локусы (Bodmer, Felsenstein, 1967). Согласно этой модели во время действия отбора средняя приспо- собленность, w, всегда возрастает (никогда не снижается). Это означает, что конечное полиморфное равновесие представляет собой максимум локальной приспособленности. Эти результаты показывают, что при не- зависимости приспособленностей межлокусная ассоциация аллелей в
Й92 Глава 10. Мультилокусные модели равновесии отсутствует, а при окончательном равновесии средняя при- способленность максимизирована. С другой стороны, при отсутствии эпистаза на мультипликативной шкале и при однолокусном сверхдоминировании в обоих локусах суще- ствуют два типа равновесия. При достаточно ослабленном сцеплении имеется полиморфное равновесие (D = 0), а при достаточно тесном сцеп- лении - два более или менее комплементарных равновесия: одно с D > 0 и одно - с D < 0. Если существуют два комплементарных равновесия, то популяция с исходным значением D > 0 придет к равновесию (D > 0) и популяция с исходным значением D < 0 тоже придет к равновесию (D < 0). Поверхность приспособленности или адаптивная топография (Wright, 1969) делится на регионы с двумя значениями равновесия (при D = 0). Однако при очень тесном сцеплении существует равновесие с D Ф 0 и поверхность приспособленности не имеет большого значения. Даже если в популяции исходное значение D = 0, то случайные флуктуации «ото- двинут» ее с поверхности. Если частота рекомбинаций так велика, что равновесия не существует (D Ф 0), то популяция придет к поверхности приспособленности под действием рекомбинации и останется на поверх- ности приспособленности. Средняя популяционная приспособленность в последующих поколениях на поверхности возрастает. На рисунке 10.7 показан пример адаптивной топографии, где относи- тельные приспособленности двойных гомозигот, простых гетерозигот и двойных гетерозигот равны 0,81, 0,9 и 1,0, соответственно (отсутствие эпистаза на мультипликативной шкале). Средняя приспособленность в этом случае полностью определяется по аллельным частотам в двух ло- кусах и относительным приспособленностям (при О0 = 0). Максимальная приспособленность, или пик, наблюдается прир} = q} = 0,5. Популяции с аллельными частотами, отличающимися от этих частот, направлены к этому пику (обозначено стрелками). Левонтин и Коджима (Lewontin, Kojima, 1960) исследовали простей- шую форму симметричной жизнеспособности двухлокусных приспособ- ленностей, когда противоположные друг другу в матрице приспособлен- ностей генотипы имеют одинаковые относительные приспособленности (таблица 10.10b). Из-за симметрии приспособленностей в этой модели существует только симметричное равновесие (р} = q} = 0,5). Предполо- жим, что все равновесные аллельные частоты равны, так же как частоты двух гамет в фазе притяжения и частоты двух гамет в фазе отталкивания. Когда рекомбинация выше определенного предела (с >Е / 4, где Е = а-2Ь+1), существует равновесие и все гаметические частоты равны. Другими сло- вами,
1.0 Pl Рисунок 10.7. Адаптивная топография, где относительные приспособленности двойных гомозигот, простых гетерозигот и двойных гетерозигот равны 0,81, 0,9 и 1,0, соответ- ственно. Цифрами обозначена средняя приспособленность (контурные линии), стрелка- ми - направление изменения аллельной частоты, а закрашенный кружок в центре означа- ет высшую приспособленность. Д=0. (10.10а) Однако, если с <Е / 4 (критический уровень рекомбинации) то возможны два комплементарных равновесия, так что гаметические частоты и значе- ние гаметического неравновесия равны: =ха),____1^-Г 4 4^ л-26 + 1 J ’ (10.10b) De=±- 1------- 4l а -26 + 1 Для анализа изменений гаметической частоты рассмотрим численный пример, где а = 0,9 и 6 = 0,93. В этом случае Е = 0,04, поэтому с должно
494 Глава 10. Мультилокусные модели быть меньше, чем 0,01 (тогда имеется равновесие при D Ф 0). Если пред- полагается, что х, = х4 и х2 = х, то гаметические частоты останутся рав- ными. При двух разных значениях частоты рекомбинаций (рис. 10.8) с = 0,0075, что ниже критического значения, и с = 0,05, что выше крити- ческого уровня. На рисунке 10.8а показано, что при с = 0,0075 и исходных значениях х и х , равных 0,0 или 0,24, популяции направлены к равнове- сию с D < 0 (D = -0,125). Если эти значения равны 0,26 и 0,5, то популя- ции направлены к равновесию с D > 0 (De = 0,125). Заметьте, что масшта- бы времени совершенно разные: приближение к равновесию от значений 0,0 или 0,5 происходит значительно быстрее, чем от значений 0,24 или 0,26. Эти различия связаны со средними приспособленностями различ- ных гаметических частот. Гаметическое равновесие при D Ф 0 - это ре- зультат баланса, при котором отбор повышает частоту определенных га- мет, а рекомбинация понижает ее. Когда с больше критического значения, приближение к равновесию (D = 0) достаточно быстрое (рис. 10.8b). В примере 10.6 представлены данные, показывающие зависимость резуль- татов долговременного эксперимента на D.melanogaster от частоты ре- комбинаций и от влияния окружающей среды. Пример 10.6. Были исследованы факторы, которые могут привести к сба- лансированному полиморфизму в локусе Adh у D.melanogaster (Van Delden, 1982). Во многих популяциях мух локус ct-Gpdh, который расположен в 29,6 сМ от локуса Adh на хромосоме II, также полиморфен. Даже если эти Рисунок 10.8. Средняя приспособленность и темп изменения гаметической частоты для зна- чений приспособленности, взятых из таблицы 10.10b, когда а = 0,9 и b = 0,93 для с = 0,0075 (а) и для с - 0,05 (Ь). Обозначено количество поколений, необходимых для данного изменения гаметической частоты, закрашенные кружки означают величину неравновесия.
111. Мулътилокусный отбор 495 два локуса тесно не сцеплены, в долгоживущей тепличной популяции не- равновесие по сцеплению было значительным. В одной из таких популя- ций была обнаружена инверсия, которая обусловила отсутствие рекомби- нации между двумя локусами (Van Delden, 1984). При дальнейшей попытке понять влияние инверсии на полиморфизм двух локусов из тепличной популяции взяли выборки мух, из которых получили три больших лабораторных популяции, содержащихся при 20°С, 25°С и 29,5°С. Мониторинг этих популяций по полиморфизму двух алло- ферментных локусов в нескольких поколениях мух показал значитель- ную дивергенцию между тремя условиями среды для обоих локусов со снижением частоты аллеля Adh-S при низкой температуре и снижением частоты аллеля u.-Gpdh-S при высокой температуре (рисунок 10.9). При двух более низких температурах частоты, по-видимому, достигают поли- морфного равновесия (хотя при 20°С частота аллеля u.-Gpdh-S становит- ся фиксированной). При более высокой температуре оба локуса все еще остаются полиморфными (при частоте аллеля около 0,5) и продолжаются медленные изменения аллельных частот. К поколению 20 для популяций, содержащихся при более низких температурах, два локуса находятся в равновесии по сцеплению, при котором рекомбинация имеет больший эффект, чем мультилокусный отбор. Однако при более высокой темпера- туре D' быстро поднялось до значения 0,3 - 0,5 и стабилизировалось на этом уровне. В последующих исследованиях такой инверсии при низких температурах не обнаружено, но при высокой температуре частота ин- 0.5 - 0.4 - «о-3- € ч: 0.2 - 0.1 - 0.0 ___।______। ।__ 0.6_______0.8 a-Gpdh-S 0.4 1.0 Рисунок 10.9. Изменения частоты аллелей Adh-S, и u.-Gpdh-S в трех популяциях дрозо- филы, содержащихся при 20°С, 25°С и 29,5°С, соответственно. Числами обозначены по- коления мух (по Van Delden, 1984).
Й96 Глава 10. Мультилокусные модели версии возросла до 0,245. Все хромосомы с инверсией несут оба аллеля (Adh-S, и u.-Gpdh-F) и 5% хромосом без инверсии также несут эти аллели. Хотя мишень отбора в данном случае не ясна, очевидно, что при пони- женной частоте рекомбинаций, обусловленной инверсией, равновесие между этими аллоферментными локусами сочетается с неравновесием между двумя локусами. Если отбор действует одновременно на более чем два локуса, то резуль- таты не всегда предсказуемы. Можно ожидать, например, что при усиле- нии эпистаза между многими локусами возникает сильное гаметическое неравновесие (см. модели мультилокусного отбора). Левонтин (Lewontin, 1964а) обнаружил, что для мультипликативной гетерозисной пятилокус- ной модели и тесного сцепления существуют комплементарные гамети- ческие полиморфизмы с межлокусными ассоциациями. Кроме того, он об- наружил две характерных для мультилокусных моделей закономерности. Во-первых, существует кумулятивный эффект, при котором аллели в двух локусах, расположенных на хромосоме далеко друг от друга, поддержива- ются в неравновесии из-за ассоциаций с аллелями в локусах между ними. Во-вторых, между аллелями в соседних локусах, объединенными в ассо- циированный комплекс аллелей, имеется большее неравновесие, чем ожи- дается, исходя только из двухлокусной теории. Основываясь на этих закономерностях, Франклин и Левонтин (Franklin, Lewontin, 1970) провели мультилокусное компьютерное исследование ограниченной популяции. Они наблюдали феномен, сходный с кристал- лизацией, при котором территории высокого неравновесия действовали как затравки (центры кристаллизации) для появления все большего чис- ла ассоциаций. Последовательности вблизи локусов с высоким неравно- весием подвержены отбору в большей степени и, таким образом, быстрее достигают неравновесия, чем последовательности, расположенные дале- ко друг от друга. Два примера образующихся гамет (таблица 10.11) полу- чены, исходя из 36-локусной модели Франклина и Левонтина. Два аллеля в каждом локусе представлены в виде 0 или 1, так что две наиболее обыч- ные (частые) гаметы в репликате 1 имеют разные аллели в 33 из 36 локу- сов. Чтобы существовала эта кристаллизация, должен быть достаточно большой отбор, а расстояние на карте между соседними локусами долж- но быть достаточно малым, чтобы позволить усиливающемуся эпистазу противодействовать рекомбинации. Ядро высокого неравновесия в попу- ляции появляется благодаря какому-то неизвестному механизму. В ма- ленькой популяции (как в моделях Франклина и Левонтина) с небольшим количеством мультилокусных генотипов затравки для «кристаллизации» обеспечивает генетический дрейф.
III. Мультилокусный отбор ТАБЛИЦА 10Л1. Две наиболее частые 36-локусные гаметы (0 и 1 представляют различ- ные аллели данного локуса) и их частоты в двух разных репликатах (по Franklin, Lewontin, 1970) Репликат Гамета Частота 1 011 010 ПО 011 000 НО 101 011 011 НО 001 101 0,441 100 101 001 010 111 001 010 101 100 000 НО 010 0,424 Совокупность других гамет 0,135 2 001 100 100 011 101 ОН 111 100 100 111 000 111 0,440 НО 011 ОН 100 010 100 001 011 ОН 000 111 000 0,427 Совокупность других гамет 0,133 Существуют ли состояния, близкие к кристаллизации, в природе? Клегг и соавторы (Clegg et al., 1978b, 1980) в экспериментах на D.melanogaster, наблюдали снижение ассоциаций между маркерными локусами. Полу- ченные ими результаты отбрасывают сомнения по поводу гипотезы мега- ассоциаций хромосом. Существенно, что темп нарушения неравновесия был выше, чем прогнозируемый теорией нейтральности, в противопо- ложность модели Франклина и Левонтина (см. рисунок 10.2). Последую- щее моделирование и анализ результатов (Clegg, 1978; Asmussen, Clegg, 1982) показывают, что объяснение различия между выводами группы Клегга и заключением Франклина и Левонтина в том, что Клегг анализи- ровал меньше локусов и меньшую интенсивность отбора на единицу дли- ны карты, чем Франклин и Левонтин. При наличии полных данных о тес- но сцепленных локусах или сайтах, можно идентифицировать полиморфные локусы (например, гены главного комплекса гистосовмес- тимости - МНС), которые поддерживаются отбором и отличаются высо- кой плотностью расположения на генетической карте (Edwards, Hedrick, 1998, а также Huttley et al., 1999). d. Некоторые выводы Из предшествующих теоретических рассмотрений гаметического нерав- новесия становится ясным, что аллели во многих локусах могут ассоции- ровать неслучайным образом. Ограниченный размер популяции, генный поток, отбор и хичхайкинг (см. ниже) могут привести к значительному га- метическому неравновесию и к усилению сцепления, а различные неслу- чайные скрещивания могут замедлить скорость падения гаметического не- равновесия. Однако при неслучайных ассоциациях аллелей найти фактор, обусловливающий гаметическое неравновесие, довольно трудно. Такими факторами могут быть эффект «бутылочного горлышка», гибридизация в
прошлом или отбор в прошлом или настоящем. При тесном сцеплении (как для данных по нуклеотидным последовательностям или высоко самоопло- дотворяющимся или бесполым популяциям) след прошлых событий мо- жет оставаться в течение чрезвычайно длительного времени. Как можно определить причину гаметического неравновесия? Это чрез- вычайно трудная проблема, даже если доступна информация о гамети- ческих частотах во времени и пространстве. Обычно способ отнесения гаметического неравновесия к причине заключается в исключении раз- личных факторов из рассмотрения до тех пор, пока не останется один фактор. Левонтин (Lewontin, 1974) считает, что значительное гаметичес- кое неравновесие, которое согласовано между популяциями, может быть следствием отбора. Согласованность между популяциями необязательно означает, что величины неравновесия во всех популяциях имеют один и тот же знак, потому что существует множественное комплементарное равновесие. Более того, генетический дрейф и поток генов (гибридиза- ция) не должны рассматриваться как причины неравновесия. В идеале, для выявления причины гаметического неравновесия следовало бы знать гаметическое неравновесие в течение времени и в пространстве, т.е. знать историю популяций, их численность, поток генов и вероятность неслу- чайных скрещиваний, а также частоту рекомбинаций между вовлеченны- ми локусами (или сайтами). Исследуемые локусы могут быть не подвер- жены отбору, и отбор может воздейстовать на локусы, ассоциированные с наблюдаемыми (генетический хичхайкинг). Для нескольких категорий генов отбор играет особенно важную роль. К ним относятся так называемые супергены (supergenes). Этот термин был предложен Дарлингтоном (Darlington, Mather, 1949) для генов так тесно сцепленных, что между ними происходит лишь очень незначитель- ный кроссинговер. Обычно гены, составляющие суперген, сходны по своей адаптивной роли в популяции. К ним относятся, например, аллели pin и thrum, которые обусловливают строение цветка у примулы, гены окраски и рисунка полос на раковине улитки Сераеа. Хотя эти гены могут иметь относительные приспособительные эффекты, полагают (Ford, 1971), что они, вовлечены в суперген и некогда были отдельными генами. Отбор, либо уменьшая частоту рекомбинаций, либо увеличивая частоту хромо- сомных аберраций, привел к их тесному сцеплению. Комплексные (сложные) гены также образованы несколькими тесно сцепленными генами. Грант (Grant, 1964) называет эти локусы «сцеплен- ной системой серийных генов», которые обычно кодируют почти одина- ковые генные продукты. Комплексные локусы считаются тесно сцеплен- ными, потому что они произошли в результате тандемной дубликации. Их называют также мультигенными семействами. В течение некоторого
периода времени эти гены дивергировали случайным образом, или под действием дифференцирующего отбора, так что они сходны, в первую очередь, по своим продуктам, но не идентичны. Помимо ассоциации, ал- лели комплексного локуса могут находиться под одинаковым регулятор- ным контролем и выполнять сходные функции. Главный комплекс гисто- совместимости (МНС) у позвоночных включает как элементы супергена (связанные, но не гомологичные, сцепленные локусы), так и локусы, про- изошедшие в результате поздних дубликаций (Edwards, Hedrick, 1998). IV. Генетический фон и генетический хичхайкинг Ассоциация с аллелями других генов, где действует отбор, или так называ- емый генетический хичхайкинг может иметь большое значение (Kojima, Schaffer, 1967; Maynard Smith, Haigh, 1974). Дело в том, что нейтральный аллель, статистически ассоциированный с аллелем в другом локусе, на ко- торый действует отбор, может передаваться потомкам или «зацепляясь» (hitchhike) из-за селективного преимущества ассоциированного аллеля (если эта ассоциация поддерживается в течение периода времени сцеплением), или посредством системы скрещивания и некоторыми другими факторами (Thomson, 1997; Hedrick, 1980а). Это особенно верно для тесно сцеплен- ных локусов или нуклеотидных сайтов внутри локусов (Kaplan et al., 1989). Однако величина эффекта хичхайкинга зависит не только от степени сцеп- ления (или степени самооплодотворения), но также от типа и значения ис- ходного гаметического неравновесия. Характерно, если нет исходного га- метического неравновесия между локусом под действием отбора и нейтральным локусом, тогда может не быть и хичхайкинга. Считается, что выметание отбором (selective sweeps), при котором частота аллелей, име- ющих селективное преимущество возрастает и они передаются со своими вариантами в тесно сцепленных локусах - это важный фактор, влияющий на хромосомную изменчивость (см. ниже). Сложности, возникающие из-за множества локусов, можно объяснить несколькими причинами. Например, преимущество гетерозигот по опре- деленному локусу может быть результатом ассоциации аллелей в сцеплен- ном локусе с аллелями в наблюдаемом (или маркерном) локусе. Непред- сказуемые изменения аллельных частот могут быть результатом отбора, действующего на аллели в ассоциированном локусе, а не в наблюдаемом локусе. В общем, трудно оценить отбор в данном локусе, независимо от влияния ассоциированных аллелей в других локусах. Но рассмотрение этого эффекта генетического фона особенно важно, когда селективные различия между генотипами в изучаемом локусе относительно малы, что наблюда- ется для большинства молекулярных вариантов.
500 Глава 10. Мультилокусные модели Наиболее прямой способ проиллюстрировать значение ассоциации с аллелями в других локусах - это предположить, что аллели в изучаемом локусе, скажем локусе А, нейтральны по отношению друг к другу. Допу- стим, что аллели в локусе А ассоциированы с аллелями в другом локусе В, и отбор благоприятствует аллелю Вг Общий ряд приспособленностей без доминантности приведен в таблице 10.12. Исследуем два типа ассо- циации - полное притяжение, при котором имеются только гаметы А , В[ и А2В2, и полное отталкивание, при котором есть только гаметы Л15, и А2В{. В обоих случаях в популяции возможны только три типа генотипов: на- пример, при полном отталкивании: А]ВуЛ[Вг АХВ2!А2В} и A2BJA2B{. Гено- типы и приспособленности в этих двух случаях даны вверху таблицы 10.12. Если предположить, что притяжение полное, то из-за ассоциации с селективным локусом В дифференцирующий отбор благоприятствует аллелю Лг С другой стороны, если отталкивание полное, тогда окажется, что отбор благоприятствует аллелю Аг Таким образом, в зависимости от типа ассоциации с локусом В может оказаться, что для нейтрального ло- куса А отбор благоприятствует либо аллелю А}, либо аллелю Аг Томсон (Thomson, 1977) дает более глубокую оценку такого кажущегося отбора (или псевдоотбора). Для определения влияния генетического фона на оценки приспособ- ленности полезно рассмотреть две альтернативных возможности, при ко- торых генетический фон либо случаен, либо постоянен по отношению к генотипам в рассматриваемом (маркерном) локусе. Если генетический фон случаен по отношению к аллелям маркерного локуса, то ассоциации между фоновыми аллелями и аллелями в маркерном локусе были бы не важны. Если генетический фон постоянен, то результаты отбора ассоциирован- ных аллелей были бы одинаковы для всех генотипов в маркерном локусе. Поэтому полезнее измерять компоненты приспособленности или иссле- довать генетические изменения на усредненном или рандомизированном фоне. Если ряд независимых аллелей каждого типа выделен из разных источников, то эффекта ассоциации с фоновыми аллелями не будет. Тогда ожидаемая степень ассоциации в первом поколении (когда п независи- мых гаплотипов или хромосом получены от родительской популяции, в которой нет ассоциации) представляет собой функцию 1/(и - 1), (Ohta, Kimura, 1970). Кроме изменения аллельных частот отбор, действующий в других ас- социированных локусах, может привести к преимуществу гетерозигот и к последующему полиморфному равновесию. Этим объясняются ассо- циации, которые иногда наблюдаются между гетерозиготностью и при- способленностью (David, 1988). Ота (Ohta, 1971) показал, что гаметичес- кое неравновесие во вредных локусах и в нейтральном маркерном локусе
(так называемое ассоциативное сверхдоминирование) могут привести к ви- димому гетерозиготному преимуществу в маркерных локусах. Предполо- жим, что локус А - это нейтральный маркерный локус и что существует неравновесие между благоприятным (-) и диким (+) аллелем в двух других локусах так, что в популяции имеются две хромосомы At + -иА2-+. Пред- полагая, что гомозиготы -/- имеют селективный вред s, при полном до- минировании аллеля дикого типа, приспособленности трех генотипов, Л + - IA + -, А{ + - 1А2- + и А2- + !А2- + равны 1 - s, 1 и 1 - s, соответ- ственно. Хотя это приводит к появлению гетерозиготного преимущества в маркерном локусе А, оно возникло из-за ассоциированных вредных ал- лелей. Для оценки значения внутреннего гетерозиготного преимущества по сравнению с ассоциацией гетерозиготность-приспособленность (ас- социативное сверхдоминирование и идентичное неравновесие) Саволай- нен и Хедрик (Savolainen, Hedrick, 1995) изучили популяции сосны, в ко- торых практически нет ни генетического дрейфа, ни инбридинга (см. пример 10.7). ТАБЛИЦА 10.12. Пример кажущегося отбора по нейтральному локусу (Л), который ва- рьирует по направлению в зависимости от ассоциации с аллелями в локусе В М я,я2 а2а2 5,5, 5,5, 5,5, 1+5 1+5 1+5 1 1 1 1-5 1-5 1-5 (а) Полное притяжение выявляет отбор, благоприятствующий аллелю А Генотип ЯД/ЯД а2в2/а2в2 Приспособленность 1+5 1 1-5 (б) Полное отталкивание выявляет отбор, благоприятствующий аллелю А Генотип ЯД/ЯД aiB2/A2Bi A2Bt/A2Bt Приспособленность 1-5 1 1+5 Пример 10.7. Ассоциация гетерозиготности и приспособленности игра- ет важную роль в поддержании генетической изменчивости, даже если корреляции между гетерозиготностью и приспособленностью слабы и непостоянны в разных выборках (David, 1998).Положительные корреля- ции между гетерозиготностью и приспособленностью могут быть резуль- татом идентичного неравновесия или ассоциативного сверхдоминирова- ния, как обсуждалось выше. Один способ для определения значения
внутреннего гетерозиготного преимущества состоит в анализе ассоциа- ции гетерозиготность-приспособленность в популяциях, где генетичес- кий дрейф, очень мал, так что ассоциативное сверхдоминирование может влиять только на малую часть генома, а малый инбридинг делает иден- тичное неравновесие маловероятным (Houle, 1989). Популяция сосны обыкновенной, Pinus silvestris, в Финляндии очень велика (Muona, Harju, 1989). Генный поток пыльцы обширен настолько, что на расстоянии более чем 1000 км не выявляется дифференциации молекулярных маркеров (Karhu et al., 1996). К тому же, даже если сосна самосовместима, генотипы взрослых деревьев соответствуют пропорци- ям Харди-Вайнберга, и взрослые инбредные деревья не встречаются (Muona, Harju, 1989). Маловероятно, чтобы в этой большой недифферен- цированной неинбредной популяции наблюдалась бы ассоциация гетеро- зиготность - приспособленность, обусловленная ассоциативным сверх- доминированием или идентичным неравновесием, поскольку существуют только очень слабый генетический дрейф и инбридинг. Существует ли какая-либо ассоциация гетерозиготность-приспособ- ленность у сосны обыкновенной? В 3 разных популяциях была изучена ассоциация гетерозиготности 12 аллоферментов и 6 количественных при- знаков, связанных с приспособленностью. Одна из популяций - линия деревьев за Полярным Кругом, в одном из наиболее экстремальных и стрессовых мест обитания сосны. Две другие популяции были размноже- ны вегетативно и количественные измерения были проведены у потом- ков одного и того же клона, так что было возможно наилучшим образом оценить влияние генотипа на количественные признаки. Из 156 тестов на 5% уровне были значимы ассоциации только в 12 (7,7%) локусах. Из этих 12 значимых величин у 6 гетерозиготы имели высшие значения, а у дру- гих 6 высшие значения имели гомозиготы. Эти результаты иллюстрирует рисунок 10.10, на котором показан уровень значимости для трех популя- ций сосны и 12 различных локусов. Очевидно, что кластеризация около вертикальной линии 5%-го уровня значимости для различных локусов или популяций отсутствует. К тому же, гетерозиготность для каждого от- дельного дерева была тестирована на ассоциацию с каждым из шести при- знаков и с совокупностью из шести признаков, и не было обнаружено значимых ассоциаций. В общем, доказательств преимущества гетерози- гот в этих популяциях не получено, даже при высокой статистической силе выявления такой ассоциации во многих сравнительных тестах. Как отмечалось ранее, сцепление и частичное самооплодотворение оказывают одинаковое влияние на снижение скорости нарушения нерав- новесия в отсутствие отбора. При исходном неравновесии, отборе по од-
Vilhelminmaki ACO F-Est Gdh Got-2 Lap-1 Lap-2 Mdh-1 Mdh-2 6-Pg-1 6-Pg-2 Sdh-1 Sdh-2 Viitaselka 0.0 0.2 0.4 0.6 0.8 1.0 P Yllastunturi Рисунок 10.10. Вероятность уровня значимости для различия между гетерозиготами и гомозиготами по 12 полиморфным локусам в трех различных популяциях. Отдельные точки обозначают уровень вероятности для данного количественного признака. Верти- кальные пунктирные линии обозначают значимость на 5% уровне. ному или двум локусам и при тесном сцеплении, или высокой степени самооплодотворения, генетический хичхайкинг может быть потенциаль- ной силой, изменяющей аллельные частоты и гетерозиготность. На ри- сунке 10.11 дано сравнение сцепления и частичного самооплодотворе- ния, которое приводит к сходному изменению частоты нейтрального аллеля В. (В. достигает конечной частоты, равной приблизительно 0,6) в обоих случаях, где на локус А действует отбор. При сцеплении с = 0,01, а при частичном самооплодотворении S = 0,95. Если коэффициент отбора в локусе А равен 0,2, то существует аддитивное действие генов, и исходная частота гамет равна 0,01 и 0,99 для гамет А ]В[ и А2В2, соответственно. Хотя уровень сцепления и самооплодотворения, выбранный в этом при- мере, приводит к сходным общим значениям изменений аллельных час- тот, хичхайкинг при частичном самооплодотворении изменяет аллельные частоты в нейтральном локусе гораздо быстрее, чем хичхайкинг при сцеп- лении. Это может быть связано с более быстрым изменением аллеля А ( в селективном локусе А при частичном самооплодотворении. Генетичес- кий хичхайкинг может также снизить уровень гетерозиготности или раз- нообразия гамет (см. ниже). Кроме влияния на аллельные частоты и гетерозиготность в ассоции- рованных локусах генетический хичхайкинг может привести к измене- ниям в гаметическом неравновесии (когда он влияет на частоты в двух и более локусах одновременно), (Thomson, 1977). Это происходит из-за одновременного хичхайкинга аллелей в двух локусах, которые находятся в гаметическом неравновесии с третьим селективным локусом. Рисунок 10.12 иллюстрирует изменения аллельных частот и гаметического нерав-
Рисунок 10.11. Изменение аллельной частоты для селективно благоприятного аллеля (Л,) и нейтрального аллеля (5^, ассоциированного с аллелем А . Пунктирные линии обозна- чают частоты аллелей А и В при их сцеплении (с = 0,01), а сплошные линии - изменения аллельных частот, когда S = 0,95 и нет сцепления. новесия для трехлокусных гамет А^В^С, А.В2С2, А2В1С2 и А2В2СХ, имею- щих исходные гаметические частоты, равные 0,25, и другие четыре гаме- ты имеют исходные гаметические частоты, равные 0, так что нет исход- ного гаметического неравновесия между любой парой локусов, кроме исходного трехлокусного неравновесия (Hedrick, 1980а). Это пример 20%-ного селективного преимущества генотипа Л Д над генотипом А^2 и промежуточного преимущества гетерозигот. В случае 99%-ного самооплодотворения (рисунок 10.12) тесное сцеп- ление дает сходные результаты. Заметьте, что частота аллеля Ах быстро возрастает к значениям, близким 1,0, тогда как частоты аллелей Вх и С остаются равными исходной (0,5). Однако неравновесие между двумя нейтральными локусами (ОЙС) быстро поднимается от нуля, так что к поколе- нию 25 оно составляет более 85% от максимального значения (D’BC = 4 ОйС). Это происходит, потому что благоприятный аллель А, ассоциирован с га- метами в фазе притяжения, ВХСХ и В2С2. Поскольку частота аллеля Л, воз- растает, он также увеличивает частоты этих ассоциированных типов. Не- равновесие между нейтральными локусами остается высоким в течение продолжительного периода времени из-за высокой степени самооплодо- творения и нарушается со скоростью, ожидаемой для двух нейтральных локусов с высоким самооплодотворением. Этот пример иллюстрирует, что генетический хичхайкинг может вызвать гаметическое неравновесие между нейтральными локусами и что повышение неравновесия может
Рисунок 10.12. Изменение аллельных частот (пунктирные линии) и гаметическое нерав- новесие (сплошные линии) при отборе только по локусу А и при 90%-ном частичном самооплодотворении. происходить без изменения аллельной частоты в нейтральном локусе (точ- но также происходит при мультилокусном отборе). В примере 10.8 об- суждаются изменения неравновесия, наблюдаемые для трех сцепленных аллоферментных локусов в популяции ячменя с высокой степенью само- оплодотворения . Пример 10.8. Аллард с сотрудниками и другие исследователи (Allard et al., 1972b; Weir et al., 1972, 1974) детально исследовали высоко самооп- лодотворяющийся культурный ячмень, Hordeum vulgare. Они обнаружи- ли очень высокую ассоциацию между аллелями в различных локусах. Более того, в двух популяциях степень гаметического неравновесия дей- ствительно возрастала в поколениях. В одной популяции изменения ал- лельных частот в четырех локусах фермента эстеразы были значительно меньше (в среднем на 0,086 в течение 26 поколений) для двух наиболее частых аллелей в каждом локусе. Но обнаружились изменения значений гаметического неравновесия между парами этих локусов (Allard et al., 1972). Попарные значения гаметического неравновесия для трех сцеп- ленных эстеразных локусов (ЕА, Ев, Ес.) во всех поколениях, исследован- ных в этой популяции (Composite Cross V-CCV), представлены на рисун- ке 10.13 (сплошные линии и незаштрихованные кружки). Эти результаты были использованы для доказательства коадаптации у данного высоко са- мооплодотворяющегося вида. Но полученные данные можно объяснить и с помощью других гипотез. Например, хичхайкинг обусловлен систе- мой скрещивания, т.е. отбор действует на другой локус или локусы в ге-
номе и из-за высокого самооплодотворения действует на частоты алле- лей в аллоферментных локусах. Хедрик и Холден (Hedrick, Holden, 1979) моделировали наблюдаемые изменения неравновесия с учетом простого направленного отбора в локу- се, не сцепленном с аллоферментными локусами (пунктирные линии на рисунке 10.13). В этих моделях были использованы известные значения частоты рекомбинаций (частоты рекомбинаций между локусами Е4 - Е, Е4 -EqmE в- Ес были 0,0023,0,0048 и 0,0061, соответственно), а оценочное значение самооплодотворения равнялось 0,9943. Поскольку популяция воз- никла в результате серий скрещиваний, предполагалось случайное распре- деление гамет в зиготах в исходном поколении. По локусу, претерпевшему отбор, было обнаружено 20% селективного различия между гомозиготами, что говорит о промежуточности гетерозигот. Из сходства наблюдаемых данных и модели, очевидно, что изменения, наблюдавшиеся в этой популяции, могли быть результатом хичхайкинга в аллоферментных локусах, при действии направленного отбора в других локусах генома. Поскольку экспериментальные популяции ячменя пред- ставляют собой генные пулы мировой коллекции, маловероятно, чтобы исходная (предковая) популяция была адаптирована к условиям Девиса (Калифорния.) Очевидно, в популяции действовал отбор, направленный против одного или более неблагоприятных аллелей. Наблюдаемые аллель- ные частоты и гаметическое неравновесие можно объяснить с помощью хичхайкинга, возникшего в результате частичного самооплодотворения. Рисунок 10.13. Наблюдаемые изменения гаметического неравновесия для трех локусов эстеразы Е4, Ев и Ес (сплошные линии) и модели, описывающие эти изменения (пунктир- ные линии), (по Hedrick, Holden, 1979).
V. Рекомбинация и генетическая изменчивость V. Рекомбинация и генетическая изменчивость Влияние рекомбинации на адаптацию и на характер и степень генетичес- кой изменчивости долго оставалось предметом эволюционной теории. Например, рассмотрение мультилокусного отбора в постоянной окружа- ющей среде предполагает, что более низкая рекомбинация, приводит к более высокой средней приспособленности (Fisher, 1930; Lewontin, 1971). Однако при изменении среды или росте приспособленности организма в этой среде преимущество состоит в большем разнообразии генотипов в популяции вследствие значительной частоты рекомбинаций. Предполо- жим, что частота гамет А ХВХ и А2В2 высока из-за мультилокусного отбора в данной среде, благоприятного для этих сбалансированных гамет. Допу- стим, что в новой среде отбор благоприятен гомозиготам Л]52/Л|52. По- скольку гаметы А{В2 (не аллели Ах или 5,) исходно низки по частоте, ско- рость ответа на действие отбора будет понижена по сравнению с популяцией в гаметическом равновесии. Теоретически бесполое размножение имеет двукратное преимущество по сравнению с половым размножением (Barton, Charlesworth, 1998). Пред- положим, что популяция стабильна по размеру, так что каждая самка, раз- множающаяся половым путем, и каждая бесполая самка имеют двух по- томков. Два потомка от самки, размножающейся половым путем, несут только половину генов их матери (другая половина от их отца), тогда как бесполые самки несут только гены их матерей. На самом деле различие в частоте рекомбинаций между двумя система- ми размножения создает популяционно-генетическое преимущество поло- вого размножения над бесполым (Muller, 1932; Barton, Charlesworth, 1998). При бесполом размножении ранее существующие, хорошо адаптирован- ные генотипы сохраняются, потому что нет гаметогенеза (сегрегации алле- лей или рекомбинации). При половом размножении благоприятные ген- ные комбинации нарушаются каждое поколение, но из-за рекомбинации есть вероятность, что могут быть сформированы новые зиготы, имеющие более высокую приспособленность, чем в предыдущих поколениях. В ре- зультате, отбор в популяции с половым размножением может привести к появлению популяции с генотипическим средним гораздо выше, чем пре- дел фенотипов в исходной популяции. Популяции с бесполым размноже- нием могут прогрессировать не далее, чем до лучшего генотипа в исход- ных популяциях. Более того, в бесполой популяции последовательные, благоприятные мутации для включения в популяцию должны появляться в одной линии происхождения (рисунок 10.14). В популяции с половым раз- множением рекомбинации способствуют объединению в одном генотипе
Глава 10. Мультилокусные модели Поколение Рисунок 10.14. Частота различных генотипов во времени при бесполом (а) и половом (Ь) размножении (по Crow, Kimura, 1965). благоприятных мутаций, появившихся в разных линиях происхождения. Другими словами, через сегрегацию и рекомбинацию пол получает пре- имущество, повышая степень адаптации к изменениям как в физической, так и биотической (хищники, патогенные организмы и т.д.) среде. Из-за селективного преимущества, которое позволяет рекомбинации объединять независимые благоприятные мутации, может существовать отбор на более высокую степень рекомбинации, особенно при тесном сцеплении генов или в периоды быстрых эволюционных изменений (Otto, Barton, 1997). Половое размножение может иметь значение и при элиминации или редукции вредных вариантов. Мюллер (Muller, 1932) предположил, что без полового размножения вредная мутация может накапливаться и приспособленность особей со временем понижается (явление, извест- ное как храповик Мюллера (Muller’s ratchet), (Kondrashov, 1988; Gillespie, 1998). Для иллюстрации этой теории предположим, что в исходный момент времени t индивиды в популяции могут иметь 0, 1, 2, 3, ... вредных мутаций (таблица 10.13). Заметьте, что эти мутации могут быть в совершенно разных генах у разных особей. Допустим, что одна вредная мутация в некотором гене имеется у доли особей у,7 в
популяции. Если в классе 0 количество мутаций мало, то класс 0 мо- жет быть потерян случайно, и в момент времени t + 1 оставшийся класс с наименьшим количеством мутантов будет классом, в котором все ин- дивиды имеют одну мутацию. С этой точки храповик (колесо с зубья- ми, которые механически предотвращают обратный ход) сделал один поворот, и приспособленность популяции непоправимо понизилась. Если количество индивидов с одной мутацией мало, то ко времени t + 2 этот класс также может быть потерян, и храповик делает два поворо- та. За это время вредные мутации могли повысить количество мутан- тов так, что количество индивидов в наименьшем оставшемся классе снизилось. В соответствии с этим сценарием приспособленность по- пуляции постепенно снизится, и популяция будет вымирать, пото- му что каждый индивид имеет большое количество вредных генов. Теоретически шкала времени для этого процесса может быть очень долгой (Charlesworth et al., 1993), но в экспериментальной системе Райс (Rice, 1994) наблюдал значительную деградацию нерекомбинантной хромосомы за относительно короткое время. Однако, при половом раз- множении рекомбинация может привести к незначительному числу вредных мутаций - у особей из классов, потерянных ранее, и сниже- ние приспособленности прекратится. ТАБЛИЦА 10.13. Схема действия храповика Мюллера во времени в популяции с беспо- лым размножением, где - пропорция особей с / вредными мутациями в момент време- ни t. С течением времени класс с наименьшим количеством мутаций случайно теряется вследствие отсутствия рекомбинаций и не может быть восстановлен. В результате храпо- вик вращается только в одном направлении, а приспособленность популяции по мере на- копления вредных мутаций снижается Количество мутаций Время t 1+1 1+2 t + 3 0 То-, 0 0 0 1 Т1.,+1 0 0 2 Уъ, ?2-t+2 0 3 Уи >'з,+1 У31 + 2 Т.з-,+з i У,, У., + 2 Т,.,+3
1.0 Поколение Рисунок 10.15. Изменение аллельной частоты и пропорций исходной гетерозиготности в локусе В с течением времени при хичхайкинге, который является результатом отбора по локусу А. Величина отбора, действующего на локусы, определяемая молекуляр- ными методами, может быть так мала, что эти локусы, по существу, ней- тральны для отбора, действующего на другие фоновые локусы. В этом случае один из наиболее значительных эффектов генетического хичхай- кинга - утрата гетерозиготности таких молекулярных вариантов в облас- тях низкой рекомбинации, обусловленная выметающим отбором. Счита- ется (Maynard Smith, Haigh,1974), что молекулярный полиморфизм может модифицироваться хичхайкингом в нейтральных генах, соседних с локу- сами, претерпевающими аллельные замены. Такие замены в близко сцеп- ленных локусах могут сильно понизить гетерозиготность в других ассо- циированных локусах. Предположим, что полиморфные и нейтральные аллели и В, в локусе В имеют равные исходные частоты и что новая благоприятная мутация (А) с селективным преимуществом х = 0,2, обра- зуется в локусе А на хромосоме В. с исходной частотой 0,01. Так как два локуса тесно сцеплены (с = 0,01), то аллель А' передается в популяции и понижает гетерозиготность в локусе В до предельного значения около 40% и выметания его отбором (рисунок 10.15). Если рекомбинация гораз- до ниже, скажем с = 0,001, тогда гетерозиготность в локусе В снижается почти до нуля. Чтобы связать этот эффект с изменчивостью внутри, или в окружении одного гена, Хадсон (Hudson et al.,\99T) предположил, что селективное выметание при 5 = 0,01 может снизить изменчивость в сай-
V. Рекомбинация и генетическая изменчивость тах на расстоянии до 10 т.п.н. от селективного локуса (при частоте реком- бинации, типичной для D.melanogaster). Альтернативное объяснение низкой изменчивости в областях низкой рекомбинации - это отбор против вредных мутантов, тесно сцепленных с нейтральными вариантами - феномен, названный фоновым отбором (background selection), (Charlesworth et al., 1993). В этом случае хромосо- ма, в которой появляется новая вредная мутация, действительно будет потеряна в результате отбора. Если мутантный и нейтральный локусы не рекомбинируют между собой, то, вариант в нейтральном локусе на этой хромосоме также будет потерян. Эффект каждого такого события мал, но при большом количестве вредных мутаций и их распространенности в геноме, они могут иметь значительный кумулятивный эффект. Хадсон и Каплан (Hudson, Kaplan, 1995) показали, что этот эффект приблизитель- но равен: 71 ~ лое~и!с, (10.11) где 71 и 7Г(| - нуклеотидные разнообразия при фоновом отборе и без фоно- вого отбора, и - скорость мутирования к вредному варианту на тысячу пар нуклеотидов, и с - степень локальной частоты рекомбинаций в опре- деленной области. Они сравнили наблюдаемые эффекты с ожидаемыми для 15 генов на третьей хромосоме D.melanogaster (рисунок 10.16). За- метьте, что наблюдаемая степень разнообразия возрастает с возрастани- ем уровня локальной рекомбинации (заштрихованные кружки). Для срав- нения теоретических прогнозов с этими наблюдениями они исследовали случаи, когда и = 0,0002 и тт0 = 0,012 (сплошная линия) и когда и = 0,00004 и тто = 0,007 (пунктирная линия). В общем, эти кривые объясняют наблю- даемые взаимосвязи между разнообразием и рекомбинацией, а модели с меньшими приближениями дают даже лучшее соответствие (Hudson, Kaplan, 1995). В общем, и выметающий, и фоновый отбор прогнозируют снижающе- еся разнообразие аллелей в областях с низкой рекомбинацией, как видно из ряда примеров с Drosophila (Berry etal., 1991;Begun, Aquadro, 1992).В отличие от фонового отбора, выметание отбором прогнозирует измене- ние в распределении вариантов из нейтральности с более низкими про- порциями редких аллелей (Braverman et al., 1995). Поэтому изучение на- блюдаемых распределений - это способ различения двух процессов отбора. Хотя оба процесса, очевидно, имеют значение в данных обстоя- тельствах (Charlesworth, 1996), правомерность двух гипотез все еще не ясна, особенно в организмах, отличных от Drosophila. Для интерпрета- ции эмпирических наблюдений пределов отбора используется алгоритм, разработанный Хиллом и Робертсоном (Hill, Robertson, 1966). Они пока-
Рисунок 10.16. Наблюдаемое нуклеотидное разнообразие (л) для разных уровней реком- бинации (с) генов на третьей хромосоме D.melanogaster (сплошные кружки) и значения, предсказанные с помощью выражения 10.11, когда и = 0,0002 и л.. = 0,012 (сплошная линия) и когда и = 0,00004 и ли = 0,007 (пунктирная линия), (по Hudson, Kaplan, 1995). зали, что при наличии двух тесно сцепленных генов (сайтов), направляю- щий отбор в одном локусе действует на вероятность фиксации во втором. По аналогии с этим эффектом, иногда называемым эффектом Хилла-Ро- бертсона, усиление генетического дрейфа понижает эффективный раз- мер популяции. VI. Оценка гаметического неравновесия Когда в популяции исследуют два или несколько полиморфных локусов, можно оценить гаметическое неравновесие между этими локусами. Если гены находятся в гаплоидном состоянии, как у гаплоидных организмов, в мтДНК, в хлДНК, в Y-хромосомах или в Х-хромосомах у самцов (см. пример 10.4) или у самцов гапло-диплоидов, то можно оценить гамети- ческие частоты и гаметическое неравновесие. У организмов с небольшим числом множественных гетерозигот, например при высокой степени са- мооплодотворения, множественными гетерозиготами можно пренебречь из-за очень малого их влияния на оценку гаметического неравновесия. У некоторых лабораторных организмов или в семейных группах, можно
VI. Оценка гаметического неравновесия 5 I 3 определить фазу гамет. Часто оценка гаметических частот не может быть сделана напрямую. Например, нельзя определить фазу гамет у множе- ственных гетерозигот, но возможно оценить гаметическое неравновесие в популяции. а. Прямая идентификация гамет При возможности прямой идентификации случайной выборки из п двух- локусных гамет (мтДНК, Y-хромосом и т.д.), получаются количества раз- личных гамет с двумя аллелями в каждом локусе, которые представлены в таблице 10.14а. Оценки максимального правдоподобия аллельных час- тот и гаметического неравновесия в таких случаях равны: Л А?.-) + Л-)-, =_12---------------22 п (10.12а) р _ ^11^22 ^12^21 л2 При D = 0 используется статистическое отношение правдоподобий: Q - пг2 = пЬ2 РхРгМг ’ (10.12b) Когда D = 0 и N велико, распределение величины Q приближается к рас- пределению %2 с одной степенью свободы (Hill, 1974). Вероятность можно вычислить с помощью точного критерия Фишера, при котором гаметические частоты имеют высшее значение как наблюда- емые (Weir, 1996). С учетом обозначений в таблице 10.14а, вероятность ряда с пИ, и12, л]2и л22 гамет АХВХ, А}В2, А2В} и А2В2, соответственно, при крайних значениях п и п2, равна: Рг(пи,пр, п21, п22 л, \п2!пх\п2\ лп!и1:!п2х!п22\п\ ’ (10.12с) Используя точный критерий Фишера, Левонтин (Lewontin, 1995) пока- зал, что при малой копийности редкого аллеля в сайте или локусе невоз- можно или очень трудно определить неравновесие (неравновесность) по сцеплению. На примере 10.9 показано использование точного критерия Фишера для малой и большой выборок данных.
Глава 10. Мультилокусные модели ТАБЛИЦА 10.14. Количество разных гамет при их прямой идентификации (а) и количе- ство разных фенотипов, когда оба локуса кодоминантны (Ь) (а) Прямая идентификация гамет А А2 Всего в, «и пи Bi п П22 И., Всего Т п (Ь) Оба локуса кодоминантны АА, Всего V. ^,3 В\В1 ^3 А,. в2в. А33 А3. Всего N., А.3 А Пример 10.9. Так как для многих генов известно множество последова- тельностей, то можно решить вопрос о степени и характере неравновесия (неравновесности) по сцеплению между сайтами этих генов. Один из рас- пространенных способов количественного определения неравновесия состоит в расчете точного критерия для всех пар полиморфных сайтов. Вейр (Weir, 1996) приводит простой пример вычисления точного крите- рия, используя данные по рестрикционным фрагментам ДНК из локуса Adh у D.melanogaster из работы Langley et al. (1982). В таблице 10.15а даны 17 гамет с двумя наблюдаемыми рестрикционными сайтами (“-“ и “+” обозначают отсутствие и наличие рестрикционного сайта). Возмож- ны семь гаметических рядов, которые удовлетворяют крайним (марги- нальным) результатам (таблица 10.15b). Эти ряды можно найти при при- своении семи номеров, от 0 до 6, редким гаплотипам и, затем, добавляя другие номера гамет, так чтобы это удовлетворяло крайним номерам. Используя выражение 10.12с, можно вычислить вероятности рядов гамет и затем распределить эти ряды по возрастанию вероятности. Наблюдае- мый ряд гамет (жирный шрифт) встречается с вероятностью в три раза меньшей, и кумулятивная (суммарная) вероятность, включающая наблю- даемый ряд, значима при 0,042. Для этого ряда D = -0,125 и из выражения 10.12b находим Q = 5,06, также значимое на уровне 0,05. Кларк и сотруд- ники (Clark et al., 1998) исследовали молекулярные варианты во фраг- менте гена липопротеин-липазы размером 9,7 т.п.н., у 71 человека из трех популяций: у 24 американцев африканского происхождения из Мисси- сипи, 24 финнов из Северной Карелии и 23 европеоидов неиспанского
происхождения из Миннесоты. В 142 исследованных хромосомах было 88 различных гаплотипов, которые объединялись в две основные груп- пы. Эти основные группы присутствовали во всех трех популяциях, и тесты на гомогенность между популяциями не были значимыми. Точный критерий был рассчитан для всех пар из 88 полиморфных нуклеотидных сайтов (рисунок 10.17). Пары сайтов со значимым точным критерием (Р < 0,001), без поправки на множественность сравнений, обозначены за- крашенными квадратиками. Между парами на З'-конце гена, начиная с интрона перед экзоном 7, имеется концентрация значимого неравнове- сия. Однако из-за редких нуклеотидов в одном или обоих сайтах большое количество полиморфных сайтов не имело статистической силы для вы- явления значимой ассоциации (квадратики с точкой в центре). Тест на общее неравновесие, основанный на количестве положительных и отри- цательных наблюдаемых случаев неравновесия (Lewontin, 1995), показал значительный избыток неравновесия в фазе притяжения с ассоциацией редких аллелей в парах сайтов. Это обширное неравновесие было обна- ружено, несмотря на доказательства поздней рекомбинации в этом участ- ке хромосомы. ТАБЛИЦА 10.15. Ряды гамет, наблюдаемые для сайтов рестрикции ВатН! и Xhol в локу- се Adh 17-ти хромосом D.melanogaster (а), (по Langley et al., 1982). Вероятность рядов гамет, полученных из уравнения 10.12с, в возрастающем порядке и кумулятивная вероят- ность (b), (по Weir, 1996) (а) BamHI - 4- Xhol - 0 6 6 4- 6 5 11 6 11 17 (b) -- -+ 4— 4-4- Вероятность Кумулятивная вероятность 6 0 0 11 0,000 0,000 5 1 1 10 0,005 0,005 0 6 6 5 0,037 0,042 4 2 2 9 0,067 0,109 1 5 5 6 0,224 0,333 3 3 3 8 0,267 0,600 2 4 4 7 0,400 1,000
Глава 10. Мультил вкусные модели Сайт / Рисунок 10.17. Значимое неравновесие по сцеплению между 88 полиморфными сайтами в гене липопротеин-липазы человека (закрашенные квадратики). Диагональные линии обо- значают локализацию сайта и положение экзонов (от 4 до 9). Квадратики с точками в центре - сайты, где потеряна сила критерия на значимую ассоциацию (по Clark et al., 1998). Хотя точный критерий Фишера теперь широко используется для опре- деления неравновесия между нуклеотидными сайтами, Цапата и Алварец (Zapata and Alvarez, 1997) считают, что он довольно консервативен и при- водит к нежелательной потере статистической силы. Однако, при исполь- зовании поправки Точера (Tocher, 1950), точный критерий становится «наи- более сильным среди достоверных критериев». При использовании этой поправки для нескольких выборок данных, исследованных Цапатой и Ал- варецом, пропорция значимых ассоциаций в два - три раза выше, чем без поправки. К тому же, пропорция значимых ассоциаций, которую они обна- ружили, с помощью точного критерия с поправкой Точера, очень близка к значению, полученному с помощью критерия %2 (см. выше), поэтому было предложено использовать более простой критерий %2.
VI. Оценка гаметического неравновесия Ь. Два кодоминантных локуса Если в каждом из двух полиморфных локусов содержится два кодоми- нантных аллеля, то можно определить все гаметы, которые составляют каждый из фенотипов двойных гетерозигот. Для такого фенотипа, два вида двойных гетерозигот (в фазе притяжения и отталкивания) неразличимы (если не проводится контрольное скрещивание). Поэтому в таблице 10.14b приведены только девять наблюдаемых фенотипических классов. В при- мере означает количество индивидов с генотипом А АД В Для оценки гаметического неравновесия, где фаза двойных гетерози- гот неизвестна, можно использовать оценку максимального правдоподо- бия частоты генотипа АДХ: 2N I х,х. + X-,: (10.13а) гдех2,х3 их4 - аналогичные выражения для других гамет (Bennett, 1965; Hill, 1974). Поскольку нет точного решения этого уравнения, значение/) должно быть получено повторением (итерацией). Хилл предложил ис- пользовать для этого выражение: Ь = х, - pq. (10.13b) и вычислять величину X] с помощью итерации. Это возможно, потому что ~ Т j- N „ 2V, + jjV2 p'=^^nq'=—ir- Можно сделать следующие подстановки: Хг = Д -X], Х4 = 1 - Д - <71 + X]. Тогда выражение 10.13а принимает вид: ^[2Х11+Х12 + Х21 + ^22*1(1" А ~А +А) АО-А - А -А) + (А -АХА -А) (10.13с) Единственная неизвестная величина в этом выражении -хг Ее можно вычислить, выбирая значение х, для правой части уравнения и определяя конечное значение xt. Это вычисленное значение можно подставить в правую часть и процесс повторяется, пока не получится желаемая точ- ность. Возможная стартовая точка для этой итерации равна:
Глава 10. Мультилокусные модели . __2N„+Ni2 + N2} ’ 2(N-N22) и представляет собой оценку гаметической частоты, исключая двойные гетерозиготы. Однако, Вейр и Кокерхэм (Weir, Cockerham, 1979) показа- ли, что в некоторых случаях, зависящих от стартовой точки, эта итераци- онная процедура может приближаться к разным значениям. Критерий %2 с одной степенью свободы равен: Q = Nr2 = ND2 P\PiQ\Qi (10.13d) В примере 10.10 показано определение значимого неравновесия для двух аллоферментных локусов у голубого двустворчатого моллюска с помо- щью этого подхода. Пример 10.10. Миттон и Коэн (Mitton, Koehn, 1973) одновременно изуча- ли два аллоферментных локуса, Ар и Lap, в популяции голубого двуствор- чатого моллюска Mytilus edulis. Эти локусы кодируют ферменты со сход- ными каталитическими функциями, но данные об их сцеплении отсутствуют. Численность особей в девяти фенотипических классах при- ведена в таблице 10.16. Используя выражение 10.13с, получим оценоч- ную частоту гамет ApfLapl{x]), равную 0,302 и оценочное значение не- равновесия (из выражения 10.13b), равное -0.0246. В этом случае наблюдаемые значения гаметического неравновесия значимы на 5% уровне (2 = 5,43). ТАБЛИЦА 10.16. Численность голубых моллюсков в разных фенотипических классах с двумя аллоферментными локусами (но Mitton and Koehn, 1973) Ар Lap ff fin mm ff 61 96 49 206 fm 60 112 56 228 mm 49 34 17 100 170 242 122 534 Xj =0,302 D = -0,0246 2 = 5,43
с. Множественные аллели Когда в локусе более двух аллелей, трудно выразить степень межлокус- ной ассоциации одним параметром. Значение D для множественных ал- лелей в двух локусах для любой пары локусов равно: (10.14а) где Хд - оценка частоты гаметы А В в популяции, и Д. и q, - оценки частот аллелей А. и 5, соответственно. Допустим, что в каждом локусе три алле- ля, тогда таких значений девять, хотя они и зависят друг от друга. Для сжатого изложения данных о гаметах с множественными аллеля- ми существует несколько альтернативных подходов (Hill, 1975; Hedrick, 1987b). Например, прямой статистический метод: к т Q = n^(DlrPiq^ (10.14b) ,=1 7=1 где к и т - аллели в локусах А и В, соответственно, а п — численность существующих гамет. Если D = 0, то величины Q приближаются к рас- пределению с1 с (к - l)(m - 1) степенями свободы. Для оценки степени неравновесия при множественном аллелизме и при неизвестной фазе двойных гетерозигот используется модифицированный метод Хилла (Hill, 1974, см. также Excoffier, Slatkin, 1995; Long et al., 1995; Slatkin, Excoffier, 1996). Задачи 1. Определите значение D в уравнении 10.2b, из выражения, данного в уравнении 10.2а. Определите частоту гамет А [В2 после одного поко- ления случайных скрещиваний. 2. Допустим, что х = 0,3, х2 = 0,1, х = 0,2 и х4 = 0,4, вычислите значе- ния D, D' и г. 3. Предположим, что с = 0,1 и S = 0,9, каково значение D после трех поколений, если исходно оно равно 0,10? Допустим, что с = 0,1 и А= 0,9, каково будет значение D после трех поколений, если исходно оно равно 0,10? 4. Если с = 0,01, N = 500 и N = 50, то каково значение г2? Используйте выражения, 10.6а и 10.6b. 5. Если две популяции смешиваются так, что т = 0,2 (т = 0,8) и час- тоты аллеля в диаллельном локусе равны 0,3 и 0,6, а частоты аллеля
520 Глава 10. Мультилокусные модели во втором двухаллельном локусе равны 0,4 и 0,5 в двух популяциях, то каково ожидаемое значение D1 6. Следует ли из данных, представленных в примере 10.5, трицен- трическое происхождение мутации серповидноклеточной ане- мии? Какие еще данные желательно иметь для проверки этой гипотезы? 7. Получите общее выражение для частоты гаметы A В2, если действу- ет отбор (см. выражение 10.9b). 8. Предположим, что а = 0,8 и Ь = 0,85, распишите матрицу приспо- собленностей 3x3. Каков критический уровень рекомбинации для этих приспособленностей? Если с = 0,01, то каковы частоты га- мет и гаметическое неравновесие в двух комплементарных рав- новесиях? 9. Допустим, что частоты гамет ++, +-, -+ и — равны 0,15, 0,45, 0,35 и 0,05. Вычислите частоты десяти возможных генотипов, предполагая соответствие пропорциям Харди-Вайнберга. Если ге- нотипы -/- имеют селективный вред, равный 0,2, имеется полное доминирование аллеля дикого типа и мультипликативные приспо- собленности по локусам, то какова средняя приспособленность для двойных гомозигот, простых гетерозигот и двойных гетеро- зигот? 10. Вычислите кумулятивные вероятности для гамет из таблицы 10.15b. 11. Определите гаметическое неравновесие для данных в таблице 10.16, используя предложенную стартовую частоту для итерации и значе- ние для выражения 10.13d с учетом этих данных. 12. Допустим, что сильное гаметическое неравновесие наблюдалось между аллелями в двух локусах в разных популяциях. Как можно спланировать исследование для определения причины этой ассо- циации? 13. Обдумайте два фактора, которые могут сделать недействительным храповик Мюллера. Как можно проверить значимость этих факто- ров в реальной популяции?
Задачи 52l) 14. Левонтин (Lewontin, 1995) отметил, что даже при сильном неравно- весии по сцеплению между нуклеотидными сайтами их ассоциация может быть статистически незначимой. В качестве примера рассмот- рим гаметы (и их численность) в двух сайтах АА (1), АТ (6), ТА (15) и ТТ (78). Рассчитайте кумулятивную вероятность обнаруженного неравновесия, равную или более крайнюю, чем наблюдаемая. 15. Обсудите различия между выметающим и фоновым отбором. Раз- работайте эксперимент, при котором были бы получены данные, по- казывающие относительное значение этих двух механизмов для ге- нетической изменчивости.
ГЛАВА 11 КОЛИЧЕСТВЕННЫЕ ПРИЗНАКИ И ЭВОЛЮЦИЯ Для описания количественных признаков важна, скорее, общая генетика, чем ста- тистика. Разнообразные проекты исследования генома дают очень плотные карты сцепления генов человека, модельных организмов и видов, имеющих сельскохо- зяйственное значение. При этом между таксонами часто сохраняются сходные группы сцепления. Развитие усовершенствованных статистических методов ана- лиза экспериментальных скрещиваний и родословных, позволяет выявлять сегре- гирующие локусы количественных признаков, ассоциированные с молекулярны- ми маркерами. При разложении этих локусов до уровня единичного гена описание менделевских генетических основ количественной изменчивости становится дос- тижимым пределом. Дуглас Фальконер и Труди Маккей (Douglas Falconer, Trudy Mackey, 1996) За последнюю пару лет мы не раз слышали, как некоторые выдающиеся коллеги утверждали, что «количественная генетика мертва.»... Что, возможно, мертво... так это простые карикатуры признаков, на которые эффективно влияет неограни- ченный ряд локусов с очень малыми аддитивными эффектами... [но] количествен- ная генетика еще полностью способна согласовывать признаки с малым количе- ством локусов (даже одним локусом), неаддитивными генетическими эффектами, нсмендслевским наследованием и другими генетическими сложностями. Действи- тельно, современная техника количественной генетики стоит в ожидании объеди- нения точных генетических деталей сложных признаков, которые будут разъясне- ны молекулярной биологией и биологией развития. Майкл Линч и Брюс Уолш (Michael Lynch, Bruce Walsh, 1998) До сих пор мы рассматривали признаки с известным наследованием. Од- нако, для многих признаков, имеющих эволюционное значение (таких как продолжительность жизни, морфологические, поведенческие и физиоло- гические характеристики) генетические основы точно не известны, а ин- формация о вовлеченных генах, их действии на эти признаки или на дру- гие свойства отсутствует или недостаточна. К тому же, генетическая основа многих болезней человека, таких как диабет, болезни сердца и рак, и ге- нетические основы многих значимых признаков описываются количе- ственно, так как генетические детерминирующие факторы, соответству- ющие этим фенотипам, распределены по непрерывной шкале. Раньше было очень трудно определить количество генов и их действие на количественные признаки. Но благодаря секвенированию геномов раз- ных организмов, многие генетические маркеры стали доступны. Эти мар-
I. Природа количественных признаков 523 керы используются для идентификации и локализации генов, влияющих на количественные признаки и называемых локусами количественных признаков (ЛКП), (quantitative trait loci - QTLs). На генетической кар- те эти ЛКП иногда соответствуют кандидатным генам, которые могут обус- ловить признак благодаря их функции или структуре. Уже идентифици- рован ряд ЛКП, влияющих на эволюционно значимые признаки. Вероятно, что многие из них будут охарактеризованы в ближайшем десятилетии. Большинство подходов, используемых в популяционной генетике для количественного определения генетической изменчивости и прогнозиро- вания действия эволюционных факторов (таких как отбор, инбридинг, ге- нетический дрейф, генный поток) следует применять и для этих генов, влияющих на значимые эволюционные признаки. Количественная генетика имеет богатую историю эмпирических, экс- периментальных и теоретических исследований, основанных, в первую очередь, на статистическом описании количественных генетических при- знаков (Falconer, Mackey, 1996; Lynch, Walsh, 1998). Хотя гены, определя- ющие количественные признаки, точно пока не известны, существует ста- тистическая связь между фенотипом и его генетической основой. При этом предполагается большое количество неизвестных генов с малыми, аддитивными эффектами.Расширение методических подходов может при- вести к биологически реалистичным предположениям. В любом случае, эти методы предоставят неоценимый инструмент познания и прогнози- рования изменений количественных признаков. I. Природа количественных признаков а. Общие характеристики Фенотипическую величину многих признаков, включая морфологические признаки (такие как размер, масса и форма) обычно можно измерить по какой-либо количественной шкале. Хотя эта фенотипическая величина мо- жет быть результатом взаимодействия лежащих в основе генетических де- терминирующих факторов, для большинства количественных признаков не существует определенных взаимосвязей между фенотипической вели- чиной и конкретным генотипом. На количественные признаки, по-видимо- му, влияют многие гены, т.е. эти признаки полигенны. Для иллюстрации полигенной природы количественных признаков предположим, что можно обнаружить влияние множества генов на признак, сравнивая фенотипичес- кие распределения, которые являются результатом действия одного, двух или четырех генов (каждого с двумя аллелями), определяющих фенотипи- ческую величину признака (рисунок 11.1). При промежуточном наследова- нии признаков у гетерозигот и действии двух или четырех генов, эффект
всех генов одинаков и частота всех аллелей равна 0,5, а среда не оказывает влияния на признак. Заметьте, что диапазон признаков остается одинако- вым при возрастании количества локусов и, в результате, среднее генети- ческое влияние каждого локуса на признак снижается. Из рисунка 11.1 вид- но, что если количество генов, действующих на признак, возрастает от одного до четырех, то распределение изменяется от одного дискретного класса к непрерывному. Действительно, при наличии только двух генов точное соответствие фенотип-генотип для всех классов исчезает. Напри- мер, когда два гена влияют на признак, вторая наименьшая фенотипичес- кая величина может быть обусловлена либо генотипом В В2, либо А А В В . К тому же, с возрастанием количества локусов, определяющих признак, пропорция фенотипов в крайних классах уменьшается. Как мы увидим в дальнейшем, отбор крайнего фенотипа может продолжаться и за пределами крайних величин мультилокусных признаков. Фенотипическая величина (например, размер или масса) Рисунок ПЛ. Фенотипические величины в случаях, когда на признак влияют один (а), два (Ь) или четыре (с) гена. Предполагается, что все аллели имеют равные частоты, нет доминирования, и общий диапазон изменчивости постоянен. Генотипы, обусловливаю- щие определенный фенотип, даны для одного и двух генов.
Среда (например, температура или влажность) Рисунок 11.2. Распределение фенотипов в спектре различных сред. Сплошные линии обозначают величины для определенных генотипов, а пунктирные линии дают феноти- пическое распределение, когда все три генотипа объединены в одной выборке. Помимо полигенности, на количественные признаки обычно сильно влияет окружающая среда. Действие среды на количественные признаки можно проиллюстрировать на примере одного локуса с двумя аллелями. На рисунке 11.2 показаны фенотипические величины, обусловленные тре- мя разными генотипами. Генотип А1Л1 проявляется лучше при самых низ- ких средовых величинах, а генотип А^А2 - при высоких средовых величи- нах и генотип А А - промежуточный. Если средняя фенотипическая величина определяется в разных средах обитания для всех трех геноти- пов, тогда фенотипическое распределение можно вычислить для различ- ных частот генотипов. Когда частота аллеля А равна 0,5 и пропорции ге- нотипов соответствуют соотношению Харди-Вайнберга, распределение фенотипов представлено в виде пунктирной линии на рисунке 11.2. За- метьте, что это распределение непрерывно, даже при моногенном насле- довании признака. Обычно такие количественные признаки как размер и масса при усло- вии достаточно точных измерений имеют непрерывное распределение. Такое распределение часто приближается к колоколообразному, или нор- мальному распределению, с высокой пропорцией индивидов, имеющих промежуточный фенотип. В главе 1, мы привели классический пример распределения роста в выборке студентов (мужчин), (рисунок 1.4), где большинство людей находилось в центре распределения и лишь неболь- шое их количество - по обоим краям, а средний рост составил 67,3 ± 2,7 дюйма. На рисунке 11.3 дано распределение роста в выборке студентов мужского и женского пола из Университета Коннектикута в 1996 году, т.е. через 80 лет. Это распределение для мужчин также имеет колоколообраз- ную форму, но средний рост почти на 3 дюйма больше: 70,1 ± 3,0. Замет- ное увеличение роста, вероятно, обусловлено влиянием среды, но выбор- ки могут различаться и в каких-либо других отношениях. У студенток на
Глава 11. Количественные признаки и эволюция рисунке 11.3 средний рост меньше, чем у студентов (64,8 ± 2,7 дюйма). Включение в выборку обоих полов приводит к общему бимодальному распределению. Рисунок 11.3. Распределение роста студентов из Университета Коннектикута в 1996г., где мужчины одеты в темное, а женщины - в светлое (Crow, 1997а). Однако, некоторые количественные признаки имеют только дискрет- ные классы, например, количество яиц в кладке у птиц, количество че- шуй на определенной площади тела у рыб или рептилий, количество ле- пестков у цветка и количество щетинок у мыши или Drosophila. Такие прерывистые признаки, иногда называют численными, или мерными признаками. Предполагается, что они контролируются многими генами и подвержены влиянию факторов среды. Например, Райт (Wright, 1968) привел распределение количества яиц на кладку у скворцов и количества яиц, отложенных у одного вида гремучих змей (рисунок 11.4). Хотя оба распределения умеренно симметричны, размер кладки скворцов показы- вает гораздо меньшую изменчивость (более 40% кладок имеет пять яиц), тогда как у гремучих змей распределение количества яиц более широкое. В крайнем случае, для прерывистого признака может быть только две категории: наличие-отсутствие, например при заболевании (больной, здо- ровый) и фертильность-стерильность для репродуктивного статуса. Мож- но предположить, что в основе таких дискретных признаков лежит не- прерывный ряд генетических факторов (Falconer, 1965). Например, заболевание может быть обусловлено генетическим детерминирующим фактором предрасположенности или восприимчивости, который имеет непрерывное распределение (рисунок 11.5). Наличие болезни у конкрет- ного индивида определяется комбинацией (сочетанием) генетической предрасположенностью индивида и факторов определенной среды оби- тания, превышающих некоторый уровень или порог. Поэтому их называ- ют пороговыми признаками. Например, на рисунке 11.5 дан гипотети-
I. Природа количественных Количество яиц Рисунок 11.4. Распределение количества яиц на кладку у скворцов (N = 1592) и количе- ства яиц у гремучих змей (N = 294) (по Wright, 1968). Рисунок 11.5. Генетическая детерминация для признака, при которой особи в области справа от нормального порога (сильное затемнение) поражены даже в нормальной среде. Когда порог отклоняется под влиянием какого-либо стрессового фактора среды, заболе- ваемость возрастает (общая заштрихованная область). ческий порог в нормальной среде для такого заболевания как диабет. По- роговый уровень повышен у относительно малой доли популяции. Учи- тывая различные условия среды, при которых тучность (ожирение), алко- голизм и другие факторы увеличивают вероятность диабета, порог смещается влево (обозначено как порог в стрессовой среде). Этот сдвиг
приводит к повышенной заболеваемости, потому что некоторые индиви- ды, которые не были бы больны в нормальных условиях среды, теперь становятся пораженными. Другими словами, порог не абсолютен, но мо- жет сильно зависеть от условий среды. Ь. Гены, влияющие на количественные признаки Предполагают, что гены, влияющие на количественные признаки, по су- ществу сходны с генами (или это те же самые гены), которые определяют моногенные качественные признаки. Нет причин предполагать наличие другого типа генов, обусловливающих изменчивость количественных признаков. Действительно, гены, определяющие качественные признаки могут также влиять на количественные признаки. Например, один из ге- нов гороха, определяющий гладкую или шероховатую поверхность се- мян, использованный Менделем при исследовании расщепления, оказы- вает влияние на содержание крахмала в семенах. Иначе говоря, гены, определяющие количественные признаки, наследуются по Менделю. Они могут иметь множество аллелей, мутировать, изменяться в аллельных ча- стотах, и так далее. Такие предположения позволяют создать модели для прогноза количественных признаков, связанных с популяционно-генети- ческими моделями, которые обсуждались ранее. Прежде чем рассматри- вать некоторые из этих моделей, кратко обсудим некоторые характерис- тики генов, ответственных за количественные признаки (далее в этой главе мы обсудим оценки количества генов и скорости мутирования). На разные количественные признаки влияют разные количества генов. Очень широко варьирующие (такие как жизнеспособность и размер) ве- роятно, определяются действием большого числа локусов. Генетические болезни человека, например, опосредованы более чем 8000 локусами. Та- ким образом, они влияют на выживание человека. Около 5000 локусов у D.melanogaster способны мутировать в летали и, таким образом, влияют на жизнеспособность. Конечно, большинство из таких крайних вариан- тов редки, но можно предположить, что менее вредные аллельные типы в этих локусах также сегрегируют в популяциях, даже с более высокими частотами. Хотя признак может определяться значительным числом ге- нов, в популяции и между популяциями может проявиться лишь неболь- шая часть от этого общего количества. Например, в продолжительном эксперименте по отбору на содержание жира и белков в зерне, обсуждае- мом на стр. 60, минимальная оценка количества генов, определяющих процент жира и белка, равна 54 и 122, соответственно (Dudley, 1977). В другом крайнем случае различия в количественном признаке могут быть результатом действия одного или небольшого количества генов. Адап- тация к инсектициду исходно могла быть обусловлена одним геном, кото-
I. Природа количественных признаков рый обеспечивает устойчивость к химическому веществу, хотя генетичес- кие основы и молекулярные или физиологические механизмы, посредством которых единичный ген обеспечивает устойчивость, могут различаться сре- ди видов или даже популяций (Taylor, Feyereisen, 1996). Например, адапта- ция к инсектициду ДДТ могла появиться, потому что определенные гены приводили к детоксикации инсектицида, накоплению ДДТ в жировых те- лах, препятствующему его циркуляции в организме или к другим защит- ным эффектам. С другой стороны, адаптация к инсектицидам может быть результатом действия ряда генов, т.е. она может иметь полигонный конт- роль, и результатом взаимодействия ряда генов, локализованных на разных хромосомах. Классическое исследование Кроу (Crow, 1957) по адаптации к ДДТ у D.melanogaster иллюстрирует полигенную адаптацию к изменяю- щимся условиям среды (см. пример 11.1). Пример 11.1. Кроу (Crow, 1957) подвергал действию ДДТ большую по- пуляцию D.melanogaster в ряду поколений, так что со временем мухи при- обретали устойчивость (резистентность) к этому инсектициду. Этих мух затем скрещивали с контрольными мухами, не подверженными действию ДДТ, согласно системе скрещиваний, которая приводила к различным комбинациям хромосом, полученных от контрольных и резистентных мух, Пропорция выживаемости Рисунок 11.6. Различное строение трех основных хромосом у линий D.melanogaster, ис- пользованных для проверки выживаемости в среде с ДДТ (слева) и пропорции их выжи- ваемости (по Crow, 1957).
7530 Глава И. Количественные признаки и эволюция в кариотипе потомства (рисунок 11.6). Выживаемость этих мух затем те- стировали в среде, содержащей ДДТ. Из этого рисунка очевидно, что все три хромосомы (X, II и III) вносят значительный вклад в выживаемость. К тому же детальный генетический анализ показал, что, по крайней мере, несколько генов на второй и третьей хромосомах вносят вклад в устойчи- вость к ДДТ. Другими словами, детерминация адаптации контролирова- лась рядом генов, распределенных по геному. Достойно внимания то, что обнаруженная Кроу устойчивость личинок к ДДТ моногенна. Это отно- сится и ко многим другим примерам устойчивости к пестицидам. Простейшая теория количественной генетики предполагает, что все гены, влияющие на признак, вносят равный вклад в развитие признака. Однако детальный генетический анализ показывает, что относительно небольшое число генов оказывает большое влияние, и много генов оказывают незна- чительное влияние на признак. Иногда их называют главные (мажорные) гены и второстепенные (минорные) гены, соответственно. Например, в двух классических экспериментах по идентификации генов, влияющих на коли- чественные признаки, около десяти локусов были причиной 75%-ной ге- нетической изменчивости стерноплевральных щетинок у D.melanogaster (Robertson, 1967), менее пяти генов в большей степени определяли время колошения у пшеницы (Law, 1967). Робертсон предложил, описывать рас- пределение генных эффектов с помощью экспоненциального распределе- ния так, что чем меньше влияние на количественный признак отдельных генов, тем больше количество локусов определяет признак. Важно помнить, однако, что данный ген может влиять больше, чем на один признак - т.е. он может оказывать плейотропное действие, и что ген, который оказывает значительное действие на один признак, может иметь только слабый эф- фект на другой признак. К тому же, часто оказывается, что существует от- рицательная корреляция между величиной эффекта гена и его аллельной частотой в популяции - аллели, оказывающие значительное влияние, час- то имеют низкие частоты. Эта низкая частота имеет место, по-видимому потому, что аллели, оказывающие значительный эффект, часто имеют плей- отропное вредное влияние на приспособленность. Если количественный признак опосредован несколькими генами, то количество мутаций, образующееся каждое поколение, должно зависеть от количества генов и их средней скорости мутирования. В результате, у признака, который обусловлен многими генами, новые мутантные вари- анты будут встречаться чаще, чем у признака, на который влияет мало генов (при условии, что два набора генов имеют одинаковую скорость мутирования на локус). Позже в этой главе мы обсудим, как можно оце- нить скорости мутирования для количественных признаков.
I. Природа количественных признаков 53 I Эффект генов, влияющих на количественные признаки, зависит от того, доминантные они или рецессивные. Некоторые гены (летали у Drosophila и у человека), как известно, почти рецессивны, тогда как другие гены, которые имеют более слабые эффекты на жизнеспособность, более адди- тивны (Charlesworth, Charlesworth, 1987). Пример аддитивного признака - различные цвета кожи у человека (при этом имеется небольшое доми- нирование, см. пример 11.2). Пример 11.2. Харрисон и Оуэн (Harrison, Owen, 1964) изучали генети- ческую детерминацию различий в цвете кожи между европейцами и аф- риканцами, измеряя интенсивность отражения кожей света в смешанной популяции Ливерпуля (Англия). В этой популяции были исследованы ро- дители (африканцы и европейцы), потомки смешанных браков (потомки первого поколения - Рг), потомки браков между метисами (потомки вто- рого поколения - F2) и потомки от возвратных браков. Интенсивность отражения света, измеренная для стандартной площади тела, показана на рисунке 11.7 в диапазоне разных длин волн. Поскольку величина Fj по- чти промежуточная между двумя родительскими величинами, и величи- ны у потомков от возвратных браков почти промежуточные между F, и соответственными родительскими величинами, гены, определяющие цвет кожи, действуют аддитивно. Количество генов, которые определяют цвет кожи, можно оценить из средних значений интенсивности отражения света в выборках и аддитивной генетической вариансы (см. Harrison, Owen, 1964). Используя величины интенсивности отражения, измеренные раз- ными способами, они оценили, что за различия в цвете кожи между дву- мя группами родителей ответственны только три или четыре гена. Ис- пользуя те же данные, но более точный способ, Линч и Уолш (Lynch, Walsh, Рисунок П.7. Процент интенсивности отражения света от кожи европейцев, африканцев, потомков от смешанных браков между ними (F,) и потомков от возвратных браков (по Harrison, Owen, 1964).
Глава 11. Количественные признаки и эволюция 1998) оценили, что количество локусов действительно мало, но может быть больше, чем оценка Харрисона и Оуэна. II. Количественная генетическая модель Для понимания и прогнозирования эволюции количественных признаков необходима соответствующая общая модель. Однако определение коли- чественных признаков очень сложно, поэтому мы начнем с простой мо- дели. Затем дополним эту модель такими параметрами, как взаимодей- ствие генотип-среда или эпистаз и покажем влияние этих и других факторов. Это делается для анализа и лучшего понимания количествен- ных признаков. Как и в моделях, обсуждавшихся ранее, детали могут быть не вполне биологически корректными, но если модель содержит важные биологические свойства и приводит к хорошему общему прогнозу, то она приемлема для исследователей. Сначала нужно построить модель количественных признаков, которая позволит разложить фенотипические величины на генетические и средо- вые компоненты. Проще всего это можно сделать, обозначив фенотипи- ческое значение индивида i в определенной среде j как ^=G;+E7, (11.1а) где G. - это генетический вклад в z-ый генотип и Е - это средовое откло- нение, являющееся результатом из /-той среды. Эта простая модель ил- люстрирует основную генетико-средовую дихотомию, или взаимосвязь природа-воспитание, обсуждавшуюся в отношении интеллекта человека (см. пример 11.6 позже) и других характеристик. Яркий пример влияния среды на фенотип - это увеличение в три раза по сравнению с нормаль- ным размера панциря у рачка Daphnia, индуцированное пестицидами (Hebert, Grewe, 1985). Если определенный генотип копируется (реплицируется) клонирова- нием, как у растений или у животных с использованием инбредных ли- ний, то средняя фенотипическая величина этого генотипа в т различных средах равна: Другими словами, средняя фенотипическая величина становится геноти- пической величиной, потому что по определению G отклонения во всех средах обитания уменьшаются. Средний эффект данной среды в п раз- личных генотипах равен:
II. Количественная генетическая модель 533 где Р -- это общее среднее фенотипическое значение во всех средах. Давно было установлено, что в определенной среде данный генотип может проявляться позитивно или негативно (Haldane, 1946). Если име- ются такие специфичные взаимодействия между генотипами и средами, тогда основную модель, представленную выше, надо расширить так, что- бы фенотипические величины составили: Py=G,+Ej+GEy, (11.1b) где GE измеряет взаимодействие между z-тым генотипом и /-той средой. Значение GE.. можно вычислить данного взаимодействия генотип-среда: GE^Py-G.-Ej. (11.1с) Подобно средовому отклонению, взаимодействие генотип-среда может быть положительным, или отрицательным. Степень различий фенотипи- ческих величин между разными средами также называется фенотипи- ческой пластичностью (Via et al., 1995; Schlichting, Pigiucci, 1998). Взаимосвязь между генотипом, средой и фенотипом можно описать с помощью нормы реакции. В качестве примера рассмотрим случаи, ког- да действие среды можно определить: например, изменение температуры от низкой к высокой, а фенотипическую величину разных генотипов мож- но оценить через средовой спектр. Если графики норм реакций для раз- личных генотипов параллельны, то, по определению, взаимодействия ге- нотип-среда нет. На рисунке 11.8а показаны нормы реакции для двух различных генотипов, в которых при увеличении значений средового фак- тора фенотипические величины обоих генотипов возрастают так, что в лучших средах обитания этим генотипам соответствуют сходные фено- типические величины. Хотя в этом случае взаимодействие генотип-среда мало, в бедных средах обитания большая доля фенотипической изменчи- вости определяется генетически, тогда как в лучших средах генетически обусловлена гораздо меньшая часть изменчивости. На рисунке 11.8b показан пример сильного взаимодействия генотип- среда, и обе компоненты - генетическая и средовая, важны. Здесь гено- тип Gl возрастает по фенотипической величине при увеличении средово- го фактора, a G2 понижается по фенотипической величине с увеличением средового фактора. Более того, из-за этих сильных взаимодействий гено- тип-среда, трудно статистически разделить генетическую и средовую ком- поненты. Можно достичь этого решения, предположив, что генотип G, - самый распространенный в популяции. В этом случае, если распределе-
Рисунок 11.8. Нормы реакции для двух генотипов (G и G,), в двух различных средах, (а) и (Ь). А и В обозначают средние фенотипические величины в популяции, когда G, - более частый генотип, и когда G, и G2 равны по частоте, соответственно (по Lewontin, 1976). ние средовых факторов равномерно, то оказывается, что нет генетическо- го эффекта, а только возрастание фенотипической величины с возраста- нием средового фактора (линия А на рисунке 11.8b). Если частоты двух генотипов в популяции сходны, то с возрастанием средового фактора нет возрастания средней фенотипической величины (линия В). В результате, средовая варианса является функцией частоты генотипов в популяции. В примере 11.3 представлены данные, показывающие сильные взаимодей- ствия генотип-среда для трех клонов растений, растущих на трех разных высотах (над уровнем моря) и представленность трех линий трипсов, от- носящихся к порядку Thysanoptera (отряд Thripidae), на трех различных клонах растений. Недавно показаны взаимодействия генотип-среда на ше- сти поведенческих признаках в трех различных, хорошо организованных лабораториях на восьми выведенных в лаборатории линиях мышей (Crabbe et al., 1999). Хотя были приняты всяческие предосторожности для стан- дартизации оборудования, протоколов и других средовых переменных, для некоторых признаков значения генетических различий зависят от спе- цифики тестирующей лаборатории. Пример 11.3. Клаузен и др. (Clausen et al., 1941) представили классичес- кий пример, показывающий и сильные средовые эффекты, и взаимодей- ствие генотип-среда у нескольких видов калифорнийских растений, рас- тущих в природе в широком диапазоне высот. Например, они собирали лапчатку, Potentilla glandulosa (семейство Розоцветных) в трех местах оби- тания: на тихоокеанском берегу (высота 100 метров), на средних высотах Сьерра-Невады (1400 метров над уровнем моря) и на высоте верхней гра- ницы альпийских лесов Сьерра-Невады (3040 метров над уровнем моря).
II. Количественная генетическая модель Из этих выборок они отобрали вегетативно размноженные клоны расте- ний и выращивали их в трех разных местах. Рисунок 11.9 хорошо иллю- стрирует результаты этого эксперимента по реципрокным (взаимным) пересадкам, показывая норму реакции высоты растения. Между средами обитания лапчатки существуют большие различия, и каждый клон лучше растет на своей высоте, что говорит о генетических различиях между этими клонами. Действительно, низковысотный клон погиб на высокогорном месте. Перестановка порядка клонов, приводящая к непараллельным ли- ниям для разных клонов, демонстрирует наличие взаимодействия гено- тип-среда. В другом примере (Lynch, Walsh, 1998) были вычислены генотипичес- кие, средовые и генотипически-средовые эффекты (из данных Strauss, Karban, 1994) на представленность различных линий паразитических на- секомых трипсов на клонах их растения-хозяина - береговой марга- ритки (таблица 11.1). Линии трипсов происходили от клона растений с таким же номером; например, трипсы из линии 1 появились на растении 1. Очевидно, что трипсы лучше приспособлены к растению-хозяину, от которого они взяты (диагональ от верхнего левого угла до правого ниж- него в таблице 11.1(a). Этот результат, сходен с обнаруженным в преды- дущем примере. В общем, трипсы линии 2 были представлены в популя- ции лучше других клонов, а представленность их на растении 2 была наивысшей. Высота над уровнем моря Рисунок 11.9. Нормы реакции для клонов лапчатки Potentilla glandulosa, выросших на трех разных высотах над уровнем моря (по Clausen et al., 1941).
Глава 11. Количественные признаки и эволюция Используя выражение 11.1с, можно определить взаимодействие ге- нотип-среда для каждой комбинации (таблица 11.1b). Например, GEH = = 77 - 59,3 + 19,2 = 36,9. Заметьте, что эффекты взаимодействия внутри рядов (строк) и внутри столбцов в сумме равны нулю. В этом случае эффекты взаимодействия генотип-среда, в общем, больше, чем средо- вые эффекты, показанные внизу таблицы 11.1а (при очень больших зна- чениях GE). При высокой представленности данной линии трипсов на растении, от которого она взята, все величины GE на диагонали боль- шие и положительные. ТАБЛИЦА 11.1. Представленность трех линий трипсов на клонах трех растений-хозя- ев (a), (Lynch, Walsh, 1998) (данные из работы Strauss, Karban, 1994). Взаимодействие GE (генотип-среда) для каждой комбинации генотипов трипсов и растительного клона (среда) (Ь) (а) Растительный клон (/) 1 2 3 G 1 77 61 40 59,3 Линия трипсов (Z) 2 34 159 71 88,0 3 47 51 107 68,3 Е / -19,2 18,4 0,78 71,9 (Ь) Растительный клон (/) 1 2 3 1 36,9 -16,8 -20,1 Линия трипсов (/) 2 -34,8 52,6 -17,8 3 -2,1 -35,8 37,9 Во многих популяциях часто имеются различные средние фенотипи- ческие величины. Трудно определить, является такое различие результа- том действия генетических, средовых факторов или их комбинацией. Од- нако, популяции можно выращивать в одинаковой среде: в исследованиях растений это называется экспериментом в общем саду (common-garden experiment). Например, если особи из разных популяций сохраняют фе- нотипические различия в общей среде, тогда это согласуется с гипотезой, что популяции генетически различны. С другой стороны, фенотипичес- кие различия исчезают в общей среде, тогда это будет обозначать, что средовые факторы важны при определении фенотипических различий. Эти выводы несколько упрощенные, потому что результаты могут зави-
II. Количественная генетическая модель 537 сеть от диапазона возможных общих сред. Например, реципрокные пе- ресадки или обмены популяций между средами их обитания подвергнут популяции действию другой среды. С другой стороны, выращивание по- пуляций на промежуточной общей среде будет комбинировать эти разли- чия каким-либо неизвестным образом. Теперь вернемся к более точному определению генетической модели. Предположим, что значение z-того генотипа равно G, = Ai+Di+I., где A., D. и 7 - это аддитивная, доминантная и взаимодействующая (эпис- татическая) компоненты, соответственно. Другими словами фенотипичес- кую величину можно обозначить: 7>. = Л,.+Е>,+7,+Е,., (11.Id) если предполагается, что взаимодействие генотип-среда мало, или мы игнорируем его. Эти различные типы генетического вклада могут быть проиллюст- рированы при исследовании однолокусной и двухлокусной моделей (при отсутствии средового действия на фенотип). Если все генетические эф- фекты аддитивны, тогда эффект в каждом локусе такой, как дан в при- мере на рисунке 11.1 Оа. Поскольку аллель A 1 добавляется (или замеща- ется): А2А2 - в AfA2 или AtA2 - в А{А{, фенотипическая величина увеличивается в этом примере на | х. При доминировании эффект в ло- кусе такой, как дано на рисунке 11.10b. В этом случае, замена на аллель А1 в генотипе А^А2 для получения гетерозигот А Д2 не увеличивает фено- типической величины на ту же величину, как замена на аллель Л] в в генотипе AfA2 для получения гомозигот Л Л . При доминировании эф- фект на фенотип можно разделить на аддитивную компоненту (показа- но пунктирной регрессионной линией) и отклонение от этой линии, обусловленное доминированием (обозначено стрелками). Для того, что- бы D равнялось нулю, не должно быть доминирования (аддитивности) в генах, влияющих на исследуемый фенотип. Как говорилось в главе 10, при взаимодействии между генами (эпис- таз) детерминация фенотипа может принимать разные формы. На рисун- ке 11.10с показано, что фенотипическая величина является функцией ге- нотипов в обоих локусах Л и В, так что для определения фенотипических величин должны быть известны генотипы по двум локусам. Например, если по локусу Л генотип - Л А , то фенотипическое значение может быть либо 1, либо 1 + 2х в зависимости от того, какой генотип в локусе В : В2В2, В.В, , или ВХВ2, соответственно. Для того, чтобы I. равнялось нулю, не дол- жно быть аддитивного эпистаза, т.е. влияние различных локусов на фе-
Глава 11. Количественные признаки и эволюция Рисунок 11.10. Фенотипические величины, определенные (а) через один ген при отсут- ствии доминирования (аддитивности), (Ь) через один ген при полном доминировании и (с) через два гена при эпистазе. нотипы может дополнять друг друга и получается мультилокусный эф- фект. Как отмечалось в начале главы, для количественных признаков, в об- щем, нет точного соответствия генотипа фенотипу К тому же, среднее средовое отклонение в популяции должно равняться нулю, поэтому сре- довой эффект следует описывать различными способами. В общем, пред- ставленные выше модели, полезны только в познавательном смысле. Бо- лее практический подход к исследованию количественных признаков заключается в разделении популяционной вариансы определенного фе- нотипа на компоненты, обусловленные генетическими факторами, и ком- поненты, обусловленные средовыми факторами. При использовании ос- новной модели (выражение 11.1а) для определения фенотипической вариансы получим: VP=VG+VE+ 1COVGE , (11,2а) где Vp, V V и СО VGE~ фенотипическая, генетическая и средовая вариан- сы и коварианса генотип-среда, соответственно. Коварианса генотип-среда отлична от взаимодействия генотип-среда, обсуждавшегося выше. Коварианса положительна, когда, например, ге- нотипы с высокими величинами находятся в лучших средовых условиях, а худшие генотипы - в худших средовых условиях. Такая взаимосвязь может быть, когда больший детеныш в помете, из-за своего генотипа, получает больше материнского молока, или когда птица, обитающая на
II. Количественная генетическая модель определенной территории, вследствие генетических факторов получает лучшую пищу или большие пространства. Растения, имеющие генотип, позволяющий расти быстрее, могут произрастать в лучших условиях сре- ды, потому что они получают больше света и тепла по сравнению с дру- гими растениями. Иначе говоря, в естественных условиях обитания су- ществует значительная коварианса генотип- среда При разведении растений и животных в неволе можно рандомизировать генотипы и сре- ды, так что величина COVGE приближается к нулю. Для простоты предпо- ложим, что коварианса генотип-среда близка к нулю. Когда COVGE равна нулю, выражение 11.2а имеет вид: VP=VG+VE. (11.2b) Когда обе части разделим на V получим: = h2+e2, где /г2 и е2 - пропорции фенотипической вариансы, обусловленной гене- тическими факторами и средовыми факторами, соответственно. Член h2 - это наследуемость в широком смысле (h2B): — (11.2с) * р Заметьте, что h2 - это наследуемость сама по себе, а не квадрат ее величи- ны (Wright, 1921). Аналогично, если выражение 11.1 d используется для определения фено- типической вариансы и все ковариансы предполагаются равными нулю, то: VP = VA+VD + V,+VE, (11.3а) где V, 1'дИ К - вариансы, обусловленные эффектами аддитивности, до- минирования и взаимодействия (эпистаза), соответственно. Деление это- го выражения на Издает пропорции фенотипической вариансы, обуслов- ленные различными генетическими компонентами. Отношение аддитивной генетической вариансы к фенотипической вариансе извест- но как наследуемость в узком смысле, или: ^v= —. (11.3b) у р
Величина наследуемости в узком смысле важна при определении скорос- ти и величины ответа на направленный отбор. Селекционеры и животно- воды часто оценивают ее перед началом селекционных программ. Для понимания того, как различные типы генетической вариансы воз- действуют на аллельные частоты и разные типы действия генов, пред- положим, что относительные фенотипические значения генотипов АХАХ, А}А2 и А?А2 равны 1 + х, 1 + hx и 1, соответственно, и популяционно- генетические модели сходны. Тогда общая генетическая варианса (при VE= 0) равна: где f - это частота z-того генотипа в /'-той среде. Используя пропорции генотипов, соответствующие соотношениям Харди-Вайнберга, для рас- чета средней фенотипической величины, получим: Р = 1 + p2x + 2pqhx и, подставляя фенотипические значения в предыдущее выражение имеем: VG = р2(\ + х')2 + 2pq(l + hx)2 +q2 -(1 + p2x + spqhx)2 = = pqx2[2h2(l-2pq)-4hp2 + />(1 + />)]. При точной аддивности, h = | и это выражение сокращается до: Ис =\pqx2. (11.4a) (11.4b) Аддитивная генетическая варианса - это генетическая варианса, кото- рая является результатом регрессии генотипического эффекта на число у аллеля А{, или: (11.4с) В этой модели генотипы А}А{, А{А2 и А2А2 имеют 2, 1 и 0 аллелей А , соот- ветственно (таблица 11.2). Во-первых, среднее число аллелей A j равно: y = p2(2) + 2pq(V) + q2(0) =2р. Тогда варианса числа аллелей А ( равна: i; = p2(2)2+2/x/(l)2-(2p)2=2W
II. Количественная генетическая модель ТАБЛИЦА 11.2. Частота и количество аллелей А , а также общие фенотипические вели- чины для различных генотипов, использованных при определении генетической вариан- сы. Три численных ряда фенотипических величин показаны на рисунке 11.11 Фенотипические значения Генотип Частота Количество А аллелей Общее («) (б) (с) М Р2 2 1 +х 1,1 1,1 1,1 << 2pq 1 1 + hx 1,05 1,1 1,2 Г 0 1 1,0 1,0 1,0 Коварианса равна = /?2(1 + x)(2) + 2/?^(1 + /ix)-(1 + p2x + lpqhx)(2p) = = 2pqx[p + h(q-p)]. Тогда значение аддитивной генетической вариансы равно: VA = 2pqx2[p + h(q-p)]2. (11.4d) При точной аддитивности/? — 4 и: ^-iPqx2. (П.4е) Как ожидается, в этом случае вся генетическая варианса аддитивная, т.е., = VA. Величина вариансы доминирования определяется как генетическая варианса, оставшаяся после вычитания вариансы аддитивности из общей генетической вариансы при Vl = 0, или: VD=Vc-VA = p2q2x2(\-2li)2. (ll-4f) Очевидно, что при наличии аддитивности нет вариансы доминирования, потому что выражение (1 - 2h) равно нулю. Генетическая варианса - это‘функция аллельных частот и относитель- ных фенотипических значений трех генотипов. На рисунке 11.11 даны значения VG, V\ и Кодля трех различных фенотипических рядов в таблице 11.2. На рисунке 11.1 la h = у, поэтому общая генетическая варианса рав- на аддитивной генетической вариансе. Варианса максимальна, когда р = q =4 . На рисунке 11.1 lb h = 1, поэтому значения общей генетической
Глава 11. Количественные признаки и эволюция Рисунок 11.11. Значения общей генетической, аддитивной и доминантной варианс для различных аллельных частот и трех фенотипических рядов из таблицы 11.2. вариансы и аддитивной генетической вариансы наибольшие, когда значе- ние q велико. Значения доминантной вариансы максимальны при р = q = ? и распределяются симметрично вокруг этой аллельной частоты. При ге- терозиготном преимуществе (при стабильном равновесии 0,333 в приме- ре на рисунке 11.11с) аддитивная варианса равна нулю. Генетическая ва- рианса максимальна при высоких частотах А2 и состоит из фактических значений аддитивной и доминантной варианс. Заметьте, что тесная ассоциация между значением генетической вари- ансы и типом генного взаимодействия, лежащего в основе признака, не является необходимой. Аддитивная генетическая варианса может быть частью генетической вариансы и это служит причиной сходства потом- ков и родителей. В примере доминантности на рисунке 11.11b при часто- те около 0,7 значение аддитивной вариансы велико. При этой аллельной частоте пропорции двух фенотипов приблизительно равны, и относитель- но сильно сходство между родителями и потомками. А при аллельной частоте, равной 0,1, аддитивная генетическая варианса низкая (рисунок 11.11Ь). В этом случае, если потомство имеет рецессивный генотип, тогда
III. Оценка генетической вариансы и наследуемости 543 большинство родителей было бы гетерозиготами, или имело бы доми- нантный генотип, и фенотипическое сходство между родителями и по- томством было бы низким. Значения генетической вариансы можно использовать для множества локусов, если предполагается, что эти локусы независимы, - т.е. нет эпи- стаза или гаметического неравновесия. Допустим, что существует т ло- кусов и что они независимы, тогда общая генетическая варианса равна: т ^c=ZrG(,), (11.5а) /=1 гдеКод- генетическая изменчивость в /-том локусе. Если/z — у, то гене- тическая варианса равна аддитивной генетической вариансе: 1 т VA=^PicIixl- (11.5b) В результате, значение общей генетической вариансы возрастает с увели- чением количества эквивалентных локусов, влияющих на проявление признака. III. Оценка генетической вариансы и наследуемости Значение генетической вариансы, или наследуемость, можно оценить несколькими разными способами (см. Falconer, Mackey, 1996, или Lynch, Walsh, 1998). Следует понимать, что такие измерения генетической вари- ансы или наследуемости признака специфичны для определенных попу- ляций и условий среды. Например, вариабельные гены, влияющие на при- знак, могут различаться в разных популяциях, что делает такие измерения популяционно-специфическими. К тому же факторы среды, влияющие на фенотипическую вариансу, могут быть довольно важными в некото- рых средах обитания и незначительными - в других. Мы кратко обсудим три способа, используемых для оценки генетической вариансы или на- следуемости: редукцию или элиминацию одной компоненты вариансы, сходство между родственниками и наблюдаемый ответ на направленный отбор, не касаясь стандартных ошибок, связанных с такими оценками генетической вариансы или наследуемости, которые обычно велики (Falconer, Mackay, 1996; Lynch, Walsh, 1998). а. Редукция или элиминация одной компоненты вариансы Для оценки комплементарной компоненты вариансы в эксперименте или при скрещиваниях можно либо уменьшить, либо полностью исключить
средовую или генетическую компоненты вариансы. Используя выражение 11,2b при VG = 0, получим Vp ~ VE , а если VE ~ 0, то Vp ~ V Генетическая изменчивость равна нулю или стремится к нулю в инбредных линиях, кло- нах, у идентичных близнецов, у гибридов между инбредными линиями и при повторных измерениях у одного и того же индивида. Теоретически, средовая изменчивость может быть сильно снижена, если все значимые средовые факторы (такие как пища, влажность и температура) известны и тщательно контролируются (хотя контролировать все средовые факторы очень трудно). Другой подход дан в примере 11.4, где сравнивается семей- ная изменчивость средних значений признаков в общих условиях среды обитания двух видов дикого овса. В этом случае предполагается, что сре- довая варианса одинакова для двух видов, так что различия в фенотипичес- кой вариансе можно отнести к различиям в генетической вариансе. Пример 11.4. В Калифорнии часто встречаются два интродуцированных вида дикого овса, Avena barbata и A.fatua. В популяции A. barbata при- близительно 99% самооплодотворяющихся растений, тогда как у A.fatua уровень самооплодотворения ниже. Фенотипическая изменчивость не- скольких количественных признаков выше у A.barbata, но генетическая изменчивость, измеренная по морфологическим или аллоферментным локусам выше в популяции A.fatua (Jain, Marshall, 1967). Для оценки от- носительного значения фенотипической изменчивости (которая обуслов- лена генетически), образцы обоих видов выращивали в «общем саду». На опытном поле вырастили 600 семей, которые получили из 10-12 се- мян, собранных с каждого из отдельных растений. Результаты измерений показаны на рисунке 11.12, где средний семейный размер семян и внут- рисемейная варианса размера семян даны для обоих видов. У растений A.fatua с этого поля изменчивость семейных средних значений была выше (0,0168 у A.fatua против 0,0096 у A.barbata), больше была и внутрисемей- ная варианса (0,0126 для A.fatua против 0,0091 у A.barbata). Поскольку эти растения выращивали в случайно выбранной среде на опытном поле, предполагалось, что средовая изменчивость имеет одинаковое значение для обоих видов. Поэтому A.fatua - генетически более вариабельный по этому признаку вид, чем A.barbata, хотя фенотипическая изменчивость растений в диких популяциях меньше. Фенотипическая варианса и в инбредных линиях, и в гибридах между инбредными линиями близка к средовой вариансе, потому что внутри ин- бредных линий или их гибридов генетическая изменчивость мала или отсутствует. Однако, в инбредных линиях значения фенотипической из- менчивости обычно очень высокие, иногда даже выше, чем в аутбредных
III. Оценка генетической вариансы и наследуемости Среднее семейное Внутрисемейная варианса значение признака Рисунок 11.12. Распределение семейных средних значений и внутрисемейной вариансы размера семян у двух видов дикого овса (по Jain, Marshall, 1967). популяциях. Различия в фенотипической изменчивости между инбред- ными линиями и гибридами, очевидно, обусловлены большей изменчи- востью инбредных индивидов под действием факторов среды. Считает- ся, что более высокая гетерозиготность у гибридов приводит к большему балансирующему потенциалу развития в разных условиях среды обита- ния (Lerner, 1954). В некоторых случаях множественные измерения можно провести у одного индивида либо в течение времени (поведенческие или репродук- тивные признаки, которые повторяются в разное время или в разные годы), либо пространственно, как при исследовании правой и левой сторон тела у животных с билатеральной симметрией. Индивидуальная изменчивость в этом случае исключительно средовая, потому что при отсутствии сома- тических мутаций генотип, определяющий количественные признаки, не изменяется. Чем меньше этот индивидуальный средовой эффект, тем бо- лее сходны измерения, сделанные в разное время, или измерения, прове- денные на правой и левой сторонах тела. Степень сходства можно оце- нить, используя меру корреляции, называемую повторяемостью, или отношением межиндивидуальной вариансы к общей вариансе признаков (межиндивидуальная плюс индивидуальная варианса), (см. Falconer, Mackay, 1996; Lynch, Walsh, 1998 для обсуждения). Значение единица минус величина повторяемости равно отношению индивидуальной из- менчивости к общей фенотипической изменчивости. Мера повторяемос- ти приводит верхний предел наследуемости к величинамh2N ^hg, хотя ошибка измерения снижает уклон соответствующего графика (Lynch, Walsh, 1998).
Индивидуальная изменчивость, измеренная при сравнении левой и правой сторон у особей с билатеральной симметрией, была предложена в качестве меры стабильности развития индивида. Существует ряд спосо- бов измерения степени стабильности развития, но чаще используются оценки флуктуирующей асимметрии (ФА) - значения лево-правосто- ронних различий, где среднее различие не отличается от нуля. (Palmer, 1996; Lynch, Walsh, 1998). Некоторые исследователи считают, что низкая ФА ассоциирована с высокой приспособленностью и что инбредные ин- дивиды имеют более высокую ФА, а стрессовые условия среды также индуцируют высокую ФА. Однако, Huole (1998) предполагает, что эти заключения должны рассматриваться с большими предосторожностями. Ь. Сходство между родственниками Наиболее важный подход, используемый для измерения компонентов ге- нетической вариансы и наследуемости, основан на фенотипическом сход- стве между родственниками. Например, из-за общих генов можно ожи- дать, что потомство родителей с высокими фенотипическими величинами будет также иметь высокие фенотипические величины, а потомки роди- телей с низкими фенотипическими величинами будут иметь низкие фе- нотипические величины. Документированные примеры этой взаимосвя- зи были представлены одним из первых статистиков, Фрэнсисом Гальтоном (Francis Galton, 1889). На рисунке 11.13 показаны ряды (обо- значенные размером закрашенного кружка) в разных классах среднего роста родителей и их потомков (из работы Arnold, 1994). Сплошная ли- ния - линейная регрессия через эти значения, а пунктирная линия обо- значает точное соответствие (наклон линейной регрессии равен единице) между ростом родителя и потомка. Очевидно, что нет полного соответ- ствия в росте между родителем и потомком, потому что у высоких роди- телей бывают низкорослые дети, и некоторые низкорослые родители име- ют высоких детей, но отмечается сильный наследственный эффект, который приводит к наклону линейной регрессии, равному 0,57. Близкие родственники имеют больше общих генов, чем индивиды, не являющиеся родственниками, и поэтому их фенотипическое сход- ство выше. Например, у монозиготных близнецов все гены одинаковые, у полных сибсов (или у родителя и потомка) общей является половина их генов, у полусибсов - одна четверть их генов, у двоюродных сибсов - одна восьмая и так далее. В результате, фенотипические величины между близкими родственниками должны иметь более высокую корре- ляцию, чем между более дальними родственниками (см. пример 11.5 об отпечатках пальцев у человека - высоко генетически детерминирован- ном признаке.)
III. Оценка генетической вариансы и наследуемости Рисунок 11.13. Данные Гальтона (Gallon, 1889), показывающие взаимосвязь среднего ро- ста родителей и их потомства в выборке британцев. Размер закрашенных кружков обо- значает номера класса, пунктирная линия - точную корреляцию между ростом родителя и потомка и сплошная линия - линейная регрессия для наблюдаемых данных (по Arnold, 1994). Пример 11.5. Отпечатки пальцев широко используются в целях иденти- фикации личности, поскольку индивидуальные рисунки уникальны. Галь- тон (Gallon, 1892) впервые представил научные основы использования отпечатков пальцев в судебной практике (Stigler, 1995). Общий способ классификации отпечатков пальцев основан на количестве борозд - при- поднятых участков кожи - между определенными точками на кончиках пальцев. Три основные конфигурации борозд на кончиках пальцев извес- тны как дуга, петля и завиток. Количество борозд для отпечатков пальцев каждого типа показано на рисунке 11.14а, b и с (Holt, 1961). Для дуг коли- чество равно нулю, потому что трирадиусы (ориентиры, используемые для подсчета борозд) отсутствуют (рисунок 11.14а). Для петель число борозд - это количество борозд от трирадиуса (Y-образная структура слева и ниже центра на рисунке 11.14b) до центра петли. В этом случае число равно 13 бороздам вдоль линии от трирадиуса до центра петли. В завит- ке, изображенном на рисунке 11.14с, число борозд равно 23 (15 от левого трирадиуса до центра завитка и 8 от правого трирадиуса до центра). Чис- 35’
Рисунок 11.14. Разные типы образцов отпечатков пальцев у человека, показывающие уве- личенные изображения дуги (а), петли (Ь) и завитка (с), (Holt, 1961). ло борозд на отпечатках пальцев, по-видимому, полностью обусловлено генетически и мало зависит от среды. В таблице 11.3 представлены на- блюдаемая и ожидаемая корреляции для разных степеней родства при условии, что признак полностью генетически детерминирован и что из- менчивость обусловлена только аддитивными генами. Заметьте, что во всех представленных случаях два эти значения очень близки. ТАБЛИЦА 11.3. Наблюдаемые и ожидаемые (когда признак полностью генетически де- терминирован и изменчивость аддитивна) корреляции для общего числа борозд отпечат- ков пальцев при разной степени родства (Holt, 1961), (средний родитель - средняя между двумя родителями) Степень родства Наблюдаемая г Ожидаемая г Монозиготные близнецы 0,95 ± 0,01 1,00 Средний родитель-ребенок 0,66 ± 0,03 0,71 Мать-ребенок 0,48 ± 0,04 0,50 Отец-ребенок 0,49 ± 0,04 0,50 Дизиготные близнецы 0,49 ± 0,08 0,50 Полные сибсы 0,50 ± 0,04 0,50 Родители 0,05 ± 0,07 0,00 Наследуемость можно оценить из этих данных при использовании либо регрессионного, либо корреляционного анализа. Мы покажем, как мож- но оценить наследуемость для пары родитель-потомок, используя рег- рессионный подход. Сходный способ можно использовать для других род- ственных связей, хотя алгебраические вычисления получаются достаточно громоздкими. Предположим для простоты, что мы изучаем один локус, в котором частоты генотипов родителей соответствуют соотношениям Хар- ди-Вайнберга и частоты фенотипов равны 1 + х, 1 + hx и 1 для генотипов
А}А , А А2и А?А2, соответственно. Если предположить, что скрещивание произошло случайно, то частоты генотипов в потомстве от родителя дан- ного генотипа такие, как показано в таблице 11.4. Например, родитель с генотипом А А имеет частоту р2. Поэтому частоты потомков с генотипа- ми А ]A t и А {А2 от индивида А {А , равны р3 и p2q, соответственно. ТАБЛИЦА 11.4. Частота потомков для родителя с данным генотипом при случайном скре- щивании Потомство Родитель Частота 4,4, 4_Л2 4,4, р2 4,42 2pq р2 p2q p2q pq pq1 А2А2 Р pq2 q3 Используя этот ряд частот родитель-потомок, можно вычислить кова- риансу фенотипических значений между родителями и их потомством. Коварианса равна: COVnP = У f Р,О, -РО, rpfif- это частота потомков с генотипомJ от родителя с генотипом i, а Р. и О - фенотипические величины фенотипов родителя и потомка. Таким образом, варианса в этом случае равна: COVOP = /?3(1 + х)2 + 2p2q(] +х)(1 + /гх) + pq(\+hx)2+ + 2pq2(l + hx) + q3 -(1 + р2х + 2pqhxf, где последний член в скобках - общая средняя у родителей и потомков. Это выражение можно упростить, подставляя р'' + p2q + pq2 + q2 - 1- p2q- pq1 из выражения 11.4, и получим: СОГОР = pqx2[p + h(q- р)]2 = = \VA. (11.6а) Наклон регрессии фенотипических величин потомков на родительские величины определяется как _ СОУор УР (11.6b)
где Vp - это и фенотипическая варианса, и варианса родительских вели- чин. Если пользоваться выражением 11.6а и определением наследуемос- ти в узком смысле, то выражение 11.3b (оценка наследуемости) примет вид: h2N=2b. (11.6с) ТАБЛИЦА 11.5. Оценки генетической вариансы и наследуемости при разной степени родства, с помощью ковариансы и корреляции. Родство Коварианса Корреляция Средний родитель-потомок ^л h2 Родитель-потомок {h2 Полусибсы (или прародитель-потомок или тетя/дядя - племянник/племянница) ±IZ 4 У А ih2 Двоюродные сибсы {Ул ih2 Полные сибсы (или дизиготные близнецы) 2 Kl + i + VЕС | 4 Ffl + У EC 2 Ур Монозиготные близнецы Ул + vD + vEC у + y h2+ P. £C Vp Расчет ковариансы между другими близкими родственниками может дать оценки либо аддитивной генетической вариансы, либо объединен- ное значение аддитивной и доминантной генетической вариансы (см. таб- лицу 11.5). Ковариансу между полусибсами и двоюродными сибсами так- же можно использовать для оценки способом, сходным с оценкой ковариансы родитель-потомок. Однако, когда родство между индивида- ми становится менее близким (двоюродные сибсы), точность оценки сни- жается. Более того, ковариансы для монозиготных близнецов и полных сибсов содержат и доминантную вариансу, и УЕС- эффект общей среды (Falconer, Mackay, 1996), и для оценки VA (если VD и VEC не равны 0) нуж- но знать дополнительные степени родства. Если имеется анализ и пол- ных сибсов, и полусибсов, то различия в оценках полных сибсов и полу- сибсов могут дать оценку эффекта общей среды обитания. Коэффициент корреляции фенотипических значений для родственников можно также использовать для оценки наследуемости (см. таблицу 11.5). Когда проводится анализ родитель-потомок, мы обычно используем родителя мужского пола, во избежание генетических эффектов материне-
III. Оценка генетической вариансы и наследуемости 55Ю ких различий. Сравнение оценок родитель-потомок от мужчин (самцов) и женщин (самок) дает оценку материнского эффекта. Степень мате- ринского влияния на фенотип потомков можно оценить в экспериментах по перекрестному воспитанию (обмену молодняком между самками), (см. Mousseau, Fox, 1998). В общем, взаимосвязи полусибсов и отец-потомок дают наиболее достоверные оценки наследуемости. Анализ полных сиб- сов наименее достоверен и может быть использован только для получе- ния верхнего предела наследуемости (Lynch, Walsh, 1998). Пример 11.6 дает представление о противоречиях, ограничивающих использование количественных генетических измерений человеческого интеллекта. Пример 11.6. В конце девятнадцатого века британские ученые предполо- жили, что высокая рождаемость среди «низших» классов ведет к общему снижению среднего интеллекта в британской популяции. Последующее обсуждение стало известно как полемика о взаимоотношении природы и воспитания: если реальные различия в интеллектуальных способностях между социальными классами существуют, то чем обусловлены эти раз- личия - генетическими или средовыми факторами? Полемика возобно- вилась в конце 1960-х годов, когда утверждалось, что различие в баллах коэффициента интеллекта (IQ - intelligence quotient scores) между расо- выми группами генетически детерминированы (Jensen, 1969) и что низ- кие баллы IQ являются результатом генетических факторов (см. Lewontin et al., 1984). В 1990-х годах полемика вокруг наследуемости IQ была во- зобновлена Хернштайном и Мурреем (Hermstein, Murray, 1994, см. от- клики в работе Devlin et al., 1997b). Здесь мы рассмотрим только теорети- ческий пример и результаты некоторых исследований близнецов, но эти комментарии иллюстрируют некоторые трудности в определении коли- чественных генетических оценок для комплексного поведенческого при- знака. В своих аргументах Jensen (1969) и другие предполагали, что когда наследуемость высока, различия в баллах IQ между группами должны иметь генетическую основу. Однако такие рассуждения могут быть оши- бочными, потому что причина изменчивости внутри группы и причина средних различий между группами могут не быть одинаковыми. К при- меру, исследуем такую фенотипическую характеристику, как высота рас- тений кукурузы, для которой главные средовые факторы известны и мо- гут контролироваться (Lewontin, 1970). Сначала, рассмотрим две разные высоко инбредные линии, А и В. Когда линии выращивают в совершенно одинаковых условиях, то средняя высота растений в таких линиях может различаться из-за случайных различий, обусловленных инбридингом (ри- сунок 11.15а). В этом случае h2 ~ 0 в обеих инбредных линиях, но разли-
Г55 г Глава 11. Количественные признаки и эволюция чие средних значений обусловлено исключительно генетическими фак- торами. Разделим аутбредную линию С, которая имеет высокую степень генетической изменчивости, на две группы. Обе группы будем выращи- вать на строго контролируемых средах так, чтобы внутри групп средовая изменчивость была мала. Однако, почва для одной группы будет содер- жать низкую концентрацию следовых количеств элемента цинка, а почва для другой группы будет иметь нормальное содержание цинка - шесть частей на миллион. В результате, в этом случае h2 равно почти единице, но различие в средних высотах растений между группами исключитель- но средовое и обусловлено низким уровнем цинка для одной группы (ри- сунок 11.15b). Монозиготные (идентичные) и дизиготные (неидентичные) близнецы у человека представляют собой один из наиболее интересных объектов для исследования количественных признаков. Монозиготные близнецы гене- тически идентичны, и за исключением мутаций, любые различия между ними должны быть обусловлены средой. Известно много примеров иден- тичных близнецов, разделенных при рождении и воссоединенных во взрос- лом состоянии, но имеющих значительное сходство в особенностях харак- тера, работе, хобби и так далее (см. рисунок). Этот феномен предполагает важность генетических факторов. Различие во внутрипарной корреляции у идентичных близнецов, выросших вместе и выросших раздельно, дает оцен- Разлученные при рождении близнецы Маллиферт неожиданно встретились в патентном бюро (рисунок Чарльза Адамса).
III. Оценка генетической вариансы и наследуемости Аутобредная линия С Аутбредная линия С Инбредная линия А Инбредная линия В при низком уровне при нормальном Генетические факторы Факторы среды Высота растений Рисунок 11.15. Частоты фенотипической величины в двух инбредных линиях кукурузы (а), у которых наследуемость равна нулю, но средняя различий в фенотипе является ре- зультатом генетических причин, и в двух выборках из аутбредной линии (Ь), когда насле- дуемость близка к единице, и среднее различие зависит от факторов среды (по Lewontin, 1970). ТАБЛИЦА 11.6. Оценки корреляции для идентичных близнецов, выросших вместе, и идентичных близнецов, выросших раздельно, для нескольких разных признаков и оценка вариансы, обусловленная общими средовыми факторами (Bouchard et al., 1990) Корреляция Вместе Раздельно Индекс борозд отпечатков пальцев 0,96 0,97 -0,01 Рост 0,93 0,86 0,07 Масса 0,83 0,73 0,10 Волновая активность мозга 0,81 0,80 0,01 Кровяное давление 0,70 0,64 0,06 IQ 0,88 0,69 0,19 Характер 0,49 0,49 0,00 Психологические интересы 0,48 0,39 0,09 ку общей средовой вариансы, VEC - одного из факторов, который отклоня- ет оценки наследуемости в сторону увеличения. В таблице 11.6 даны оцен- ки некоторых физических и психологических признаков, большинство из которых малы (Bouchard et al., 1990). Оценка IQ и альтернативная оценка у детей, не являющихся родственниками, но выращенных одними и теми же родителями, выше на 0,34 (Lynch, Walsh, 1998). Считается (Devlin et al., 1997a), что общая пренатальная среда может обусловливать до 20% кова-
Глава 11. Количественные признаки и эволюция риансы между идентичными близнецами и что наследуемость IQ в узком смысле может быть только 34%, т.е. ниже больших значений, предполо- женных в предыдущих исследованиях. с. Реализованная наследуемость Как отмечалось выше, скорость и значение ответа на направленный от- бор являются функциями наследуемости признака в узком смысле под действием отбора. Это совершенно очевидно, когда/г^, равно либо 0, либо 1. Когда h2N = 0, фенотипическая изменчивость не обусловлена аддитив- ной генетической компонентой, и в результате, отбор даже крайних инди- видов не изменил бы фенотипическую среднюю. С другой стороны, ког- да 1, вся фенотипическая изменчивость обусловлена аддитивной генетической компонентой. Когда значение наследуемости в узком смыс- ле находится в пределах от 0 до 1, различие между средним родителем и средним потомком, равно: R = h2NS, (И.7а) где 5 - это дифференциал отбора, разница между средним отобранным родителем и средним индивидом в родительской популяции (см. Falconer, Mackay, 1996). Это уравнение можно преобразовать так, что оценка на- следуемости в узком смысле будет равна: п R (11.7b) Л Это выражение называют также реализованной наследуемостью, потому что это отношение наблюдаемых различий к общим различиям. На рисунке 11.16 показана взаимосвязь между уровнем реализован- ной наследуемости и ответом на действие отбора для гипотетического количественного признака. Здесь общее фенотипическое распределение обозначено под кривой, тогда как заштрихованная область - это часть популяции, отобранной для размножения (родители следующего поколе- ния). Средние значений признаков в популяции отобранных родителей и их потомков равны Р ,PS и Р', соответственно. 5 = Ps - Р и R = P'-P. Если h2n равно 0 или 1, тогда R = 0 и R = S, соответственно. Если h2N принимает промежуточное значение, например, h2N = 0,2 (как показано в середине рисунка 11.16), то R < S. Это происходит тогда, когда некоторые индивиды, отобранные в качестве будущих родителей, являются крайни- ми в результате хороших условий среды и действия других, не генетичес- ких факторов. Даже при отборе генетически крайних индивидов с редки- ми генотипами их потомство может иметь генотипы, близкие к норме.
III. Оценка генетической вариансы и наследуемости R=Q Рисунок 11.16. Ответ на отбор в одном поколении для трех уровней наследуемости, где затемненная область - доля отобранной популяции; Р и - общая фенотипическая сред- няя и средняя отобранных индивидов в родительской популяции, соответственно; иР' - фенотипическая средняя потомства. Теоретически, измерение реализованной наследуемости доступно толь- ко после того, как отбор произошел, поэтому нельзя прогнозировать от- вет в данном поколении. Однако оценка реализованной наследуемости в данном поколении может быть использована для прогноза изменения в следующем и в будущих поколениях. Такая оценка наследуемости стано- вится менее достоверной с увеличением охватываемого периода време- ни. И поскольку отбор, генетический дрейф и мутирование могут изме- нить аллельные частоты, то другие признаки, которые могут влиять на ответ, могут также измениться. Пример 11.7 иллюстрирует, как можно оценить наследуемость размера тела у мышей в эксперименте при дву- направленном отборе. Мейер и Хилл (Meyer, Hill, 1991) для получения неотклоняющихся оценок реализованной наследуемости использовали подход, который включает эффекты и отбора, и генетического дрейфа. Более широкое обсуждение проблем, связанных с реализованной насле- дуемостью, можно найти в работах Falconer и Mackay (1996) и Lynch, Walsh (1998). Пример П.7. Оценка наследуемости, основанная на ответе на отбор че- рез поколения, дана Фальконером и Маккеем (Falconer and Mackay, 1996) для эксперимента при двунаправленном отборе массы тела у мышей. Сна- чала селекционные линии усреднялись по массе тела (около 22 граммов
Глава 11. Количественные признаки и эволюция за 6 недель). Повышающий отбор повышал массу почти до 27 граммов в 21 поколении, тогда как понижающий отбор снижал массу тела почти до 13 граммов в 18 поколении. На рисунке 11.17 показан кумулятивный от- вет на вертикальной шкале и кумулятивный селекционный дифференци- ал на горизонтальной шкале для этого эксперимента. Линейная регрес- сия через эти точки дает оценку реализованной наследуемости, равную 0,175 для повышающего отбора и равную 0,518 для понижающего отбо- ра. Такой несимметричный ответ может являться результатом ряда раз- личных факторов, таких как направляющее доминирование и меньшая приспособленность для крайних индивидов в одном направлении. Кумулятивный селекционный дифференциал Рисунок 11.17. Кумулятивный ответ, нанесенный на график против кумулятивного се- лекционного дифференциала, для экспериментального двунаправленного отбора массы тела у мышей. Прямые линии - линейная регрессия (Falconer, Mackay, 1996). Величина наследуемости признака используется при прогнозировании потенциального ответа на отбор. К тому же, часто предполагают, что при- знаки с низкой наследуемостью подвергались в прошлом отбору и поэто- му потеряли изменчивость. В частности, признаки, тесно связанные с приспособленностью, должны иметь низкую наследуемость и низкую аддитивную генетическую вариансу, потому что отбор на приспособлен- ность универсален и понижает генетическую изменчивость признаков, связанных с приспособленностью (предполагается фундаментальной те- оремой естественного отбора Фишера). Исследования наследуемости ряда характеристик в диких популяциях различных видов (Mousseau, Roff, 1987) и у Drosophila (Roff, Mousseau, 1987), в общем, согласуются с этими про- гнозами. Однако, Хоул (Houle, 1992) считает, что наследуемость может иметь малое применение в сравнительных целях для определения степени гене-
III. Оценка генетической вариансы и наследуемости тической изменчивости различных признаков и что среднее стандартизо- ванное измерение, называемое способностью эволюционировать, полез- но (см. обсуждение в работе Lynch, Walsh, 1998). Он определил меру спо- собности эволюционировать как величину: cv = А р которая является аддитивным генетическим коэффициентом изменчиво- сти и дает ожидаемое пропорциональное изменение для признака. Высо- кая CVA означает, что генетическая варианса высока относительно сред- него значения признака, и тогда признак изменяется в ответ на отбор. Хоул (Houle, 1992) сравнил наследуемость и способность эволюциониро- вать в обширном ряду опубликованных исследований. В таблице 11.7 пред- ставлены данные по четырем признакам у D.melanogaster, из которых, как часто обнаруживается, два признака, более тесно связанные с при- способленностью (плодовитость и продолжительность жизни), имели бо- лее низкие величины наследуемости, чем два других признака (количе- ство стерноплевральных щетинок и длина крыльев). Способность эволюционировать достигает наивысших значений у признаков, связан- ных с приспособленностью. Очевидно, что относительные размеры двух мер тесно не коррелируют. Таким образом, у признаков, связанных с при- способленностью, относительные значения генетической вариансы боль- ше, чем у других признаков. Это означает, что низкая наследуемость при- способительных компонент скорее связана с высокими уровнями средовой вариансы, чем с низкими уровнями аддитивной генетической вариансы, (Houle, 1992; Charlesworth, Hughes, 1999). ТАБЛИЦА 11.7. Наследуемость и мера способности эволюционировать для четырех раз- личных признаков у D.melanogaster, где N ~ число исследований (Houle, 1992) Признак N 1г Стерноплевральные щетинки 21 0,44 8,39 Длина крыла 31 0,36 1,56 Плодовитость 12 0,06 11,90 Продолжительность жизни 7 0,11 9,89 d. Факторы, влияющие на генетическую вариансу Факторы, влияющие на значение генетической вариансы в популяции, включают все факторы, которые влияют на значения других типов гене- тической изменчивости, таких как отбор, инбридинг, генетический дрейф
Глава 11. Количественные признаки и эволюция и мутирование. Здесь мы обсудим два из этих факторов - генетический дрейф и мутирование, ставшие предметом обширных споров и исследо- ваний. Значение аддитивной генетической вариансы в поколении t в ограни- ченной популяции, при условии, что признак не связан с приспособлен- ностью и при аддитивном действии генов, равно: ( 1 I ^w=^(0) 1-— , (11.8а) \ е / где N - эффективный размер популяции (Wright, 1951). Другими слова- ми, VA уменьшается из-за генетического дрейфа таким же образом, как и гетерозиготность (выражение 6.3b). Основной фактор, противодействующий эффекту генетического дрей- фа - новая мутация, которая может увеличить степень генетической из- менчивости. Например, если вклад аддитивной генетической вариансы на поколение составляет то изменение аддитивной генетической ва- риансы равно: ^А=~^Ге+Ум- (1L8b) Допустим, что существует баланс между генетическим дрейфом, умень- шающим вариансу, и мутированием, повышающим ее, тогда это выраже- ние можно решить для равновесной VA. V =2N V УА er М И N = 2V ' м (11.8с) Это последнее выражение используется в консервативной генетике для прогнозирования эффективного размера популяции, необходимого для под- держания генетической изменчивости у исчезающих видов (Franklin, 1980). Для иллюстрации предположим, что есть только аддитивная генетическая и средовая вариансы, так что наследуемость в узком смысле равна: и
III. Оценка генетической вариансы и наследуемости 559 Теперь предположим, что /г2 равна 0,5 (приближенная величина наследу- емости числа щетинок у D.melanogaster) и что Vu приблизительно равна 0,001 VE (Lande, 1976; Houle et al., 1996). В примере 11.8 обсуждается экс- перимент, по оценке Vu для признаков числа щетинок у D.melanogaster в результате отбора в инбредных линиях. Подставляя эти данные в выра- жение 11.8с, получим Ne = 500. Этот расчет лежит в основе рекоменда- ции, что эффективный размер популяции, равный 500, достаточен для долговременного поддержания генетической вариансы количественных признаков у исчезающих видов (Franklin, 1980). Пример 11.8. Один из методов оценки мутационного вклада в аддитив- ную генетическую вариансу в поколении - отбор в высоко инбредных линиях, которые, вероятно, имеют очень малую исходную генетическую изменчивость и наблюдение за скоростью ответа. Например, Маккей с сотрудниками (Mackay et al., 1994) проводили отбор на высокие и низкие количества абдоминальных и стерноплевральных щетинок у высоко инб- редных линий D.melanogaster в течение 125 поколений и оценивали вклад новых мутаций, влияющих на эти признаки. Они добились успеха в отборе обоих признаков, и средняя дивергенция между репликатами (копиями) линий с высокими и низкими количествами щетинок в конце экспери- мента была 12,0 абдоминальных (рисунок 11.18) и 8,2 стерноплевраль- Рисунок 11.18. Ответ на 125 поколений отбора по количеству абдоминальных щетинок в инбредной популяции из трех линий, в каждой из которых действует отбор на высокое и низкое количество щетинок (Mackay et al., 1994).
G60 Глава 11. Количественные признаки и эволюция ных щетинок. Эта дивергенция привела к фенотипическим стандартным отклонениям от величин в основной популяции для двух типов щетинок, равным 7,0 и 8,0, соответственно. Ответ на отбор в линиях с высокими и низкими количествами щетинок был довольно асимметричным (меньший ответ в сторону увеличения, чем в сторону уменьшения для абдоминаль- ных щетинок, и меньший ответ в сторону уменьшения, чем в сторону увеличения для стерноплевральных щетинок). К тому же, были периоды и быстрого ответа, и остановки уменьшения числа щетинок для снижаю- щего отбора по абдоминальным щетинкам и увеличения их числа - для повышающего отбора по стерноплевральным щетинкам. Эта картина со- ответствует быстрому изменению после новой мутации, имеющей отно- сительно большой эффект, и последующему плато, когда мутация дости- гает высокой частоты. Оценки мутационного вклада на поколение за первые 25 поколений были 4,3 х 10 3 и 3,7 х Ю’для абдоминальных и стерноплевральных щетинок, соответственно. Эти оценки незначитель- но выше, чем более ранние оценки у линий, не подвергающихся отбору (Mackay et al., 1992). Однако, в более раннем исследовании изменчивость среди линий была симметричной с небольшим средним изменением, в противоположность асимметричным ответам, наблюдаемым в этом экс- перименте, что предполагает асимметричное действие естественного от- бора против более крайних мутаций. Однако, Ланде (Lande, 1995) задал вопрос: достаточен ли размер по- пуляции, равный 500, для поддержания адаптивной генетической вари- ансы? Если очень вредные мутации исключаются, тогда величина гене- тической вариансы оказывается в результате мутирования на порядок ниже величины VM - 0,0001 VE (Lopez, Lopez-Fanjul, 1993a; 1993b). При этом для поддержания генетической изменчивости значение Ne должно быть равным 5000. Очевидно, это слишком много для исчезающих видов. С другой стороны, если наследуемость в узком смысле низкая (Franklin, Franklin, 1998), (как это характерно для многих признаков, связанных с приспособленностью), скажем /г2 - 0,1, и при V = 0,0001 V& величина Ne =556. Хотя эти расчеты иллюстрируют, как использование теории ко- личественной генетики может дать некоторое общее понимание проблем консервативной генетики, эти фактические величины следует рассматри- вать в большей степени эвристически. Хоул и соавторы (Houle et al., 1996) обнаружили, что величина отно- шения V /V обычно колеблется от 30 до 300. Это означает, что величи- на Ne находится между 15 и 150 (Lynch, Lande, 1998). Очевидно, столь низкая численность популяций не реальна для таких видов, как D.melanogaster, которые имеют крайне большие популяции. Таким об-
III. Оценка генетической вариансы и наследуемости 561 разом, рекомендации, основанные на этом методе, следует использовать с предосторожностями. К тому же, Хоул изучал значение количествен- ной генетической изменчивости, поддерживаемой мутационно-селекци- онным равновесием, для понимания модели мутирование-генетический дрейф в оценке эффективного размера популяции при долговременном поддержании генетической изменчивости. Считается, что для большин- ства количественных признаков стабилизирующий отбор (см. ниже), действуя на признак (и косвенно на коррелирующие признаки), пони- жает степень генетической изменчивости (Lande, Arnold, 1983; Lande, 1995). С другой стороны, мутации сами по себе не могут объяснить сте- пень постоянной генетической изменчивости, наблюдаемой для многих признаков (Charlesworth, Hughes, 1999) при наличии некоторых типов балансирующего отбора. В общем, можно сказать, что расчеты необхо- димого эффективного размера популяции, представленные выше, мо- гут обосновать сохранение генетической вариансы в маленьких по раз- меру популяциях. Но другие факторы, по-видимому, более значимы для поддержания численности популяции, что и обусловливает их вымира- ние (Lande, 1994). Оценка скорости мутирования для генов, которые влияют на призна- ки, связанные с приспособленностью, приведена в обширном исследова- нии Дрейка (Drake et al., 1998). В общем, считается, что эти мутации по- нижают приспособленность, а имеющие такие мутации индивиды элиминируются отбором. Чем больше вредный эффект мутации как в го- мозиготном, так и в гетерозиготном состоянии, тем ниже ожидаемая ал- лельная частота вредных мутаций (см. главу 8). Оценка скорости мутиро- вания и влияния мутаций на жизнеспособность были определены в нескольких обширных экспериментах по накоплению мутаций у D.melanogaster (см. данные из эксперимента Mukai, 1964 в примере 11.9). Из этих экспериментов, которые включают ряд репликатных линий (ко- пий), можно рассчитать снижение средней жизнеспособности на поколе- ние, АЛ/, и возрастание межлинейной жизнеспособности на поколение, А И Используя эти величины и выражения, получим: <10-9а) (10.9b) AL 5 <--- Ш Можно вычислить минимальную оценку U, скорости мутирования, влия- ющую на жизнеспособность, на гаплоидную хромосому за поколение, и максимальную оценку У среднего эффекта мутаций.
Глава 11. Количественные признаки и эволюция Пример 11.9. Инбредные линии Drosophila используют для наблюдения за влиянием мутаций на жизнеспособность, изменения частоты леталь- ных генов в популяции и других признаков. Мукаи (Mukai, 1964), напри- мер, оценил влияние спонтанных мутаций на жизнеспособность у D.melanogaster, используя изогенные по второй хромосоме линии, в ко- торых периодически оценивается относительная жизнеспособность. Сред- няя относительная приспособленность (в 72 таких линиях) и фенотипи- ческая варианса между этими линиями показана на рисунке 11.19. Накопление мутаций во времени понижает жизнеспособность и повыша- ет вариансу между линиями. Мукаи оценил количество полигонных му- таций, влияющих на жизнеспособность, за поколение как 0,141. Особен- но важно то, что значение изменчивости жизнеспособности к концу эксперимента сходно по величине со значением изменчивости в природ- ной популяции. Это значит, что популяции, генетически обедненные по изменчивости количественных признаков, могут восстановить изменчи- вость в относительно короткое время. В таблице 11.8 суммированы результаты четырех экспериментов по накоплению мутаций, включающие один пример, обсуждавшийся ранее, в котором оценивались эти значения жизнеспособности по второй хро- мосоме у D.melanogaster. Экстраполируя на диплоидный геном (хромо- сома II составляет приблизительно 40% генома), скорость мутирования Рисунок 11.19. Относительная жизнеспособность и варианса жизнеспособности в тече- ние времени для 72 линий дрозофилы, которые были исходно изогенны по второй хромо- соме (Mukai, 1964).
ТАБЛИЦА П.8. Оценочные значения снижения средней жизнеспособности на поколе- ние (АЛ/) и повышения вариансы среди линий (ДИ) даны для четырех разных исследова- ний. Используя эти значения и выражения 11.9а и 11.9b, рассчитана скорость мутирова- ния, влияющая на жизнеспособность, на гаплоидную вторую хромосому на поколение (U) и средний эффект мутаций (V). Также дана оценочная скорость мутирования на зиго- ту которая получена умножением U на 5. Исследование AM ДК U 5 Mukai (1964) 0,0038 0,00010 0,14 0,027 0,70 Mukai et al. (1972) 0,0040 0,000094 0,17 0,023 0,85 Onishi (1977) 0,0017 0,000051 0,058 0,030 0,29 Fry et al. (1999) 0,0024 0,00027 0,021 0,113 0,10 равна приблизительно единице за поколение, исходя из двух эксперимен- тов Мукаи, меньше в эксперименте Ониши, и только 0,1 за поколение у Фрая с сотрудниками (Fry et al., 1999). Более того, Фрай обнаружил, что оценка эффекта мутаций составляет три пятых от полученной в предыду- щих экспериментах. Некоторые недавние оценки скорости мутирования у других организмов также значительно меньше, чем ранние оценки для D.melanogaster'. например, оценка скорости мутирования за поколение для общей приспособленности у E.coli (Kibota, Lynch, 1996) для признаков, связанных с приспособленностью, у C.elegans (Keightley, Cabellero, 1997; Vassilieva, Lynch, 1999) и признаков, связанных с приспособленностью, у Arabidopsis thaliana (Schultz et al., 1999). С другой стороны, непрямые оценки (Drake et al., 1998) скорости мутирования признаков, связанных с приспособленностью, у Daphnia (Deng, Lynch, 1997), у самоопыляющих- ся растений (Johnstos, Schoen, 1995) и у D.melanogaster (Hughes, 1995) сильно не отличаются от ранних оценок скорости мутирования для D.melanogaster. Возможное объяснение этих различий в оценках скорос- ти геномного мутирования можно найти в работе Keightley и Caballero (1997), Drake et al. (1999) и Lynch et al. (1999). Хотя аддитивная генетическая варианса, как ожидается, снижается в результате генетического дрейфа строго аддитивных генов (выражение 11.8а), в нескольких исследованиях сообщается, что степень аддитивной генетической вариансы для признаков, связанных с приспособленностью, может повыситься в результате эффекта «бутылочного горлышка» (Bryant etal., 1986; Lopez-Fanjul, Villaverde, 1989; Wade et al., 1996). Такие увеличе- ния могут иметь место, когда редкие рецессивные аллели оказывают боль- шое влияние на приспособленность (Robertson, 1952; Willis, Orr, 1993) или из-за превращения эпистатической вариансы в аддитивную генетическую вариансу (Cockerham, Tachida, 1988; Goodnight, 1988). Возрастание адди-
&64 Глава 11. Количественные признаки и эволюция тивной генетической вариансы интерпретируется как потенциальное пре- имущество, при необходимости быстрого селективного ответа. Однако по- чти все оценки экспериментальных результатов показывают возрастание аддитивной генетической вариансы для признаков, связанных с приспо- собленностью. Более того, в недавнем, обширном исследовании (Whitlock, Fowler, 1999) было обнаружено для шести признаков строения крыльев у D.melanogaster, что даже при снижении аддитивной генетической вариан- сы в случае инбридинга, как ожидалось для аддитивности, варианса среди репликатов (копий) была очень велика. Для одного признака диапазон зна- чений находился в пределах от 14% до 211% от обнаруженных у аутбред- ных контрольных линий. IV. Отбор по количественным признакам Многое стало известно о природе количественной генетической измен- чивости из экспериментов по отбору. Отбор, при котором человек отби- рает размножающихся особей, называют искусственным отбором в про- тивоположность естественному отбору, при котором нет вмешательства человека. Практически, направленный отбор приводит к образованию или улучшению разновидностей или пород растений или животных и являет- ся важным орудием для селекционеров растений и животных. Действи- тельно, все эксперименты по направленному отбору изменяют до некото- рой степени фенотипическую среднюю рассматриваемой популяции (Lewontin, 1974), хотя скорость ответа на отбор для некоторых признаков медленная (см. Hill, Caballero, 1992). а. Отбор в природных популяциях В природных популяциях отбор часто разделяется на три разных вида: на- правленный отбор в пользу индивидов одного крайнего (экстремального) фенотипа; стабилизирующий отбор в пользу промежуточного фенотипа против крайних фенотипов; и дизруптивный (или разделяющий) отбор, когда оба крайних фенотипа имеют преимущество перед промежуточными фенотипами. Схема этих типов отбора дана на рисунке 11.20, где затемнен- ные площади обозначают отбираемые фенотипы. Обычно в природных популяциях фенотипы определенного класса имеют более высокую веро- ятность выживания и репродукции, чем фенотипы других классов. Прежде чем продолжить обсуждение этих типов отбора, рассмотрим возможную взаимосвязь между приспособленностью и количественным признаком. Если естественный отбор зависит от измененией фенотипи- ческой величины, то эта взаимосвязь описывается зависимостью от рас- сматриваемого фенотипа (Robertson, 1955). Как показано на рисунке 11.21а,
IV. Отбор по количественным признакам 565 Исходное поколение Направленный Фенотипическое значение Снижение вариансы Возрастание вариансы Последствия Изменение средней Рисунок П.20. Направленный, стабилизирующий и дизруптивный отбор. Затемненные площади - пропорция отбора в каждом распределении, меньшее распределение обозна- чает ожидаемое изменение после нескольких поколений отбора. некоторые признаки могут быть почти нейтральными в отношении при- способленности. Например, индекс борозд отпечатков пальцев в популя- циях человека изменяется в широких пределах и относительная приспо- собленность, вероятно, сходна для всех этих фенотипических значений. С другой стороны, для таких признаков, как размер тела и масса, высшую относительную приспособленность имеют промежуточные фенотипичес- кие значения, что приводит к стабилизирующему отбору по этим призна- кам (рис. 11.21b). Классический пример такой взаимосвязи для приспо- Периферический Размер тела Компонента признак приспособленности Рисунок 11.21. Значение приспособленности данного фенотипа, когда он почти нейтра- лен в отношении приспособленности (а), когда оптимален фенотип с промежуточными признаками (Ь) и для компоненты приспособленности (с), (по Robertson, 1955).
собленности - масса тела при рождении у человека (сплошные кружки на рисунке 11.22, показывающем данные из исследования более, чем 13000 английских новорожденных), (Kam, Penrose, 1951). По этим данным, у детей с низкой массой при рождении смертность выше, а у детей с массой тела больше нормальной смертность незначительно выше, чем у тех, чья масса при рождении имеет промежуточные значения. Средняя масса при рождении в популяции была 7,16 фунтов (3,247г), а мода пропорции вы- живших была 8,0 фунтов (3,632г). Для компонент приспособленности, таких как численность потомства, выживаемость и способность к скре- щиванию, относительная приспособленность обычно растет по величи- не. По мере роста компоненты приспособленности усиливается и направ- ленный отбор (рисунок 11.21с). Только на некотором высоком уровне происходит снижение общей приспособленности с возрастанием величи- ны компоненты приспособленности. Этот поворот в приспособленности может быть связан с отрицательной корреляцией между компонентами приспособленности; например, особь с высокой плодовитостью имеет более низкую выживаемость. Заметим, что эти схемы - лишь некоторые из возможных и что могут существовать другие взаимоотношения между фенотипом и приспособленностью. Последствия трех типов отбора, изображенные на рисунке 11.20 - на- правленного, стабилизирующего и дизруптивного - будут совершенно раз- ными. Изменения в популяции после отбора обычно связаны со средней и вариансой фенотипической величины, хотя распределение фенотипов Рисунок 11.22. Распределение массы при рождении (гистограмма) и вероятность выжи- вания у детей (закрашенные кружки) (Kam, Penrose, 1951).
IV. Отбор по количественным может описываться и другими статистическими величинами. При этих трех видах отбора средняя изменяется только в случае направленного от- бора, оставаясь приблизительно одинаковой при стабилизирующем и дизруптивном отборе. Величина вариансы остается примерно той же, понижается или повышается при направленном, стабилизирующем или дизруптивном отборе, соответственно (см. нижнюю часть рисунка 11.20). Теоретически, при дизруптивном отборе имеется бимодальное распреде- ление. В экспериментах по искусственному отбору предполагается воз- растание вариансы или сдвиг к одной или другой моде. Считается, что направленный отбор имеет значение для адаптации популяции в экстре- мальных условиях среды, а, стабилизирующий отбор - для сохранения адаптации популяции и дизруптивный отбор - в начале процессов специ- ализации (хотя этот последний пункт и спорен). Простой переход между этими типами отбора для полигенных при- знаков и моделей одного гена имеет эвристическое значение (некоторые двухлокусные модели даны в главе 10). Для направленного отбора, как отмечалось выше, можно представить ряд сходных локусов, имеющих благоприятные аллели. Изменения в частоте этих аллелей приведут к из- менению средней фенотипической величины. Несколько сложнее описать действие стабилизирующего отбора в мультилокусной модели. Для слу- чаев, когда промежуточная фенотипическая величина имеет максималь- ную приспособленность Райт (Wright, 1969) предложил модель оптималь- ного отбора. Допустим, что Р и Ро - это фенотипические величины z-того и оптимального генотипов, соответственно, тогда приспособленность z-того генотипа можно выразить как ил -Ро )2, (11.10) где К - константа. Другими словами, приспособленность снижается как функция квадрата отклонения данного фенотипа от оптимального фено- типа. Пример этой взаимосвязи проиллюстрирован на рисунке 11.23 для двух локусов, которые аддитивны по фенотипической шкале, К = 4 и PQ = 1,1. Заметьте, что особи с тремя генотипами — двойные гетерозиготы AjA2BjB2 и две гомозиготы, А]А]В2В2 и A^AJi Bt - имеют оптимальный фенотип и, поэтому, максимальную приспособленность. Стабилизирующий отбор может привести к отрицательному гамети- ческому неравновесию между тесно сцепленными локусами, т.е. к ассо- циации благоприятных и неблагоприятных аллелей в гаметах (Mather, 1941; Lewontin, 1964). Педположим, что имеется промежуточный фено- тип с максимальной приспособленностью и ряд генов с альтернативны- ми аллелями, которые оказывают либо положительное (+ аллели), либо отрицательное (- аллели) влияние на приспособленность. Если все гены
BgBg A] A2B2 Рисунок 11.23. Приспособленность различных фенотипов согласно модели оптимально- го отбора (пояснения в тексте). имеют одинаковые эффекты, то для удобства будем считать максималь- ную фенотипическую величину равной нулю. Другими словами, если два гена вносят вклад в приспособленность, тогда два негомозиготных гено- типа имеют оптимальную фенотипическую величину: двойная гетерози- гота в фазе притяжения ++/— и двойная гетерозигота в фазе отталкива- ния +-/-+. Когда нет сцепления между двумя локусами, оба эти генотипа образуют равные пропорции гамет сбалансированного типа, +- и -+, и несбанласированных гамет, ++ и —. Однако, когда локусы сцеплены, образуется больше нерекомбинантных гамет, чем рекомбинантных. В ре- зультате, генотип +-/- + дает, в основном, сбалансированные (в фазе при- тяжения) гаметы, а генотип ++/— продуцирует в основном крайние (эк- стремальные, в фазе отталкивании) гаметы. Этот анализ можно распространить на множество локусов. Действительно, эффект становится более значительным при большем количестве локусов. Однако, этот тип отбора относительно слабый, поэтому он легко подавляется при реком- бинации между локусами. Более того, такой стабилизирующий отбор по множеству локусов не повышает стабильный полиморфизм и, в конеч- ном итоге, приводит к утрате изменчивости (Lewontin, 1964b). Ланде (Lande, 1976) предположил, что генетическая изменчивость при- знака под действием стабилизирующего отбора снижается двумя спосо- бами: путем образования гамет в фазе отталкивания, где гаметическая
IV. Отбор по количественным признакам 569 изменчивость существенно скрыта с точки зрения фенотипической из- менчивости и путем фиксации определенных аллелей. Нарушение сцеп- ления генов в результате рекомбинации и появление новой изменчивос- ти, обусловленной мутированием и генным потоком, противодействует этим эффектам (и генетическому дрейфу). Ь. Ответ (реакция) на отбор Природу генетической изменчивости, которая влияет на количественные признаки, иллюстрируют эксперименты по долговременному направлен- ному отбору. Они показывают регулярное повышение или снижение фено- типической средней в ряду поколений, так что средние значения находятся за пределами крайних фенотипических величин, обнаруженных в исход- ной популяции. Обычно в некоторой точке скорость ответа на отбор замед- ляется и достигает селекционного предела, или плато. В этой точке может наблюдаться небольшой дальнейший рост ответа при очень сильном дав- лении отбора. Некоторые селекционные эксперименты показали непрерыв- ный рост ответа во многих поколениях; примером служит отбор на содер- жание жира в зернах кукурузы, показанный на рисунке 1.17. Как предполагалось, на значение и скорость ответа влияет ряд генов, важных для признака, их доминирование, распределение их эффектов, размер по- пуляции, взаимодействие между этими генами и т.д. В примере 11.10 обсуждается ответ на отбор по количеству щетинок у D.melanogaster и приближенная к этим наблюдениям генетическая модель. В некоторых случаях оказывается, что мутации вносят значительный вклад в ответ на действие долговременного отбора (Hill, Keightkey, 1988). Пример 11.10. При попытке понять факторы, влияющие на значение ко- личественных признаков и скорость их изменений в ответ на действие отбора, Лэтер (Latter, 1969) провел серию селекционных экспериментов по отбору количества скутеллярных щетинок у D.melanogaster. Количе- ство скутеллярных щетинок - высоко наследуемый признак с оценкой наследуемости в основной популяции, равной 0,33. Пятнадцать реплика- тивных (копийных) линий, полученных из основной популяции, были объектом направляющего отбора в течение 22 поколений. Средний балл количества щетинок увеличился во всех линиях. На рисунке 11.24 даны два репликата с наибольшим ответом и два - с наименьшим, а также об- щая средняя. Заметьте, что диапазон ответа на отбор у этих линий очень большой. При построении компьютерной модели наблюдаемого ответа, изменяли количество локусов и аллелей, влияющих на признак, их ис- ходное сцепление и селективные отношения. Модель, согласующаяся с результатами этого эксперимента на Drosoplila, показана на рисунке 11,24b.
Глава 11. Количественные признаки и эволюция Рисунок П.24. Наблюдаемый ответ на увеличенное количество скутеллярных щетинок у D.melanogaster (а) и ответ, основанный на моделировании эксперимента (Ь). Пунктирная линия - средняя для 15 репликатов, также показаны по два наиболее экстремальных реп- ликата (по Latter, 1969). В этом случае было десять независимо сегрегирующих, мультиаллель- ных локусов с равными эффектами. И скорость ответа, и изменчивость ответа по репликатам очень близки к наблюдаемым результатам. Это мо- делирование обеспечивает приемлемое представление о характере ответа на действие отбора, хотя другие модели также могут быть согласованы с наблюдениями. Влияние эффективного размера популяции на селекционный отбор показано теоретически. Исследования искусственного отбора в больших популяциях на практике обычно не проводят. Однако, Вебер (Weber, 1990) разработал оборудование для быстрого скрининга длины концевых сег- ментов крыла у D.melanogaster. Он смог провести селекционные экспе- рименты в выборке 5000 мух родительского поколения. Отбор в большой популяции в течение 55 поколений (с одинаковыми пропорциями отбира- емых родителей) изменил среднюю более, чем в два раза по сравнению с результатами отбора на 200 родителях, что говорит о значении популяци- онного размера для ответа на отбор. Некоторые фенотипические характеристики очень постоянны в своих значениях среди особей в популяции (например, большая часть растений белого клевера имеет три листочка, и обнаружение необычного клевера с четырьмя листочками считается счастливой приметой). Признаки с та- ким высоким постоянством фенотипа, как говорят, канализированы. Действительно, такие направляющие, канализированные признаки часто совершенно необходимы в идентификации видов или видовых групп из- за их постоянства внутри вида. Даже если направляющие признаки име-
ют малую фенотипическую изменчивость, значительная генетическая из- менчивость, которая могла бы влиять на признак, может быть скрыта из- за сильного контроля, достигающего высшей точки в определенном фе- нотипе. Такой контроль можно разрушить либо факторами среды, которые несколько отличаются от нормальных условий, либо генетическими ва- риантами, которые влияют на нормальный буфер фенотипа. В примере 11.11 даны случаи и средового (количество лепестков у флоксов) и гене- тического разрушения контроля (дизрупции), (количество пальцев у мы- шей). Возможно, что сравнимые с этими факторы возникают и в природ- ных популяциях. Пример 11.11. Количество частей цветка у большинства растений высо- ко канализировано. Например, цветки нескольких близко родственных видов флоксов (Linanthus) обычно имеют 5 долей у венчика (лепестков). Обширное исследование (Huether, 1969) выявило, что только от 1% до 4% цветков в популяции отклоняется от этой нормы, обычно имея 4, 6 или 7 долей. Однако, когда растения выращивают в условиях какого-либо стресса в оранжерее, изменчивость в числе долей увеличивается. Когда направляющий отбор происходит в популяции, находящейся в стрессо- вых средовых условиях, число долей может быть увеличено или умень- шено. На рисунке 11,25b показаны некоторые типы цветков, образующихся в результате отбора в стрессовых условиях среды. Диапазон в этих усло- виях от 1 доли до 16, т.е. происходит огромный рост фенотипической из- менчивости (вариабельности). Число пальцев у нормальной мыши - высоко канализированный при- знак. В исследовании 44184 мышей, было только пять особей, отклонив- шихся от нормы (Kindred, 1967). Мутация luxate (lx) влияет на развитие задней конечности и приводит к значительному увеличению изменчивос- ти числа пальцев. Очевидно, аллель 1х вызывает нарушение канализации ТАБЛИЦА 11.9. Распределение числа пальцев у мышей дикого типа и у гетерозиготных и гомозиготных мышей линии luxate (по Kindred, 1967). Число пальцев +/+ +Их 1х/1х 8 - - 9 9 - - 12 10 86 67 57 11 - 12 11 12 - 4 - 13 - 1 -
Глава 11. Количественные признаки и эволюция Рисунок 11.25. Примеры цветков флоксов, найденных в природных популяциях (а) и по- явившихся в результате стрессовой среды и отбора (b),(no Huether, 1968). числа пальцев и приводит к появлению особей с большим и с меньшим, чем десять числом пальцев. Более того, в линии luxate в течение несколь- ких поколений экспериментального отбора, варианса числа пальцев су- щественно возрастает (Kindred, 1967). Когда средовой стресс приводит к увеличению редкого аномального фе- нотипа в популяции, и когда особи с аномальными признаками впослед- ствии дают потомство, оказывается, что стрессовые факторы среды инду- цируют наследственное изменение. Такой результат согласуется с пороговой моделью, которую мы обсуждали ранее (рисунок 11.5). Предположим, что в нормальной среде и в неселективной популяции аномальный фенотип в действительности отсутствует, потому что генетическая тенденция, или предрасположенность признака у всех индивидов в популяции ниже спон- танного порога (рисунок 11,26а). В стрессовой среде порог сдвигается вле- во (индуцированный порог) и приводит к увеличению пропорции индиви- дов с аномальным фенотипом (затемненная область). Поскольку стрессовая среда выявляет генетически экстремальных индивидов, отбор может по- высить пропорцию индивидов с аномальным генотипом, изменяя среднюю генетическую предрасположенность в популяции (рисунок 11.26b). После
Рисунок 11.26. Распределение генетической предрасположенности до отбора (а) и после отбора (Ь) в стрессовой среде, демонстрирующее основу генетической ассимиляции. действия отбора часть популяции проявляет аномальные признаки даже в нормальной среде. Этот процесс отбора, который приводит к возрастанию частоты аномального фенотипа в стрессовой среде, называют генетичес- кой ассимиляцией. Особенно поразительный пример генетической асси- миляции - эксперимент Уоддингтона (Waddington, 1956), в котором он про- водил отбор в линии D.melanogaster с удвоенным грудным отделом (двойной торакс). Возможно, что включение нового признака в природную популя- цию происходит сходным образом, т.е. стрессовая среда индуцирует новый фенотип, и отбор, благоприятствующий фенотипу, увеличивает его часто- ту в популяции. Теоретически, предел ответа на отбор может зависеть от нескольких факторов или их комбинации. Например, экстремум (крайнее выражение признаков) может отрицательно коррелировать с некоторыми компонен- тами приспособленности (естественный или искусственный отбор рабо- тают в противоположных направлениях). Или, возможно, аддитивная ге- нетическая варианса исчерпывается из-за отбора, ограниченного размера популяции или инбридинга. К тому же, благоприятный аллель в некото- рых локусах может быть в гаметическом неравновесии с аллелями в дру- гих локусах, которые оказывают отрицательное действие либо на при- знак, либо на какую-либо компоненту приспособленности. Часто трудно различить эти альтернативы и некоторые факторы могут вносить вклад
[Г574 Глава И. Количественные признаки и эволюция одновременно. Например, если отбор ослабляется, то снижается феноти- пическая средняя при отрицательной корреляции с приспособленностью, либо фенотипические изменения отсутствуют, если причина плато - ис- черпанность аддитивной генетической вариансы (см. Falconer, Mackay, 1996). К примеру, Энфильд (Enfield, 1977) обнаружил снижение средней массы куколок под действием ослабленного отбора у мучного хруща Tribolium, для которого предполагается отрицательная корреляция с при- способленностью, тогда как Weber (1996) не обнаружил изменений при ослабленном отборе для линий D.melanogaster, отбираемых по скорости полета в продуваемых туннелях. Если в определение признака вовлечено большое количество локусов с совершенно равными эффектами, следует ожидать, что ответ на отбор в ходе эксперимента будет наибольшим в начале, когда аддитивная генети- ческая варианса наибольшая, и затем замедлится по мере приближения популяции к своей асимптоте. В некоторых экспериментах, однако, ответ не был регулярным и показывал перемежающиеся периоды быстрого и медленного ответа. Один классический пример - селекционные экспери- менты по измерению числа стерноплевральных щетинок у D.melanogaster, (Thoday et al., 1964). В нескольких экспериментах наблюдали ответ, близ- кий к исходному и приближение к видимому плато после 15-20 поколе- ний. Но, спустя ряд поколений, произошло увеличение среднего числа щетинок до значений, равных числу щетинок в первый период ответа на отбор. Это объяснили рекомбинацией между сцепленными аллелями в разных генах, влияющих на количество щетинок. При тесном сцеплении генов должно пройти некоторое время, прежде чем произойдут рекомби- нации между сцепленными аллелями и впоследствии возрастет частота рекомбинантных хромосом и перемежающих нуклеотидных замен, кото- рые Элена с сотрудниками (Elena et al., 1996) в долговременных экспери- ментах на E.coli, отнесли к редким, полезным мутациям. Если частота рекомбинаций мала или они отсутствуют, то значение ответа на отбор может быть очень небольшим. Эта редукция ответа имеет место, когда ре- комбинация ограничена, поскольку частота благоприятных аллелей увели- чивается, а сцепленные неблагоприятные аллели в других локусах, ассоци- ированные с ними, могут быть перенесены в последующие поколения и зафиксироваться, снижая максимальную величину ответа на отбор, дости- жимую в популяции (Robertson, 1967; McPhee, Robertson, 1970). Если отбор действует на один признак, то изменения могут затронуть и другие признаки, т.е. наблюдается вторичный ответ. Генетической основой таких коррелированных ответов считается плейотропное действие опреде- ленных генов или гаметическое неравновесие между генами, влияющими на эти признаки. Разделить эти эффекты часто трудно, особенно когда на
IV. Отбор по количественным признакам 575 признак, находящийся под действием отбора влияют многие локусы. Это вполне возможно при ассоциации аллелей из других локусов и при плейо- тропном действии некоторых селективных аллелей. Если коррелирован- ный ответ является результатом сцепления аллелей в другом локусе, то сле- дует ожидать, что скорость и продолжительность такого ответа будут очень изменчивыми и быстрыми, потому что на них влияет гаметическое нерав- новесие и рекомбинации. Когда в ответ на действие отбора вовлечены плей- отропные эффекты, коррелированный ответ должен быть более повторяе- мым и прогнозируемым, учитывая наличие одинаковых аллелей. Ассоциация двух количественных признаков - фенотипическая кор- реляция, может быть вызвана или средовыми, или генетическими факто- рами. Генетические и средовые корреляции можно оценить аналогично способу, использованному для оценки наследуемости. Показано (Falconer, Mackay, 1996), что фенотипическая корреляция, г, является функцией этих корреляций, поэтому: ГР =hxhyrA + ехеугЕ, (11.11) где h2 и h2v - наследуемости в узком смысле для признаков х и у, е2х - 1 - h2, е2 = 1 - h2, а гА и гЕ - генетическая корреляция (аддитивная ком- понента) и средовая корреляция (также включающая неаддитивную ге- нетическую компоненту), соответственно. Некоторые примеры фенотипической корреляции и составляющих ее генетической и средовой корреляций даны в таблице 11.10. Заметьте, что средовая и генетическая корреляции могут быть противоположны по зна- ку. Действительно средовая и генетическая корреляции могут погашать друг друга, что приводит к отсутствию корреляции между двумя признаками (Atchley, Rutledge, 1981). Такие открытия важны для морфометрических исследований роста и развития, потому что они вызывают сомнения в том, что фенотипическая ассоциация двух признаков обязательно имеет генети- ческую причину. К тому же, основа фенотипической ассоциации важна при прогнозировании коррелированного ответа на отбор. Например, при отри- цательной генетической корреляции с приспособительной компонентой признаков получить ответ на отбор гораздо труднее, чем при отрицатель- ной средовой корреляции с приспособительной компонентой. На основе изучения опубликованных оценок корреляции появилось предположение (Cheverud, 1988, Roff, 1996), что фенотипическая и генетическая корреля- ции могут иметь одинаковый знак и сходные величины. Если это так, то более просто оцененная фенотипическая корреляция может действовать вроде суррогата генетической корреляции. Однако Уиллис с сотрудниками (Willis et al., 1991) считают, что любое видимое сходство фенотипической и генетической корреляций скорее исключение, чем правило.
ТАБЛИЦА 11.10. Значения фенотипической, генетической и средовой корреляций для нескольких признаков (по Falconer, Mackay, 1996). Организм Признак X У Крупный рогатый скот Молочность Жирность -0.26 -0,38 -0,18 Свиньи Прирост массы Эффективность питания 0,66 0,69 0,64 Куры Масса тела Продукция яиц 0,01 -0,17 0,08 Мыши Масса тела Длина хвоста 0,45 0,29 0,56 D.melanogaster (количество щетинок) Абдоминальные Стерноплевральные 0.14 0,41 0,06 с. Оценка отбора в природных популяциях Как мы обсуждали ранее, индивидуальная приспособленность данного фенотипического признака изменяется как функция фенотипических ве- личин. Дарвин показал это в теории естественного отбора. Однако, коли- чественное определение действия естественного отбора на фенотипичес- кий признак - непростая задача. Сначала рассмотрим несколько простых подходов для оценки, отбора, которые имеют важное эвристическое зна- чение, хотя они очень трудны для практического применения. Один способ измерения интенсивности естественного отбора был пред- ложен Ван Валеном (Van Valen, 1963): (11.12а) / = wv-w wo где w0 иур - выживаемость фенотипов с оптимальными величинами и средняя выживаемость, соответственно (предполагается, что отбор влия- ет только на различия в выживаемости). Это сходно с эффектом генети- ческого груза (глава 3), только в данном случае речь идет о фенотипах, а не о генотипах. Интенсивность отбора выражается в пропорции элими- нированной популяции, поскольку не все особи имеют оптимальный фе- нотип (O’Donald, 1971). Графически это изображено на рисунке 11.27, где верхняя кривая - распределение величин признака до отбора, и пло- щадь под ней соответствует единице. Нижняя кривая - распределение величин признака после отбора, и площадь под ней несколько меньше, чем единица. В одном месте графика эта кривая достигает кривую рас- пределения величин признака до отбора, что соответствует оптимально- му фенотипу (фенотипу с наивысшей выживаемостью). Заштрихованная
IV. Отбор по количественным Рисунок 11.27. Распределение величин признака до (верхняя кривая) и после (нижняя кривая) действия отбора. Заштрихованная площадь между кривыми - интенсивность от- бора (Van Valen, 1963). площадь между кривыми соответствует интенсивности отбора, как опре- делено выражением 11.12а (Van Valen, 1963). При описании действия отбора на распределение величин признаков в целом, а не только как функции приспособленности оптимального фено- типа и средней приспособленности, можно получить лучшую оценку от- бора. Для этого используется модификация оптимизирующего отбора, которая связывает приспособленность с количественным признаком. Пред- полагая, что распределение индивидов нормальное и что фенотипичес- кая средняя постоянна, получим: ДУ ДУ+ 27 ’ (11.12b) где V - варианса величины признака, так что интенсивность отбора явля- ется функцией вариансы и изменения вариансы до и после отбора. Этот метод применялся для оценки естественного отбора по ряду признаков у различных организмов (например по количеству пятен на крыльях у ба- бочек, количеству щетинок у Drosophila, половому отбору у птиц (O’Donald, 1971; O’Donald et al., 1974) и по количественным признакам у водяных змей (Beatson, 1976). Другой метод оценки потенциала отбора основан на фундаменталь- ной теореме естественного отбора (Crow, 1958). Как обсуждалось на стр. 131, можно определить относительный прирост (увеличение) приспособ- ленности следующим образом: w'-w (11.12с)
Глава 11. Количественные признаки и эволюция где w и w' - относительные приспособленности до и после отбора. По- скольку генетические факторы обусловливают только долю различий в приспособленности, величину I можно назвать общей возможностью от- бора и она является верхним пределом для возможного эволюционного ответа. Возможность отбора можно подразделить на компоненты, кото- рые отражают различия в смертности и плодовитости (Crow, 1958). При исследовании нескольких человеческих популяций Кроу (Crow, 1961) об- наружил, что возможность отбора выше у компоненты плодовитости, чем у компоненты смертности, в большей степени из-за влияния современ- ной медицины, улучшающей выживаемость. Ранее, при обсуждении реализованной наследуемости мы упоминали дифференциал отбора 5 (изменение средней в поколении). В природных популяциях S определяется как коварианса между признаком и приспо- собленностью (Robertson, 1996; Price, 1970). Более того, дифференциал отбора включает прямой эффект рассматриваемого признака и непрямой эффект отбора по коррелированным признакам. Как мы увидим ниже, отбор по коррелированным признакам может сильно влиять на измене- ние интересующего признака (см. ниже). Для прогнозирования ответа на естественный отбор Ланде (Lande, 1979b) ввел концепцию градиента отбора, поддерживающего другие (кро- ме интересующего нас) признаки постоянными (Lande, Arnold, 1983; Arnold, Wade, 1984). Для прогнозирования изменений множественных при- знаков должны быть известны значения аддитивной генетической вари- ансы признаков, а также аддитивной генетической ковариансы между ними. Тогда изменение в фенотипической средней признака 1 может быть записано в виде: АД = G, t Д + Gi; Д2 +... + G,„ , (И-13) где Д - градиент отбора по первому признаку, G,, - аддитивная генети- ческая варианса по первому признаку и СД - аддитивная генетическая коварианса между признаками 1 и 2 (придерживаясь стандартной терми- нологии, z используется здесь вместо Р для обозначения фенотипических величин). Ожидаемый ответ для всех подходящих признаков в матрич- ной форме имеет вид:
V. Идентификация локусов количественных признаков (ЛКП) где значения G формируют матрицу аддитивных генетических варианс и коварианс. Заметьте сходство этого прогнозирования для данного призна- ка с ответом на отбор (выражение 11.7а), за исключением того, что гради- ент отбора определяется отлично от дифференциала отбора, и что выраже- ние 11.7а не включает коррелированные ответы других признаков. Учет множественных признаков может влиять на фенотипическую среднюю. Допустим, что имеются только два признака и что Д в два раза больше, чем Д, (корреляция между признаками отсутствует и аддитивная генетическая варианса для каждого признака равна 0,5), тогда: 0,5 0 0 2 0,5 1 1,0 0,5 поэтому ответ на отбор по первому признаку в два раза больше. Но если отри- цательная генетическая варианса между двумя признаками равна 0,5, то: 2 1 0,5 -0,5 -0,5 0,5 0,5 -0,5 что приводит к утрате второго признака.На выборке из природной попу- ляции насекомых с высокой смертностью особей показано (Lande, Arnold, 1983), что дифференциал отбора и градиент отбора для измеряемых при- знаков могут сильно различаться по величине и знаку. V. Идентификация локусов количественных признаков (ЛКП) Есть надежда, что с идентификацией генов, влияющих на количествен- ные признаки, количественная генетика обретет большое будущее. С по- мощью молекулярных маркеров во многих геномах можно локализовать ЛКП и в дальнейшем идентифицировать эти гены. Основные статисти- ческие методы, используемые для картирования генов относительно про- сты, но они становятся сложнее, когда маркеров и ЛКП много (детально эти методы рассмотрены в работе Lynch, Walsh, 1998). Сначала остановимся на статистических методах, которые использу- ют для оценки ряда генов, воздействующих на признак. Когда направлен- ный отбор действует в популяции в ряду поколений, значение ответа мож- но представить в виде совокупного ответа всех локусов, совместно влияющих на данный признак. Предположим, что все локусы имеют рав- ное влияние на признак и что нет ни эпистаза, ни сцепления. Тогда можно получить оценку ответа для ряда локусов из эксперимента по направлен- ному отбору (см. работу Mather, Jinks, 1971). Этот подход, использован- ный Дадли (Dudley, 1977) для оценки минимального ряда генов, влияю-
Глава 11. Количественные признаки и эволюция щего на содержание жира и белка в зернах кукурузы (54 и 122, соответ- ственно), обсуждался на стр. 60. Однако, такой подход не учитывает дей- ствия новых мутаций, возникающих во время эксперимента, влияние ко- торых может значительно повысить ответ на отбор (Hill, 1982). Действие ряда генов можно также оценить из величины средней и ва- рианс признаков у родительских линий (F,, F2) и в обратных скрещивани- ях для двух популяций, которые дивергировали либо в результате искус- ственного, либо в результате естественного отбора (Lande, 1981; Cockerman, 1986; Lynch, Walsh, 1998). В простейшем случае минималь- ная оценка ряда эффективных генов равна: 8F (П.14) где/) иР2 - фенотипические средние двух родительских популяций и V- генетическая варианса F2 между двумя популяциями. Если предположить, что существует п несцепленных, аддитивных генов, действующих в двух популяциях с разным эффектом, то Д- Р2=2п и V = и/2, и после подста- новки пе = п. Поскольку различие между двумя популяциями обусловле- но всё большим и большим числом генов, генетическая варианса F , как ожидается, будет всё меньше и меньше. Если гены сцеплены, имеют оди- наковое влияние на признаки, не аддитивны, или эпистатичны, то оценка эффективного количества генов низка, поэтому она называется минималь- ной оценкой. В результате анализа многочисленных данных (Lande, 1981) оказалось, что за межпопуляционные различия отвечают, по крайней мере, пять из десяти генов. Например, два сорта томатов сильно различались по массе плода. Логарифм различия между двумя сортами был 1,826 граммов, и оценка генетической варинсы F2 равна фенотипической варинсе F2 (0,0570) минус фенотипическая варианса Ft (0,0144), или 0,0426. По этим расче- там получается, что родительские сорта томатов были гомозиготными, но с разными генотипами, так что растения в поколении F также генети- чески инвариантны (но гетерозиготны по некоторым генам). Поэтому фенотипическая варианса F, - средовая, и если вычесть ее значение из фенотипической вариансы F2 останется только генетическая варианса. В этом случае п? = (1,826)2/[(8)(0,0426)] = 9,8, поэтому за наблюдаемые раз- личия отвечают десять или более генетических факторов. Этот метод полезен для получения общих сведений о том, сколько ожидаемых генов влияют на признак. Для подсчета количества ЛКП и для их локализации используют прямой метод картирования. Часто скре- щивают две фенотипически разные линии. С этой целью можно исполь- зовать сегрегацию по маркерному локусу (или локусам) и фенотипи-
V. Идентификация локусов количественных признаков (ЛКП) 581 ческие величины в потомстве F2 или от обратного скрещивания. При скрещивании линий, которые различаются по маркерным локусам и ЛКП, между этими локусами возникает неравновесность по сцеплению, которое позволяет локализовать ЛКП. Для иллюстрации метода, назы- ваемого анализом одного маркера, предположим, что у родителей раз- ные аллели в обоих маркерных локусах М и А фиксированы и эти алле- ли влияют на интересующий признак так, что генотипы M^AJM^A и М1А^М1Аг полностью неравновесны по сцеплению. Тогда особи в поко- лении F, имеют генотип М^А^/М^А^, а ожидаемые генотипы в потомстве F2 даны в таблице 11.11, где с - частота рекомбинации между локусами. Проще использовать систему параметров, предполагающую, что гено- типы АА , А^А2 и А2А2 встречаются с частотой a, d и а, где а - аддитив- ный эффект аллеля And- мера доминирования (отличие от полной аддитивности), (Falconer, Mackay, 1996). Тогда можно вычислить ожи- даемые фенотипические величины для трех маркерных генотипов. ТАБЛИЦА 11.11. Частота генотипов в поколении F2 и средние для различных маркерных классов, если ген А, вносящий вклад в интересующий признак, имеет генотипические величины a, d и -а для генотипов 4 /1 , А Д и A^AV ген М- сцепленный маркерный локус, и с - частота рекомбинации между ними Генотип Частота Генотипическая величина MlAl/MlAl (1 -с)2/4 а м1а1/м1а2 с(1 -с)/2 d m}ajmxa2 с,2/4 -а miai/m2a1 с(1 - с)/2 а м1а]/м2а2 (1с)2/2 d М1А(М}А1 с2/2 d М2А}/М2А2 с(1 - с)/2 -а м2а1/м2а] с2/4 а м2а1/м2а2 с(1 - с)/2 d М2А2!М7А2 (1 -с)2/4 -а Например, вклад генотипа в поколение F2 равен М1М1 = а(1 - с)2 /4 + dc(l -с)/2-ас2 /4 = = -tfa(l-2c) + 2dc(l-c)]. Поскольку, у и4 генотипов в поколении F2 составляют генотипы М{М2 и М^М2, соответственно, то:
M\M\ =a(l—2c) + 2dc(l — c), М,М2 = d[(l-c)2 + с2], (11.15а) М2М2 = -а(1 - 2с) + 2dc(l - с). Оценку аддитивного эффекта можно получить из выражения: j-(M,M,-M2M2) = a(l-2c). (11.15b) Например, если с = 0, что означает отсутствие рекомбинации между мар- керным локусом и ЛКП (маркерным локусом является ЛКП), тогда эта оценка равна величине а. Однако, если предел рекомбинации между мар- керным локусом и ЛКП равен с, то оценка меньше на величину (1 - 2с), поскольку рекомбинация в гаметах, дающих поколение F2, снижает ассо- циацию между аллелями в двух локусах. Сходным образом оценка d мо- жет быть получена из выражения: МХМ2 -±(МХМХ +M2M2) = d(\-c)2. (11.15с) В этом случае из-за рекомбинации оценка d недооценена на величину (1 - с)2. В качестве примера ассоциации между маркерным локусом и ко- личественным признаком рассмотрим данные по линиям фасоли. Пример 11.12. Первым примером ассоциации между маркерным локу- сом и количественным признаком (Sax, 1923) стала ассоциация генов ок- раски семян с их массой у фасоли, Phaseolus vulgaris (данные из работы Falconer, Mackay, 1996). Две родительские линии, использованные в скре- щивании, сильно различаются по размеру семян. В линии, фиксирован- ной по маркерному аллелю окраски семян - М, средняя масса семени составила 48 сантиграмм (сг), а в линии, фиксированной по аллелю М, - только 21 сг. Средние массы семян у растений трех генотипов в F, равны: Генотип МХМ} М}М2 М2М2 Масса семян 30,7 28,3 26,4 Из выражения 11.15b получаем оценку аддитивного эффекта: а(1 - 2с) = = 0,5(30,7 - 26,4) = 2,15 сг. Различие в массе семян между двумя гомозигот- ными растениями в F2 равно 4,3 сг и дает всего около 16% различия в массе семян между двумя родительскими линиями (27сг). Возможно, что такая значительная разница обусловлена геном окраски семян, использованным в качестве маркера, т.е. маркерный ген оказывает плейотропное действие на массу семян. Если действие обусловлено другим геном, сцепленным с геном окраски, то эффект может быть несколько выше при рекомбинации в гаметах, дающих F , которая снижает ассоциацию между аллелями. На- пример, если величина уровня рекомбинации между ЛКП и маркером с =
V. Идентификация локусов количественных признаков (ЛКП) М, Mz Да Л/2 С Сг с Рисунок 11.28. Степень рекомбинации между двумя маркерными локусами М и N, и ЛКП (геном А). 0,1, то а = 2,69. Используя выражение 11.15с, <7(1 - с)2 = -0,25 сг. Поэтому доминирование гена, влияющего на массу семян, очень мало. Когда используется один маркер, то оценки эффектов аддитивности и доминирования смешиваются со значением рекомбинации. Если исполь- зуется множество маркеров и известно их расположение на генетической карте, то каждую пару соседних маркеров можно исследовать по ассоци- ации с ЛКП. Метод, называемый картирование интервалов, или анализ фланкирующих маркерных локусов позволяет дать независимую оценку расположения и эффекта ЛКП (Lynch, Walsh, 1998). На рисунке 11.28 по- казано расположение двух маркерных локусов, М и N, с известным уров- нем рекомбинации с между ними, которые локализуются с любой сторо- ны от ЛКП, обозначенного как ген А. Неизвестная частота рекомбинаций между генами Ми А обозначена с,, а неизвестная частота рекомбинаций между генами А и У- с2. Так как в этом примере ct < с2, то в поколении F2 аллель Л! должен более тесно ассоциирован с геном М чем с геном Nx (а аллель Л2 должен быть более тесно ассоциировать с геном Л/,,чем с геном AQ. Если генотип Л Л обусловливает большую величину признака, чем генотип , а гетерозиготы имеют промежуточную величину признака, то это должно привести к большей средней величине признака у гомози- гот М}МХ, чем у гомозигот NXNX из-за более тесного сцепления генов М и Л, чем генов Л и N. Таким образом, можно оценить и с, (с2 = с~ с{, где величина с известна), и влияние гена Л на признак (Lynch, Walsh, 1998). Обычно используются методы с более, чем двумя маркерами одновре- менно (Lynch, Walsh, 1998). Для графического представления статистической значимости ассо- циации аллелей с определенными локусами на карте, часто дается карта вероятностей позиций ЛКП вдоль хромосомы. Этот метод (см. Lander, Botstein, 1989) использует LOD баллы (likelihood of odds - вероятность
шансов, или LOD scores) - величины, которые относятся к статисти- чески вероятным отношениям. LOD балл в определенной позиции свя- зан с вероятностью, что ЛКП локализован именно в этой позиции. Ста- тистически значимы LOD баллы больше двух, но из-за множественных тестов часто необходимо, чтобы LOD баллы были равны 3 и выше. Чем выше величина LOD балла в данном локусе, тем вероятнее, что это истинная позиция ЛКП. В качестве иллюстрации рассмотрим при- мер 11.13 по локализации генов, определяющих метаморфоз у сала- мандры. Пример ПЛЗ. При скрещивании между родственными видами и после- дующем анализе ЛКП были идентифицировали гены, которые определя- ют главные морфологические различия между видами - например, меж- ду маисом (кукурузой) и его диким предком теосинте (Doebley et al., 1995). У мексиканского аксолотля, Ambystoma mexicanum, есть производная фор- ма развития - педоморфоз, при котором существует только водные фор- мы аксолотля, т.е.метаморфоз отсутствует. С другой стороны, родствен- ная саламандра, A.tigrinum - облигатный метаморф. Как показали скрещивания (Tompkins, 1978), различия между этими видами первично обусловлены одним рецессивным геном у производной формы аксолот- ля. Для локализации вовлеченного в метаморфоз гена провели обратное скрещивание (Voss, Shaffer, 1997) между метаморфными особями в поко- лении F] и изучили сегрегацию по 262 ПДРФ-маркерам и состояние ме- таморфоза. Таблица 11.12 суммирует эти данные для трех сцепленных маркеров, которые показывали значительную ассоциацию с метаморфо- зом. На рисунке 11.29 даны LOD баллы по исследуемому региону и пока- зано, что наиболее вероятная позиция ЛКП - приблизительно 30 сМ в пределах центрального маркера, AFLP32.17. Как становится ясно из это- го исследования, такие методы можно использовать для картирования ЛКП, обусловливающих даже сложные (комплексные) признаки организ- ма, о которых нет детальной генетической информации. ТАБЛИЦА 11.12. Сегрегация гетерозигот и гомозигот для трех ПДРФ-маркеров и разли- чия жизненного цикла у саламандр Ambystoma (по Voss and Shaffer, 1997). AFLP11.7 AFLP32.17 AFLP34.5 Гет. Гом. Гет. Гом. Гет. Гом. Метаморф 03 Педоморф 03 39 10 42 7 41 8 9 22 5 26 7 24
V. Идентификация локусов количественных признаков (ЛКП) AFLP34.5 AFLP32.17 AFLP11.7 Рисунок 11.29. LOD баллы для трех сцепленных ПДРФ-маркеров и сегрегация различий в жизненном цикле у саламандр Ambystoma (по Voss, Shaffer, 1997). Доступность многих маркеров у человека (и некоторых других орга- низмов) позволила локализовать гены для многих сложных поведенчес- ких признаков. Например, были попытки локализации генов, вызываю- щих маниакальную депрессию, шизофрению и гомосексуальность, хотя эти открытия и не были подтверждены последующими исследования- ми. (см. пример 11.14). При использовании множества маркеров выпол- няется широкий ряд статистических тестов и вероятность значимых ре- зультатов высока, даже если уровень значимости низкий. Другими словами, вероятность ложно-положительной ошибки (тип I), выявляю- щей ассоциацию там, где имеется только случайный эффект, высока. Поправка для множественных тестов, например поправка Бонферрони, может быть использована для снижения уровня значимости а. Посколь- ку многие маркеры могут быть сцеплены, более подходящим считается перестановочный тест (Churchill, Doerge, 1994). Если используется не- сколько тестов, то LOD балл, необходимый для статистической значи- мости, может быть выше. Пример 11.14. При исследовании 40 семей с братьями-гомосексуалиста- ми (геями) Хамер с сотрудниками (Hamer et al., 1993) предполагали, это на Х-хромосоме находится ген, определяющий гомосексуальность, что согласовалось с опубликованными данными. Недавно, Райс с сотрудни- ками (Rice et al., 1999) исследовали эту же Х-хромосому (Xq28) у 52 пар сибсов мужчин-геев. В отличие от более раннего исследования, не было увеличения более чем на 50% от ожидаемого перекрывания четырех вы-
(Г586 Глава 11. Количественные признаки и эволюция соко вариабельных микросателлитных маркеров, относящихся к участку Х-хромосомы длиной 12,5 сМ.Для этого участка были вычислены LOD баллы и оказалось, что все они отрицательные и нет статистической зна- чимости (рисунок 11.30). Действительно, эти LOD баллы были так низ- ки, что можно исключить наличие такого гена в данном регионе Х-хро- мосомы. Поскольку теоретически против гена гомосексуальности действует сильный отбор, эти отрицательные результаты не удивитель- ны. Не ясно, является ли значимость, обнаруженная Хамером, результа- том ошибки I типа, или она действительна, так как они формировали ис- следуемую выборку способом, который мог отклонить их результаты. Очевидно, что это пример «ошибочной идентификации» ЛКП, обуслов- ливающих комплексный поведенческий признак у человека. Количество исследований, оценивающих наличие ЛКП, быстро рас- тет. До сих пор казалось, что существенная часть генного влияния при- надлежит одному или нескольким локусам (Lynch, Walsh, 1998; Kearsey, Farquhar, 1998). Однако такой вывод обусловлен статистическим откло- нением, которое приводит к переоценке эффекта предполагаемых ЛКП. Сейчас в генетике наступает волнующее время, когда кажется достижи- мой возможность локализации и исследования генов, действительно вли- яющих на любой признак любого организма. В ближайшем будущем мы будем разбираться в эволюции количественных признаков гораздо луч- ше, чем сейчас. Рисунок 11.30. LOD баллы для региона Х-хромосомы длиной 12,5 см, исследованного Rice et al. (1999). Две линии обозначают различные величины, полученные для гомосек- суальной ориентации у братьев-геев по сравнению с популяционной частотой.
Задачи Задачи 1. Каков тип наследования (моногенный или полигенный) признака, у которого только две фенотипические категории? 2. Предположим, что Рц, Pi2, Р и Р22 равны 140, 62,45 и 112, соответ- ственно. Рассчитайте величины GE . Допустим, что генотип 1 при- шел из среды 1, а генотип 2 пришел из среды 2, какие заключения можно сделать? 3. Эксперименты по выращиванию в «общем саду» часто используют- ся для оценки значения генетических факторов, влияющих на опре- деленный признак. Обсудите сложности таких экспериментов, ко- торые могут быть вызваны взаимодействиями среда-генотип. 4. Получите выражение 11.4d для значения аддитивной генетической вариансы. 5. Предположите, что фенотипические величины генотипов AfA , А^А2 и А^2 равны 1,4, 1,3 и 1,0, соответственно. Если р = 0,3, каковы VG V и V 2 A D 6. Фенотипические величины генотипов А А}, А{А2 и А2А2 равны 1,0, 1,2 и 1,0, вычислите и графически изобразите VA для всего диапазо- на аллельных частот. 7. Обсудите преимущества и проблемы, связанные с разными спосо- бами оценки генетической вариансы, или наследуемости. 8. Фенотипическая изменчивость может быть изначально результатом фенотипической пластичности или генетической изменчивости. Учи- тывая, что признак адаптивно значим, и что среда варьирует или во времени, или в пространстве, определите, какой тип фенотипичес- кой изменчивости приведет к более высокой адаптивности? Допол- ните Ваш ответ теоретическими доводами. 9. Допустим, что признак имеет низкое значение аддитивной генети- ческой вариансы. Считается, что такой признак близко связан (или был связан) с приспособленностью. Насколько это верно? Обсудите пригодность этой логики для исследования эволюции признака. 10. Если У = 100, то какая доля аддитивной генетической изменчивос- ти будет потеряна за 10 поколений при отсутствии мутирования или отбора, влияющих на значение генетической изменчивости? Если V =0,0001 Vp /г2 = 0,2, и существуют только аддитивная и средовая вариансы, какова ожидаемая величина У_, необходимая для сохра- нения генетической вариансы?
Глава 11. Количественные признаки и эволюция 11. Рассчитайте минимальную оценку U и максимальную оценку $ для четырех экспериментов в таблице 11.8 из данных оценок АЛ/ и А К 12. Используя взаимосвязь между фенотипической величиной и при- способленностью в выражении 11.10, определите величины приспо- собленности для различных генотипов в двух локусах, когда К = 2 и Ро = 1,1 (см. рисунок 11.23). 13. Составьте матрицу варианса-коварианса для положительных кова- рианс между признаками и сделайте прогноз изменений двух при- знаков в дальнейшем. 14. Потомство F2 от скрещивания между инбредными линиями, кото- рые различались по размеру, имеет маркерные генотипы ММ, М}М2 и М2М2, соответствующие средним величинам 22,3, 20,1 и 15, 3 см. Каковы оценки а и d, если нет рекомбинации между маркерным ло- кусом и локусом, влияющим на признак? Позже было обнаружено, что локус, который потенциально влияет на размер, находится на расстоянии 5 единиц карты от маркерного локуса. Каковы оценки а и d, если это ЛКП, влияющий на размер? 15. Пример 11.14 представляет недавние данные, что в противополож- ность более раннему исследованию, на Х-хромосоме нет гена гомо- сексуальности. Какую работу можно проделать в дальнейшем для определения правильности этого вывода?