ДНК – материальная основа наследственности. Строение и свойства ДНК

в состав хромосом входят два вида молекул - молекулы белка и дезоксирибонуклеиновой кислоты(Днк) . Сначала предполагали, что основной генетической субстанцией является белок. Двадцать различных аминокислот, входящих в молекулы белков, могут давать бесконечное разнообразие сочетаний, которое может лежать в основе разнообразия генов. И только в начале 50-х гг. было доказано, что носителем генетической информации является ДНК. Оказалось, что ДНК сама по себе, независимо от белка, способна переносить наследственную информацию из одной клетки в другую, тогда как белок без ДНК этого не может. ДНК имеет молекулярное строение, обеспечивающее способность к удвоению и к образованию множества разнообразных форм. Молекула нуклеиновой кислоты имеет форму нити, представляющей собой цепь нуклеотидов (рис. 3.13). Каждый нуклеотид состоит из трех частей: азотистого основания, углеводного компонента и фосфорной кислоты. Отдельные нуклеотиды в нуклеиновых кислотах соединены друг с другом через фосфорную кислоту прочной химической связью. Углеводный компонент в ДНК представлен сахаром - дезоксирибозой . Сахарный и фосфорный компоненты у всех нуклеотидов одинаковы, что же касается оснований, то существует четыре типа оснований: аденин , цитозин , гуанин и тимин . Для простоты их часто обозначают буквами А, Ц, Г и Т. ДНК образована двумя нитями. Ген- - это небольшой участок хромосомы, обладающий определенной биохимической функцией и оказывающий специфическое влияние на свойства особи. Локус- Место в хромосоме, в котором расположен данный ген . В одном и том же локусе у особей определенного вида могут располагаться одинаковые гены, но во многих случаях локус не отличается подобным постоянством и в нем располагается тот или иной вариант данного гена. Обычно эти варианты одного и того же гена сходны между собой, хотя и не идентичны. Такие различные состояния локуса носят название Аллель . Часто для определенного локуса известны лишь два аллеля, то есть две альтернативные формы одного гена, однако нередки случаи, когда данный локус встречается в целом ряде различных состояний, и тогда мы имеем дело со множественными аллелями .Несмотря на большую точность репликации ДНК во время процессов митоза и мейоза , время от времени неизбежно возникают ошибки, которые приводят к изменению последовательности нуклеотидов в цепи ДНК, или генным мутациям . Мутация может представлять собой замену одной пары оснований на другую, потерю одного или нескольких нуклеотидов или, наоборот, добавление дополнительных нуклеотидов. При этом худшим вариантом будет потеря или добавление одного или двух нуклеотидов. В этих случаях рамка считывания триплетов неизбежно сдвигается на одно-два основания вправо или влево и все последующие триплеты будут считываться неправильно. Если же выпали или добавились сразу три основания, то изменения коснутся лишь одной аминокислоты, а вся остальная цепь останется верной.
Генные мутации , возникающие в гаметах, оказывают разнообразное действие на организм. Многие из них летальны, так как вызывают слишком серьезные нарушения развития. Известно, например, что у человека около 20% беременностей заканчиваются естественным выкидышем в сроки до 12 недель, и в половине этих случаев обнаруживаются аномалии наследственного аппарата, обусловленные, впрочем, не только генными мутациями.
Генная мутация может привести к тому, что данному локусу будет соответствовать несколько аллелей . Это увеличивает генетическое разнообразие и повышает количество гетерозиготных особей . Предполагается, что все генетические полиморфизмы возникли из-за замены, потери или добавления нуклеотидов в процессе эволюции.
Большинство генных мутаций рецессивны по отношению к "нормальному" аллелю. Такие мутантные аллели могут циркулировать в популяции в течение многих поколений, пока им не удастся встретиться и проявиться. Время от времени могут возникать и доминантные мутантные аллели, которые сразу же дают эффект.
Мутации, происходящие в соматических клетках, наследуются только теми клетками, которые образуются из мутантной клетки путем митоза . Они могут повлиять только на тот организм, в котором они возникли, но со смертью особи исчезают из генофонда популяции. При некоторых соматических мутациях возникают клетки с повышенной скоростью роста, что приводит к возникновению опухолей.

Метод картирования генов, использующий семейные исследования для определения связи между двумя генами при их передаче от одного поколения другому. Для того чтобы решить, что два локуса сцеплены и, если да, то как сильно, мы основываемся на двух видах информации.

Во-первых, мы устанавливаем, значимо ли отклоняется частота рекомбинации Q между двумя локусами от 0,5; определение сцепления между двумя локусами эквивалентно выяснению того, отличается ли доля рекомбинаций между ними от 0,5 ожидаемой для несцепленных локусов.

Во-вторых, если доля рекомбинаций менее чем 0,5, нужно оценить ее наилучшим образом, поскольку это покажет, насколько тесно сцеплены локусы. В обоих случаях применяют статистический метод отношения правдоподобия. Правдоподобие - меры вероятности, шансы - отношения правдоподобия. Отношения правдоподобия рассчитывают следующим образом.

Изучают фактические семейные данные , подсчитывают число детей, имеющих рекомбинацию между локусами и, наконец, вычисляют правдоподобие (вероятность) наблюдаемого значения Q в интервале от 0 до 0,5. Затем вычисляют вторую вероятность, основанную на гипотезе, что два локуса не сцеплены, т.е. Q=0,50. Мы рассматриваем отношение правдоподобия наблюдаемых в семейных данных значений Q и правдоподобия при условии отсутствия сцепления между локусами и тем самым получаем отношение шансов:
1) Правдоподобие данных, если локусы сцеплены с некоторым коэффициентом Q
2) Правдоподобие данных, если локусы не сцеплены (Q = 0)

Вычисленные отношения шансов для значений Q обычно представляют в форме десятичных логарифмов и называют LOD-оценкой (Z) логарифма шансов (log of the odds). (Использование логарифмов позволяет объединять данные, полученные из разных семей простым сложением).

Анализ сцепления менделирующих болезней, основанный на моделях (прототипах)

Анализ сцепления называют модельным (или параметрическим), если допускают, что существует конкретный тип наследования (аутосомно-доминантный, аутосомно-рецессивный или Х-сцепленный), объясняющий наследование признака.

Анализ LOD-оценки допускает картирование генов, мутации в которых вызывают болезни, передающиеся по менделирующему типу.

LOD-оценка дает:
- наилучшую оценку частоты рекомбинации (Qmax) между маркерным локусом и локусом болезни;
- оценку того, насколько хорошо подтверждается сцепление этой величиной Qmax. Величины LOD-оценки более 3 считают надежным подтверждением.

Сцепление с конкретным значением Qmax локуса гена болезни и маркера с известной физической позицией подразумевает, что локус гена болезни должен располагаться около маркера.

Отношение шансов важно в двух смыслах. Во-первых, оно обеспечивает статистически правильный метод для использования семейных данных при оценке частоты рекомбинации между локусами. Дело в том, что статистическая теория гласит, что величина, дающая наибольшую величину Z, фактически, наилучшая оценка доли рекомбинации, которую можно сделать, основываясь на имеющихся данных. Эта величина называется Qmax. Если Q отличается от 0,50, мы получаем подтверждение сцепления.

Тем не менее хотя Qmax - наилучшая оценка Q, насколько она хороша? Отношение шансов отвечает и на этот вопрос, поскольку, гем выше велигина Z, тем лугше оценка Qmax. Положительные величины Z (шансы >1) при данной Q указывают, чтобы два локуса сцеплены, тогда как отрицательные (шансы <1), предполагают, что сцепление менее вероятно, чем возможность, что два локуса не сцеплены.

Картирование генов анализом сцепления предоставляет возможность локализовать важные для медицины гены, руководствуясь наследованием болезни и наследованием аллелей в полиморфных маркерах, если локус болезни и локус полиморфного маркера сцеплены. Вернемся к семье, показанной на рисунке. Мать имеет аутосомно-доминантную форму пигментного ретинита. Есть десятки других форм этой болезни, многие из них картированы в специфических местах в пределах генома и гены которых известны.

Мы не знаем, которую из форм пигментного ретинита имеет мать. Она также гетерозиготна по двум локусам в хромосоме 7 (один в 7р14 и один в дистальном конце длинного плеча). Можно видеть, что в этой семье передача мутантного аллеля (D) неизменно «следовала» за аллелем В в локусе маркера 2 от первого поколения второму. Все три потомка с болезнью (по-видимому, унаследовавшие материнский мутантный аллель D в локусе RP), также унаследовали аллель В в локусе маркера 2. Все потомство, унаследовавшее материнский нормальный аллель d, унаследовало b аллель и не имеет пигментного ретинита. В то же время ген пигментного ретинита не имеет тенденции следовать за аллелем в локусе маркера 1.

Вероятно, мы получили бы Q как «истинную » долю рекомбинации между локусом пигментного ретинита и локусом 2, если бы у нас было неограниченное число потомков. С этой точки зрения, Q можно рассматривать как вероятность того, что рекомбинация происходит между двумя локусами в каждом мейозе. Поскольку рекомбинация или происходит, или нет, вероятность рекомбинации, равная Q, и вероятность отсутствия рекомбинации должны в сумме давать единицу. Следовательно, вероятность, что рекомбинация не происходит, равна Q-1. Фактически, есть только шесть потомков без рекомбинации.

Поскольку каждый мейоз является независимым случаем, мы перемножаем вероятности рекомбинации (Q) или отсутствия рекомбинации (Q-1) для каждого ребенка. Вероятность наблюдения ни одного ребенка с рекомбинацией и шестерых без рекомбинации между пигментным ретинитом и маркером локуса 2, таким образом, равна Q°х(1-Q)6. Оценка LOD между локусами пигментного ретинита и маркером 2, равна:

Максимальная величина Z равна 1,81 , встречающаяся, когда Q=0, и предполагает, но не уверенно, наличие сцепления, поскольку значение Z - положительное, но меньше 3.

Объединение информации LOD-оценки из разных семей

Таким же образом, каждый мейоз в семье, производящей нерекомбинантное или рекомбинантное потомство - независимый случай, так же независимы и мейозы, происходящие в других семьях. Следовательно, мы можем перемножить вероятности в числителе и знаменателе отношений правдоподобия отдельных семей. Аналогичное, но более удобное вычисление - сложить десятичные логарифмы (log10) всех вычисленных отношений правдоподобия, формируя общую Z-оценку для всех семей.

Родословная наследования пигментного ретинита

В случае пигментного ретинита на рисунке, предположим, что изучались две других семьи и в одной не обнаружена рекомбинация между локусом 2 и пигментным ретинитом у четырех детей, а в третьей нет рекомбинации у пяти детей. Для каждой семьи рассчитаны индивидуальные LOD-оценки, затем сложенные вместе. В этом случае, можно было бы говорить, что ген пигментного ретинита в этой группе семей сцеплен с локусом 2.

Поскольку хромосомная позиция полиморфного локуса 2 известна - 7р14, пигментный ретинит в этой семье может картироваться в области вокруг 7р14, рядом с локусом RP9, уже определенным для одной из форм аутосомно-доминантного пигментного ретинита.

05.05.2015 13.10.2015

В современной генетической науке широко используются термины – аллели, локусы, маркеры. Между тем, от понимания таких узких терминов часто зависит судьба ребенка, ведь диагностика отцовства напрямую связана с этими понятиями.

Генетическая особенность человека

Любой человек имеет собственный уникальный набор генов, получаемый им от родителей. В результате комбинации совокупности родительских генов и получается совершенно новый, уникальный организм ребенка со своим набором генов.
В генетической науке современными исследователями для проведения диагностики были выявлены определенные участки генов человека, имеющие наибольшую изменчивость – локусы (второе их название маркеры ДНК).
Любой их данных локусов имеет множество генетических вариаций — аллелей (аллельных вариантов), состав которых сугубо уникален и сугубо индивидуален для каждого человека. К примеру, у локуса цвет волос есть два возможных аллеля – темный или светлый. Каждый маркер имеет свое индивидуальное количество аллелей. Одни маркеры содержат 7-8, другие более 20. Комбинация аллелей у всех исследованных локусов называется ДНК профилем определенного человека.
Именно вариативность данных участков генов и дает возможность проводить генетическую экспертизу родства между людьми, ведь ребенок от своих родителей получает по одному из локусов от каждого родителя.

Принцип генной экспертизы

Генетическая процедура по установлению биологического отцовства помогает установить, является ли тот мужчина, который считает себя родителем определенного ребёнка, настоящим папой или данный факт исключен. Для экспертизы биологического отцовства при проведении анализа происходит сравнение локусов между родителями и их ребенком.
Современные методики анализа ДНК способны одновременно проводить исследование генома человека сразу же по нескольким локусам. Например, в стандартизированное генное исследование включена экспертиза сразу 16 маркеров. Но сегодня в современных лабораториях экспертные исследования делают почти по 40 локусам.
Проведение анализов осуществляют с использованием современных генных анализаторов – секвенаторов. На выходе исследователь получает электрофореграмму, на которой указаны локусы и аллели анализируемой пробы. Таким образом, в результате проведения анализа ДНК анализируют присутствие определенных аллелей в анализируемой пробе ДНК.

Определение вероятности родства

Для определения уровня родства профили ДНК, которые были получены для определенного участника экспертизы, проходят статистическую обработку, по результатам которой эксперт делает вывод о процентной вероятности родственной связи.
Для того, чтобы рассчитать уровня родства, определенная статистическая программа производит сравнение по наличию одинаковых аллельных вариантов всех исследованных локусов из проанализированных. Расчет проводится между всеми участвующими в анализе. Результатом расчета становится определение комбинированного индекса отцовства. Вторым показателем служит вероятность отцовства. Высокое значение каждой из определяемых величин является доказательством биологического отцовства обследуемого мужчины. Как правило, для расчета показателей родства используют базу данных аллельных частот, полученных для населения России.
Положительный результат сравнения 16 различных, случайно выбранных маркеров ДНК позволяет, согласно данным статистики, определить вероятность отцовства. Однако при несовпадении результатов по аллелям из 3 или большего количества маркеров из 16, результат экспертизы биологического отцовства считается отрицательным.

Точность результатов экспертизы

На точность результатов генной экспертизы влияют несколько факторов:
количество анализируемых генетических локусов;
природа локуса.
Генетический анализ как можно большего количества локусов, уникальных для определённого человека, позволяет более точно установить (или наоборот, опровергнуть) степень вероятности отцовства.
Таким образом, достигаемая степень вероятности при одновременном анализе до 40 различных локусов составляет до 99.9% для подтверждения вероятности биологического отцовства, а также до 100% при получении отрицательного результата.
Определение биологического отцовства со степенью вероятности 100% невозможно в связи с теоретической возможностью существования мужчины с таким же набором маркеров ДНК, как у отца ребенка. Однако при уровне вероятности 99,9 % проведенную экспертизу считают положительной, а отцовство – доказанным.

Какие источники ДНК подходят для анализа?

ДНК экспертиза является высокочувствительной процедурой, не требующей больших количеств образца для извлечения ДНК. Благодаря современным научным достижениям генную экспертизу для определения вероятности отцовства можно проводить, используя как биологический материал, полученный от определённого человека (мазок изо рта, волос, кровь), так и материал небиологический, то есть лишь только соприкосающийся с человеком (например, его зубная щетка, предмет одежды, детская соска, кухонная посуда). Это возможно благодаря тому, что во всех человеческих клетках, вне зависимости от их происхождения, молекулы ДНК совершенно одинаковы, что дает возможность сравнения образцов ДНК полученных изо рта пациента с образцом из крови, или из пробы ДНК, полученной от зубной щётки или одежды.

Новые достижения в определении отцовства

Новым словом в определении отцовства стала разработка микрочиповой диагностики. Благодаря указанию на микрочипе (небольшой пластинке) почти всех генов человека определение отцовства не составит сложности. Такая технология похожа на генетический «паспорт». Взяв у плода пробу крови или амниотической жидкости, можно будет легко выделить из нее ДНК и провести гибридизацию на микрочипы родителей. Исследователи планируют использование данной технологии также для определения наследственных заболеваний.


Ген - структурная и функциональная единица наследственности живых организмов. Ген представляет собой участок ДНК, задающий последовательность определённого полипептида либо функциональной РНК.

Пептиды - семейство веществ, молекулы которых построены из двух и более остатков аминокислот, соединённых в цепь пептидными (амидными) связями -C(O)NH-. Обычно подразумеваются пептиды, состоящие из аминокислот. Пептиды, последовательность которых короче примерно 10-20 аминокислотных остатков могут также называться олигопептидами , при большей длине последовательности они называются полипептидами .

Белками обычно называют полипептиды, содержащие примерно от 50 аминокислотных остатков.

Геном - совокупность наследственного материала, заключенного в клетке организма. Геном содержит биологическую информацию, необходимую для построения и поддержания организма. Большинство геномов, в том числе геном человека и геномы всех остальных клеточных форм жизни, построены из ДНК, однако некоторые вирусы имеют геномы из РНК. У человека (Homo sapiens) геном состоит из 23 пар хромосом, находящихся в ядре, а также митохондриальной ДНК. Двадцать две аутосомы, две половые хромосомы Х и Y, а также митохондриальная ДНК человека содержат вместе примерно 3,1 млрд пар оснований.

Вместе с факторами внешней среды геном определяет фенотип организма.

Генотип - совокупность генов данного организма, которая характеризует особь. Термин «генотип» наряду с терминами «ген» и «фенотип» ввёл генетик В. Л. Иогансен в 1909 году в работе «Элементы точного учения наследственности». Обычно о генотипе говорят в контексте определенного гена, у полиплоидных особей он обозначает комбинацию аллелей данного гена. Большинство генов проявляются в фенотипе организма, но фенотип и генотип различны по следующим показателям:

  1. По источнику информации (генотип определяется при изучении ДНК особи, фенотип регистрируется при наблюдении внешнего вида организма)
  2. Генотип не всегда соответствует одному и тому же фенотипу. Некоторые гены проявляются в фенотипе только в определённых условиях. С другой стороны, некоторые фенотипы, например, окраска шерсти животных, являются результатом взаимодействия нескольких генов по типу комплементарности

Аллели - различные формы одного и того же гена, расположенные в одинаковых участках (локусах) гомологичных хромосом и определяющие альтернативные варианты развития одного и того же признака. В диплоидном организме может быть два одинаковых аллеля одного гена, в этом случае организм называется гомозиготным, или два разных, что приводит к гетерозиготному организму. Термин «аллель» также предложен В. Иогансеном (1909 г.).

Локус - в генетике означает местоположение определённого гена на генетической или цитологической карте хромосомы. Вариант последовательности ДНК в данном локусе называется аллелью. Упорядоченный перечень локусов для какого-либо генома называется генетической картой .

Генное картирование - это определение локусa для специфического биологического признака.

Хромосомы - нуклеопротеидные структуры в ядре эукариотической клетки, в которых сосредоточена большая часть наследственной информации и которые предназначены для её хранения, реализации и передачи. Хромосомы чётко различимы в световом микроскопе только в период митотического или мейотического деления клетки. Набор всех хромосом клетки, называемый кариотипом, является видоспецифичным признаком, для которого характерен относительно низкий уровень индивидуальной изменчивости.

Исходно термин был предложен для обозначения структур, выявляемых в эукариотических клетках, но в последние десятилетия всё чаще говорят о бактериальных или вирусных хромосомах. Поэтому более широким определением является определение хромосомы как структуры, которая содержит нуклеиновую кислоту и функция которой состоит в хранении, реализации и передаче наследственной информации. Хромосомы эукариот - это ДНК-содержащие структуры в ядре, митохондриях и пластидах. Хромосомы прокариот - это ДНК-содержащие структуры в клетке без ядра.

Хромосомы вирусов - это молекула ДНК или РНК в составе капсида.

ЛЕКЦИЯ 1. Классическая и молекулярная генетика. Основные понятия: признак, фенотип, генотип, ген, локус, аллель, гомозигота, гетерозигота, гемизигота.

ИЦиГ СО РАН и ФЕН НГУ, Новосибирск, 2012 г.

1.1. Классическая и молекулярная генетика

Сегодняшняя лекция – вводная, к конкретике мы перейдем позже. Как и в случае практически любой науки, границы генетики очертить довольно сложно, и весьма общее определение «генетика – наука о наследственности » - не особенно плодотворно. Жимулев, к примеру, как-то сказал, что сейчас генетика присутствует везде – в медицине, криминалистике, теории эволюции, археологии , а в самой генетике даже и нуклеиновых кислот уже почти не видно – сплошь белковые взаимодействия. Тем самым он фактически поставил знак равенства между генетикой и всей современной биологией. С другой стороны, приблизительно первые две трети ХХ века генетика была, пожалуй, наиболее обособленной и четко-очерченной областью биологии, выделяясь прежде всего своей синтетической методологией, в отличие от аналитической методологии прочих отраслей биологии. Чтобы узнать об устройстве своего объекта, она не разделяла его на части, но судила о частях по косвенным образом, путем наблюдения целого (а именно посредством наблюдения за поведением признаков в скрещиваниях) и опираясь на математику, а в верности своих выводов убеждалась, получая живые организмы с предсказанными свойствами. Таким образом, генетика с самого своего начала обладала способностью создавать нечто новое, а не только описывать наблюдаемое. В то же самое время, во второй половине ХХ века бурно развивалась молекулярная биология – наука поначалу чисто аналитическая, расщепляющая на части. Впрочем, ее прогресс осуществлялся во многом генетическими методами – вспомнить хотя бы то, что генетический код был установлен в опытах Бензера и Крика с использованием мутаций у бактериофагов. Однако в этом случае использовалась генетика микроорганизмов, а прогресс «классической» генетики всегда ассоциировался с генетикой эукариот.


В итоге, молекулярная биология получила почти исчерпывающие знания о том, из чего и как устроен живой организм. Предметы молекулярной биологии и генетики во многом пересекались: обе они изучали передачу и реализацию наследственной информации (а живой организм – это и есть реализация наследственной информации), однако к пониманию этого предмета они двигались с противоположных сторон – генетика «снаружи», молекулярная биология «изнутри».

В последнюю треть ХХ века молекулярная биология и генетика, можно так сказать, встретились, в том числе и в изучении эукариот. Умозрительные объекты генетики превратились в совершенно конкретные физико-химические объекты известной структуры, а молекулярная биология стала наукой синтетической, способной влиять по своему произволу даже на высшие многоклеточные организмы – взять хотя бы генетическую модификацию. Вот здесь границы генетики как науки стерлись до неразличимости – нельзя стало сказать, где кончается молекулярная биология и начинается генетика. Более того, для обозначения получившейся синтетической науки появился термин «молекулярная генетика», в результате чего стало малопонятно, что именно осталось в генетике за пределами последней. Генетике домолекулярного периода, со всеми ее подходами, основанными на скрещиваниях и теории вероятностей, был присвоен почетный титул «классическая генетика». С другой стороны, с этим титулом ее как бы отправили в почетную же отставку. Можно вспомнить, как Уотсон и Крик отказались обсуждать свою модель структуры ДНК в их статье в Nature, поскольку следствия из нее были слишком велики и очевидны. В какой-то момент могло показаться, что из этой модели вытекает и вся генетика.

Складывается парадоксальная ситуация. Все курсы генетики начинаются с истории этой науки. Разбирается то, как Мендель работал с горохом, что он получил и как это интерпретировал исходя из имеющихся у него знаний, потом как Морган и его школа работали с дрозофилой, что они получили и как интерпретировали. Обе эти темы опустить никак невозможно – Мендель являет нам пример человека, с нуля разработавшего и с блеском применившего генетическую методологию, основанную на математике, а школой Моргана за первые три десятка лет ХХ века была разработана хромосомная теория наследственности и фактически вся классическая генетика. Далее, курсы генетики можно разбить на два больших класса. Одни детально прорабатывают всю историю и внутреннюю логику развития этой науки, демонстрируя и мощь ее методологии, и возможности человеческого разума в умозрительном проникновении вглубь вещей. Другие курсы, быстро проскочив этот исторический период, приступают к молекулярной генетике и там рассматривают что же известно на настоящий момент о структуре и работе генов. Фактически оба типа курсов помещают классическую генетику в прошлое и различаются только по детальности ретроспекции. Получается, что классическая генетика имеет как бы только историческое значение. Однако ее мощная методология никуда не делась и является необходимой для весьма широкого спектра исследований. Если заглянуть в статьи, имеющие вполне молекулярно-биологические названия и опубликованные в лучших журналах, то мы увидим, что все они основаны на обширном материале, касающимся сотен индивидуальных мутаций и их сочетаний, с учетом взаимосвязи природы мутаций и того фенотипа, который они вызывают. Это справедливо как для дрозофилы или мыши, для которых собраны огромные генетические коллекции и созданы (некоторые около ста лет назад, другие недавно) специальные лабораторные линии, так и для человека, где в настоящее время накоплено огромное количество медико-генетических – по сути популяционно-генетических - данных, связанных с наследственными заболеваниями. И чем богаче этот арсенал знаний и модельных организмов, тем изящнее работа. Все эти более чем серьезные исследования невозможны без одновременного владения методологией классической и молекулярной генетики. Поэтому и изучать эти «две генетики» лучше всего параллельно, как ни сложно это организовать.


В современной науке можно наблюдать и примеры того, как пренебрежение «устаревшей» классической генетикой приводит к курьезам. Вот например, группе европейских ученых понадобилось получить гетерозиготу по транслокации у гороха. (Я сейчас говорю исходя из того, что у вас есть некое представление о чем идет речь. Если его нет – не беда, все это мы еще будем рассматривать едва ли не слишком подробно; пока же мы говорим о необходимости генетических знаний). Они получили ее посредством слияния протопластов родительских линий. Регенерация из культуры клеток у гороха идет крайне тяжело, это исключительно трудоемкий путь. Зачем они это сделали? По-видимому, они думали, что носители транслокации не скрещиваются с обычным горохом! На самом деле, проблемы с размножением при скрещивании родителей, различающихся транслокацией, действительно возникают, но только в следующем поколении и состоят в потере всего лишь половины плодовитости.

Но этими ученым хотя бы нужна была гетерозигота. Между тем всеобщее увлечение молекулярной биологией и пренебрежение к классической генетике приводит к тому, что о существовании гетерозигот – то есть о том, что у эукариот каждый ген представлен в двух копиях, которые могут различаться, а могут быть идентичны - часто вообще забывают. К примеру, мне на рецензию приходила статья немецких авторов, в которой они напрямую прочитали некую некодирующую последовательность ДНК из 38 особей стрекоз, пойманных в разных регионах (Западной Европе, Западной Сибири, Японии и Северной Америке) и нашли у них 20 ее вариантов. Написано было так, как если бы в каждой особи был найден только один вариант. Однако если изменчивость действительно так высока, как они утверждают, то вероятность того, что в их выборке найдется хотя бы одна особь, у которой обе копии этой последовательности окажутся одинаковыми, не очень сильно отличается от нуля. И это даже никак не обсуждалось. После рецензии они написали, что в пяти случаях было подозрение на гетерозиготность. Если действительно всего пять – то у них в руках был поразительный феномен превращения гетерозигот в гомозиготы посредством неизвестных пока механизмов, но они этого, похоже, даже не поняли.

Сейчас широко распространены реконструкции филогении на основе тех или иных последовательностей ДНК. Так вот, сплошь и рядом делаются попытки на основе времени дивергенции между популяциями судить, относятся ли эти популяции к одному биологическому виду или к разным. (Заметим, что оценивается именно время дивергенции, поскольку изучаемые гены, изменчивость которых более или менее постоянна во времени, заведомо не являются теми генами, с изменением которых видообразование могло быть связано). Между тем, время дивергенции вообще имеет мало отношения к этой проблеме – моменты приобретения некоей локальной популяцией репродуктивной изоляции, то есть моменты видообразования, случаются в определенных условиях и обычно занимают с палеонтологической точки зрения не так много времени (десятки-сотни тысяч лет), тогда как популяции могут дивергировать долгое время без видообразования. Вопрос состоит в именно том, чтобы узнать, имеется между популяциями репродуктивная изоляция (хотя бы потенциальная). Для этого следует посмотреть, идет ли между ними обмен генами (если он физически возможен) или нет. Здесь как раз очень важно узнать, присутствуют ли в местах стыка популяций гетерозиготы по характерным для каждой из них аллелям, и какова их частота. Но это почти никто не делает, и о том, к одному и тому же или к разным видам принадлежат популяции, судят по уровню различий между ними, сравнивая их с различиями в тех случаях, которые полагаются несомненными.

Вообще, если отдельно взятый организм (допустим как представитель своего вида) можно исследовать методами молекулярной генетики, то как только речь заходит о множестве организмов, то есть возникает популяционно-генетическая задача – а такая задача возникает достаточно часто, например в популяционной биологии и селекции – здесь не обойтись без подходов классической генетики. Классическая генетика незаменима во всем, что касается индивидуальных различий и характеристик множеств особей одного вида. Это именно ее стихия, и именно в ней часто оказываются беспомощны те нынешние ученые, которые заменили классическое генетическое образование молекулярно-биологическим.

Исходя из вышесказанного, я вижу свою задачу в том, чтобы изложить классическую генетику не столько в историческом аспекте, следуя за великими учеными прошлого, сколько отталкиваясь от современного состояния науки, в частности - не абстрагируясь от знаний, которые вы уже получили на курсах молекулярной биологии и цитологии . При этом некоторые закономерности, открытые в качестве чисто эмпирических на уровне организмов, приобретают вполне естественную интерпретацию на уровне молекул и выглядят едва ли не тривиальными. В то же время, о самих этих закономерностях следует иметь четкое представление, поскольку именно ими следует пользоваться на уровне организмов. В некотором смысле, такой курс генетики мыслится как нечто вроде «демонстрации фокусов с разоблачениями» - где и сам фокус, и его подоплека в равной мере являются «медицинскими фактами». Такой курс был бы призван научить весьма продуктивной методологии: спускаться от признака к генам и, через понимание механизма их действия, подниматься обратно, к синтезу новых признаков.

Как вы уже поняли, в настоящий моменту содержание генетики огромно и разнородно, так что отведенного нам времени вряд ли хватит даже на краткое ознокомление. Это заставляет оставить за кадром историю генетики как самостоятельную тему, которой должен был бы быть посвящен спецкурс.

К сожалению, очерченному выше идеалу изучения генетики на современном этапе – от признака к гену и обратно – не соответствует ни один имеющиеся учебник, скорее всего потому, что эта наука развивается сейчас слишком быстро. В качестве некоторой компенсации этого обстоятельства, я буду стараться выкладывать свои скромные лекции на мой собственный сайт, где они будут доступны тем, кому я сообщаю их адрес – то есть вам. Я бы порекомендовал взять за основу учебник -Вечтомова «Генетика с основами селекции». Хорошо известен также учебник академика Игорь Федорович Жимулев «Общая и молекулярная генетика», в котором основной упор делается именно на молекулярную генетику, и Леонид Владимирович рекомендует именно его в качестве базового учебника. Я понимаю, что два базовых учебника – это не самая удобная ситуация для сдачи экзамена. Но зато она способствует пониманию предмета. Могу сказать, что лично я нахожусь здесь и вообще работаю в Институте цитологии и генетики исключительно потому, что прослушал курс генетики Владимира Александровича Бердникова. Это был лучший курс, который я слышал, и он вообще не соответствовал никакому учебнику, потому что В. А. готовил его по материалам последних обзоров в научной периодике, еще не вошедших ни в какие учебники. Игорь Федорович тоже превратил в учебник свой оригинальный курс лекций.

Мы с вами коснемся основ генетики весьма основательно, с тем, чтобы их хорошо прочувствовать. Начнем мы с самого начала, невзирая на то, что самые элементарные основы генетики проходятся еще в школе, чтобы не дай бог не упустить чего-нибудь простого, но важного. С другой стороны, я имею дело с тетьекурсниками, которые уже прошли курс молекулярной биологии и в данный момент проходят теорию вероятности и математической статистики, что позволяет мне не слишком отвлекаться на материалы этих столь необходимых для изучения генетики курсов. Я, к примеру, буду считать, что вы знаете (или в нужное время узнаете), что такое альтернативный сплайсинг или распределение Пуассона.

Стандартная логика изложения биологии в университетских курсах состоит в движении снизу вверх, от атомов к молекулам и макромолекулам, далее – к структурам клетки, к жизни самой клетки и далее – к многоклеточному организму. Когда мы знаем принципы организации жизни до конца, этот порядок изложения получается органичным и естественным. В эти принципы входит и механизм функционирования нуклеиновых кислот как носителя информации прежде всего о разнообразных белках и функциональных РНК (которые после открытия малых РНК оказались более разнообразными, чем считалось ранее), причем не только об их структуре, но и о том, когда, где и сколько тех или иных РНК или белков должно синтезироваться. Управление этими процессами осуществляется опять-таки с помощью определенных белков (а нередко и РНК). Налицо каскадный принцип разворачивания генетических систем управления – гены кодируют белки (РНК), необходимые для того, чтобы управлять генами, которые кодируют другие белки (РНК) и т. д. Поскольку почти все вообще в организме «делается» белками (плюс некоторыми РНК), то получается, что фактически в нуклеиновых кислотах записана информация обо всем организме вообще - однако считывание этой информации невозможно без ранее синтезированных (опять-таки по матрице ДНК) белков, которые и оперируют с ДНК.

Этот порядок изложения полностью совпадает с тем порядком, в котором развивалась сама жизнь. Сначала это были какие-то «простые» (но лишь по сравнению с тем, что из них потом возникло) системы из самовоспроизводящихся макромолекул, по-видимому, нуклеиновых кислот. Потом им случилось окружить себя фосфолипидной мембраной, что позволило им строить свой собственный микрокосм внутри нее. Так возникли клетки. Все большую роль в функционировании этих первых живых существ приобретали белки, но контроль полностью сохранился за нуклеиновыми кислотами. Клетки усложнялись и научились делиться все более правильно. После деления они иногда не расходились, образуя колонии. Перед этими колониями возникали все более сложные проблемы в связи с их размерами и формой – всем клеткам в колонии нужно было доставить все необходимое для жизни. Разрешение этих проблем было достигнуто за счет определенной структуры колоний и разделению труда между составляющими их клетками. Простые колонии превратились в государства клеток, т. е. в многоклеточные организмы. Были решены также проблемы их самовоспроизведения как сложных структур, причем это удалось реализовать так, что каждый организм мог развиваться из одной клетки посредством разворачивания сложной генетической программы, регулирующей деления клеток и взаимодействия между ними.

Однако такой стандартный порядок изложения биологических знаний отвлекается от того, каким образом они были получены. А получены они были по мере развития науки в прямо противоположном направлении – от организмов к органам, клеткам, макромолекулам и атомам. По мере погружения на каждый из этих уровней ученые могли только делать догадки о том, как устроен уровень более глубокий. Когда-то максимум, что они могли сделать, это вскрыть тело, посмотреть на органы и предположить, как они работают. Когда открыли клетки, сначала считали, что они заполнены пустотой. Потом открыли протоплазму, но сначала видели ее только как вязкую жидкость, в которой, однако же, каким-то таинственным образом содержалась сущность жизни. Открыли ядро и органеллы клетки. Нашли красители, которые по-разному их красят, и тем самым подступились к их химическому составу. В конце ХIХ в. обнаружили нуклеиновые кислоты и выяснили их приблизительный химический состав, но их конкретная структура долго оставалась загадкой, разгадка которой выглядела столь блестяще. На этом погружение вглубь биологии, пожалуй, прекратилось. Пришел период накопления частностей на этом углубленном молекулярном уровне. Частностей оказалось необычайно много. Сейчас мы переживаем период, когда это огромное количество частностей начинают соединять в некую связную картину – модель устройства живого организма. Причем эта модель столь сложна, что она далеко не в полной мере может быть воспринята человеческим сознанием, так что не только ее построение, но и наглядное описание и использование невозможно без современных компьютеров. Тем не менее, к концу ХХ в. все основные принципы биологии были открыты. Классическая же генетика силами нескольких талантливых ученых развилась почти в полном виде в течение первых трех десятилетий ХХ этого века в качестве стройной и логичной науки.

Классическая генетика как раз являет собой яркий пример движения исследователя от макроуровня к микроуровню. Она реконструирует схему устройства системы по ее поведению, подходя к ней как к черному ящику. Как если бы в руки к ученым попали инопланетные механизмы неизвестного устройства безо всяких к ним схем и инструкций. Можно отметить две ее главные особенности. Первое, это поразительная глубина реконструкции, которой она достигала при недостатке прямой информации об устройстве объекта. Мощь классического генетического подхода впечатляет: имея дело лишь с видимыми признаками, он позволил создать представление об умопостигаемых генах, об их размещениях в каких-то таинственных линейных носителях, об изменениях генов и этих носителей. Отталкиваясь от картины наследования признаков, с его помощью были получено представление о структуре носителей генетической информации, передаче этой информации потомкам и превращения её в живую плоть. Вторая особенность – уже упоминавшийся синтетический, а не аналитический характер генетических знаний, справедливость которых в самом процессе их получения сразу же воплощалась в создании некоего нового – организмов с новыми признаками. Достаточно иметь хорошо изученную генетику немногих модельных объектов, тогда об остальных объектах можно судить по мере сходства с ними. Известный афоризм Томаса Моргана «что верно для мухи, то верно для слона», конечно, является довольно сильным преувеличением, и мы в этом убедимся. Однако такой подход (нашедший свое выражение также в так называемом законе гомологических рядов) все же работает.

Основным методом классической генетики являются скрещивания. К большинству своих выводов генетики пришли, наблюдая за поведением признаков родителей и потомков, причем действия исследователя с каждым новым поколением определяются результатами, полученными на предыдущем. Поэтому генетическое исследование немного напоминает шахматную партию. Выводы, получаемые из таких исследований, были на редкость детальны и, как показало дальнейшее развитие науки, верны. Грегор Мендель в своих опытах на горохе в конце XIX в. фактически постулировал существование и описал поведение хромосом в мейозе, не имея ни малейшего представления о хромосомах. Отношение генов к хромосомам было установлено только в начале XX в., и почти до его середины сильно подозревали, что материальным носителем наследственности являются белки. Иными словами, если прочие отрасли биологии не очень отрывались от описательного подхода, то генетика в своих моделях далеко опережала то время, когда изучаемые ею объекты стало можно описывать как материальные сущности. В трагический период истории отечественной науки, подпавшей под идеологический диктат в 30-50е годы прошлого века, это дало повод объявить генетику идеалистической лженаукой и отбросить нашу страну, бывшую на ее переднем крае, далеко назад, причем уничтожив лучших генетиков физически.

Такая познавательная сила классической генетики как науки, способной на основании поведения признаков в скрещиваниях делать верные выводы о поведении неких микроструктур клетки, даже не имея представления о том, из чего они состоят, связана прежде всего с тем, что генетика включает в себя много математики из различных ее отраслей. А это обстоятельство обязано своим существованием тем, что объектом генетики является не некая биологическая структура, а информация. Информацию можно изучать независимо от того, на каком материальном носителе она реализована. Так, программист в своей работе не нуждается в знаниях о том, как именно его программа воплотится в состоянии кристаллов в процессоре компьютера, хотя он в курсе того, что реализована она будет именно на этой физической основе. Генетика – это по сути биологическая информатика. Раньше информатика называлась кибернетикой. И это была еще одна «лженаука», подвергшаяся гонениям при Сталине и Хрущеве, при всей разнице между ними. (К счастью, тогда она не была настолько развита в виде раздела математики, как генетика в виде раздела биологии, и как следствие этой компанией был нанесен меньший ущерб).

«Классическую» генетику (иногда называемую менделевской , хотя то, что имеется в виду, много шире того, что открыл Мендель, и здесь более бы подошло пресловутое идеологическое клеймо «менделизм-морганизм») можно определить как науку о наследственности, оперирующую с абстрактными элементами системы управления развитием организма , отвлекаясь от их материального носителя и по сути не нуждаясь в нем. Соответственно, молекулярную генетику можно определить как науку о молекулярных механизмах, лежащих к основе наследственности . Надеюсь, излишним был бы призыв не придавать этим и подобным им формальным определениям большого значения. В реальной научной практике «двух генетик», и тем более границы между ними не существует, а сами по себе вышеприведенные определения лишь указывают общее направление мысли...

Впрочем, известно, что любое определение чего бы то ни было несовершенно, поскольку наше мышление – не математическая логика и понятия – то, чем оперирует наше мышление – не сводятся к словам – тому, при помощи чего мы с теми или иными потерями фиксируем и сообщаем результаты мышления. Понятия можно только понять (с той или иной степенью отчетливости), наблюдая за их взаимодействиями с ранее понятыми понятиями на множестве текстов, где понятия обозначены словами. Определение – всего лишь наиболее краткий и эффективный текст, приближающий к пониманию, но всегда найдутся ситуации, где любое определение не работает (притом что понятия – работают). Где возможно, я пытаюсь давать определения, которые мне кажутся наиболее удачными, не особенно заботясь о том, насколько они соответствуют предложенным ранее или оригинальны, но не отношусь к ним слишком серьезно и очень далек от мысли, что записывание их под диктовку и зазубривание может облегчить понимание предмета.

Поначалу генетика состояла в одиноком подвиге единственного ученого, которого не понял ни один современник и который, в силу личного гения и разностороннего образования, сам и предложил плодотворную методологию, и скрупулезно провел длительные и обширные эксперименты и сделал неочевидное умозрительное предположение. Вскоре после переоткрытия генетики, то есть ее возникновения уже в качестве науки многих, было обнаружено, что факторы наследственности расположены в строго определенном порядке и на определенном расстоянии друг от друга в нескольких линейных структурах, количество, относительный размер и поведение которых совпадало с количеством, относительным размером и поведением хромосом в мейозе. Хромосомная теория наследственности была сформулирована в 1900–1903 гг. американским цитологом Уильямом Сеттоном и немецким эмбриологом Теодором Бовери и в дальнейшем развита знаменитым американским генетиком Томасом Морганом и его школой – Мёллером, Стертевантом, Бриждесом. (Это они впервые, с 1906 г., стали проводить исследования на дрозофиле, причем сначала они планировали кроликов, но этот план не пропустил финансовый менеджер их университета. Первым же начал культивировать дрозофилу Чарльз Вудворт, он же предположил, что она может стать удобным объектом для изучения наследственности.) И вот этот важный вывод о нахождении факторов наследственности в хромосомах, полученный столь рано, отвергался официальной наукой в СССР с конца 1940-х до начала 1960-х гг.!

Сопоставление умозрительных генетических карт (относительное расположение генов в этих структурах) и различных частей хромосом сделало очевидным, что гены расположены именно в них. Но классической генетике это не так уж и необходимо – ее модели, проверяемые по результатам скрещиваний, ставили гены в своего рода «виртуальные хромосомы». Так что и по сию пору для большинства объектов существуют два рода карт хромосом: физические карты, показывающие, в каких именно местах на видимых в микроскоп хромосомах или на молекуле ДНК расположены гены, и генетические , или рекомбинационные карты , реконструирующие взаимное расположение генов по результатам скрещиваний. Порядок генов в этих двух типах карт полностью совпадает, относительные расстояния между ними – далеко не всегда, и этому имеются вполне исчерпывающие объяснение, о чем сказано будет позже.

Как наука об информации и управлении, классическая генетика даже структуру имеет подобную математике. Она вся держится на системе умозрительных априорных понятий, с которыми соотносятся наблюдаемые явления (в отличие, к примеру, от цитологии, понятийный аппарат которой вводится исходя из видимых глазом эмпирических фактов). К сожалению, в соответствующей этим понятиям терминологии (а понятия и термины – это не одно и то же) за время существования генетики накопился определенный разнобой, на чем я буду специально заострять внимание, чтобы Вы не были введены в заблуждение различным словоупотреблением в генетической литературе. Конечно, генетические понятия вводятся на основе наблюдаемых фактов. Но основные из них вводятся скорее как умозрительные математические понятия. Понятий и соответствующих им терминов в генетике много. Но они действительно нужны, и, будучи введенными, практически исчерпывают предмет. Во многих случаях достаточно сопоставить наблюдаемое явление с подходящим понятием, и все становится ясно. Пожалуй, в качестве учебника по генетике мог бы служить хороший толковый словарь генетических терминов. Педагогически правильнее было бы вводить понятийный аппарат и терминологию по мере того, как в них возникает необходимость. Но не будет вреда, если ввести и обсудить основные понятия с самого начала, а потом отмечать места, в которых в них возникает необходимость. Будем исходить из того, что с некоторыми понятиями вы уже знакомы хотя бы из школьного курса и иногда пользоваться ими еще до их детального обсуждения.

1.2. Признаки организмов. Фенотип и генотип.

Пожалуй, самым важным генетическим понятием является признак . Генетика как наука началась именно в тот момент, когда Грегор Мендель начал анализировать отдельные признаки, а не всю наследственность как единое целое. Скажите, что такое признак? И сколько их может быть? Признак – это все что угодно, связанное с особью, лишь бы был способ как-то его зарегистрировать. Рост, вес, цвет, высота крика, половина длины хвоста, прибавленная к квадратному корню из трети длины носа, количество волосков в бороде, форма норы или муравейника, количество самцов, преследующих одну самку, продолжительность времени, в течение которого можно не дышать под водой, количество любовников у матери или дочери изучаемого субъекта. Я не шучу – среди признаков носителей определенного варианта одного из рецепторов к дофамину фигурирует высокая частота признака «вырос без отца» (понятно, что здесь речь шла скорее о признаке одного из родителей, а не самого обсуждаемого субъекта, который, впрочем, мог унаследовать предраположенность).

Выбор огромен, но чем удачнее, мудрее или остроумнее вы выберете признак, тем больше информации узнаете из опыта. Понятно, что прибавлять квадратный корень из длины носа к длине хвоста не следует, так как обе длины имеют одну и ту же размерность, и в результате вы получите математическую абракадабру. А вот если прибавлять к длине хвоста кубический корень из массы тела, то это имеет больше смысла, ведь масса зависит от куба линейных размеров и, извлекши кубический корень, мы получим величину, соизмеримую с длиной хвоста, а сложив две упомянутые величины, получим некое мерило линейных размеров.

Легко понять, что далеко не все признаки из их бесконечного разнообразия одинаково информативны. Некоторые информативны одинаково, но ничего друг к другу не добавляют. К примеру, если взять два таких признака: длина правой ноги и длина левой ноги, то даже интуитивно понятно, что хотя две ноги и могут слегка различаться по длине, второй мало что добавит к первому. Возьмем такие признаки: длина левой ноги и рост. Что мы можем сказать о них? Чем больше рост, тем больше длина ног,– это совершенно очевидно. Рост и длина ног коррелируют – не более, но и не менее того. И действительно, если возьмем выборку людей, померим рост и длину ног и вычислим коэффициент корреляции, то он будет довольно близок к единице и высокодостоверен. Но мы знаем, что люди вообще-то бывают коротконогие и длинноногие. И если мы возьмем рост и отношение длины ног к росту, то получим два совершенно независимых признака – линейные размеры и длинноногость, которые могут наследоваться независимо.

У нас появилось отношение двух измеренных величин. Как правило, работа со многими признаками сразу требует корректной статистической обработки. Для такой обработки не очень удобно иметь дело с отношениями. Но зато есть набор математических методов , называемый многомерной статистикой (в частности, метод главных компонент для количественных признаков), который позволяет из N любых измеренных нами признаков получить N новых признаков, представляющих собой линейные комбинации исходных (их суммы с разными коэффициентами), которые не будут коррелировать друг с другом. Это означает, что каждый из них будет нести независимую информацию. И если мы посмотрим на то, как составлены N этих новых признаков, то увидим, что один из них отражает, к примеру, линейные размеры (сюда войдут всякие длины тела, рук, ног и т. д.), другой – толщину, третий – неравномерность толщины (выраженность талии, бедер и бюста), четвертый – относительные размеры головы, пятый – смуглость кожи и т. д. Такие признаки наиболее информативны, причем они имеют разный вклад в общую изменчивость объектов, который также можно оценить. Однако методы многомерного анализа не решают проблемы дублирования признаков, поскольку дублирование влияет на упомянутый относительный вклад в общую изменчивость того нового признака, в который они попадают. Эта проблема не решена в математической статистике до сих пор.

Признаки могут быть самыми разными, однако распадаются на два больших класса – качественные , или альтернативные , и количественные , или континуальные . Признак является качественным в том случае, когда изменчивость проявляется в существовании нескольких альтернативных вариантов признака, то есть в принадлежности особи к определенному четкому классу, причем отнесение ее к одному из классов не вызывает сомнений. К примеру, можно выделить два таких класса особей человека как мужчины и женщины. Женщин тоже можно разделить на несколько альтернативных классов. Допустим, одета девушка в брюки или ее ноги одеты в единый цилиндрический кусок материи – платье или юбку. Получаем два класса. Последний случай можно разбить на два класса – одета в платье или в юбку. Получаем три класса женщин. Женщины наверняка могут выделить много альтернативных классов относительно одежды и при этом не испытают ни малейших затруднений в классификации. Классические примеры: цветы гороха – белые или пурпурные, глаза дрозофилы – опять-таки белые или пурпурные; забавно, но оба органа могут быть еще и розовыми, и это еще одно состояние качественного признака, отдельный класс. В тех случаях, когда можно выделить качественные (альтернативные) признаки, а особи, принадлежащие к разным классам (вариантам) регулярно встречаются в природе, принято говорить о полиморфизме , а сами классы (варианты) этих признаков обычно называть морфами , или формами Изначально это одно и то же слово, по-гречески и по латыни, но значение второго слишком многозначно, и его лучше избегать. Этимологически оба слова обозначают форму, но как термины применяются для любых признаков, например, связанных с цветом. Ниже показаны две морфы – соответственно с желтыми и фиолетовыми цветками - высокогорной фиалки алтайской, встречающиеся в природе примерно с равной частотой.

https://pandia.ru/text/78/138/images/image002_73.jpg" width="283" height="311 src=">.jpg" width="347" height="453 src=">

Поскольку все мы учились в школе, мы можем заподозрить, что белый и фиолетовый ирис – гомозиготы по каким-то аллелям, а сиреневый – гетерозигота по этим аллелям. Но такой информации у нас (у меня в частности) пока нет, и мы в любом случае должны начать с констатации трех цветовых морф.

Мы упоминали о трех четких классах цвета гороховых цветков – белый, пурпурный и розовый. Но вот на улице Золотодолинской растут яблони с пурпурными лепестками. А бывают яблони с розовыми, со слегка розоватыми и белыми лепестками. В случае гвоздик, продаваемых в ларьках, нам кажется, признак цвета цветков качественный– там бывают красные, белые, розовые и белые с красной оторочкой лепестков. А у селекционеров-цветоводов наверняка есть такое разнообразие гвоздик, что признак превращается в количественный. Можно взять спектрофотометр, экстрагировать пигмент антоциан из стандартной навески лепестков и измерить интенсивность пурпурной антоциановой окраски, выразив ее цифрой. И тогда получаем количественный признак – это такой признак, который может быть выражен вещественным числом. Один и тот же признак в разных ситуациях может выступать как количественный и качественный. Для практически любого качественного признака можно найти способ его измерения и тем самым рассмотреть его как количественный. Наоборот, большинство количественных признаков не могут рассматриваться как качественные, так как значения измеряемого параметра редко группируются в четко различимые классы.

Рост человека (если исключить явную карликовость) – типичный количественный признак. Сколько бывает вариантов роста нормального человека? Правильно, сказать нельзя – это положительное вещественное число, а количество «вариантов» зависит от того, с какой точностью мы мерим и какие существуют физические пределы этой величины. Рост множества людей можно охарактеризовать его средним значением. Но нам понадобится также какие-то характеристики его изменчивости. Для этого нам придется изучать частотное распределение количественного признака. Еще один хрестоматийный пример: если взять много людей, измерить их рост с точностью до сантиметра и построить по росту так, чтобы люди с одинаковым ростом стояли в одну колонну, то получим следующую картину: длина колонн образует некую колоколообразную кривую. При достаточной дробности измерения роста и количестве людей, она неплохо воспроизведет хорошо известное в теории вероятностей – нормальное или Гауссово распределение .

Дисперсия" href="/text/category/dispersiya/" rel="bookmark">дисперсией – усредненным квадратом отклонений индивидуальных значений от среднего. Квадратный корень из этой величины дает среднеквадратическое отклонение , его размерность совпадает с размерностью измеряемой величины и оно может служить мерой разброса признака. В интервале значений величины от среднего минус среднеквадратическое отклонение до среднего плюс среднеквадратическое отклонение находится около 70 % всех нормально распределенных объектов, сколько бы мы их ни измерили. Если этот интервал вокруг среднего расширить вдвое, то там будет около 90 %, если втрое, то около 99 % объектов.

Центральная предельная теорема математической статистики утверждает, что распределение суммы большого количества независимых случайных величин приближается к нормальному. А практически любой количественный признак формируется под действием большого количества разнонаправленных и разных по силе факторов (для размера тела это особенно верно). Именно поэтому большая часть количественных признаков подчиняется нормальному распределению.

Однако и это утверждение верно лишь в первом приближении. Как известно, чтобы оценить приемлемость модели, нужно обязательно обратить внимание на граничные условия. Нормальное распределение симметрично и задано на всем множестве вещественных чисел, от – до +, хотя плотность вероятности спадает при удалении от среднего достаточно быстро. Вернемся в качестве примера к признаку «рост человека». Действительно, у нас нет жесткого верхнего предела на рост человека, и какого бы рекордсмена мы не нашли, никогда нет гарантии, что рано или поздно не найдется более высокий субъект. А вот нижний предел есть даже теоретически – ведь рост человека по определению не может быть меньше нуля. Значит, граничные условия не пропускают для роста человека Гауссову модель. Более того, если мы возьмем много людей, то обнаружим, что распределение их по росту слегка ассиметрично и скошено вправо – физический нижний предел в нуле дает о себе знать! Какую модель мы можем предложить взамен Гауссовой как более адекватную для количественных признаков биологических объектов?

Подумаем вот о чем. Признаки формируются в ходе индивидуального развития организма, которое по сути есть очень сложная химическая реакция, происходящая под управлением генов, которые в определенные моменты обеспечивают определенные концентрации определенных веществ. Эти концентрации выступают как сомножители в уравнениях скоростей составляющих индивидуальное развитие реакций (например, уравнения Михаэлиса), а значения признаков напрямую зависят от каких-то из этих (или даже всех) скоростей. Поэтому индивидуальные вклады отдельных генов в количественный признак обычно не складываются, а перемножаются, то есть каждый ген увеличивает или уменьшает значение признака во сколько-то раз. Произведение многих независимых случайных величин стремится к логнормальному распределению . В результате, реальные распределения количественных признаков организмов являются не нормальными, а логнормальными. Они действительно очень похожи, но все же несколько асимметричны – более пологие вправо.

https://pandia.ru/text/78/138/images/image007_23.jpg" width="304" height="416 src=">

Нормальный (А и В) и карликовый (С) горох

Именно этот признак –относительная длина междоузлия - является здесь альтернативным признаком, в то время как рост растения очень редко ведет себя как настоящий альтернативный признак.

Есть еще один условно выделяемый класс признаков, о котором нужно иметь ясное представление. Возьмем такой признак, как количество отростков на рогах марала. Самые мелкие рога неветвистые. В максимальном случае имеем на оба рога 10 отростков. Мы не испытаем затруднений в отнесении того или иного рога к классу с определенным числом отростков и на этом основании можем подумать, что это качественный признак. Но качество здесь соотносится с целым числом, и число классов, как и ряд целых чисел, неограниченно (никто не может поручиться, что нам рано или поздно не попадется марал с 11 или более отростками). Такие признаки называются счетными ; еще они называются меристическими , что может сбить с толку, поскольку нам здесь нужно не измерять, а именно считать. На самом деле, здесь имеется простая закономерность - чем больше рог, тем больше на нем отростков; просто для того чтобы отросток добавился, зачатку рога нужно набрать некоторый критический прирост массы. Так что счетное количество отростков – просто мера величины рога. В случае числа ячеек на крыле стрекозы это становится еще более очевидно. Такую же меру мы получаем при измерении, когда останавливаемся на какой-то его точности. Представьте, если мы считаем не отростки рогов оленя, а волоски на его молодых рогах. Фактически имеем различные меры размера рога, но с разным шагом (округлением).

Оперируют со счетными признаками при помощи тех же подходов, что и с количественными, с некоторыми особенностями математической обработки. И было бы ошибкой применять к ним те же подходы, которые применяются для альтернативных признаков. Например, одна московская группа ученых изучала количество ячеек в определенных зонах крыльев стрекоз. Они подсчитывали среднее количество ячеек, определяли среднее и среднеквадратическое отклонения и, к примеру, находили, что на двух разных водоемах эти средние статистически значимо различались. Они сделали вывод, что популяции на двух озерах имеют генетическую специфику – на том основании, что альтернативные признаки непременно должны определяться наследственными факторами, одним или немногими. Но оперировали то они со своим признаком как с количественным! Скорее всего на одном из водоемов стрекозы развивались в менее благоприятных условиях и имели меньшую площадь крыльев, на которой умещалось меньше ячеек, размер которых довольно стандартизован в онтогенезе.

Наконец, часто выделяют третий большой класс признаков – ранговые признаки. Речь идет о тех случаях, когда мы можем ранжировать объекты по принципу «больше» / «меньше» («лучше» / «хуже»), но не имеем прямой возможности выразить это качество превосходства одних над другими численно. Ситуации, в которых возникают ранговые признаки – довольно многообразны. На плацу мы можем легко построить солдат по росту, не измеряя их роста, там же по погонам мы легко распознаем воинские звания, заведомо зная в каком порядке они ранжированы относительно друг друга. В некоторых случаях мы вынуждены субъективно оценивать некие сложные интегральные параметры, например, «силу» индивидуальных растений, классифицируя их на «сильных», «средних» и «слабых».

Любопытно, что коль скоро мы имеем ранги, мы уже имеем грубое численное измерение признака, пусть очень приблизительное или субъективное. Так, ранги, будучи порядковыми номерами, сами по себе суть целые числа. И с ними уже можно оперировать как с измеряемыми признаками. При всей условности такого «измерения», разработаны математические методы, позволяющие получать на их основе весьма надежные выводы. Более того, и несомненные качественные признаки можно весьма приблизительно обрабатывать как количественные. Допустим, если у нас имеется четыре цветовых морфы, то мы можем рассматривать их не как один качественный признак, а как четыре количественных признака, каждый из которых может принимать два значения – 0 (особь не принадлежит к данной морфе) и 1 (особь принадлежит к данной морфе). Опыт показывает, что и такие подобные искусственные «количественные признаки» можно с успехом обрабатывать.

Как показывают примеры с ростом гороха, один и тот же признак может быть и количественным, и качественным. Любое различаемое нами качество всегда можно как-то измерить (даже принадлежность к мужскому и женскому полу можно измерить как соотношение определенных гормонов). Выбор как оперировать с признаком – как со значением численного параметра или как с индикатором принадлежности к классу - диктуется особенностями конкретной задачи. В случае бимодального распределения бывает полезно разбить все особи на два класса хотя бы в первом приближении, даже если два горба распределения сливаются и мы не можем однозначно классифицировать особей, попадающих между ними, кроме как формального введя пороговое значение.

И качественные, и количественные признаки могут в той или иной мере наследоваться, а стало быть, попадают в поле зрения генетики. Для анализа количественных и качественных признаков генетика пользуется разными моделями. Наследование качественных признаков (именно с ними и работал Мендель) описывается в терминах комбинаторики и теории вероятности проще и точнее, им мы и будем в основном заниматься. Наследование количественных признаков описывается в терминах математической статистики и основано в основном на анализе корреляций и разложении на компоненты дисперсии. Как сказано выше, наследование качественных признаков также можно обрабатывать как наследование количественных, что в ряде случаях оказывается весьма плодотворным подходом. Я надеюсь, что у нас будет время кратко ознакомится с началами генетики количественных признаков. А пока - еще немного терминологии.

Два не менее широких понятия, чем признак, без которых, однако, не обойтись, – генотип и фенотип . Сами эти термины, как и термин «ген» , введены в 1909 г. датским генетиком Вильгельмом Людвигом Иогансеном. Фенотип – это все то, что касается признаков рассматриваемых организмов, генотип – это все то, что касается их генов. Понятно, что признаков может быть бесконечное количество, а генов существует десятки тысяч. Причем подавляющую часть признаков никто не регистрирует, а подавляющую часть генов никто не знает. Но фенотип и генотип – это рабочие понятия, содержание которых в каждом конкретном случае диктуется генетическим экспериментом. Генетический эксперимент состоит обычно в том, что кого-то с кем-то скрещивают, часто на протяжении многих поколений, и следят за признаками потомства, которое может в соответствии с этими признаками отбираться, скрещиваться и т. д. Или изымают из природы выборку особей, регистрируют их признаки, выясняют, какими вариантами представлены некоторые гены, наблюдают за динамикой их частот. В каждом случае мы следим за строго определенными признаками и генами, часто немногими. И когда мы говорим о фенотипе, мы имеем в виду значения или состояния именно этих признаков, а когда о генотипе, то набор именно этих генов. Зависимость первого от второго есть, но, как мы увидим, не самая прямая. В выяснении этой зависимости во многом и состоит генетика. И только в случае если в качестве признака фигурирует сама последовательность ДНК, фенотип совпадает с генотипом.

Лишь в последнее время появилась возможность проводить высокотехнологичные эксперименты по слежению за всеми известными генами тех объектов, у кого они известны (например, человека) – допустим присутствием-отсутствием всей матричной РНК или всех белков в той или ткани. Соответствующие направления получили названия, соответственно, «протеомика» и «транскриптомика», а совокупность всех имеющихся в том или ином объекте белков или матричной РНК, соответственно – протеом и транскриптом.

1.3. Понятия «ген», «локус», «аллель», «ортолог», «паралог», «мутация».

Исходя из нашего предварительного утверждения, что в генетике очень много от математики, мы должны были бы ожидать в ней терминологической строгости. К сожалению, это еще и эмпирическая наука, существующая на огромном и разнородном экспериментальном материале, делаемая множеством ученых разной специализации (и разного образования!), и это привело к существованию и в генетике различных терминологических «диалектов», в том числе и в вещах очень важных. Перейдем к понятию, которое может показаться для генетики центральным, но которое оказалось в реальности слишком для этого расплывчатым. Скажите, что такое ген ? На самом деле это понятие, которому сильно не повезло, так что сейчас оно имеет несколько значений. В классической генетике ген – это наследуемый фактор, влияющий на признаки организма . Некогда он рассматривался как далее неделимая единица наследственности. После открытия структуры ДНК очень быстро выяснилось, что многие классические гены представляют собой участки ДНК, кодирующие некий белок, к примеру фермент, который и определяет наследуемый признак. Это было огромным прорывом в науке, и на этой волне первоначально показалось, что все гены классической генетики именно таковы. Выработалось такая формула: «Один ген – одна полипептидная цепь ». Она была предложена, в первоначальной формулировке «один ген – один фермент», в 1941 г. (то есть за 12 лет до расшифровки структуры ДНК Уотсоном и Криком) Джорждем Бидлом и Эдвардом Тейтэмом (портреты этих и многих других ученых вы найдете в учебнике), которые работали со штаммами плесени нейроспоры, различавшимися по способностям осуществлять те или иные биохимические реакции и установили, что каждый ген ответственен за одну определенную биохимическую реакцию, то есть за определенный этап метаболизма плесени. За эти работы они в 1948 г. получили Нобелевскую премию. Заметим, на том этапе ген еще понимался вполне классически, но велись активные исследования по выяснению того, что же он представляет физически. И после открытия структуры ДНК все, как казалось, встало на свои места и геном стали называть участок ДНК, кодирующий полипептидную цепь.

Однако со временем обнаружилось, что рядом с кодирующей последовательностью всегда имеются регуляторные последовательности ДНК, которые ничего не кодируют сами, но влияют на включение-выключение и интенсивность транскрипции этого гена. Вы хорошо их знаете: это промотор – место посадки РНК-полимеразы, операторы – места посадки регуляторных белков, также энхансеры – также места посадки регуляторных белков, способствующих транскрипции, но находящиеся на некотором, иногда значительном, удалении от кодирующей последовательности, и сайленсеры – последовательности, препятствующие транскрипции и т. д. Иногда они располагаются за сотни и тысячи нуклеотидов (по масштабам хромосомы это не так и много), но все равно функционируют как цис -факторы (т. е. находящиеся рядом), физически оказывающиеся неподалеку за счет определенной укладки ДНК. Все это хозяйство стали рассматривать как принадлежности гена, который что-то кодирует. Таким образом, в молекулярной генетике эукариот ген – это кодирующий участок ДНК вместе с прилежащими участками ДНК, влияющими на его транскрипцию .

Для такого участка в 1957 году С. Бензером был предложен уточняющий термин цистрон , которому также не повезло, поскольку этим термином стали обозначать и только лишь кодирующий участок ДНК (так называемую открытую рамку считывания), а иногда и участок ДНК между промотором и терминатором, с которого считывается единая молекула РНК. Вы помните, что у прокариот, у которых молекулярно-генетические механизмы стали выясняться раньше, широко распространена оперонная организация генов, когда последовательности, кодирующие несколько полипептидных цепей, имеют общую регуляцию и считываются в составе единой мРНК. Это не позволяет пользоваться вышеприведенным определением термина «ген». С другой стороны, здесь малоприменим и термин «цистрон»: будучи определенным как участок ДНК, с которого считывается единая РНК, он включит участки, кодирующие несколько разных белков, что, с другой стороны, было некогда названо «полицистронным принципом организации генетического материала». В результате употребление терминов «ген» и «цистрон» без пояснений (хотя бы о каком царстве идет речь) в настоящее время чревато недоразумениями.

Заметьте, что в молекуляно-биологическом понимании ген получился подразделенным на части – экзоны, интроны, операторы, энхансеры, в конце концов – отдельные нуклеотиды. А регуляторная последовательность ДНК, взятая как таковая, лишилась права называться геном, так как сама ничего не кодирует. Но за счет влияния на транскрипцию гена эта последовательность может влиять и на какой-то признак (т. е. на фенотип), который будет наследоваться вместе с этой последовательностью. А сама она может быть отделена рекомбинацией от кодирующей последовательности, в особенности если это удаленный энхансер. Иначе говоря, регуляторная последовательность – это тоже особый наследственный фактор, имеющий к тому же свое собственное место на хромосоме. Некоторые регуляторные последовательности, такие как энхансеры, могут влиять на транскрипцию несколько генов сразу, т. е. занимать свое определенное место в регуляторной сети управления развитием и функционированием организма. Налицо все признаки гена в понимании классической генетики.

Это противоречие между классическим и молекулярно-биологическим понятием гена, возникшее в тот момент, когда казалось, что все классические гены – это транскрибируемые участки ДНК, кодирующие белок или РНК, не преодолено до сих пор, что, впрочем, не особенно важно, так как слово «ген» давно не употребляется как строгий термин. В связи с бурным развитием молекулярной биологии побеждает молекулярно-биологическое: ген – это транскрибируемый участок ДНК вместе со своими регуляторными последовательностями ДНК. Однако классическое понятие: ген – это наследственный фактор (неважно, как он функционирует, чем является и из чего состоит), было исторически первым, продержалось более полувека и оказалось исключительно плодотворным. Вам необходимо быть в курсе этого противоречия и учиться понимать, о чем идет речь, из контекста.

На практике это противоречие разрешается двумя путями: либо перед употреблением слова «ген» его значение предварительно оговаривается, либо оно не используется в качестве термина. Пример первого случая: в разделе «материалы и методы» в статье, посвященной подсчету генов в геноме обязательно будет написано, по какому критерию ген определяли – например, было подсчитано число открытых рамок считывания. В следующей статье напишут: мы проанализировали экспрессию и показали, что некоторые из найденных потенциальные рамок считывания никогда не транскрибируются и, по видимому, представляют собой не гены, а псевдогены. Пример второй ситуации: изучается локус, с которого делается несколько тысяч белков за счет того, что есть три альтернативных промотора, три альтернативных терминатора и десяток интронов, подверженных альтернативному сплайсингу. Где тут ген и сколько генов в этом локусе? В данном случае слово «ген» будет упомянуто разве что во введении, в качестве синонима слова «локус». Если взять фразу, содержащую слово "ген" из популяционно-генетического контекста, и вставить в молекулярно-биологический контекст, то мы получим потерю смысла.

Разные варианты одного и того же гена, в любом его понимании, обозначаются термином аллели . В данной форме термин предложен В. Иоганзеном в 1926 г., на основе введенного В. Бэтсоном в 1902 г. термина «аллеломорфная пара»). Понятие «аллель» появилось тогда, когда о структуре ДНК ничего не знали, и оно было введено именно как альтернативный вариант гена. Это понятие особенно важно для диплоидных организмов, которые получают одинаковый набор генов от отца и матери и как следствие каждый из них присутствует в геноме в двух копиях, которые могут быть идентичными или различаться, но не до такой степени, чтобы нельзя было сказать, что это «один и тот же ген». Эти две копии и были названы аллелями.

Забавно, но в отношении термина «аллель» не имеет однозначного решения и такой простой вопрос, как грамматический род этого слова в русском языке . Московская, а также киевская и новосибирская школы, считают, что аллель мужского рода , ленинградская (санкт-петербургская) – что женского. Вы можете убедиться, что даже в двух рекомендованных учебниках это слово употреблено в разном роде.

Первоначально термин «аллели» был введен для обозначения вариантов гена, ответственного за определенный признак, которые связаны с состоянием этого признака. Однако выяснилось, что на один и тот же признак могут одинаковым образом влиять независимые друг от друга гены. Это поднимает проблему различения аллелей одного и того же либо разных генов. К счастью, еще раньше выяснилось, что гены расположены в строго определенной последовательности в линейных структурах - как оказалось, в хромосомах – так что каждый ген занимает строго определенное место на одной из хромосом. Поэтому каждый ген можно было идентифицировать не только по влиянию на признак, но и по его месту на определенной хромосоме. Получается, что каждое место на хромосоме, ответственное за какой-то признак – локус – занято одним из аллелей – индивидуальных вариантов гена. Диплоидное ядро содержит по два аллеля каждого локуса, полученных от матери о отца, разных или одинаковых. Локус можно определить как позицию на хромосоме, занимаемую определенным наследственным фактором , а аллель – как вариант определенного наследственного фактора, а поскольку определенность наследственному фактору придает именно локус, но аллель – это вариант наследственного фактора, находящегося в определенном локусе . Очевидно, что это определение дано с точки зрения классической генетики. При этом лучше говорить «локус на хромосоме». а не «локус хромосомы», потому чтово втором случае может создаться впечатление, что хромосома составлена только лишь изтаких вот локусов, имеющих генетический смысл. Хотя ген в классическом понимании действительно соответствует определенному отрезку ДНК хромосомы, и хотя очень часто ничего не кодирующие участки ДНК могут на что-то влиять хотя бы косвенным образом (например, присутствие блока повторов может способствовать компактизации хроматина и тем самым влиять на интенсивность транскрипции кодирующих отрезков ДНК, расположенных даже на значительном расстоянии от него), тем не менее заведомо существуют протяженные участки ДНК, не имеющие никакого генетического содержания, то есть ни на что не влияющие и не являющиеся генами в любом смысле.

Но термины «локус» и «аллель» имеют и забавное расширительное значение. Если мы изучаем саму последовательность ДНК, которая в данном случае является и нашим признаком, и нашим геном, поскольку в прямом смысле кодирует сама себя, мы можем называть локусом любой ее участок, который можно каким-либо образом распознать, а аллелем – его вариант. Например, в геноме есть так называемые «микросателлиты» - последовательности очень коротких, состоящих из двух-трех букв, тандемных (расположенных друг за другом) повторов. Число этих повторов очень легко меняется за счет механизмов, связанных с проскальзыванием при репликации или неправильной рекомбинацией. Собственно, за счет этих механизмов они в геноме и «заводятся», в то время как никакой своей функции у них нет и генами в молекулярном смысле они никак не являются. Благодаря их высокой изменчивости, микросателлиты любят изучать эволюционные генетики – поскольку по числу копий повторов можно с определенной степени уверенности судить о родстве. Так вот, в этом случае также принято говорить об аллелях, обозначая этим словом последовательности микросателлитов разной длины (то есть с разным числом копий повторов).

Получилось, что от слова «ген» в классической генетике можно вообще отказаться. Есть локус – место на хромосоме, которое всегда занято одним из аллелей. Отношение между локусом и аллелем такое же, как отношение между переменной и ее значением. При этом в соответствии с классическим определением и локус – это ген (как родовое понятие), и аллель – это ген (как индивидуальное понятие). Часто можно услышать «эти гены неаллельны друг другу», то есть говорят об аллельных и неаллельных генах, то есть об аллелях одного локуса и аллелях разных локусов. В практике генетики устоялась не очень жесткая традиция употреблять слово «ген» как синоним слову «локус», и такие примеры будут встречаться и в нашем тексте.

Но есть ситуации, когда слова «ген» избежать трудно. К примеру, обработали горох с красными цветами химическим мутагеном и получили горох с белыми цветами. Установили, что признак «цвет цветков» наследуется как определяемый одним локусом – в таких случаях принято говорить о моногенном признаке (хотя несуществующий термин «монолокальный» был бы точнее). Однако горох с белыми цветами уже известен ранее и этот признак определяется аллелем хорошо известного локуса. Спрашивается, мы получили тот же самый аллель того же локуса или другой (на уровне последовательности ДНК) аллель того же локуса, который, однако, также приводит к белым цветам? Или аллель нового, ранее неизвестного локуса – который может, скажем, за совсем другой этап синтеза пигмента? Пока это не установлено, приходится нестрого говорить: «Получили ген белоцветковости». Кстати, описана реальная ситуация из жизни нашей лаборатории – мы получили ген, определяющий белоцветковость, который оказался аллельным не широкоизвестному локусу, ответственному за антоциановую окраску цветка a , а малоизвестному локусу a 2 .

Термины локус и аллель можно применять и к гену в молекулярно-генетическом понимании - а именно к конкретной последовательности нуклеотидов. Здесь значение терминов «локус» и «ген» совпадает, а аллель будет означать конкретную нуклеотидную последовательность данного гена . Однако в рамках молекулярной генетики необходимости в этих терминах как возникает не так уж часто, поскольку молекулярно-биологическое рассмотрение обычно отвлекается от существования у диплоидного организма второго такого гена, с идентичной или несколько отличающейся последовательностью, в гомологичной хромосоме.

Вы наверняка знаете из молекулярной биологии о существовании мультигенных семейств : когда в геноме есть несколько генов в молекулярном понимании, кодирующих белковый продукт одного и того же типа – один и тот же фермент, например. Причем они могут несколько различаться по первичной структуре: и ДНК, и белкового продукта, равно как и по каким-то физико-химическим свойствам белкового продукта –интенсивности молекулярной функции, а также по особенностям экспрессии – то есть места, времени и интенсивности синтеза. У того же гороха есть семь генов (в молекулярном смысле) гистона Н1, каждый из них кодирует особый вариант молекулы, один из которых присутствует лишь в активно делящихся клетках и исчезает из хроматина клеток, закончивших деление. Любая последовательность любого из этих генов будет являться вариантом гена гистона Н1. Но в пределах одного генома эти семь генов занимают разные локусы, поэтому аллелями будут только разные варианты конкретного локуса. Вам должно быть знакомо понятие гомология – сходство, основанное на общности происхождения, и гомологи – объекты, обладающие таким сходством. В молекулярной генетики различают два типа гомологии генов. Гомологичные, но неаллельные гены в одном гаплоидном геноме, занимающие разные локусы, называются паралоги (от греческого «пара» - около, рядом). Индивидуальные же варианты одного и того же локуса у разных индивиддумов называются ортологи (от греческого «орто» - прямо, напротив; вспомните орто-пара изомеры в органике). По сути ортологи являются аллелями. Однако термином «ортолог» обычно пользуются молекулярные биологи, когда изучают гены разных видов – в тех случаях, когда можно однозначно установить, что у них имеются один и тот же локус, тогда как термин «аллель» применяют лишь к вариантом гена у одного и того же вида, или же у близких видов, которые, тем не менее, способны скрещиваться (например, пшеница и ее дикие родственники). Таким образом, аллель – понятие именно генетическое, об аллелях говорят тогда, когда они в принципе могут участвовать в скрещивании.

Зададимся вопросом - а откуда взялись паралоги? Логично и правильно предположить, что они возникли в результате дупликации генов – то есть редких случаев «размножения» гена в геноме. Естественно, всякое такое событие, сколь угодно редкое, происходит в пределах какого-то одного вида. В результате мы имеем ситуацию, когда у каких-то особей одного вида в геноме имеется два локуса, идентичных по первичной структуре (со временем она может накопить различия), а у других – всего один. Допустим, что две копии размножившегося гена расположились рядом, так что оба новых локуса расположены там же, где располагался один старый. И вот они начинают накапливать различия. Где и чего здесь аллели? Мы рассмотрели ситуацию, когда понятие «аллель» дает сбой, и это очень хорошо, так как тем самым мы проследили границу его применимости.

Кстати, неожиданно нетривиальный вопрос – что такое разные и одинаковые аллели. На ранних этапах развития генетики аллели распознавались только по фенотипу и разными аллелями считались только те, которые приводят к разным фенотипам. Чаще всего аллелей было два – нормальный и дефектный (мутантный), так что на ранних этапах развития генетики была популярна «теория присутствия-отсутствия» (определенной функции). Однако по мере развития генетики все больше становилось известно случаев, когда один и тот же признак обладает несколькими наследуемыми вариантами, что в конечном счете привело к появлению известного афоризма Томаса Моргана: «Одному присутствию не может соответствовать несколько отсутствий». А в случае количественных признаков, определяемых сразу многими генами, особого фенотипического проявления отдельно взятого аллеля вообще не существует. В результате остановились на том, что аллели стали считать заведомо разными, если в данном эксперименте они не унаследованы заведомо от одной и той же особи, то есть не тождественны по происхождению или таковое тоджество не установлено. К примеру, ловим в природе сто с виду совершенно одинаковых особей, чтобы изучить мелкие нюансы фенотипического проявления какого-то гена, скрещиваем их со специальными тестерными линиями, переводим полученный от них изучаемый ген на идентичный генный фон, измеряем интересующий нас признак - и при этом считаем, что в опыте участвует сто разных (по происхождению) нормальных (!) аллелей (все они получены из природы от жизнеспособных особей).

Вы понимаете, что когда появилась возможность расшифровки первичной структуры исследуемых генов, вопрос идентичности аллелей перестал быть теоретическим и свелся к идентичности их первичной структуры (последовательности нуклеотидов). Если есть хотя бы одна замена – аллели разные, если нет – одинаковые, поскольку являются совершенно идентичными молекулами. Учитывая возможность накопления замен нуклеотидов, многие из которых не влияют на функцию локуса, на практике этот подход мало отличается от того, чтобы априорно считать разными любые аллели, независимо полученные от разных особей. Однако скорость возникновения замен сильно варьирует от локуса к локусу - к примеру, в некоторых локусах мы наблюдали идентичную последовательность нуклеотидов даже у аллелей, полученных от разных подвидов гороха (дикого и культурного).

Коснемся таких нестрогих, по популярных терминов, как «аллели дикого типа», «мутантные аллели» и «нуль-аллели». Вышеупомянутая «теория присутствия-отсутствия» во многих случаях вполне применима. Возьмем в для примера тот же горох. В цветах гороха есть пигмент – антоциан, который окрашивает их в розово-красный (пурпурный) цвет. Если какой-то из белков, участвующих в биохимической цепочке синтеза антоциана, дефектен или его нет, антоциан не синтезируется и цветы остаются белыми. Допустим, в некоей хромосоме есть локус, обозначим его а , в котором находится последовательность ДНК, которая кодирует один из таких белков. Обычно же говорят менее строго, но проще – в некоей хромосоме есть ген а , который кодирует один из таких белков (Такой ген с таким обозначением у гороха действительно есть и кодирует регуляторный белок, связывающийся с ДНК, а не фермент, участвующий в синтезе антоциана). Пусть у этого гена есть два аллеля, обозначим их A и a . Аллель А кодирует нормальный функциональный белок. Аллель а не кодирует функционального белка. Каким образом это возможно - мы поговорим позже, для нас сейчас важно, что этот аллель просто «не работает» - не выполняет свою молекулярную функцию, пусть нам и неизвестную. В таких случаях нормальный аллель называется диким типом / На примере с горохом этот термин вдвойне правилен. Горох – растение и культурное, и дикое (представители того же вида продолжают существовать в диком виде). И у всех диких горохов цветы пурпурные, а у культурных есть и пурпурные, и белые, но у овощных и зерновых сортов европейской селекции преобладают белые. Для аллеля, не способного образовать функциональный белковый продукт, часто также применяется термин нуль-аллель .

Бывают случаи, когда понятие «дикий тип» или «нуль-аллель» неприменимы. К примеру, у двуточечной божьей коровки Adalia bipunctata есть две формы – красная в черную крапинку и черная в красную. (Кстати, это один из классических объектов генетики популяций, введенный в эту науку Тимофеевым-Ресовским.) Обе представлены в Европейской части России, ни одна не лучше другой (у нас в Новосибирске, правда, встречается только вторая). Ни одну из них нельзя назвать диким типом в противовес другой. Однако не исключено, что один из этих аллелей связан с потерей молекулярной функции белкового продукта данного локуса, который, как и другие гены индивидуального развития, наверняка является фактором, влияющим на экспрессию других генов.

Далее есть популярный в генетике термин – мутация . Исторически понятие введено Гуго Де Фризом в значении, приближающимся к тому, которое сейчас бытует в фильмах ужасов – внезапное изменение наследственных задатков, приводящее к радикальному изменению фенотипа. Де Фриз работал с одним из видов ослинника (Oenothera ), у которого, как потом выяснилось, в высшей степени оригинальная цитогенетика: вследствие множественных хромосомных перестроек весь геном наследуется как один аллель. Однако слово стало широкоупотребимым термином, и не только в Голливуде. Сергей Сергеевич Четвериков, один из основателей популяционной генетики, пользовался термином «геновариация», который более корректен, но не прижился (хотя Четвериков был одним из отечественных генетиков, оказавших существенное влияние на мировую генетику, фактически основав популяциюнную генетику). В настоящее время под мутацией понимается любое изменение в первичной структуре ДНК – от замены одного нуклеотида до выпадения огромных частей хромосом. Хочу обратить внимание, что слово «мутация» обозначает само событие изменения. Однако в нестрогой, но живучей генетической практике, это же слово «мутация» сплошь и рядом применяют к его результату, то есть к аллелю, в результате мутации возникшему. Говорят: «В опыте участвуют дрозофилы - носители мутации white ». Никто не регистрировал само мутационное событие, приведшее к возникновению этой классической мутации – оно, кстати, связано со встройкой в ген фермента мобильного генетического элемента copia , который перемещается исключительно редко – но все продолжают говорить «мутация» вместо «мутантный аллель». Подразумевается, что некогда произошла мутация, испортившая нормальный аллель, в результате чего возник мутантный. Нетрудно понять, что «мутантный аллель» – также антоним выражения «аллель дикого типа», но более широкий, чем «нуль-аллель», так как допускает различные отклонения от аллеля дикого типа, как приводящие к полной потере молекулярной функции (те самые «несколько отсутствий»!), так и не приводящие.

Есть еще одна весьма скверная терминологическая ситуация, с которой некоторым из вас предстоит столкнуться в генетике человека. Как мы еще убедимся, генетика человека вообще терминологически довольно сильно уклонилась от общей генетики. Причина в том, что, с одной стороны, эта специализированная область науки принадлежит одновременно биологии и медицине и чисто институционально изолирована от всей прочей генетики, и в этом смысле она варится в собственном соку. С другой стороны, в силу практической значимости, эта область весьма велика по объему – количеству исследователей и проводимых ими исследований, журналов, статей - что делает ее внутренние традиции устойчивыми к влияниям извне, в том числе со стороны «материнской» общей генетики. Современная генетика человека продвинулась настолько далеко, что во многих случаях реализовала вековечную мечту генетиков, а именно оказалась способна связать те или иные признаки (в том числе патологические) с нахождением определенных нуклеотидов в конкретных позициях конкретных генов. Но именно здесь и произошла досадная терминологическая подмена. Когда мы сравниваем множество аллелей в отношении первичной структуры ДНК, то оказывается, что в некоторых позициях всегда находится один и тот же определенный нуклеотид, а в каких-то позициях возможны нуклеотидные замены. (Есть подозрение, что в геномах всех людей человечества можно найти любой нуклеотид в любой позиции, что ставит забавный философский вопрос – что же такое есть геном человека). Они совершенно корректно были названы полиморфными позициями - и действительно, каждая такая позиция проявляет альтернативную изменчивость – то есть полиморфизм - в отношении того, каким из четырех нуклеотидов она может быть занята. Но вот здесь каким то образом произошла подмена понятий. «Полиморфизмом» стали называть конкретный нуклеотид в конкретной полиморфной позиции (то, что следовало бы назвать «морфой»). Стали говорить примерно так: «Просеквенировали такой то ген у стольки-то людей и нашли двенадцать полиморфизмов, два в позиции такой-то, шесть в такой-то и четыре в такой-то. Два из полиморфизмов в такой-то позиции показали достоверную связь с синдромом таким-то.» Скорее всего, такая подмена произошла на уровне лабораторного сленга, который существует в любой научной работе и состоит в упрощении терминологии, зачастую неграмотном. Студенты, приходящие в лабораторию, иногда принимают сленг за терминологию и начинают пользоваться им на полном серьезе. В какой-то момент случается, что и автор статьи, и рецензенты в научном журнале привыкли к одинаковому сленгу, тогда он проникает в научную печать и с какой-то вероятностью закрепляется. (Картина, кстати, более чем знакомая из популяционной генетики и полностью копирующая процесс видообразования – когда в изолированной популяции случайно возникают, совпадают у разных полов и фиксируются аномалии системы распознования подходящих половых партнеров, которые становятся нормой у нового вида и приводят к его нескрещиваемости со старым.) Кроме этимологического противоречия (одна единственная морфа называется словом, указывающим на то, что морф много) и дурного вкуса такая подмена имеет и то следствие, что употребляющие этот жаргон исследователи лишили себя термина «полиморфизм» в его правильном значении. И когда возникает необходимость выразить соответствующее понятие (которое никуда не делось), вместо однозначного термина им приходится прибегать к многословным описаниям. Допустим, в ситуациях, для которых существует термин «сбалансированный полиморфизм» - когда одна из морф имеет преимущество в одних условиях, другая – в других, поэтому они сосуществуют и не вытесняют одна другую – им всякий раз приходится прибегать к длинным описаниям, подобным приведенному.

В плане введения вас в традиционную и не всегда последовательную генетическую терминологию необходимо упомянуть довольно забавный термин маркер . Этот термин введен для локусов, которые важны нам не сами по себе, а постольку, поскольку они маркируют определенный район хромосомы. Появление такого термина было связано с длительным периодом времени, когда генетических локусов было известно не очень много. Он был нужен в ситуациях, когда нужно было поставить на карту только что открытый ген либо же, как это ни парадоксально звучит, работать с еще не открытыми генами. Допустим, природа генов, контролирующих хозяйственно-ценные количественные признаки растений и животных долгое время была неизвестна совершенно, да и сейчас о них известно немного. В то же время, не вызывало сомнений, что эти гены существуют и расположены в хромосомах. Манипулируя с известными локусами – маркерами – можно было выявить районы хромосом, с которыми связаны определенные эффекты на количественные признаки, и воспользоваться ими в селекционной работе. Первоначально это были в основном «видимые маркеры» – локусы, в которых имелись аллели с видимым эффектом. Однако в дальнейшем этот подход получил серьезное развитие за счет вовлечение в генетический анализ биохимических признаков (как правило также не связанных функционально с хозяйственно-ценными признаками), а в дальнейшем за счет появления возможности работать с полиморфизмом самой ДНК хромосом. Это привело к появлению понятия «молекулярный маркер». Таким образом, термин «маркер» является всего лишь синонимом термина «локус», но подчеркивает, что этот локус интересует нас не как таковой, а лишь как ориентир на хромосоме. Однако к термину привыкли настолько, что он стал использоваться и в тех случаях, когда локус является непосредственно изучаемым объектом. Парадоксальным образом, в исследованиях по молекулярной филогении сами анализируемые последовательности также обычно называются маркерами. Здесь могло бы подразумевается, что они всего лишь являются ориентирами во времени и нуклеотидные замены в них маркируют эволюционные события, которые, конечно же, не сводятся к изменениям только лишь в анализируемых последовательностях.

Гены (точнее локусы) принято обозначать аббревиатурами , состоящими из латинских букв, а также цифр. Однако за этими обозначениями стоят полные названия генов, латинские или, чаще, английские. Как полные названия, так и сокращенные обозначения генов всегда записываются курсивом. Для генов с видимым проявлением это обычно слово, описывающее мутантный фенотип: w white (белые глаза у мухи), y yellow (желтое тело у мухи), a anthocyanin inhibition (у гороха), op ovula pistilloida (у гороха), bth bithorax – не очень удачное название мутации дрозофилы, у которой на заднегруди (метатораксе) появляется вторая пара крыльев (как на мезотораксе) – а написано, как если бы удвоилась грудная тагма. Есть даже мутация дрозофилы с официальным названием fushi tarazu (сокращенный символ - ftz ) - японским. Веселые американцы назвали один из генов mothers against decapentaplegic , по аналогии с организациями типа «матери против войны в Ираке» - у самок дрозофил, носителей этой мутации, не выживют потомки-носители гена decapentaplegic . Сокращенное обозначение этого гена звучит не хуже: mad . Изредка, и не у самых популярных объектов, официальное название гена и его сокращенное обозначение не имеют отношения друг к другу: мутация, превращающая усики гороха в листочки, имеет обозначение tl (от tendrilless ), а название – clavicula . Если ген известен по молекулярному продукту (белку или РНК), то и сам этот ген будет называться по своему продукту: mtTrnK mitochondrial transportation RNA for lysine , RbcL ribulose biphosphate carboxylase large subunit . Немаловажно, что у каждого вида существует совершенно независимая официальная номенклатура генных символов, что приводит к некоторым затруднениям в настоящее время, когда число объектов с развитой частной генетикой увеличилось, а количество объектов, у которых гены исследуются не путем генетических экспериментов, а прямым прочтением последовательностей ДНК – растет лавинообразно (например, уже действует проект «10 000 геномов позвоночных»).

Генетика начиналась со случаев, когда в каждом локусе было известно только два аллеля и можно было их различать путем написания с большой или маленькой буквы, начало чему положил еще Мендель. Большая буква применялась для доминантного аллеля (вы знаете что это означает со школы, в дальнейшем мы коснемся явления доминирования более подробно) - как правило это аллель дикого типа; как мы бы сейчас сказали - аллель с нормальной, не нарушенной молекулярной функцией. Локус при этом обозначался с маленькой буквы, то есть его обозначение совпадало с таковым рецессивного, то есть мутантного, нефункционального аллеля, потому что именно по существованию такого аллеля ученые впервые узнавали и о существовании локуса. В редких случаях, когда мутантный аллель оказывался доминантным, и он, и сам локус обозначались с большой буквы.

Когда, и очень скоро, выяснилось, что аллелей в локусе бывает много (сейчас мы знаем, что их очень много), были введены обозначения аллелей, которые пишутся в верхнем индексе после обозначения локусов. В качестве такого индекса для аллеля дикого типа часто применяется символ «+», иногда индекс отсутствует. Допустим, у самого первого известного локуса дрозофилы white (w ) аллель дикого типа обозначается w + , аллель, ответственный за белые глаза – w , а ответственный за абрикосовые – wa (полное название - white a pricot ).

Обращаю ваше внимание на то, что для традиционных генетических объектов с развитой частной генетикой, сейчас до сих пор сосуществуют разные традиции в написании обозначений локусов и их аллелей. На данный момент я обнаружил их три:

Локусы с видимым проявлением пишутся с маленькой либо с большой буквы в зависимости от того, по рецессивному или доминантному по отношению к дикому типу аллелю локус описан; и с большой буквы, если локус известен по молекулярной функции. При этом для локусов с видимым проявлением и доминированием сохраняется традиция писать рецессивные аллели с маленькой буквы, а доминантные – с большой. Такова генетическая номенклатура, например, у гороха и мыши. Например, локус гороха a , ответственный за окраску цветков имеет аллели A и a .

Как в предыдущем случае, но большая и маленькая буквы в обозначении локуса и его аллелей жестко фиксированы. Такая система применяется у дрозофилы. Здесь обозначения w и W относятся к совершенно разным локусам – white и Wrinkled . Аллель дикого типа здесь всегда обозначается индексом «+». (Любопытно, что генетики, занимающиеся дрозофилой и мышью, привыкшие к системе, принятой у своих объектов, обычно даже не подозревают о существовании другой системы обозначения локусов.)

Все буквы в обозначениях локусов всегда большие. Такая система сейчас применяется в генетике человека, и принята она достаточно недавно.

Те же самые обозначения аллелей используются и для обозначения фенотипов, но всегда без курсива. Так, если вы описываете результаты опыта, в котором наблюдали столько – то растений гороха с пурпурными цветками и столько-то - с белыми, и знаете, что белоцветковость в опыте связана с локусом a , то вы будете обозначать в таблице встречаемости пурпурноцветковые и белоцветковые растения буквами A и a, даже если вы не знаете их генотип. То же самое делается и в случае, если вы определяете присутствие электрофоретических вариантов какого-то изофермента: там соответствие фенотипа генотипу больше, но и оно не всегда однозначно.

1.4. Понятия «гомозигота», «гетерозигота», «гемизигота».

У каждого диплоидного организма каждая хромосома (кроме половых) представлена в двух экземплярах – гомологах, полученных от отца и матери соответственно. Каждый из гомологов имеет один и тот же набор локусов, и в каждом из гомологов каждый локус занят каким-то аллелем. Следовательно, каждый диплоидный организм несет два аллеля каждого локуса. При записи его генотипа обозначения имеющихся в интересующем нас локусе (локусах) двух аллелей пишутся подряд, например при наличии в локусе a у гороха аллелей A и a возможны три генотипа: A A , A a и a a .

Если в обоих гомологах локус представлен одним и тем же аллелем, то говорят, что особь гомозиготна по этому аллелю, или по этому локусу. Причем, когда говорят, что гомозиготна по локусу, упор делается на то, что в обоих гомологах нет различий по нему, когда же говорят, что гомозиготна по аллелю, упор делается на то, по какому именно аллелю. Если в обоих гомологах локус представлен разными аллелями, то особь гетерозиготна по данному локусу. Для простоты гомозиготную и гетерозиготную особь называют соответственно гомозиготой и гетерозиготой . Учитывая то, что говорилось выше об идентичности/различиях аллелей, истинные гомозиготы в природе встречаются не так уж часто. Однако в конкретном эксперименте никто не мешает отвлечься от различий, которые в этом эксперименте не выявляются или не могут быть выявлены, и считать гомозиготами особи, у которых обе копии локуса имеют идентичное фенотипическое проявление. В исследованиях, в которые вовлечены родственные особи, встречаются заведомые гомозиготы – особи, в которых оба аллеля какого-то локуса идентичны по происхождению. В таких исследованиях часто оперируют понятием средняя гетерозиготность – доля гетерозиготных локусов среди всех локусов.

Добавим еще термин гемизигота - это особь, у которой заведомо присутствует не два, а всего один аллель. Ну например вы наверняка знаете, что у мужчин есть всего одна половая Х-хромосома, а вторая половая хромосома, У-хромосома – ей не гомологична (за исключением небольших участков), так как не лишена большинства районов, насыщенных генетической информацией. Поэтому аллели из тех районов Х-хромосомы, которые не представлены в У-хромосоме, не имеют в ядре гомологов, то есть находятся в гемизиготе. Иногда хромосома теряет какой-то свой фрагмент вместе с находящимися в ней генами (или одним геном). В таком случае аллели этих генов в гомологичной хромосоме тоже оказываются в гемизиготе. Однако в генетическом эксперименте мы часто не знаем, что произошло в хромосомах, и судим о генах только по фенотипу. В таком случае отсутствие гена может не отличаться от его «поломки» - потери им своей функции. И пока мы не знаем, скажем так, молекулярной подоплеки, но каким-то образом заключаем, что молекулярная функция потеряна, мы будем говорить всего лишь об аллеле, или «нуль-аллеле».

Различать гомозиготу, гетерозиготу и гемизиготу бывает важно у диплоидных организмов, потому что доза соответствующего аллеля в геноме в этом случае различается вдвое (допустим, в случае локуса в Х-хромосоме две копии на геном у женщин и одна – у мужчин), что может быть важно. Молекулярная генетика обычно отвлекается от гомозиготности/ гетерозиготности своих объектов. Однако здесь часто привлекается понятие дозы гена , то есть количество аллелей с ненарушенной молекулярной функцией в геноме – обычно оно варьирует от 0 до 2, но может быть увеличено путем генной модификации, то есть искусственного внесения в геном дополнительных копий.

В случае гаплоидных организмов принято говорить, что у них вообще все аллели всех генов находятся в гемизиготе. Какие у нас есть гаплоидные организмы? Прокариоты, низшие грибы и аскомицеты, гаметофиты растений. Заметим одну деталь – гаплоиды – это не те, кто имеют строго один гаплоидный геномов в клетке. В большинстве бактериальных клеток имеется несколько нуклеоидов, которые еще не успели разделиться – но все они идентичны (с точностью до мутаций, возникших de novo). У низших грибов гифы часто вообще не подразделены на отдельные клетки. Важно то, что гаплоидный организм имеет в клетках единственный вариант гаплоидного генома. Наконец, у некоторых животных – например, перепончатокрылых – имеется гаплоидный пол – вы, наверное, знаете, что пчелиные трутни гаплоидны. При этом в соматических клетках набор хромосом удваивается, от чего они не перестают быть гаплоидами. Митохондрии и пластиды чаще наследуются только от матери, поэтому клетки гемизиготны по генам, находящимся в геномах этих органелл. Однако у многих растений пластиды иногда имеют двуродительское наследование, у других это случается изредка, крайне редко в зиготу проникают и отцовские митохондрии. В таких случаях потомство получает от обоих родителей некую варьирующую долю этих органелл, вовсе не обязательно равную 1/2. В таких случаях принято говорить о гетероплазмии .