Система CRISPR-Cas защищает бактерии и археи от вирусов и других генетических паразитов. Ее работа основана на том, что фрагменты ДНК паразитов вставляются в геном хозяйской клетки и затем используются как образцы для поиска и уничтожения молекул ДНК или РНК с такой же нуклеотидной последовательностью. Американские биологи обнаружили, что некоторые мобильные генетические элементы (транспозоны) присвоили бактериальную систему CRISPR-Cas и научились ее использовать в собственных интересах. С ее помощью транспозоны находят определенные места в чужой ДНК, чтобы встроиться в них. Исследование открыло перед генной инженерией новые заманчивые перспективы, показав общий принцип, на основе которого можно разработать методы аккуратного встраивания фрагментов ДНК в точно определенные места генома.
Рис. 1. Нитчатая цианобактерия Scytonema hofmanni, в геноме которой найден транспозон, «присвоивший» бактериальную систему CRISPR. Внизу показана структура транспозона. Он состоит из концевых последовательностей (RE, LE), по которым транспозаза (transposase) узнает свой транспозон, генов трех субъединиц транспозазы (tnsB, tnsC, tniQ), системы CRISPR (Cas12k, tracrRNA, CRISPR array), а также набора дополнительных генов, не связанных с перемещениями транспозона (cargo genes). Эти гены могут быть более или менее любыми: например, они могут защищать хозяйскую клетку от токсинов или давать ей другие преимущества. Длина масштабных отрезков — 40 мкм.
Изучение системы CRISPR-Cas имеет огромное практическое значение, потому что на ее основе можно создавать эффективные методы редактирования геномов и регуляции работы генов. Модифицируя систему CRISPR и дополняя ее новыми компонентами, биологи уже разработали методы, позволяющие резать молекулы ДНК и РНК в заданных местах и блокировать работу тех или иных генов (см.: CRISPR interference). Обычно для этого используют комплекс из белка Cas9 и специально изготовленной молекулы РНК — «единой гидовой РНК» (single guide RNA, sgRNA). Она состоит из двух частей, которые у прокариот существуют как две отдельные молекулы (tracrRNA и crRNA), но для решения генно-инженерных задач их удобнее объединять в одну. Та часть sgRNA, которая соответствует crRNA, содержит спейсер — участок, служащий образцом для поиска (специалисты по CRISPR выработали чудовищный жаргон, на котором они общаются, и с этим, по-видимому, уже ничего не поделаешь: приходится выучивать эти корявые названия и аббревиатуры, ни о чем на самом деле не говорящие, кроме мало кому известных обстоятельств открытия соответствующих объектов). Другая часть sgRNA, соответствующая tracRNA, нужна для прикрепления crRNA к белку Cas. Комплекс Cas-sgRNA находит в молекуле ДНК протоспейсер (участок с такой же последовательностью нуклеотидов, как у спейсера) и прикрепляется к нему. Чтобы система сработала, перед протоспейсером должна находиться короткая последовательность нуклеотидов, которая называется PAM (Protospacer adjacent motif). Это — своеобразная предосторожность, благодаря которой система CRISPR не атакует саму себя. В локусе CRISPR закодированы спейсеры, но перед ними нет PAM, что и спасает бактерию от аутоиммунных проблем.
После прикрепления белков Cas к протоспейсеру возможно несколько сценариев. Если используется обычный белок Cas9 «дикого типа», то он просто разрезает молекулу ДНК в определенном месте, через три нуклеотида после протоспейсера. Так бактерии защищаются от паразитической ДНК.
В генной инженерии широко используются модифицированные версии Cas9, которые либо вообще не режут ДНК, либо разрезают только одну из нитей двойной спирали. Присоединяя к модифицированному Cas9 другие белки, в том числе выведенные с помощью искусственной эволюции, ученым удалось изготовить молекулярные конструкции, способные производить точечные замены нуклеотидов.
Несмотря на впечатляющие успехи, на сегодняшний день искусственные молекулярные системы, основанные на CRISPR, умеют выполнять далеко не любые манипуляции с геномами. Особенно трудной оказалась задача точного встраивания фрагментов ДНК в указанное место генома. Те подходы, которые удалось пока разработать, основаны на использовании имеющихся в клетке систем репарации (починки) разрывов ДНК. Идея в том, что Cas9 разрезает ДНК в указанном месте, системы репарации пытаются залатать разрыв, и тут в их работу вмешиваются изготовленные учеными молекулярные конструкции, пытающиеся сбить системы репарации с толку и заставить их встроить в репарируемый участок нужную последовательность нуклеотидов. Но эти технологии пока далеки от совершенства, а их эффективность сильно зависит от типа клетки и от нюансов устройства ее репарационных систем.
Статья американских биологов, опубликованная в начале июня в журнале Science, открывает новый путь к решению этой задачи. Суть открытия в том, что некоторые геномные паразиты, как выяснилось, в ходе эволюции позаимствовали у своих хозяев систему CRISPR и научились ее использовать для точного встраивания собственных копий в определенные места чужих геномов. Ученым теперь не нужно изобретать сложную молекулярную конструкцию с нуля: эволюция уже это сделала, и можно просто позаимствовать у геномных паразитов их «ноу-хау».
В 2017 году коллектив американских исследователей, в состав которого входят известные биологи российского происхождения Евгений Кунин и Кира Макарова, обнаружил, что транспозоны определенного типа (Tn7-like transposons), встречающиеся в бактериальных геномах, часто содержат тот или иной упрощенный вариант бактериальной системы CRISPR-Cas. Эти упрощенные варианты, судя по их нуклеотидным последовательностям, не умеют разрезать ДНК, но вполне способны находить протоспейсер и прикрепляться к нему. Филогенетический анализ показал, что Tn7-подобные транспозоны в ходе эволюции независимо приобретали систему CRISPR-Cas, заимствуя ее у бактерий, не менее трех раз. Некоторые спейсеры, имеющиеся у транспозонов в их системах CRISPR, совпадают с фрагментами плазмид и других транспозонов. На основе этих данных авторы предположили, что транспозонам удалось приспособить заимствованную у бактерий систему CRISPR для встраивания самих себя в геномы других геномных паразитов. Возможно, это помогает транспозонам эффективно распространяться.
До сих пор это была только гипотеза, хотя и очень правдоподобная и заманчивая. Альтернативное объяснение могло состоять в том, что система CRISPR, кодируемая транспозоном, входит в состав так называемых “cargo genes”, то есть генов, которые транспозон таскает с собой, но сам не использует (рис. 1). Такие гены могут быть чем-то полезны бактерии-хозяину, и поэтому транспозону выгодно их иметь. Они дают преимущество бактериям, зараженным транспозоном, что косвенно способствует размножению самого транспозона.
В своем новом исследовании Макарова, Кунин и их коллеги экспериментально подтвердили гипотезу, высказанную два года назад, и показали, что система CRISPR-Cas, кодируемая Tn7-подобными транспозонами, действительно обеспечивает точное встраивание транспозона в определенные места чужой ДНК. С практической точки зрения важно, что система способна встроить не только сам транспозон, но и любой другой фрагмент ДНК (с какими-то ограничениями разве что по длине), заключенный между характерными для данного транспозона концевыми последовательностями LE и RE (рис. 1). Таким образом, систему можно перепрограммировать для встраивания того, что нужно, туда, куда мы пожелаем.
Авторы выбрали для детального изучения CRISPR-содержащие транспозоны цианобактерий Scytonema hofmanni и Anabaena cylindrica. На рис. 1 показана структура транспозона S. hofmanni. Для начала авторы убедились, что системы CRISPR, кодируемые транспозонами, живы и активны (об этом свидетельствует наличие в клетках соответствующих tracRNA и crRNA). Затем был проведен ключевой эксперимент, целью которого было выяснить, действительно ли эти системы обеспечивают встраивание транспозона около протоспейсера. Для этого ученые изготовили три плазмиды (см. схему эксперимента на рис. 2).
Первая плазмида, «плазмида-помощник» (pHelper), включает все компоненты предполагаемой системы «транспозиции, направляемой РНК» (RNA-guided transposition), а именно: гены компонентов транспозазы (tnsB, tnsC, tniQ), ген единственного белка Cas, который есть у изучаемых транспозонов (Cas12k), ген tracrRNA и ген crRNA со спейсером, который должен направить систему к искусственно синтезированному протоспейсеру (PSP1) с произвольной последовательностью нуклеотидов.
Вторая плазмида, «плазмида-донор» (pDonor), содержит последовательность, которая должна быть вырезана и встроена в указанное место. Эта последовательность представляет собой произвольный ген (в данном случае — ген устойчивости к канамицину), заключенный между LE и RE.
Третья плазмида, «плазмида-мишень» (pTarget), содержит протоспейсер PSP1. В плазмиду-мишень должен был встроиться кусок ДНК, обрамленный LE и RE, из плазмиды-донора. Здесь была сложность с последовательностью PAM, о которой говорилось выше и которая служит чем-то вроде пин-кода, который нужно указать правильно, чтобы система сработала. Авторы не знали, какой пин-код используется изучаемой системой. Ведь он не кодируется никакими спейсерами и определяется свойствами белков Cas, которые никто пока не умеет расшифровывать по аминокислотной последовательности этих белков. Поэтому ученые синтезировали много разных плазмид-мишеней со случайными шестинуклеотидными последовательностями перед протоспейсером.
Рис. 2. Схема главного эксперимента. Три искусственные плазмиды (pDonor, pTarget, pHelper) внедрили в клетки Escherichia coli (Transform E. coli). Спустя 16 часов из бактерий извлекли плазмидную ДНК (Extract plasmids). Секвенирование показало, что в некоторые плазмиды-мишени встроился ген kanR, заключенный между концевыми последовательностями LE и RE. Секвенирование также позволило понять, какая последовательность PAM нужна для работы системы, и на каком расстоянии (d) от PAM происходит встраивание. Прочие пояснения в тексте.
Все эти плазмиды внедрили в клетки кишечной палочки, подождали 16 часов, а потом извлекли из бактерий плазмидную ДНК и изучили ее. Секвенирование показало, что ген устойчивости к канамицину, заключенный между LE и RE, благополучно встроился в те плазмиды-мишени, у которых непосредственно перед протоспейсером находилась последовательность GTN (гуанин — тимин — любое основание). Таким образом, стало ясно, какая последовательность PAM нужна в данном случае. Кроме того, секвенирование показало, на каком расстоянии от PAM происходит встраивание. Это расстояние оказалось разным для двух транспозонов: 60–66 пар оснований (п. о.) для транспозона Scytonema hofmanni и 49–56 п.о. для транспозона Anabaena cylindrica. Различие — примерно на один оборот двойной спирали ДНК.
Многочисленные дополнительные эксперименты подтвердили, что всё работает именно так, как и было предсказано. Для успешного встраивания необходимо совпадение последовательностей спейсера и протоспейсера, последовательность GTN в роли PAM, наличие всех трех компонентов транспозазы (tnsB, tnsC, tniQ), Cas12k и tracrRNA. При этом последовательность нуклеотидов в самом месте встраивания не играет особой роли. Авторы соорудили из tracrRNA и crRNA единую sgRNA двумя разными способами, и оба сработали. Удалось выяснить и другие важные подробности, например, что у системы есть защита от множественных встраиваний: если на определенном расстоянии от протоспейсера есть LE и RE, то повторного встраивания транспозона в то же самое место не происходит. Длина встраиваемого фрагмента ДНК в исходной плазмиде-доноре составляла 2200 п. о. Оказалось, что можно с тем же успехом встраивать фрагменты длиной от 500 до 10 000 п. о. (более длинные и более короткие варианты не проверялись). Если заменить белок Cas12k на Cas9 (лишенный способности резать ДНК), то ничего не получается. Из этого следует, что функция Cas12k не сводится просто к нахождению протоспейсера и прикреплению к ДНК: это делает и Cas9, и этого недостаточно для встраивания транспозона. Вероятно, Cas12k как-то взаимодействует с транспозазой. Предполагаемый механизм работы системы показан на рис. 3.
Рис. 3. Предполагаемая схема работы системы транспозиции, направляемой РНК. Белок Cas12k держит молекулу РНК (sgRNA), часть которой соответствует мишени — протоспейсеру (target), перед которым должна находится PAM-последовательность GTN. Транспозаза (комплекс белков tnsB/tnsC/tniQ) держит транспозон, который она распознает по концевым участкам LE и RE. Транспозон в итоге встраивается в ДНК, отступя на 60–66 п. о. от PAM. При этом пять нуклеотидов, находящиеся непосредственно перед точкой встраивания (insertion site NNNNN), оказываются сдублированными после вставки (duplicated insertion site NNNNN). Это чисто техническая деталь, обусловленная способом разрезания ДНК-мишени транспозазой и помогающая убедиться, что транспозиция действительно произошла при помощи данного механизма, а не как-то иначе.
Затем авторы повторили весь эксперимент in vitro, то есть в просто в пробирке, без использования живых клеток E. coli. Это было сделано, чтобы убедиться, что для успешной «транспозиции, направляемой РНК» не требуются какие-либо дополнительные факторы, имеющиеся в клетках кишечной палочки. В пробирку добавляли четыре очищенных белка (tnsB, tnsC, tniQ, Cas12k), tracrRNA, crRNA (или объединенную sgRNA, что дает точно такой же результат) и две плазмиды: pDonor и pTarget. Оказалось, что в присутствии АТФ и ионов Mg2+ система отлично работает и без участия живых клеток: фрагменты ДНК из плазмид-доноров благополучно переместились в плазмиды-мишени.
В заключительной серии экспериментов авторы показали, что при помощи данной системы можно вставлять куски ДНК не только в специально изготовленные плазмиды, но и в произвольно выбранные места генома кишечной палочки. Для этого использовались «плазмиды-помощники» с генами sgRNA, нацеленными на 48 разных точек в геноме E. coli. Эти плазмиды внедряли в клетки вместе с плазмидами-донорами. Плазмиды-мишени в данном случае были не нужны, потому что мишени теперь находились в геноме бактерии.
ДНК из плазмиды-донора успешно встроилась в 29 точек из 48. Секвенирование показало, что примерно 50–60% встраиваний происходит точно в указанное место (рядом с протоспейсером), а остальные вставки осуществляются более или менее случайно — куда попало, вне зависимости от последовательности нуклеотидов в том месте, где полагалось бы быть протоспейсеру. С точки зрения адаптивной стратегии транспозона это логично: транспозону невыгодно ставить себе слишком жесткие ограничения при выборе места для вставки. Но генным инженерам, которые будут разрабатывать на этой основе технологию точного встраивания фрагментов ДНК строго в выбранное место, придется помучиться, чтобы избавиться от вставок «мимо цели».
Еще одним недостатком новооткрытого механизма с точки зрения его практического использования является то, что вместе с нужным участком ДНК обязательно вставляются концевые фрагменты LE и RE. Впрочем, это не помешает использовать данный механизм для исправления испорченных мутациями генов — способом, показанным на рис. 4.
Рис. 4. Гипотетическая схема использования новооткрытого механизма для исправления испорченного мутацией гена. Идея в том, что в интрон, находящийся перед испорченным экзоном, вставляется фрагмент ДНК, содержащий исправленный экзон и все последующие. С гена, отредактированного таким способом, будут считываться исправленные транскрипты. Наличие у вставленного фрагмента концевых участков транспозона (LE и RE) не принесет вреда, потому что LE окажется в составе интрона и будет вырезан при сплайсинге, а RE находится после точки окончания транскрипции.
Авторы считают, что целенаправленный поиск в геномах прокариот позволит найти и другие варианты новооткрытой системы, из которых можно будет выбрать подходящие для разработки генно-инженерных технологий. Если же отвлечься от практического использования, то открытие интересно как пример удивительного зигзага коэволюции геномных паразитов и их хозяев. Мы видим, что паразиты позаимствовали у хозяев систему приобретенного иммунитета (оружие, направленное против подобных паразитов) и сумели приспособить ее для совершенно другой задачи — поиска места для встраивания в чужой геном. Это оказалось возможным благодаря блочно-модульному принципу организации системы CRISPR-Cas (как и других сложных молекулярных систем). Блок поиска участка ДНК с определенной последовательностью по образцу-РНК, входящий в систему CRISPR, можно отделить от всего остального и присоединить к другим белкам, чтобы получить хитроумные инструменты для редактирования геномов. Ученые, едва разобравшись в устройстве CRISPR, сразу это поняли и взялись за дело. А теперь выяснилось, что геномные паразиты «придумали» этот подход миллионы лет тому назад.
Источник: ЭЛЕМЕНТЫ БОЛЬШОЙ НАУКИ