К «естественным» А, Т, Г, Ц добавились З, Б, С, П.
В классическом «алфавите», которым написана наша ДНК, — четыре нуклеотида: аденин (А), гуанин (Г), цитозин (Ц) и тимин (Т). В алфавите РНК символов больше: кроме урацила (У), заменяющего тимин, там встречаются неканонические нуклеотиды, но они появляются там после копирования, в результате дополнительных модификаций. Это, в частности, может означать, что ДНК-нуклеотидов тоже могло быть больше, если бы возникновение жизни пошло другим путем.
Предыдущие исследования показали, что нуклеотиды в составе ДНК не обязательно должны образовывать связи с противоположной цепью. Для устойчивости структуры достаточно, чтобы все пары нуклеотидов были одинакового размера, а связи между ними не имеют большого значения. Благодаря этому удалось увеличить генетический алфавит на два нуклеотида. Но если длинные участки ДНК состоят из таких не связанных между собой нуклеотидов, то цепи будут скользить друг относительно друга. Поэтому, чтобы сделать молекулу прочнее, новые буквы должны образовывать водородные связи подобно классическим парам.
Группа американских ученых смогла добавить в генетический алфавит четыре новых нуклеотида, о чем они сообщают в новом выпуске Science. Новые «буквы» являются производными классических нуклеотидов и зовутся З, Б, С и П. Они также образуют между собой комплементарные пары: З с П, а Б с С. Получившийся алфавит исследователи назвали японским словом «хатимодзи», что в переводе означает «восемь букв».
Восьмибуквенные молекулы хатимодзи-ДНК оказались похожи на классическую двойную спираль и по кристаллической структуре, и по устойчивости, и по температуре плавления (разъединения цепей). Более того, на базе такой ДНК удалось построить соответствующую РНК-копию, то есть природные ферменты легко подхватывают новые «буквы» и встраивают их в цепь.
Ученые также подтвердили, что новые нуклеотиды не встраиваются в РНК случайным образом, построив из хатимодзи-РНК аптамер — сложную структуру, которая умеет связывать другие вещества. Тестовый аптамер связался со светящимся белком и засветился сам. Это говорит о точности копирования ДНК: если бы при построении ДНК нуклеотиды встраивались в цепь случайно, структура РНК не сформировалась бы и не смогла бы удержать краситель.
Расширение генетического алфавита не говорит нам ничего о прошлом ДНК, кроме того, что на месте АТГЦ могли бы быть другие буквы, зато значит немало для ее будущего. Нетрудно подсчитать, что восьмибуквенный код гораздо более емкий, чем четырехбуквенный. Поэтому, например, развивающаяся технология хранения информация в ДНК может получить дополнительный импульс.