В последние годы в биологии заметно возрос объем данных, получаемых в ходе исследовательской работы, причем речь идет о весьма разнородной информации. Естественно, что это порождает новые подходы к работе с этими массивами информации, которые с полным правом можно назвать Big data.
Долгое время в системной биологии при изучении живых систем преобладал редукционистский подход: строились отдельные модели биохимических реакций, отдельные модели взаимной регуляции работы генов и т.д. То есть система рассматривалась на отдельных уровнях биологической организации. Но еще в прошлом веке была сформирована концепция описания клеток в виде молекулярно-генетических систем. Отметим, что в ИЦиГ ещё в 60-70-х годах прошлого века профессором В.А. Ратнером была предложена расширенная концепция «молекулярно-генетических систем управления», развитая затем научной школой академика Н.А. Колчанова до теории «генных сетей». Эта концепция подразумевает, что гены очень тесно взаимодействуют между собой, образуя сети, причём именно генные сети, а не отдельные гены контролируют фенотипические признаки организмов и их метаболические системы, реализуя информацию, закодированную в геноме. А потому все уровни биологической организации – отдельные «слои» процессов, происходящих внутри клетки, – надо рассматривать взаимосвязанно, что и является предметом исследований современной системной биологии и биоинформатики, работы по которым ведутся и в ИЦиГ.
– Такой подход позволяет извлекать новую информацию даже из ранее изученных по отдельности данных, – отмечает ведущий научный сотрудник сектора компьютерного анализа и моделирования биологических систем, к.б.н. Сергей Лашин. – Когда мы связываем эти данные послойно на едином «остове» генной сети, взаимосвязь различных процессов в клетке, которые часто изучали независимые группы ученых, становится заметной и доступной для дальнейшего анализа.
Естественно, что для такой исследовательской работы требуется специфический инструментарий (программное обеспечение), его созданием и занимаются новосибирские ученые. За основу взяли бурно развивающуюся и популярную у биологов систему по анализу биологических сетей Cytoscape, которая считается стандартом для работы с различными биологическими сетями.
– Мы создали компьютерную программу для анализа генных сетей на основе эволюционных характеристик генов. И когда просмотрели Cytoscape-приложения, предназначенные для эволюционного анализа генных сетей, то с удивлением обнаружили, что наша работа оказалась первой, – рассказал аспирант сектора компьютерного анализа и моделирования биологических систем ИЦиГ Захар Мустафин.
Что же подразумевается под эволюционными характеристиками генов? Сравнивая геномы различных организмов (а их с каждым годом становится все больше), ученые отслеживают родственные гены (схожие по строению, но с возможными различиями по функциям) и сопоставляют их роль в генных сетях. Такое сопоставление родственных генов в геномах различных организмов позволяет отследить момент в эволюционной истории живых организмов, когда эти гены возникли, т.е. определить возраст гена.
– Подобный анализ в масштабе генных сетей первыми применили мы, – подчеркнул Сергей Лашин. – Причем, мы использовали его для изучения как макроэволюционных (возраст гена), так и микроэволюционных (индекс отбора или интенсивность мутаций у современных организмов) характеристик генов.
Возраст гена показывает, на какой стадии эволюции («ветви таксономического дерева») возник тот или иной ген: одни гены-гомологи встречаются только у высших приматов, другие – у всех млекопитающих, третьи – вообще у всех клеточных организмов и т.д. Для изучения индекса отбора берут гены только близкородственных организмов (например, человека и человекообразных обезьян) и смотрят, как именно в ходе эволюции изменились одни и те же гены, их функции и роль в генных сетях.
Новую систему уже успешно «обкатывают» несколько групп исследователей.
В частности, с её помощью оценили «эволюционный возраст» болезней, связанных с теми или иными генными сетями (таких известно более семидесяти). Оказалось, в развитии алкоголизма и никотиновой зависимости участвуют довольно древние гены, которые появились около 410 млн лет назад (что соответствует времени возникновения насекомых).
А вот в патогенезе астмы и ряда других автоиммунных заболеваний задействованы гены, большая часть из которых появились либо около 160 млн лет назад, одновременно с возникновением плацентарных млекопитающих, либо ещё позже, около 55 млн лет назад, с возникновением приматов.
В другом исследовании разработанная программа используется для создания более полной картины генетических механизмов, «запускающих» болезнь Паркинсона. И этими примерами область применения предложенной разработки, как в ИЦиГ, так и в других научных центрах, не ограничивается.
Тем временем сами разработчики заняты не только доработкой существующей программы, но и созданием новых ее модификаций, которые позволят осуществлять анализ генных сетей по другим параметрам. В перспективе эта работа может привести к созданию самостоятельной многослойной платформы, которая будет приспособлена для работы именно с генными сетями.
Георгий Батухтин
- Войдите или зарегистрируйтесь, чтобы отправлять комментарии