Machine learning и ДНК

В ФИЦ «Институт цитологии и генетики СО РАН» продолжают проходить мероприятия крупнейшей в Сибири 57-й Молодежной научной студенческой конференции (МНСК). Выступления участников подсекции «Цитология и генетика», о которых мы уже рассказывали, сменили доклады в рамках другой подсекции – «Биоинформатика».

Развитие этой относительно молодой научной дисциплины в нашей стране тесно связано с учеными ИЦиГ. Именно здесь (в сотрудничестве с коллегами из Института математики и Вычислительного центра) еще в советское время сложилась сильная школа математической биологии. А в 1998 году Институт цитологии и генетики СО РАН провел первую в России международную конференцию «Bioinformatics of Genome Regulation and Structure» («Биоинформатика геномной регуляции и структуры»).

Для подготовки специалистов по данному профилю в НГУ 16 лет назад была открыта кафедра Информационной биологии, которую возглавил академик РАН Н.А. Колчанов (в то время – зам. директора, затем директор, ныне научный руководитель ИЦиГ СО РАН). Студенты, занимающиеся на этой кафедре, традиционно являются «ядром» участников биоинформатической подсекции МНСК.

В этом году в программу вошли доклады по нескольким ключевым направлениям этой научной дисциплины. Ряд работ был выполнен в области классической биоинформатики – разработка алгоритмов обработки биологических данных: данных высокопроизводительного секвенирования, анализ биологических изображений, а также создание специализированного программного обеспечения. Последнему вопросу был посвящен, например, доклад Алексея Мухина «Разработка программного комплекса для WebMCOT для поиска совместно встречаемых ДНК-мотивов сайтов связывания транскрипционных факторов».

Достаточно большой блок докладов был посвящен компьютерному и математическому моделированию разнообразных биологических объектов. В своих работах участники строили модели ферментативных систем бактерий, микробных сообществ, распространения глухоты в популяциях человека и проч.

Относительно новым направлением для конференции стали работы по применению machine learning (машинного обучения), которое демонстрирует в настоящее время бурное развитие во всем мире. Полина Белокопытова в своем исследовании использовала этот метод для предсказания пространственных контактов хроматина. Обращались к machine learning и ряд других участников, что вызвало положительные оценки со стороны жюри.

Целый ряд работ был связан с использованием биоинформатических методов в исследованиях медицинского характера, с целью реконструкции механизмов возникновения и развития разных заболеваний человека.

Показательным, по мнению организаторов, стало расширение географии участников, показывающее распространение биоинформатики в российских вузах. Вот уже несколько лет на конференцию приезжают студенты Сибирского федерального университета (Красноярск). Их работы выполняются в рамках крупного проекта по изучению геномики хвойных пород деревьев. В этом году они, однако, вышли за его границы, заметно расширив тематику своих исследовательских работ.

Подвести итоги работы подсекции в целом мы попросили председателя ее оргкомитета, руководителя сектора компьютерного анализа и моделирования биологических систем ФИЦ ИЦиГ СО РАН, к.б.н. Сергея Лашина:

– В этом году было представлено много интересных докладов, которые отражают основные направления развития биоинформатики. И хотел бы отметить еще один важный момент. Сейчас доклады студентов выполняются на таком уровне, что еще лет десять назад, по объему результатов они вполне потянули бы на статью в хорошем научном журнале. Это говорит, во-первых, о том пути, который пройден в этом направлении (включая появление в свободном доступе более мощных программных инструментов и технологий). А во-вторых, о том, что в наших учебных заведениях дают подготовку на уровне, достаточном, чтобы молодежь могла результативно использовать эти научные и технологические достижения в своей работе.

Пресс-служба ФИЦ «Институт цитологии и генетики СО РАН»