Локомотив новой Научной Революции

В свое время знаменитый ученый Блез Паскаль поведал о том чувстве ужаса, который испытывает исследователь, созерцая безграничность макро и микромира. Глядя в телескоп, вы видите мириады звезд в бесконечном пространстве Вселенной. И такую же бесконечную Вселенную вы обнаруживаете, садясь за микроскоп или размышляя о строении вещества. Человеческий разум просто теряется перед этой бездной умопомрачительных данных, воспринимая себя песчинкой в огромном океане. И, тем не менее, эту бездну пытаются постичь на протяжении нескольких столетий, с каждым разом открывая всё новые и новые глубины.

В наши дни – благодаря популяризации астрофизики и физики элементарных частиц – об этих бескрайних макро и микромирах уже хорошо известно широкой публике. Об этом написаны сотни научно-популярных книг и тысячи статей. Однако не только физики открывают перед нами бездонные глубины Природы. Параллельно свою безграничную микро-вселенную пытаются постичь биологи, проникая в тайны живой материи. И как уже предсказывают специалисты в области теории познания, именно биология начинает претендовать на роль локомотива новой Научной Революции. И даже более того – она заявляет о себе как движущая сила научно-технического прогресса, выходящего на более высокий качественный уровень, где тон будут задавать технологии искусственного интеллекта.

Какая на самом деле связь между искусственным интеллектом и наукой о жизни, точнее, о той ее части, где происходит исследование клеточных структур и молекул? Именно здесь перед учеными открывается упомянутая микро-вселенная, которую не только нельзя увидеть невооруженным глазом, но в последнее время уже невозможно постичь обычными средствами из-за гигантского массива данных. Для этих целей наука остро нуждается в принципиально новом высокотехнологичном инструментарии. Таким инструментарием как раз и становятся технологии искусственного интеллекта.

Предпосылки к указанному развитию событий складывались давно, однако реальный прорыв свершился уже в нашем столетии. Как сказал по этому поводу научный руководитель Института цитологии и генетики СО РАН академик Николай Колчанов, за последние пятнадцать лет произошел реальный информационный взрыв в области генетических исследований. По словам ученого, генетика стала одним из важнейших источников больших данных в мировой науке, обогнав в этом плане все остальные научные дисциплины и технологии по темпам накопления информации. Здесь уже сложился целый комплекс экспериментальных дисциплин, относящихся к так называемым «омиксным» технологиям – геномика, протеомика, транскриптомика, метаболомика и так далее (таковых в наше время насчитывается более десятка). Фактически, пятнадцать лет назад в науке началась эпоха «больших генетических данных», в результате чего сформировалась принципиально новая парадигма. В рамках этой парадигмы, отметил Николай Колчанов, объектами исследований выступают не отдельные гены, а целые ГЕННЫЕ СЕТИ. Они представляют собой группы координированно функционирующих генов, взаимодействующих друг с другом через свои продукты – такие, как РНК, метаболиты и другие молекулы. К числу основных компонентов генных сетей относятся также пути передачи сигналов.

В этой связи серьезной проблемой для ученых становится реконструкция генных сетей. По признанию Николая Колчанова, это очень сложная задача, требующая кропотливого поиска и извлечения информации, рассеянной среди десятков миллионов научных статей, тысяч фотографических баз данных и миллионов патентов, содержащих биологические, медицинские, фармакологические, химические и другие знания. Как раз решение этой задачи потребовало разработки компьютерных программных систем, использующих комбинацию методов традиционного анализа текстов и методов машинного обучения – в целях автоматического извлечения генетических знаний из упомянутых источников.

Такая система не так давно была разработана специалистами ИЦиГ СО РАН. Она представляет собой компьютерную систему, предназначенную для реконструкции целых сетей знаний и фактов, включая и генные сети. Данная система опирается на мощные словари и методы семантического анализа. Она содержит 15 тысяч специально разработанных семантических шаблонов, включает в себя описание 36 миллионов генов и сотен тысяч клеток, белков, метаболических путей, а также огромное количество другой информации. Причем, дело не стоит на месте. За прошедший год был разработана новая версия этой системы, использующая комплексный подход, сочетающий традиционные методы анализа текста (основанный на словарях и шаблонах) с методами глубокого машинного обучения, куда включается особый класс систем искусственного интеллекта, основанного на архитектуре нейронных сетей.

Конечно, оценить сугубо научное значение подобных методологических инноваций могут только специалисты. Однако даже стороннему наблюдателю становится понятна роль современных биологических наук, проникающих сейчас в самые глубинные пласты живой материи, в деле развития ИИ на текущем этапе.

Как мы понимаем, фундаментальная «цифровизация» биологии – общемировой тренд, определяющий, по большому счету, научно-технический прогресс. По сути, мы становимся свидетелями серьезных трансформаций в организации исследований, когда новые знания и прорывные технологии рождаются на стыке научных дисциплин при участии передовых высоких технологий. Отсюда на первый план выходит вопрос междисциплинарного взаимодействия, когда, например, биологи реализуют задачи совместно с математиками, физиками и программистами.  По общему признанию ведущих ученых, как раз междисциплинарность является особенностью нынешнего этапа развития. В наше время все важные технологические решения обнаруживаются на стыке фундаментальной математики и биологии. Именно здесь, полагают ученые, лежат корни прорывных технологий, которые остро нужны как нашей стране, так и дружественным нам странам.

Напомним, что в конце июня этого года в России состоялся Всемирный конгресс «Теория систем, алгебраическая биология, искусственный интеллект: математические основы и приложения». В организации мероприятия принимали участие Российская академия наук, Академия наук Китая, Индийская национальная академия наук, а также национальные академии ряда стран СНГ. Как подчеркивали российские участники, в нынешних геополитических условиях нашей стране необходимо добиться безусловного лидерства в области искусственного интеллекта. В этой связи совсем не удивительно, что на одной площадке собрались представители разных наук – биологи, математики, физики и даже философы. Однако их научное общение происходило под единым знаменателем – вопросами создания передовых технологий искусственного интеллекта, без которых наше дальнейшее развитие просто невозможно. Это обстоятельство, кстати, хорошо осознают у нас на самом верху. Иначе говоря, руководство страны дает ученым «зеленый свет», обещая государственную поддержку данного направления.

Необходимо отметить, что ИЦиГ СО РАН также принял активное участие в организации и проведении мероприятия. Так, в рамках Конгресса была создана отдельная Секция «Системная биология, логика и искусственный интеллект», в которой также приняли участие зарубежные гости. Важно иметь в виду, что для ИЦиГ СО РАН освещение указанной тематики происходит уже не первый год. Научные конференции международного уровня по системной биологии происходят на данной площадке регулярно, в чем отражается специфика самой деятельности этой научной организации. Надо сказать, что «цифровизацией» биологии здесь занимались уже тогда, когда это еще не было общепризнанным трендом, а на генетику некоторые «ответственные товарищи» продолжали смотреть с предубеждением. Тем не менее, жизнь показала, что путь был выбран верный. И сегодня мы можем надеяться на то, что накопленный в стенах Института интеллектуальный потенциал найдет серьезное применение. Причем не только в теории, но и на практике.  

Николай Нестеров