«Вавилонская башня» для искусственного интеллекта

Помните историю про Вавилонскую башню (или – Вавилонское столпотворение) из Библии? После Всемирного потопа выжившие люди были одним народом, разговаривали на одном языке. В междуречье Тигра и Евфрата они основали город Вавилон и решили построить там башню, которая дотянулась бы до небес. Строить затеяли, что характерно, не из практических побуждений и не для наблюдений за звездами, а, чтобы «сделать себе имя». А далее Бог разгневался на людей за гордыню, сделал так, что все они заговорили на разных языках, строительство из-за этого не задалось и башня рухнула, так и не достав до неба.

Эта всем известная история вспомнилась, когда прочитал про суперкомпьютер StarGate для искусственного интеллекта, который хотят построить Microsoft и OpenAI.

Почему именно эта история? Давайте разбираться. Для начала, что известно про этот проект. Как пишут в СМИ, ссылаясь на источник, близкий к главе OpenAI Сэму Альтману, речь идет о строительстве Центра обработки данных нового поколения с суперкомпьютером для искусственного интеллекта, которое оценивается в $100 млрд. А это, на минуточку, в сто раз дороже ряда наиболее крупных и мощных ЦОД на планете.

Впрочем, это еще не самая дорогая инициатива от Сэма Альтмана. В феврале он заявлял о намерении привлечь 7 (семь) триллионов долларов от инвесторов, включая правительство ОАЭ, чтобы совершить революцию в полупроводниковой промышленности и преодолеть дефицит микросхем, необходимый для развития ИИ. От названной суммы полезли глаза на лоб даже у самых смелых экспертов и вскоре Альтман объявил, что он таких цифр не называл, это все журналисты, мол, раздули.

Но почти сразу выступил одним из инициаторов нового мегапроекта – того самого StarGate. Заявлено, что он будет состоять из миллиона специальных LPU-чипов то ли от Nvidia, то ли от Groq, и обладать мощностью в 5 гигаватт, чтобы обеспечить необходимую фантастическую производительность.

И вот на этой стадии у здравомыслящих людей возникли первые вопросы, поскольку самая мощная на текущий момент атомная электростанция в США способна выдавать лишь 3.3 гигаватта. И они уже поделены между существующими потребителями. На что Альтман парирует: почему бы не построить рядам с ЦОД новую АЭС с необходимой мощностью генерации, которая и обеспечит его энергоснабжение. Более того, он предполагает построить всю инфраструктуру к 2028 году.

Причем, одним мега-ЦОД дело не должно ограничиваться, опыт, накопленный при его создании, Альтман и компаньоны намерены использовать для строительства еще десятка подобных дата-центров (хорошо, почти подобных, но несколько меньших по масштабу), дабы раз и навсегда закрепить за собой и Соединенными Штатами место лидера ИТ-технологий.

К перспективам собственно OpenAI как флагмана информационных технологий мы еще вернемся. А пока посмотрим, почему планы Альтмана вызвали скептические усмешки у представителей атомной отрасли.

Итак, согласно озвученным планам и срокам, за четыре года надо спроектировать и построить самую мощную АЭС в США, использующую не обычные реакторы, а маленькие модульные, которые вроде как легче в эксплуатации. Ради этого Microsoft и OpenAI вкладывают немалые средства в ядерные стартапы по типу Oklo и NuScale, а также инвестируют в разработку реактора термоядерного синтеза.

Но в настоящее время малые модульные реакторы существуют лишь на бумаге, а реактор термоядерного синтеза и вовсе лишь в теории. И за указанный срок, в самом оптимистичном сценарии, учитывая все необходимые протоколы и процедуры для новых технологических решений в области АЭС, разработчики модульных реакторов в лучшем случае успеют подготовить необходимую документацию для получения разрешения на строительство. Если очень повезет. Потому что в любой новой технологии при переходе к внедрению могут проявиться непредвиденные изъяны и проблемы.

Но даже если инвесторы решат строить АЭС по обкатанным ранее технологиям, это не снимает других проблем. Например, с топливом. Сегодня треть топлива Америка импортирует из России (санкциями в этой области даже не пугают), а остальной рынок поделили между собой несколько компаний, каждая из которых сделала свои топливные элементы незаменяемыми. И это не раз приводило к проблемам у АЭС при смене поставщика (особенно и покупателей из других стран – вспомним историю с Фукусимой). Так что, обеспечение топливом, да еще и не одной АЭС, а целой сети (напомню, в перспективе Microsoft и OpenAI хотят построитьь несколько аналогичных дата-центров) – само по себе непростая задача.

Далее – строительство. В принципе, оно (со всеми подготовительными и разрешительными процедурами) занимает лет пятнадцать. Могут ли в Штатах ускориться, если инвестиции будут щедрыми, вопрос спорный. За последние тридцать лет американские атомщики построили один новый энергоблок у себя и пять за рубежом. Причем, у заказчиков были постоянные технические проблемы на этих объектах. Китайцы, от души намучавшись, просто доработали построенную американцами станцию сами и после этого за заказами к ним не обращались. Согласитесь, это не очень похоже на могучую отрасль, которая сможет построить мощную АЭС в три раза быстрее обычного, были бы деньги. Скорее, такие темпы приведут к появлению новой «зоны отчуждения», но уже в американской пустыне.

В этом отношении больше опыта у Росатома, и в плане строительства АЭС по миру, и в плане разработки малых реакторов (для нужд Арктики). Но очевидно, что обратиться к российской госкорпорации американские ИТ-гиганты не могут по политическим причинам. Да и вряд ли наши атомщики взялись бы за заведомо невыполнимую задачу.

Кстати, кроме собственно АЭС есть и еще одна проблема в энергоснабжении будущего суперкомпьютера. Невозможно дата-центр подключить напрямую к нескольким тысячам вольт, производимых станцией, без постепенного понижения напряжения до 0.6 вольт, которые запитают миллионы чипов внутри него. Нужен сложный комплекс понижающих трансформаторов, которых тоже нет, в том числе, в проекте. На это слабое звено недавно обратил внимание Илон Маск, а он, что ни говори, знает толк в больших проектах.

Но вопросы у экспертов возникли не только к энергоснабжению для StarGate, но и по поводу перспектив и проблем, связанных с большими языковыми моделями. Последни два-три года мы переживаем настоящий бум в этой области, Nvidia заявляет о продаже чипов для различных разработчиков на сумму в 50 млрд долларов, а они на рынке не единственные. Они создают самые разные нейросети, генерирующие картинки, видео, тексты, даже музыку. А знаете, какую прибыль показали эти ИТ-компании? Пока что – три миллиарда долларов. В обычном бизнесе это назвали бы провалом, «айтишники» говорят о больших перспективах и необходимости привлечения еще больших инвестиций. Ранее похожую бизнес-стратегию демонстрировал, к слову, Мавроди.

Но может, скептики зря грешат на необоснованный оптимизм разработчиков и все будет, надо только подождать? Вот только, откуда ждать этих громадных прибылей. Самое близкое к чему подошёл GPT и ему подобные – помощник для кодинга (Copilot от GitHub). Мало того, что рынок таких помощников весьма ограничен, на нем действуют бесплатные специализированные языковые модели (CodeLLama, Qwen и др.), которые работают ничуть не хуже, а в некоторых вопросах даже лучше. У нейросетей, генерирующих картинки, абсолютно та же история. Кто будет оформлять подписку на MidJourney при наличии как бесплатного Stable Diffusion, так и возможности бесконечно оформлять пробный период с разных аккаунтов. В результате, приходится признать, что за два года не была найдена достойная финансовая модель для монетизации нейросетей.

Зато выяснилось, что результат их работы ненадежный. Нейросети ошибаются в деталях на рисунках, придумывают несуществующие в реальности источники информации для якобы аналитических текстов и так далее. Это породило дискуссию о доверительном искусственном интеллекте, в которую активно вовлечены и ученые Академгородка. Действительно, как мы можем доверить нейросети обработку снимков МРТ у реального пациента или мониторинг состояния фундамента здания, если нет уверенности, что она не «выдумает» часть информации для более убедительного обоснования результата? На сегодня нет надежного способа научить нейросеть честности и ответственности (да и гуманности), и это остается одним из главных барьеров для внедрения. Сможет решить ее строительство гигантского дата-центра в американской пустыне? Вряд ли.

Но все развитие ИТ-индустрии в этой области строится как раз на почти религиозной вере в то, что эти проблемы как-то сами собой разрешатся. Да-да, надо только подождать. А пока построить мега-дата-центр, которому нет аналогов на планете. А лучше, десять центров и все будет прекрасно, всем все будет «в кайф» и нам совсем не надо будет умирать.

В Библии не сказано, что стало с инвесторами Вавилонского столпотворения, но куда делись капиталы вкладчиков финансовых пирамид конца прошлого и начала этого века мы прекрасно помним. И есть такое ощущение, что с пустынными дата-центрами тоже не «взлетит», а нейросети, пережив некий бум, превратятся в очередной инструмент, со своими «плюсами» и ограничениями. Ведь не ждем же мы чудес от соцсетей или смартфонов.

Сергей Исаев