Лучшее из двух миров: физика + ИИ

ТЕХНОЛОГИИ / НОЯБРЬ #8_2023
Беседовала Татьяна Кутузова / Иллюстрация: Кирилл ФИЛОНОВ
«НАЭ» продолжает исследовать возможности, открываемые искусственным интеллектом перед бизнесом и промышленностью. Доктор физико-­математических наук, директор Центра прикладного искусственного интеллекта Сколтеха Евгений Бурнаев рассказывает о технологиях, которые развивают в Центре, и о том, какие приложения на их основе уже помогают врачам, морякам и спасателям.
Евгений, расскажите, пожалуйста, о задачах Центра и о технологиях, которые вы разрабатываете и используете для приложений.

В Центре мы ведем фундаментальные исследования, связанные с искусственным интеллектом, развиваем собственные фреймворки и работаем с индустриальными заказчиками. Можно выделить три основных направления, на которых мы специализируемся, я расскажу о них подробнее.

Во-первых, это технологии, связанные с генеративными моделями на основе мультимодальных данных. Сейчас растет интерес к такого рода технологиям — ​например, мегапопулярный ChatGPT или приложения, позволяющие генерировать изображения по текстовому описанию. Конечно, для создания таких моделей, как ChatGPT, требуются огромные вычислительные мощности, которыми мы не располагаем. Но в нашем распоряжении есть неплохие вычислители, и мы проводим с их помощью фундаментальные исследования. Пока еще очень мало известно о том, почему эти методы работают и как можно улучшить их качество. Мы также решаем важные инженерные задачи, например, улучшаем качество различных изображений, снимков дистанционного зондирования, повышаем разрешение расчетов полей погоды и т. п. Кроме того, мы активно работаем над развитием методов, позволяющих дообучать предобученные большие генеративные модели, для того чтобы они смогли решать конкретные задачи — ​такие модели используются в индустриальных сервисах.

Второе направление — ​Data Fusion, консолидация мультимодальных и разноточных данных. Эта технология позволяет объединять и одновременно обрабатывать различные данные, например, спутниковые снимки, снимки с БПЛА, информацию с сенсоров. Это важно для сельского хозяйства, оценки углеродного баланса, прогнозирования пожаров, предупреждения чрезвычайных ситуаций и оценки их последствий.

Третье направление — ​физически информированное машинное обучение, другими словами — ​машинное обучение с учетом физических моделей. Физические модели, такие как уравнение теплопроводности, не всегда точно описывают реальность, они основаны на приближениях. Для уточнения прогнозов на основе физических моделей нужны модели на основе искусственного интеллекта. Мы строим модель на одних принципах и встраиваем в нее модели, построенные на основе других принципов. В результате точность прогноза может увеличиться в разы, возрастает и скорость вычислений.

На самом деле технологий больше, так как прикладные задачи шире. У нас также развиваются подходы к автоматизации машинного обучения. Мы используем автоматический поиск нейросетевых архитектур — ​и Data Scientist не приходится выбирать из огромного числа вариантов подходящую модель.

Как можно использовать эти технологии на практике?

Машинное обучение, искусственный интеллект — ​это прикладные дисциплины, они не могут обходиться без конкретных кейсов. Приложения позволяют протестировать границы применимости того или иного метода, а также понять, в каком направлении должно идти дальнейшее развитие фундаментальных основ.

Допустим, мы решили три прикладные задачи и на их основе вывели общий метод решения — ​в дальнейшем он будет использоваться для решения аналогичных задач.

Иногда компании сами формулируют запросы для нас, и мы ищем их решение. Но чаще инициатива исходит от нас. Мы компетентны в конкретных технологиях, поэтому ищем такие приложения, которые, с одной стороны, востребованы и приносят деньги, с другой — ​являются сложными и интересными задачами, которые заказчик не может решить самостоятельно.

Приведите, пожалуйста, примеры конкретных задач.

Мы достигли высокой точности в прогнозировании вероятности возникновения лесных пожаров.

Сейчас мы находимся на этапе внедрения этого решения в контур МЧС. По внутренним данным МЧС мы прогнозируем риск возникновения пожара на несколько дней вперед в заданном регионе, с учетом прогноза погоды, ландшафта местности, информации о типах подстилающей растительности и так далее. Наш прогноз помогает МЧС оптимизировать работу, эффективно распределять силы и средства.

Мы используем базовую технологию, связанную с Data Fusion, то есть консолидируем разные типы пространственных данных. Для этого мы разрабатываем платформу, в которую в качестве инструментов встроены технологии:

  • для создания генеративных моделей;
  • для консолидации мультимодальных данных;
  • для физически информированного машинного обучения.

С целью получения прогнозов вероятности возникновения пожаров и других рисков на этой платформе запускается обучение моделей ИИ. Прогнозы, выдаваемые обученными моделями, представляют собой пространственные данные, которые можно на этой платформе визуализировать.

Мы прогнозируем ледовую обстановку на Северном морском пути. Качественный прогноз ледовой обстановки нужен капитанам грузовых судов, для того чтобы оптимизировать логистику. Мы предоставляем такие прогнозы на 72 часа вперед, обновляя их каждые шесть часов.

Для того чтобы получить прогноз, нужно, с одной стороны, смоделировать физические процессы: океан, атмосферу, взаимодействие с ними льдов и солнечной радиации; всё это — ​на основе специализированных гидродинамических моделей. С другой стороны, необходимо учитывать данные оперативных наблюдений с буев, судов, данные дистанционного зондирования (концентрацию льда на определенном участке) и другие важные характеристики. Таким образом мы можем прогнозировать движение льдов на основе модели гидродинамики, уточняя прогноз с помощью искусственного интеллекта, насыщая его информацией из данных оперативных наблюдений. Фактически при решении этой прикладной задачи для СМП мы используем все три ключевые технологии, о которых я рассказал.

Также мы прогнозируем распространение загрязнения воздуха. Сотрудничаем с индустриальными компаниями. Они предоставляют нам данные с датчиков, измеряющих концентрацию загрязняющих веществ. С учетом погоды мы ­прогнозируем распространение шлейфа загрязнений.

Можно решать и обратную задачу — ​на основе измерения концентрации загрязняющих веществ определить, где располагается источник загрязнения. Такие расчеты очень интересны предприятиям: можно доказать, что источник загрязнения — ​не они.

Одно из наших подразделений занимается прогнозированием долгосрочных физических рисков — ​засух, ураганных ветров и так далее. Такой прогноз важен для ряда регионов России. Допустим, в сельскохозяйственном регионе важно знать риск возникновения засухи на ближайшие пять лет.
Объясните, пожалуйста, как можно спрогнозировать риск на столь отдаленную перспективу. Пять лет — ​это же огромный срок.

Предположим, нам нужно оценить риск таяния многолетней мерзлоты. Для этого потребуется модель теплопроводности, которая по данным о промерзании почвы спрогнозирует этот процесс в целом. Затем к этой модели с помощью машинного обучения мы добавляем уточнения: климатический сценарий, другие внешние факторы. Грубо говоря, исходная модель задает некий тренд, а с помощью машинного обучения можно задать уточнение по данным непосредственных измерений. В результате можно оценить, в каких частях региона риск таяния будет повышенным. Знать такие риски очень важно, например, страховым организациям.

А как вы применяете технологии искусственного интеллекта в медицине?

Здесь, в первую очередь, мы развиваем направление, связанное с Data Fusion. Речь идет о консолидации сигналов и данных разного типа. Например, разница между такими биомедицинскими сигналами, как ЭЭГ, МРТ или фМРТ, заключается в способах сбора данных и разрешении. Дополнительно мы можем учесть информацию, полученную в результате геномного анализа биоматериала. Строим нейросеть, выделяющую определенные признаки, например, по данным МРТ или фМРТ. Эти признаки соединяем с признаками, выделенными из ЭЭГ или из геномного анализа биоматериала. Затем прогнозируем риск наличия ­какого-то заболевания, например, серьезных депрессивных расстройств. Или локализуем эпилептогенные зоны.

Для решения задач, связанных с анализом такого типа данных, мы сотрудничаем с ведущими лечебными учреждениями: клиниками им. Н. И. Пирогова, им. В. И. Кулакова и другими. Сотрудничаем и с зарубежными коллегами.

Медицинские приложения уже применяются на практике?

Вопрос внедрения медицинских приложений всегда непростой. Врачи тестируют наше приложение для визуализации и анализа выявления кортикальной дисплазии. Это локальное нарушение строения мозговой коры, приводящее к эпилепсии у детей. Такое нарушение нельзя вылечить лекарствами, но можно удалить пораженные участки хирургическим путем. В противном случае состояние пациента будет ухудшаться. Проблема в том, что снимки не всегда позволяют найти источник, он часто выглядит как небольшое локальное уплотнение. Нейросеть дает дополнительные рекомендации по поиску.

Выявить можно многие нарушения — ​вопрос в наличии данных и создании качественной модели для прогноза.

Как трансформировать идею в бизнес-­процесс? Можно ли, например, создать приложение для промысловых компаний, которое будет прогнозировать перемещения крупных косяков рыб?

Рыбным промыслом мы еще не занимались, но я готов поразмышлять на эту тему. Для начала нужно проанализировать погоду в акватории, поведение океана — всё это влияет на развитие и перераспределение биомасс, планктона. Есть модели, описывающие, как в этой акватории развиваются те или иные породы рыб. У нас уже есть компоненты и заготовки для некоторых этапов этого процесса, их можно использовать. Модель океана, например — ​здесь мы сотрудничаем с Институтом океанологии им. П. П. Ширшова РАН. Далее мы можем выступить интегратором нескольких команд — ​биологов, океанологов — ​и добавить оценку по данным — ​это наша специализация. Таким образом получаем прогноз.

Как устроен ваш центр?

У нас работает больше 160 человек. Это, прежде всего, профессорско-­преподавательский состав, возглавляющий научные и прикладные группы. Каждая группа специализируется на ­каком-то классе/типе приложений либо на конкретной технологии. В каждой группе есть разработчики, оформляющие результат работы в виде кода. Есть отдел разработки, контролирующий качество, собирающий всё воедино, ведущий ИТ-процессы. Есть административный отдел. Есть ответственный за взаимодействие с индустриальными заказчиками. Есть люди, занимающиеся образовательным процессом.

При необходимости мы привлекаем профильных экспертов: океанологов, биологов, врачей, технологов с предприятий. Многие задачи, которые мы решаем, находятся на стыке предметных областей.
К нам приходят выпускники вузов, студенты и аспиранты.

Уровень образования в вузах поспевает за технологиями?

Нет, не поспевает. Проблема еще и в том, что не во всех вузах можно менять учебную программу. К счастью, в некоторых — ​таких, как Высшая школа экономики, МФТИ, Сколтех, — ​этот процесс более гибок. Мы каждый год пересматриваем программу Сколтеха, так что нам удается более-­менее соответствовать темпу развития технологий, а этот темп очень быстрый.

Для того чтобы работать у нас в Центре, нужно прослушать широкий спектр дисциплин — ​от фундаментальных, базовых предметов до методов машинного обучения, анализа данных. И всё это нужно уметь использовать для решения прикладных задач.

С какими сложностями вы сталкиваетесь в процессе работы?

В основном, это сложности организационного плана — ​компании не всегда предоставляют нам данные хорошего качества. Не все стейкхолдеры понимают, зачем нужен искусственный интеллект, в чем он может им помочь. Мы стараемся объяснить суть процессов, у нас даже есть специальные курсы дополнительного профессионального образования разных уровней — ​от технических специалистов до топ-менеджмента крупных компаний. Это позволяет повысить качество взаимодействия. Очень важно, чтобы заказчики понимали, для каких задач можно использовать наши технологии, а для каких — ​нет.

Чего вам с командой хотелось бы достичь?

Хотелось бы продвинуться дальше в развитии применяемых технологий. Сейчас самые интересные автономные системы — ​это ChatGPT и GPT‑4. И возникает вопрос: сможем ли мы в России, где существуют большие ограничения по вычислительной мощности, создать ­что-то подобное и сделать это более адаптивным и автономным? Работы в этом направлении ведутся.
ДРУГИЕ МАТЕРИАЛЫ