Евгений, расскажите, пожалуйста, о задачах Центра и о технологиях, которые вы разрабатываете и используете для приложений.В Центре мы ведем фундаментальные исследования, связанные с искусственным интеллектом, развиваем собственные фреймворки и работаем с индустриальными заказчиками. Можно выделить три основных направления, на которых мы специализируемся, я расскажу о них подробнее.
Во-первых, это технологии, связанные с генеративными моделями на основе мультимодальных данных. Сейчас растет интерес к такого рода технологиям — например, мегапопулярный ChatGPT или приложения, позволяющие генерировать изображения по текстовому описанию. Конечно, для создания таких моделей, как ChatGPT, требуются огромные вычислительные мощности, которыми мы не располагаем. Но в нашем распоряжении есть неплохие вычислители, и мы проводим с их помощью фундаментальные исследования. Пока еще очень мало известно о том, почему эти методы работают и как можно улучшить их качество. Мы также решаем важные инженерные задачи, например, улучшаем качество различных изображений, снимков дистанционного зондирования, повышаем разрешение расчетов полей погоды и т. п. Кроме того, мы активно работаем над развитием методов, позволяющих дообучать предобученные большие генеративные модели, для того чтобы они смогли решать конкретные задачи — такие модели используются в индустриальных сервисах.
Второе направление — Data Fusion, консолидация мультимодальных и разноточных данных. Эта технология позволяет объединять и одновременно обрабатывать различные данные, например, спутниковые снимки, снимки с БПЛА, информацию с сенсоров. Это важно для сельского хозяйства, оценки углеродного баланса, прогнозирования пожаров, предупреждения чрезвычайных ситуаций и оценки их последствий.
Третье направление — физически информированное машинное обучение, другими словами — машинное обучение с учетом физических моделей. Физические модели, такие как уравнение теплопроводности, не всегда точно описывают реальность, они основаны на приближениях. Для уточнения прогнозов на основе физических моделей нужны модели на основе искусственного интеллекта. Мы строим модель на одних принципах и встраиваем в нее модели, построенные на основе других принципов. В результате точность прогноза может увеличиться в разы, возрастает и скорость вычислений.
На самом деле технологий больше, так как прикладные задачи шире. У нас также развиваются подходы к автоматизации машинного обучения. Мы используем автоматический поиск нейросетевых архитектур — и Data Scientist не приходится выбирать из огромного числа вариантов подходящую модель.
Как можно использовать эти технологии на практике?Машинное обучение, искусственный интеллект — это прикладные дисциплины, они не могут обходиться без конкретных кейсов. Приложения позволяют протестировать границы применимости того или иного метода, а также понять, в каком направлении должно идти дальнейшее развитие фундаментальных основ.
Допустим, мы решили три прикладные задачи и на их основе вывели общий метод решения — в дальнейшем он будет использоваться для решения аналогичных задач.
Иногда компании сами формулируют запросы для нас, и мы ищем их решение. Но чаще инициатива исходит от нас. Мы компетентны в конкретных технологиях, поэтому ищем такие приложения, которые, с одной стороны, востребованы и приносят деньги, с другой — являются сложными и интересными задачами, которые заказчик не может решить самостоятельно.
Приведите, пожалуйста, примеры конкретных задач.Мы достигли высокой точности в прогнозировании вероятности возникновения лесных пожаров.
Сейчас мы находимся на этапе внедрения этого решения в контур МЧС. По внутренним данным МЧС мы прогнозируем риск возникновения пожара на несколько дней вперед в заданном регионе, с учетом прогноза погоды, ландшафта местности, информации о типах подстилающей растительности и так далее. Наш прогноз помогает МЧС оптимизировать работу, эффективно распределять силы и средства.
Мы используем базовую технологию, связанную с Data Fusion, то есть консолидируем разные типы пространственных данных.
Для этого мы разрабатываем платформу, в которую в качестве инструментов встроены технологии:- для создания генеративных моделей;
- для консолидации мультимодальных данных;
- для физически информированного машинного обучения.
С целью получения прогнозов вероятности возникновения пожаров и других рисков на этой платформе запускается обучение моделей ИИ. Прогнозы, выдаваемые обученными моделями, представляют собой пространственные данные, которые можно на этой платформе визуализировать.
Мы прогнозируем ледовую обстановку на Северном морском пути. Качественный прогноз ледовой обстановки нужен капитанам грузовых судов, для того чтобы оптимизировать логистику. Мы предоставляем такие прогнозы на 72 часа вперед, обновляя их каждые шесть часов.
Для того чтобы получить прогноз, нужно, с одной стороны, смоделировать физические процессы: океан, атмосферу, взаимодействие с ними льдов и солнечной радиации; всё это — на основе специализированных гидродинамических моделей. С другой стороны, необходимо учитывать данные оперативных наблюдений с буев, судов, данные дистанционного зондирования (концентрацию льда на определенном участке) и другие важные характеристики. Таким образом мы можем прогнозировать движение льдов на основе модели гидродинамики, уточняя прогноз с помощью искусственного интеллекта, насыщая его информацией из данных оперативных наблюдений. Фактически при решении этой прикладной задачи для СМП мы используем все три ключевые технологии, о которых я рассказал.
Также мы прогнозируем распространение загрязнения воздуха. Сотрудничаем с индустриальными компаниями. Они предоставляют нам данные с датчиков, измеряющих концентрацию загрязняющих веществ. С учетом погоды мы прогнозируем распространение шлейфа загрязнений.
Можно решать и обратную задачу — на основе измерения концентрации загрязняющих веществ определить, где располагается источник загрязнения. Такие расчеты очень интересны предприятиям: можно доказать, что источник загрязнения — не они.
Одно из наших подразделений занимается прогнозированием долгосрочных физических рисков — засух, ураганных ветров и так далее. Такой прогноз важен для ряда регионов России. Допустим, в сельскохозяйственном регионе важно знать риск возникновения засухи на ближайшие пять лет.