Структура «Росатома» создаст модель распространения эпидемий
Она будет учитывать транзакции и геолокацию россиян«Дочка» госкорпорации «Росатом» — ФГУП «Российский федеральный ядерный центр — Всероссийский научно-исследовательский институт технической физики им. академика Е.И. Забабахина» (ВНИИТФ) — создает «Ферму данных» для автоматического прогнозирования распространения вирусных инфекций с использованием технологии искусственного интеллекта и на основе данных МТС и «Сбера», а также из интернета и других источников. Это следует из материалов тендера ФГУП, размещенных на сайте госзакупок.
Это третья подобная закупка, предыдущие две проводились в 2020 и 2021 годах. Как говорится в техзадании, «в условиях возникновения эпидемий необходимо адекватное средне- и долгосрочное описание их распространения» в масштабах России, которое учитывает введение и снятие карантина, психологические и поведенческие характеристики различных групп населения, воздействие на них замедления и постепенного восстановления рабочей активности, а также вакцинацию. Для решения этой задачи необходимо создать «математическую модель, наиболее приближенную к реальной ситуации».
На текущем этапе проекта нужно провести опытную эксплуатацию экспериментального образца программного комплекса «Ферма данных»: отработать технологии добычи, обработки и хранения исходных данных с применением искусственного интеллекта, а также сформировать базу данных для определения модели распространения вирусных инфекций в городах из согласованного с заказчиком списка. О каких городах будет идти речь, как и то, на каких условиях и какие именно данные будут передавать МТС и «Сбер», а также из каких еще источников программа будет получать информацию, в материалах закупки не уточняется.
Представитель ВНИИТФ сообщил РБК, что закупка проводится для выполнения работ по гранту, который был выдан еще в 2020 году на моделирование эпидемий вирусных инфекций. Речь идет о сумме 300 млн руб., которую получил консорциум, куда помимо ВНИИТФ вошли Институт прикладной физики, Институт прикладной математики им. М.В. Келдыша, Национальный исследовательский центр эпидемиологии и микробиологии им. Н.Ф. Гамалеи, Национальный медицинский исследовательский центр фтизиопульмонологии и инфекционных заболеваний. Руководит проектом член-корреспондент РАН, доктор физико-математических наук Сергей Лебедев. На другие вопросы РБК представитель ВНИИТФ не ответил.
Как «Росатом» прогнозировал распространение COVID
Как сообщал ВНИИТФ в мае 2020 года, для прогноза распространения коронавируса была модернизирована самая популярная в мире модель SEIRD, из которой следует, что если скорость заражения выше скорости выздоровления, то эпидемия разрастается, а если ниже — то затухает.
Чтобы погасить эпидемию, необходимо было уменьшить скорость заражения как минимум в четыре раза. Изначально ученые ВНИИТФ моделировали различные варианты снижения скорости за счет повышения уровня иммунитета населения, введения карантина и т.д. Но поскольку у значительной части населения COVID мог развиваться бессимптомно, нужно было учитывать и другие параметры: к какой группе относится человек (дети, студенты, работающие, пенсионеры), если он работает, то каков размер коллектива и т.д.
Такая модель позволяла бы, например, анализировать введение карантина в отношении отдельных социальных групп или в отдельных сферах деятельности (работа, транспорт, магазины). Для работы такой модели требовались адекватные исходные данные — от численности населения и его распределения по социальным группам до загруженности различных видов транспорта или магазинов. В сообщении ВНИИТФ указано, что Сбербанк и МТС предложили помощь в получении оперативных статистических данных по некоторым аспектам поведения людей и его изменения во время карантина. «Так, Сбербанк на основе анализа потока транзакций по пластиковым картам может оценить изменение активности людей в магазинах, а МТС, используя геолокационные возможности сотовой связи, может давать обобщенную информацию по перемещениям», — говорилось в сообщении.
Работой заинтересовались в правительстве, на это исследование был выделен грант.
Зачем нужна «Ферма данных»
Из материалов закупки следует, что исполнитель должен будет подготовить экспериментальный образец программного комплекса «Ферма данных» к опытной эксплуатации (включая разработку вариантов получения данных), провести пилот, а затем оценить его результаты. Начальная цена контракта — 17 млн руб. Ранее, в 2020 году, по заказу ВНИИТФ была создана концепция «Фермы данных», а в 2021-м разрабатывалось техническое решение на основе открытого программного обеспечения, программные модули для будущего комплекса и др. В предыдущие годы ВНИИТФ выбирал в качестве единственного исполнителя на тендерах Институт прикладной математики им. М.В. Келдыша.
По словам собеседника РБК, близкого к одному из участников проекта, при построении своей модели ВНИИТФ может использовать обезличенные треки траектории движения людей. «Единственный путь смоделировать распространение инфекций в данном случае — это рассчитывать пересечения зараженных и незараженных граждан», — указал он.
Еще один эксперт, знакомый с подобными исследованиями, отметил, что такие прогнозные модели используют данные, непосредственно сопровождающие или влияющие на развитие явлений, которые они оценивают: в случае распространения инфекции это число жителей, плотность, количество и интенсивность социальных контактов, трафик в городе и стране в целом, ретроданные о количестве заболевших, выздоровевших, привитых и др. «Чем больше срез данных, тем точнее прогноз. Все модели так или иначе различаются видами и количеством данных, которые нужны для построения прогноза, быстротой их обработки и, главное, точностью предсказания результата. Если модель точна, есть шансы, что ее будут использовать при выработке решений по мерам борьбы с инфекцией, при введении карантина, планировании закупок и транспортировки лекарств, расчете нагрузки на систему здравоохранения», — говорит он.
Представитель Сбербанка рассказал РБК, что их исследовательская команда «проводила совместные исследования в области прогнозирования эпидемиологической динамики COVID, в том числе с обменом и сравнением результатов различных моделей-симуляторов». «Обмен персональными данными, сведениями, составляющими коммерческую и банковскую тайну, и любой другой конфиденциальной информацией никогда не осуществлялся», — настаивает он.
Представитель МТС отказался от комментариев. РБК направил запрос в Институт прикладной математики им. М.В. Келдыша и Минздрав.
Насколько точным будет прогноз
Вирусолог, член-корреспондент РАН Александр Лукашев отметил, что в России целый ряд научных учреждений в последние годы занимается разработкой моделей прогнозирования распространения инфекций, поскольку они могут быть крайне востребованными. «Причина в том, что у нас нет актуальных моделей прогнозирования инфекций. Те, что были разработаны в ХХ веке, оказались неэффективными, поскольку выросли из физики и химии, где многие параметры молекул или атомов идентичны, в то время как все люди разные по характеристикам», — говорит эксперт.
По мнению Лукашева, подобной разработкой стоит заниматься мультидисциплинарным командам — не только математикам, но и медикам с социологами. Однако только данных, которые могут предоставить «Сбер» и МТС, для такой работы будет недостаточно. «Важно также учитывать разную заразность больных, разную социальную активность людей, их разную восприимчивость к болезни, динамику коллективного и индивидуального иммунитета», — рассуждает Лукашев.
С этим согласен главный врач клиники «Лидер-Медицина», инфекционист Евгений Тимаков. По его словам, модель получится неточной, если лишь проследить перемещения и скученность людей. «Понадобятся в том числе данные о менталитете, возрасте пациентов, воздействии вируса на каждого. Точность создаваемой модели будет высока, только если будут учтены все эти данные, а также информация об иммунитете населения, группах риска — людях, у которых есть проблемы с иммунитетом. Поэтому такую работу возможно вести только совместно с Минздравом», — говорит Тимаков. При этом он указал, что придется провести отдельные исследования для каждого вируса, что практически невыполнимо из-за высокой стоимости подобной работы.
На вопрос, существуют ли риски для тех, чьи данные будут использоваться в проекте, директор по развитию бизнеса центра противодействия кибератакам Solar JSOC компании «РТК-Солар» Алексей Павлов ответил, что, скорее всего, данные для ВНИИТФ либо являются полностью обезличенными, либо несут лишь частичный признак, не позволяющий однозначно определить человека. «Для анализа больших данных, популяций и прогнозирования трендов не нужны персональные данные каждого человека — достаточно статистики. Поэтому даже если информация попадет в руки злоумышленников, никаких критичных последствий произойти не должно. В любом случае для подобных проектов логично использовать маркеры — например, социальная группа или тип заболевания, а не конкретные данные человека», — заключил он.