Москва создаст новую платформу для анализа данных жителей города
Уровень защиты от утечек в ней выше, но для чего она нужна — пока не ясноПравительство Москвы построит общегородскую платформу совместных вычислений на основе агрегированных данных, которая должна позволить городу использовать информацию, полученную от государственных и частных учреждений, не передавая сторонним компаниям или агентствам.
Соответствующий тендер провел департамент города Москвы по конкурентной политике. Стоимость разработки платформы оценивается в 203,5 млн руб., победителем стала компания Ubic (ООО «УБИК»), предложившая выполнить контракт за 201 млн руб.
Как пояснил РБК директор отдела исследований и разработки Ubic Петр Емельянов, платформа будет использовать современный метод информационной безопасности — протоколы совместных конфиденциальных вычислений, благодаря чему власти столицы не будут видеть или передавать данные в исходном виде, а смогут лишь получать выводы и результаты проведенного на их основе анализа.
Что такое совместные вычисления
Совместные конфиденциальные вычисления — это набор техник, позволяющих множеству пользователей объединить их данные, обработать и получить результат, не раскрывая секретной информации друг другу, объясняет руководитель лаборатории криптографии НПК «Криптонит» Василий Шишкин.
«Представим, что группа людей решила определить средний размер их заработной платы. Для этого каждый участник процесса передает значение размера своего дохода единому доверенному судье, который, получив все данные, вычисляет среднее и оглашает его всем сторонам, сохранив конкретные значения заработка людей в секрете. Протокол совместных конфиденциальных вычислений, базируясь на строгих математических обоснованиях, играет роль такого беспристрастного судьи», — привел пример Шишкин.
Сейчас данные россиян защищаются законом «О персональных данных», это усложняет их использование и обмен информацией между компаниями даже в обезличенном виде, говорит гендиректор Ubic Виталий Саттаров. Метод конфиденциальных вычислений позволяет бизнесу и государству работать с данными, не нарушая прав граждан и снизив риск утечки информации, утверждает он. В компании рассчитывают, что новая платформа поможет городу усовершенствовать антифрод-мониторинг, устраивать более безопасные онлайн-голосования и аукционы, а также проводить социологические и медицинские исследования.
Какие данные попадут на новую платформу и зачем это правительству Москвы, разбирался РБК.
С какими данными будет работать платформа
Из материалов закупки следует, что исполнитель должен будет организовать поступление данных из нескольких информационных систем города, среди которых:
- система управления данными в распределенной вычислительной среде (УДРВС), которая хранит разного рода информацию, имеет подсистему для обработки неструктурированных данных по медицинским обследованиям и интернет-трафику (например, для поиска признаков раковой опухоли на снимках КТ с помощью технологий компьютерного зрения и нейронных сетей). В 2018 году контракт на модернизацию этой системы за 88 млн руб. также выиграла Ubic;
- система мониторинга и анализа интернет-активности пользователей (СТАТС), которая предназначена для наблюдения интернет-активности посетителей ресурсов города. Среди прочего она должна обеспечить возможность выявления уникального интернет-посетителя в условиях отсутствия файлов cookies (данные, которые отправляет сайт, когда пользователь обращается к нему через web-браузер, и которые могут храниться на устройстве пользователя) в его браузере. Система обошлась городу в 52,4 млн руб. Исполнителем работ также выступает Ubic;
- ГИС «Единая мобильная платформа города Москвы», которая обеспечивает информационное взаимодействие подключенных к ней федеральных и городских органов власти, разных организаций с гражданами через мобильные устройства (СМС- и USSD-сообщения). Платформа обрабатывает запросы на предоставление госуслуг, обеспечивает идентификацию пользователей при выходе в интернет в пунктах коллективного доступа и т.п. Конкурс на техническую поддержку этой системы в 2019–2021 годах стоимостью 200,4 млн руб. выиграло ООО «Интермобилити» в 2019-м и получило контракт на ее модернизацию за 96,2 млн руб. в начале этого года;
- интегрированная автоматизированная информационная система «Единое геоинформационное пространство города Москвы» (ИАИС «ЕГИП»), которая используется для автоматизации деятельности городских властей для формирования, консолидации, хранения пространственных данных, осуществления связывания, поиска данных и предоставления доступа к ним. В 2019 году тендер на техническое обслуживание этой системы выиграло ООО «Антисистемс» за 47,2 млн руб.
Что известно о подрядчике
Ubic — разработчик сервисов фильтрации и анализа трафика, основанный бывшим техническим директором Rambler Mobile Виталием Саттаровым и экс-руководителем платформы электронной коммерции Rambler Алексеем Ворониным. В 2016 году компания привлекла 50 млн руб. инвестиций от Фонда развития интернет-инициатив (ФРИИ), в 2018-м — 115 млн руб. от ФРИИ и Российской венчурной компании (РВК). По данным СПАРК, сейчас Саттарову принадлежит 28% УБИК, Воронину — 27%, ФРИИ — 32%, РВК — 13%. Выручка в 2018 году составила 170,9 млн руб., чистая прибыль — 62,7 млн руб.
В рамках выполнения работ Ubic также должна подключить к платформе не менее пяти внешних информационных систем. Представитель исполнителя не уточнил, системы чьих компаний это могут быть, но сообщил, что видит интерес к технологии со стороны рынка.
Представители МТС, «ВымпелКома» и «Ростелекома» в проекте не участвуют, но готовы его изучить впоследствии. Представитель «МегаФона» рассказал, что вопрос о возможном присоединении к платформе может быть рассмотрен только после проведения успешных испытаний системы и итоговой аттестации по требованиям безопасности информации.
Департамент информационных технологий Москвы переадресовал вопросы о новой платформе в мэрию, представитель последней не смог оперативно представить комментарий.
По словам Саттарова, Ubic сейчас разрабатывает инструмент вычислений данных, о конкретных кейсах, как будут применяться обработанные данные, можно будет говорить позднее. «Платформу планируется интегрировать с системой СТАТС, в которой есть вероятностные характеристики посетителей московских информационных порталов. Таким образом, можно вычислить, например, вероятность отношения пользователя к сегменту «автомобилисты». Платформа позволит лучше понимать текущие потребности целевой аудитории (в данном случае жителей столицы), использовать эти знания при проектировании городских электронных сервисов и информационных систем. Она позволит также повысить точность моделирования за счет заполнения ранее имеющихся пробелов, например частоты использования каршеринга жителями Москвы», — рассуждает представитель Ubic.
Зачем власти Москвы собирают данные о гражданах
По данным Би-би-си, у московской мэрии есть около 170 разнообразных информационных систем. С 2012 года из бюджета Москвы на сбор и анализ данных москвичей правительство выделило около 500 млрд руб. (с учетом средств, которые будут потрачены в 2020 году). Как рассказывал изданию бывший сотрудник московского правительства, еще в момент прихода на должность мэра Москвы Сергей Собянин поставил задачу собрать информацию о том, что происходило в разных отраслях. С 2015 года власти столицы закупают у сотовых компаний геоаналитические данные, что позволяет получить достоверную информацию о месте жительства и перемещениях жителей города. Эта информация, например, используется при развитии транспортной системы. Система городского видеонаблюдения с системой видеоаналитики помогают сотрудникам правоохранительных органов разыскивать правонарушителей, а городским службам — контролировать качество уборки дворов, тротуаров и дорог и т.д.
Особенно актуальными многочисленные информационные системы Москвы оказались в последние месяцы в связи с пандемией коронавируса. Так, система видеонаблюдения теперь используется для выявления нарушителей карантина. «По итогам межведомственных проверок были аннулированы рабочие пропуска для 23,5 тыс. пациентов с COVID-19 и 36,6 тыс. горожан с симптомами ОРВИ, подписавших постановление главного санитарного врача о соблюдении изоляции, что позволило обезопасить других горожан от инфекции, — рассказал представитель ДИТ. — Благодаря технологиям электронного мониторинга местоположения было зафиксировано порядка 47 тыс. нарушений режима изоляции, то есть случаев, когда пациенты с коронавирусом или симптомами ОРВИ, которые подписали соответствующие документы и обязаны соблюдать карантин, выходили на улицу и подвергали риску заражения остальных жителей».
По мнению Шишкина из НПК «Криптонит», платформа с совместными конфиденциальными вычислениями может быть полезной для развития информационных сервисов, сохраняющих конфиденциальность пользовательских данных. В то же время он отметил, что это новая область, которая на текущий момент не регламентирована российскими и международными стандартами, поэтому ее применение на практике требует ответственности и масштабной экспертизы на этапах проектирования, внедрения и использования криптографических средств.
Вариантов воплощения системы может быть несколько, но до ее запуска сложно сказать, как будет реализован алгоритм совместных вычислений, рассуждает руководитель направления Big Data ИТ-компании КРОК Егор Осипов. По его словам, если к хранилищу данных ни у кого не будет прямого доступа, то решится фундаментальная проблема утечки данных.