Вляпались в статистику
Раздавая QR-коды, Минцифры случайно рассекретило масштабы эпидемии ковида в России
Всего три недели в московских ресторанах не обслуживали посетителей без QR-кодов. Получить их могли не только вакцинированные, но и переболевшие люди, а также обладатели свежего отрицательного ПЦР-теста. При этом в QR-кодах с сертификатами, которые начали приходить россиянам, оказались зашифрованы статистические показатели из федеральных реестров. Изучая выданные «Госуслугами» сертификаты, «Медуза»*, «Холод» и «Медиазона» обнаружили, что в реестре Минздрава, созданном для отслеживания числа заболевших коронавирусом, уже больше 29 миллионов записей. Это в пять раз больше, чем официально сообщает оперативный штаб по борьбе с коронавирусом.
***
Мэр Москвы Сергей Собянин 22 июня сообщил, что через неделю в рестораны и кафе будут пускать посетителей только с QR-кодами. Получить их через московский портал госуслуг mos.ru могли те москвичи, кто вакцинировался, переболел ковидом в последние полгода или сдал отрицательный ПЦР-тест.
Мера не планировалась как кратковременная, и она не оставляла шансов попасть в рестораны немосквичам, поэтому для них аналогичная система присвоения QR-кодов чуть позже была реализована через федеральный портал «Госуслуг»; и если московский сайт начал выдавать коды 28 июня, то «Госуслуги» — только с 1 июля.
Замминистра цифрового развития России Олег Качанов объяснял 24 июня эту задержку тем, что потребуется интеграция «Госуслуг» с базами Минздрава. «Единый регистр переболевших есть в информационных ресурсах Минздрава РФ… У нас эта интеграция будет сделана, и мы для тех, кто переболел, а их там в регистре около девяти миллионов записей таких есть, мы их [QR-коды] получим», — сказал чиновник в интервью «России 24».
Названное Качановым число переболевших — около девяти миллионов — стало сенсацией, ведь, судя по данным оперштаба на тот же самый день — 24 июня, — коронавирусом переболели чуть менее пяти миллионов россиян. Однако, как выяснили журналисты трех изданий, чиновник не завысил, а даже занизил это число.
На слова Качанова и их расхождение с официальной статистикой обратил внимание исследователь статистических аномалий физик Сергей Шпилькин, изучающий показатели вакцинации. И вскоре он выдвинул гипотезу, что реальное количество переболевших можно оценить, отталкиваясь от номеров сертификатов «Госуслуг» с QR-кодом — раз уж они как-то связаны с федеральным регистром по ковиду.
Гипотеза Шпилькина
Физик Сергей Шпилькин обычно исследует статистические аномалии на голосованиях, но с началом эпидемии он начал пристально следить и за статистикой заболеваемости и смертности от ковида, а также за ходом вакцинации. Он заметил, что на «Госуслугах» сертификаты о прохождении вакцинации пронумерованы по порядку, и попросил желающих присылать ему часть номера своего сертификата. Анализ собранных номеров привел его к выводу, что нумерация сертификатов о вакцинации едина для всей России, а значит, по номеру сертификата (последние восемь цифр) можно узнать, сколько человек привились в стране к этому моменту. Полученные Шпилькиным номера полностью совпадали с данными о вакцинации, которые собрали независимые аналитики (Минздрав так и не начал публиковать эти данные).
Одновременно у Шпилькина «возникла еще одна идея». Он предположил, что раз сертификаты о прививках пронумерованы по порядку, то и сертификаты для переболевших могут быть устроены аналогично. И снова попросил всех желающих о помощи: прислать обезличенную часть номера сертификата и указанную в нем же дату выздоровления от коронавируса.
Уникальный номер
Читательница «Медиазоны» из Москвы заразилась коронавирусом в конце марта, но переболела легко и в течение двух недель уже получила отрицательный ПЦР-тест. Три месяца спустя приложение «Госуслуги» прислало ей уведомление о «сертификате иммунизации после болезни COVID-19» и QR-код для посещения московских ресторанов.
На самом деле этот код представляет собой обычную гиперссылку, которая ведет в специальный раздел сайта «Госуслуг». Открыв эту ссылку, сотрудник ресторана должен убедиться, что посетителю можно находиться в помещении ресторана. А если открыть ссылку на компьютере и посмотреть код страницы, видно, что номер сертификата обозначен аббревиатурой УНРЗ (unrz). Это — «Уникальный номер регистровой записи», такой термин используется во многих регистрах Минздрава — такое же обозначение есть и на странице с кодом сертификата о вакцинации.
На следующий день после выступления замминистра Качанова об интеграции с регистром заболевших, 25 июня, описание схемы загрузки данных «из регистра COVID» появилось в ситуационном центре Минцифры и на техническом портале. Помимо других данных, из регистра должен передаваться и 15-значный номер УНРЗ.
Можно ли увидеть этот номер в сертификате переболевшего? Журналисты «Медузы», «Холода» и «Медиазоны» выяснили, что да.
Номер сертификата о перенесенной болезни состоит из 16 цифр: это восьмерка, двузначный код региона и единица (эта цифра во всех проверенных нами сертификатах одинаковая и, судя по аналогичным регистрам, обозначает получателя бюджетных средств); следующие четыре цифры — месяц и год; а вот последние восемь цифр — уникальный номер переболевшего.
Этот же формат (только без восьмерки в начале, то есть 15-значный) используется при формировании УНРЗ в Федеральном регистре лиц, больных новой коронавирусной инфекцией. Когда данные о заболевшем впервые сохраняются в регистре, ему присваивается УНРЗ — этот момент показан в обучающем видео Минздрава. Видимо, в тот же момент назначается и дата, закодированная в УНРЗ, которая потом попадает и в номер сертификата. Ведь у читательницы «Медиазоны», выздоровевшей в апреле, в номере сертификата на месте даты значится 0321 — а диагноз ей поставили именно в марте.
Получается, что при создании сертификата для переболевшего портал «Госуслуг» просто берет его номер из Федерального регистра и добавляет к нему первую восьмерку (а сертификаты о прививке начинаются с цифры 9). Об этом свидетельствует версия сертификата в специализированном формате JSON, которую можно также скачать с «Госуслуг»: там есть 15-значное поле unrz и 16-значный unrzFull — с восьмеркой спереди, как у номера сертификата.
Но поскольку УНРЗ в Федеральном регистре формируется при регистрации заболевания (и потом попадает в сертификат для выздоровевшего), выходит, что последние восемь цифр в сертификате — это порядковый номер заболевшего человека.
Собеседник «Медузы» в одном из региональных минздравов подтвердил, что порядковый номер в регистре единый по всей стране и отражает общее количество зарегистрированных заболевших на момент создания УНРЗ для каждого пациента.
125 тысяч новых случаев в день
Несколько десятков номеров сертификатов и дат выздоровления, которые собрал у добровольцев Сергей Шпилькин, позволили оценить реальные масштабы эпидемии за последние полгода — более «старые» номера на «Госуслугах» недоступны, так как QR-код для переболевшего формируется только за предыдущие полгода. Зато самый последний из присланных сертификатов — от человека, выздоровевшего в конце июня 2021 года, — имеет порядковый номер 27 миллионов 300 тысяч. Источник «Медузы» в одном из федеральных ведомств, знакомый с работой Федерального регистра, на вопрос о том, соответствует ли эта цифра количеству записей в регистре, ответил: «Так и есть».
Сейчас, как выяснили журналисты «Медузы», порядковые номера сертификатов «Госуслуг» для переболевших уже превышают 29 миллионов. Это почти в пять раз больше, чем официально зарегистрированное за время пандемии число больных в стране — шесть миллионов.
Поскольку номер сертификата создается в тот момент, когда человек заболел, а сам сертификат выписывают только при его выздоровлении, номер сегодняшнего сертификата показал бы количество записей в регистре (то есть заболевших), которое наблюдалось две-три недели назад. Сертификат создается только после выздоровления человека, однако номер в этом сертификате относится к моменту заболевания. Поэтому сказать точно, на какие даты пришелся пик появления новых записей в регистре, невозможно. Официально максимум случаев коронавируса в России — 29 935 заболевших за день — зафиксирован 24 декабря 2020 года.
«Регистр заполняется очень честно, но он неточный»
Впрочем, количество записей в Федеральном регистре не точно отражает количество переболевших. Например, если человек заболевает опять, для него создают новую запись. Но и это не все.
По инструкции Минздрава в регистр должны попадать не только люди с положительным результатом «лабораторного исследования» (имеются в виду ПЦР и другие тесты), но и те, кому диагноз COVID-19 поставили «с помощью других методов диагностики» (согласно рекомендациям Минздрава, речь идет о компьютерной томографии). Помимо этого, в регистр попадают «все случаи пневмонии, включая амбулаторные».
Какую долю в регистре занимают больные пневмонией, не связанной с коронавирусом, журналистам оценить не удалось. За статистикой заболеваемости воспалением легких без учета COVID-19 «Медиазона» обратилась в Росстат, который уже предоставлял такие данные за первые месяцы 2020 года. Теперь же в ведомстве ответили, что в поступающих от Минздрава и Роспотребнадзора данных о заболеваемости больше нет отдельной графы о пневмонии.
К тому же, по словам источника «Медузы» в одном из федеральных ведомств, регионы сами определяют, как вести регистр: вносить туда только случаи коронавируса и пневмонии или также сомнительные случаи ОРВИ, которых может быть до 20–30% в регистре.
«Регистр заполняется очень честно, но он неточный», — объясняет собеседник, добавляя, что на федеральном уровне приходится перепроверять данные от регионов.
Еще одна погрешность, которая может возникать при оценке по номеру регистра, связана с тем, что из него удаляют пациентов, чей первичный диагноз COVID-19 не подтвердился, — а освободившийся порядковый номер потом присваивается новому заболевшему.
Среди сертификатов, которые получил Сергей Шпилькин, есть примеры непоследовательности в номерах. Например, сертификат с порядковым номером, начинающимся на 2327, был выдан болевшему в апреле 2021 года, а номер, начинающийся на 2376, — переболевшему в марте.
Но эта погрешность означает только, что конкретный номер УНРЗ может быть меньше, чем реальное число заболевших в реестре.
«Информация не соответствует действительности»
На просьбу журналистов «Медиазоны» к Минцифры (это министерство отвечает за работу российского портала «Госуслуг») подтвердить, что номер сертификата переболевшего формируется на основе УНРЗ из коронавирусного регистра Минздрава, пресс-служба Минцифры ответила, что «портал „Госуслуг“ является витриной данных, содержавшихся в регистре переболевших COVID-19, оператором которого выступает Минздрав».
«При формировании сертификата используется регистровая запись Минздрава», — сообщила пресс-служба в ответ на запрос.
«Медуза» и «Медиазона» обратились в Минздрав и федеральный оперативный штаб по борьбе с коронавирусом с просьбой прокомментировать количество записей в регистре и его отличие от официальных сводок о заболеваемости. В штабе попросили привести их комментарий целиком. Вот он:
Федеральный информационный ресурс учета информации в целях предотвращения распространения новой коронавирусной инфекции COVID-19, созданный для служебного пользования, содержит сведения о следующих гражданах:
— с подтвержденным диагнозом COVID-19,
— госпитализированных с признаками пневмонии,
— прошедших вакцинацию от COVID-19.
Ваша информация о 27 миллионах случаев заболевания COVID-19 или пневмонией не соответствует действительности. Цифра 27 миллионов, на которую ссылается ваш источник, действительно фигурирует в информационном ресурсе, но в отношении вакцинированных первым компонентом вакцины по состоянию на 9 июля 2021 года.
Актуальная информация о числе случаев COVID-19, в том числе без клинических проявлений, ежедневно сообщается Оперативным штабом по предупреждению завоза и распространения новой коронавирусной инфекции на территории России и публикуется в открытом доступе на сайте стопкоронавирус.рф. На 15 июля 2021 года зарегистрировано 5 882 295 случаев заболевания COVID-19 на территории России.
В Минздраве на уточняющий вопрос по поводу регистра переболевших ответили, что комментарий оперштаба отражает и их позицию тоже. По словам представителя Минздрава, «единственное, на что эта цифра [27 миллионов] похожа, так это на число вакцинированных первым компонентом по состоянию на 9 июля». А для оценки количества заболевших он призвал ориентироваться только на ежедневные сводки оперативного штаба.
То есть федеральный оперштаб по борьбе с коронавирусом и Минздрав предположили, что, задавая вопрос о 27 миллионах записей, журналисты перепутали регистры переболевших и вакцинированных.
Но это не так, и это видно по обезличенному скриншоту сертификата человека, выздоровевшего от ковида 18 февраля 2021 года.
Номер его сертификата никак не может быть взят из регистра вакцинированных просто потому, что на тот момент вакцинированных в стране было в разы меньше. Порядковый номер в этом сертификате — 17 миллионов, а к середине февраля в России было произведено только 11 миллионов доз вакцин и привито около четырех миллионов человек.
Если же считать, что номер сертификата переболевшего близко отражает количество заболевших ковидом в стране, то показатель 29 миллионов заболевших вывел бы Россию на третье место в мире по абсолютному количеству случаев коронавируса. В пересчете на миллион жителей страна поднялась бы с 85-го места на первое, опередив даже небольшие государства Андорру и Сейшелы.
Обновление. После публикации текста с «Медиазоной» связался читатель, который в июле 2021 года из-за ошибки на сайте «Госуслуг» получил сертификат переболевшего COVID-19 — хотя болел коронавирусом еще в апреле 2020-го. В качестве доказательства он предоставил редакции скриншот этого сертификата и письмо от «Госуслуг», где указана дата его выздоровления — даты на этих документах совпадают, и это май 2020 года. А в номере сертификата в совпадающем с УНРЗ поле стоит число чуть больше 214 000 (точное число читатель просил не раскрывать). Согласно данным оперштаба, к концу апреля 2020 года в России было выявлено 106 тысяч случаев COVID-19. Этот пример доказывает, что журналисты не спутали реестры заболевших и привитых, как предположил Минздрав, ведь в апреле-мае 2020-го прививок от коронавируса в стране еще не было — первая российская вакцина «Спутник V» зарегистрирована в августе.
* - Минюст признал «Медузу» иноагентом
Авторы: Светлана Рейтер и Денис Дмитриев («Медуза»), Михаил Зеленский («Холод»), Максим Литаврин («Медиазона»)