Исправление
открытых данных

КАК ЭТО РАБОТАЕТ НА ПРАКТИКЕ
ЭКСПЕРИМЕНТ ИНФОМЕТРА
ЧАСТЬ 2

Качественные открытые данные не нужно исправлять, и они регулярно обновляются. Это основные признаки хорошего набора. На практике данные часто размещаются с ошибками или неактуальны (перестают обновляться).

По общим правилам, для каждого набора должен быть назначен ответственный, а его контакты размещены на странице паспорта набора. Связь с ответственным — это прямой способ сообщить об ошибках в данных. Кроме того, попросить исправить данные можно и через комментарии.

Мы протестировали эти два способа, чтобы узнать, может ли пользователь повлиять на улучшение данных.
Не знаете, что такое "открытые данные"?
Отвечаем на часто задаваемые вопросы:

Что это?
Это бесплатная информация, доступная всем желающим, не ограниченная патентами, авторским правом: статистика, координаты, перечни, реестры, базы данных.

Для кого эти данные?
Для тех, кто умеет в программирование, анализ, визуализации.

Качественные открытые данные позволяют использовать их без ручной обработки, регулярно обновляются.

Какая польза от таких данных?
Появляются полезные приложения и сервисы, развивается независимая журналистика.

Простой пример — «Яндекс-транспорт» использует в том числе и открытые данные для отображения движения транспорта на картах. Если открытых данных нет — горожане могут увидеть такую грустную картинку.

Другой пример, открытые данные госзакупок позволяют найти сложные коррупционные схемы или просто странные траты бюджета.

Сложно начать работать с данными?
Порог вхождения минимальный — умение работать с офисными таблицами, считать цифры, делать выводы.

Кроме того, можно попробовать бесплатные инструменты, например Infogram для простых наглядных графиков, Tableau Public для анализа и визуализаций.

Как государство связано с данными?

Государство — это основной источник данных. Ежегодно собираются огромные массивы информации. И происходит это за наш счет. Своими налогами мы фактически уже оплатили сбор и хранение информации.

Но до сих пор мы часто оплачиваем пошлину, чтобы получить выписку из какой-нибудь информационной системы. А государственная статистика подаётся в сжатом виде, по которой можно сделать только общие выводы.
Что значит ОД?
ОД — это общепринятое сокращение от «открытые данные»
Что такое набор данных?
Набор данных, он же «датасет» (от английского data set/dataset) — это совокупность показателей, объединенных одной тематикой. Чаще всего набор данных соответствует по своей структуре таблице, где отдельные показатели указываются в заголовках столбцов. Вот несколько примеров разных наборов:

—  государственный реестр сертифицированных средств защиты информации

— статистика Россельхознадзора по проверке юрлиц и индивидуальных предпринимателей

— список многофункциональных центров
Что такое открытые даные?
Открытые данные (ОД) — это свободная лицензия + машиночитемость.

Свободная лицензия
 — можно использовать и распространять данные без ограничений, в т. ч. в коммерческих целях.

Машиночитаемость — данные структурированы и размещены в форматах, не требующих от аналитиков и програмистов их ручной обработки
Так Яндекс пытается получить доступ к данным самостоятельно.
Тест «Медузы» про то, что можно найти в данных о закупках, если поискать. Данные найдены проектом «Госзатраты».
Под каждым набором должно быть поле для ввода комментария, на эти комментарии должен даваться ответ.
Порядок публикации открытых данных госорганами закреплен в Методических рекомендациях 3.0.

В них же закреплена необходимость указания контактов (телефон и email), а также ФИО лица, ответственного за отдельный набор.
Для каждого набора данных назначают ответственное лицо, которому пользователи могут сообщить об ошибках, задать вопросы.

Методические рекомендации предусматривают указание ФИО, номера телефона и адреса электронной почты ответственного. Всё это можно найти на странице с описанием отдельного набора (паспорт набора). Подробнее читайте в нашей статье.
У каждого набора должен быть паспорт. Это правило закреплено в Методических рекомендациях.

Паспорт набора содержит ссылку на скачивание данных, описание его структуры, иную сопроводительную информацию, в т. ч. ФИО и контакты ответственного за набор.

Для примера.
Об эксперименте
Исправление ошибок в данных.
Кому и как мы писали
Письмо ответственному
На email ответственного, который указан на странице паспорта проблемного набора.
Комментарий на сайте
На площадках с данными, где есть форма комментирования, оставили комментарий.
Что мы просили исправить?
Несложные ошибки, которые можно быстро поправить. Почти всегда — это неактуальность набора, т.к. это системная проблема: она встречается очень часто, ее проще всего найти. Мы также просили исправить что-то в самом наборе, или исправить ошибку паспорта, но реже.
Есть ли регион без ошибок?
«Здоровых нет, есть недообследованные».
Неявные проблемы с ошибками и неточностями в данных обычно всплывают после начала работы с ними.
Если говорить об актуальности данных, то сложнее было найти неактуальные наборы в Тульской и Томской области.
Сколько всего отправлено?
140 обращений об ошибках

В отдельный регион мы отправляли 1 письмо и 1 комментарий по случайно выбранным наборам, где нашли проблему. Старались, чтобы эти наборы были разными.

1. Письма на email ответственным отправили почти везде — в 81 из 85 регионов.

2. Возможность прокомментировать отдельные наборы встречается реже. В 51 из 85 регионов мы оставили комментарии, либо использовали альтернативный способ, если не было возможности комментирования (общий email или форма обратной связи для сообщения об ошибках).

Посмотреть, на какие наборы мы обратили внимание, можно в таблице, где мы собрали ссылки, скриншоты, описания ответов.
Не слишком ли маленькая выборка?
Выборка репрезентативна для исполнительных органов власти субъектов, при обращении по простым ошибкам. Такого количества достаточно, чтобы составить общую картину. Допускаем, что на федеральном уровне, либо при обращении по более сложным вопросам, картина может быть другой.
Когда мы отправляли письма и комментарии?
Летом — июль, август. Анализировали в сентябре.

Все изменения, которые были внесены спустя 30 и более дней, не учитывались.
На наш взгляд, одного месяца достаточно для внесения несложных изменений — обновления набора, указания даты актуальности и т. п.
Положительные примеры, когда данные обновляют за несколько дней, это подтверждают.
Что это за форма?
Обычно на госсайтах эти формы находятся в разделе «Обращения граждан» или «Интернет-приемная»
59-ФЗ О порядке рассмотрения обращений граждан устанавливает возможность обратиться в госорган с обращением. Ответ на обращение должен быть дан в течении 30 дней (в исключительных случаях этот срок может быть продлен до +30 дней).

8-ФЗ Об обеспечении доступа к информации госорганов устанавливает право на запрос информации, а с 2013 года этот закон включает в себя нормы по открытым данным. Запрос информации немного отличается по срокам от обычного обращения — все те же 30 дней, но продлевать срок рассмотрения госорган может только до 15 дней.
59-ФЗ О порядке рассмотрения обращений граждан устанавливает возможность обратиться в госорган с обращением. Ответ на обращение должен быть дан в течении 30 дней (в исключительных случаях этот срок может быть продлен до +30 дней).

8-ФЗ Об обеспечении доступа к информации госорганов устанавливает право на запрос информации, а с 2013 года этот закон включает в себя нормы по открытым данным. Запрос информации немного отличается по срокам от обычного обращения — все те же 30 дней, но продлевать срок рассмотрения госорган может только до 15 дней.
59-ФЗ О порядке рассмотрения обращений граждан устанавливает возможность обратиться в госорган с обращением. Ответ на обращение должен быть дан в течении 30 дней (в исключительных случаях этот срок может быть продлен до +30 дней).

8-ФЗ Об обеспечении доступа к информации госорганов устанавливает право на запрос информации, а с 2013 года этот закон включает в себя нормы по открытым данным. Запрос информации немного отличается по срокам от обычного обращения — все те же 30 дней, но продлевать срок рассмотрения госорган может только до 15 дней.
РЕЗУЛЬТАТЫ
Живые и мертвые
Из 140 обращений по ошибкам
101
Письмо или комментарий.
Ноль реакции.
39
Случаев активности.
Отвечают, поясняют, разъясняют.
Ответственные
И безответветственные
Типизируем ответственных
Для каждого набора должен быть назначен ответственный.

Это может быть технический специалист, контент-менеджер, кто-то другой, в зависимости от роли госслужащего в подготовке и публикации данных.

На основе ответов (или их отсутствия) мы разделили ответственных на такие категории:
КОНТАКТНЫЕ - 19
Отвечают на письма.
Таких около четверти.
МОЛЧАЛИВЫЕ - 7
Не отвечают.
Но ошибки исправляют.
НЕАКТУАЛЬНЫЕ - 12
Письмо не доставлено — 9
Или больше не ответственные — 3.
БЕЗРАЗЛИЧНЫЕ - 43
Ответа нет.
Ошибки не исправлены.
Важное в фактах
ответственные:
Активных — треть

Ответили на письма —
22 ответственных.

Семеро не дали ответ, но внесли правки.
Быстро дают ответ

Средний срок ответа — 2 дня.

Самые быстрые отвечают в тот же день.
Дольше всех — 9 дней (Курганская область).
Исправляют ошибки

14 ответственных исправили ошибки — это почти половина активных.

Еще пятеро не внесли правки, но прислали свежие данные в виде табличек xls, pdf.
Галерея ответов
Дело больше слов
Есть ответственные, которые не дали ответ на письмо, но внесли изменения. Это можно понять по давно не обновляемому набору, который внезапно после письма был обновлен.

Нам кажется, что это очень даже приемлемый вариант.

Хотим отметить крутой пример, когда всё сработало так, как задумано: набор адресный реестр объектов недвижимости города Москвы до обращения от 18.07.18 последний раз обновлялся в апреле. После письма ответственному, набор был обновлен 19.07.18 и продолжает обновляться регулярно до сих пор:
Комментарии
Актуальные и не очень
Редкий зверь
Для каждого набора на его странице должно быть поле для ввода комментария.
Комментарий и ответ на него должны размещаться на той же странице.

Это придумали не мы, так написано в правилах по публикации открытых данных.

Тем не менее, возможность прокомментировать наборы на сайтах госорганов встречается редко (нашли 14). Этого мало для составления общей картины, поэтому наш список для тестирования комментариев включает в себя:
Порядок публикации открытых данных госорганами закреплен в Методических рекомендациях 3.0.

В п. 8.1 (пп.6):

«Инструмент обратной связи должен позволять… указывать на ошибки и несоответствия… и публиковать все поступившие замечания на… странице, относящейся к данному набору открытых данных.»

«Ответы… должны публиковаться на той же странице. «

Локальные сайты
14 сайтов ОД госорганов с возможностью оставить комментарий (+ 1 форум в Москве, где для каждого набора создана отдельная тема).
Портал data.dov.ru
25 — для тех, кто использует портал как единственную/основную площадку для размещения ОД.
Email по вопросам ОД
8 почтовых адресов, для которых указано, что можно сообщить об ошибке.
Форма обратной связи
11 экранных форм, через которые можно оставить сообщения об ошибках.
Важное в фактах
Комментарии и что с ними не так
Отреагировали только 15%

Из 59 комментариев об ошибках, ответили в семи случаях.

Еще в трех случаях были внесены правки без ответа.

Реакция получена всего на 10 комментарев.
Полученные ответы

Нет идеального способа, который бы гарантировал ответ.

Мы получили:
3 ответа по email;
3 через комментарии;
1 через форму связи.
В чем причина?
Нужна регламентация и контроль — формально закреплять порядок и сроки ответа на комментарии. Нет четких и понятных обязанностей — нет ответа. Нет контроля за выполнением обязанностей — свою работу будут делать только самые сознательные.

Пользователи редко пишут комментарии, потому что не получают ответы, комментарии не публикуются, а если публикуются, то годами могут висеть без внимания. Ничто так не убивает мотивацию, как игнорирование.

А чиновники, не получающие общественного запроса, могут просто разместить у себя на сайте «комментариев и запросов за X лет не поступало», вместо того, чтобы разобраться в причинах, почему, и действительно ли это так.

Поэтому пользователям — будьте активны, используйте все инструменты связи, не ждите, пока первыми придут к вам и спросят мнения, вероятность этого крайне мала.

Госслужащим — не получаете фидбэк от пользователей, а ваши данные никого не интересуют? Увы, проблема скорее всего на вашей стороне, а не потому что «это никому не интересно». Выясняйте, все ли работает на вашем сайте, полезны ли ваши данные.
Галерея ответов на комментарии
И неответов тоже
Советы
Подытожим
Писать ответственному или использовать комментарий?
Шанс получить ответ — один из трех, а на комментарий — где-то один из десяти.
Поэтому лучше сразу связаться с ответственным.

Но и комментарий (при такой возможности) будет не лишним. Статистически это повышает ваши шансы на ответ и исправление ошибок.

Кроме того, в течении этого года мы консультировали госорганы, и у многие стали делать работоспособные формы для комментирования. Предлагаем поддержать такие начинания комментариями :)
Ответственные могут быть «неактуальными»
Если планируете использовать набор регулярно, свяжитесь с ответственным заранее, узнайте — отвечает ли он за данные, попросите уведомить вас, если будут крупные изменения в наборе.

Так вы дадите знать, что данные используются и нуждаются в актуальном обновлении. Или узнаете, что контакты устарели или ответственный на самом деле кто-то другой.
Вы нашли крупную проблему с данными и не хотите, чтобы вас проигнорировали?
Сообщите о ней через официальную форму обращений. Придется подождать дольше, но так надежнее. Алгоритм такой:

— посмотрите в паспорте набора, кто владелец данных (госорган, который предоставляет данные);
— зайдите на официальный сайт этого госоргана, обычно такая форма в разделе «Интернет-приемная», «Обращения» и т. п.;
— для такой формы указано, что она рассматривался в соответствии с 59-ФЗ и/или 8-ФЗ;
— такое обращение обязаны зарегистрировать в течении 3х дней, а ответ дать за 30 дней (после регистрации) в обязательном порядке.
Что это за форма?
Обычно на госсайтах эти формы находятся в разделе "Обращения граждан" или "Интернет-приемная"
Скачать результаты
— посмотреть куда, что, когда и как мы писали
— найти описание ответов, скриншоты

можно в одном из этих файлов:
Кнопочки для репоста:
Изображения: LudgerA, geralt, qimono
Иконки: icons8.com
Котик
Статьи по теме
© 2016-2018
Проектный центр «Инфометр»
Мы в Facebook
Канал в Telegram
Мы ВКонтакте
Disclaimer

контакты по вопросам партнерства:
info@infometer.org (812) 944-13-40
При использовании материалов сайта
гиперссылка на источник обязательна
Made on
Tilda