ПРОЕКТНЫЙ ЦЕНТР «ИНФОМЕТР»

Единый стандарт – это возможно

Интервью с Андреем Петраченко, ответственным за публикацию открытых данных на портале Правительства Сахалинской области
Инфометр
Если вы впервые слышите это словосочетание
Что такое открытые данные?
ОД - это базы данных, сведения об адресах и любая другая неперсональная информация, у которой есть 3 признака:

  • Свободное использование (любые законные цели)
  • Свободный доступ (без ограничений)
  • Машиночитаемый формат

Такая информация используется программистами, учеными, журналистами и самими органами власти для анализа, прогнозирования и создания на ее базе удобных пользовательских сервисов и приложений.

Например:
  • Чтобы в правильных местах поставить светофоры, нарисовать разметку и пешеходные переходы пригодятся открытые открытые данные о ДТП и пробках.
  • Чтобы автобус пришел вовремя и в нём нашлось место, гражданам полезны сведения о его местонахождении, а экспертам - о нагрузке на транспортную сеть.
  • Чтобы выбрать город и район для покупки квартиры, незаменимы открытые данные о стоимости жилья, состоянии домов, загрязнении воды и воздуха.
С 2013 года публикация открытых данных органами власти в РФ обязательна, данное направление активно развивается во всём мире. "Инфометр" оценивает результаты развития открытых данных
Обязательные наборы ОД
Обязательные (первоочередные) наборы данных - это нормативно закрепленный перечень информации, который органы власти обязаны разместить в формате открытых данных. Согласно Распоряжению Правительства РФ от 10.07.2013 №1187-р, это 7 наборов для федеральных министерств и 17 - для региональных и муниципальных органов власти.
«Первопроходцами себя не чувствовали» – Андрей Колесников об открытых данных Тульской области
Кликните, чтобы ознакомиться с интервью
Федеральный портал открытых данных
Кликните, чтобы перейти на портал
Структура набора данных
это система полей и описаний для однотипных категорий информации внутри набора ОД. Для различных видов данных (от перечня кинотеатров до базы госзакупок) используются разные структуры: от простой таблицы до сложных древовидных взаимосвязей. Детальное описание структур есть только для 7 обязательных федеральных датасетов.
Рейтинг "2015: Высшие исполнительные органы государственной власти субъектов РФ. Открытые данные"
Кликните по ссылке чтобы ознакомиться с рейтингом
Рейтинг "2016: Высшие исполнительные органы государственной власти субъектов РФ. Открытые данные (весна)"
Кликните по ссылке чтобы ознакомиться с рейтингом
Путь развития открытых данных в России выдался нелёгким. Мы оцениваем данные регионов и видим, что даже обязательные наборы не имеют единой структуры. Как решить эту проблему сейчас и кто должен позаботиться о стандартизации?
Мы говорили об этом с экспертами и органами власти, проводили опросы, мнением делился Андрей Колесников из Министерства по информатизации Тульской области. Мы рассчитывали, что первая ласточка запустит дальнейшее обсуждение, и не ошиблись.
Общались:
Андрей Петраченко
ведущий советник Управления информатизации и связи
Агентства по информационным технологиям и связи
Сахалинской области
Михаил Карягин
ведущий эксперт
Проектного центра «Инфометр»
М.К: Вы  говорили о необходимости нормативного закрепления полей и структур наборов открытых данных. Это должно быть сделано на федеральном уровне?
А.П.: Да. Я считаю, что только стандартизация на федеральном уровне является целесообразной. Только стандартизация, охватывающая весь массив открытых данных РФ, на мой взгляд, будет способствовать созданию универсальных приложений и приложений, обеспечивающих аналитическое или статистическое сравнение между различными наборами данных (например, наборами данных разных регионов).
Только стандартизация, охватывающая весь массив открытых данных РФ, на мой взгляд, будет способствовать созданию универсальных приложений и приложений, обеспечивающих аналитическое или статистическое сравнение между различными наборами данных
Поясню. Возьмите, например, набор данных «Государственный лесной реестр» на сайте data.gov.ru (поиск по словосочетанию «лесной реестр»). По сути, каждый орган, опубликовавший такой набор данных, «сочинил» свою структуру этого набора и названия полей. Поэтому написать приложение, которое бы сравнивало эти наборы — сколько у кого и каких лесов — мягко говоря, затруднительно. Или, если ближе к людям, можно набрать в поиске: «кинотеатры». Чтобы посмотреть на карте кинотеатры города Москвы и кинотеатры города Тулы, необходимо написать, по сути, разные приложения (или обработчики), ведь наименования полей совершенно разные (я даже не говорю о другой информации).
Сколько, по Вашему мнению, понадобится времени и ресурсов, чтобы все опубликованные наборы данных привести к единому стилю оформления?
Конечно, не имея информации о том, как готовятся и публикуются наборы открытых данных в  регионах и ведомствах, невозможно говорить о точных датах, но думаю, что год — это реальный период для приведения данных (по крайней мере, новых версий наборов) к общему стандарту. Здесь я исхожу из тех соображений или точнее предположений, что регионы или ведомства, которые опубликовали (или публикуют) большое количество открытых данных (например, Москва) делают это не в ручном режиме, а с помощью каких-либо программных сервисов (в противном случае я бы оценил такую публикацию как неэффективную). Приведение к общему стандарту обеспечивалось бы корректировкой этих программных сервисов (компонент). Те же, кто осуществляет публикацию открытых данных в «ручном режиме», просто обеспечили бы дальнейшее размещение своих наборов открытых данных в соответствии с новыми правилами. Что касается уже разработанных приложений, которые работают с текущими структурами наборов, то их корректировка, думаю, тоже не стала бы огромной проблемой для разработчиков.
Как вы считаете, не возникнет ли конфликт интересов во время обсуждения стандартов? Очевидно, что госорганы, которые уже опубликовали много наборов данных, будут настаивать на том, чтобы за основу была взята их структура (например, подход Правительства Москвы). Возможно ли принять единые стандарты?
Думаю, определенные конфликты интересов возникнут. По хорошему, стандарты должны были разрабатываться до широкого внедрения процессов публикации открытых данных. Но преодоление таких конфликтов интересов может заключаться в обоснованном и взвешенном подходе к выработке стандартов. Выработка стандарта — это коллективный процесс с учетом знаний, мнений, перспектив и т. п., поэтому обоснованность принимаемых решений — это основной фактор, влияющий, в том числе, и на преодоление конфликтов интересов. Что касается вопроса о возможности принятия единого стандарта сегодня, то, конечно, это возможно.
Чем больше ведомств и регионов включаются в процесс публикации наборов открытых данных, тем будет более «разнообразна» их структура и более «болезненна» и затратна процедура перехода к общим стандартам
Что касается стандартизации, то, на мой взгляд, чем раньше она проводится, тем лучше. Вообще, на мой взгляд, стандартизация должна была предшествовать проведению работ по публикации открытых данных в широком масштабе. Я думаю, что маловероятно ожидать некой неуправляемой самоорганизации и прихода большинства ведомств к каким-то общим стандартам. Наоборот, чем больше ведомств и регионов включаются в процесс публикации наборов открытых данных, тем будет более «разнообразна» их структура и, соответственно, более «болезненна» и затратна процедура перехода к общим стандартам.
Почему, по вашему мнению, стандартизация не произошла на начальных этапах развития ОД в России?
Вопрос отчасти провокационный. Но ответ, на мой взгляд, простой: кто-то не додумал, кто-то не учел, кого-то не спросили, к кому-то не прислушались. А если более серьезно, то здесь, наверное, виноват подход. У нас часто бывает так, что хотят сделать очень быстро, сразу, чтобы потом отчитаться о проделанной работе. При этом о дальнейших шагах задумываются уже потом, если вообще задумываются. За «маленькие деньги» что-то делается, а потом в это «что-то» вкладываются большие деньги, чтобы оно «как-то» работало. Это проблема не только открытых данных. Возьмите информационные системы. На сегодняшний момент, например, существует две информационные системы: pravo.gov.ru и minjust.consultant.ru. Обе содержат правовые акты. В обе эти системы госорганы предоставляют документы. Обе системы обслуживаются и расширяются. И у меня как у обычного гражданина возникает вопрос: а зачем на федеральном уровне две по сути одинаковые системы, которые требуют затрат – и финансовых, и людских –и почему не объединить ресурсы и не сделать одну систему просто «расширив и углубив». Думаю, что выгода при этом была бы существенная.
Как мотивировать регионы, в которых еще нет открытых данных, развивать это направление?
Думаю, что мотивировать достаточно сложно. Чаще всего, наверное, это связано с тем, что регионы не видят никакой реальной отдачи от публикации этих данных. Поэтому, если на публикацию данных необходимо затрачивать какие-то ресурсы (не только финансовые, но и людские, временные, организационные), то регионы в большинстве будут публиковать только те данные, которые являются обязательными. Как у обычного гражданина, у меня возникает недоумение: насколько в своем большинстве полезны мне те наборы, которые являются обязательными для опубликования. И как гражданину, и как госслужащему мне непонятна конкретная цель публикации части (а может даже большинства) обязательных наборов. Если же говорить о том, что может кардинально повлиять на публикацию, то здесь поможет только внедрение информационных систем, которые будут использоваться в работе различных структур и обеспечивать выгрузку наборов открытых данных в автоматическом или полуавтоматическом режиме. Т.е. наборы открытых данных должны стать не целью, как это происходит сейчас, а результатом работы органов. Какие информационные системы и как должны создаваться – это отдельная тема. Но, если кратко, здесь тоже должна достаточно широко использоваться централизация, как ресурсов, так и подходов.
Минималистичный портал открытых данных
Правительства Сахалинской области

Большинство обязательных элементов, вроде описания и использования открытых данных, перечня приложений, фильтрации датасетов доступны на сайте
Расскажите, пожалуйста, как открытые данные развивались в вашем регионе? Весной 2015 в нашем рейтинге Сахалинская область занимала 38 место, а уже через год поднялась до десятого с показателем 73,6%. Что поспособствовало развитию ОД? Кто был инициатором?
Это, наверное, еще одна картинка, которая показывает текущее состояние в данной сфере в некоторых (или в большинстве) регионов. Чтобы сделать такой «рывок» Сахалинской области понадобилось желание и свободное время одного программиста, который в свободное время сделал сайт и прочитал методические рекомендации. Плюс был издан нормативный правовой акт Сахалинской области по открытым данным, регламентирующий порядок взаимодействия органов исполнительной власти по размещению наборов на этом сайте. Конечно, такой «рывок» вызывает гордость, но, на самом деле, это не тот подход, который надо приветствовать и культивировать. Кстати, это еще показывает, на мой взгляд, насколько оценки развитости сферы открытых данных далеки от реального состояния дел. Ведь сравнивать, например, портал открытых данных Москвы и Сахалинской области у меня, как у технического специалиста, рука бы не поднялась, особенно с учетом тех работ, которые остаются за рамками непосредственно портала открытых данных. Но выполнение методических рекомендаций позволяет это сделать. Конечно, можно говорить о ресурсах, затратах, но всё же...
Расскажите, пожалуйста, о ваших планах по развитию открытых данных в Сахалинской области.
Я бы, конечно, хотел сказать, что планов масса. Но это было бы не совсем верно. И связано это с тем, что я отвечал на вопрос о мотивации регионов. Что касается технической реализации, то на сегодняшний момент, если «тот программист» найдет время и изъявит желание, то, возможно, что-то будет еще реализовано. А что касается публикуемых наборов (их количества и качества), то здесь пока всё зависит от самих госструктур и руководства.
Фото обложки: Andrey dementev, фото участников интервью предоставлены авторами
Made on
Tilda