공공 자료 “속빈 강정”으로 외면 당해

건수 올리기식 자료 공개로 이용 가치 떨어져

비슷한 사이트 따로따로 만들기도 문제 소지

정부가 이른바 '빅 데이터' 유행에 발맞춰, 공공 데이터 공개에 적극 나서고 있다. 정부가 공개하고 있는 데이터는 믿을 만한 것인지, 또 쓸모있는 형태로 공개하고 있는지, 두번에 나눠 점검한다. 첫번째는 세밀하게, 두번째는 폭넓게 따져본다.

(1) 꼼꼼하게 따져본 국토교통부의 지적도

(2) 공공데이터 포털 자료들은 얼마나 쓸모 있나

 

정부의 공공 데이터 공개 실태를 가장 잘 알 수 있는 곳이 공공데이터포털(data.go.kr)이다. 이 사이트는 정부 각 기관이 가지고 있는 공공 데이터를 민간에 개방하는 대표 창구 구실을 한다. 특히 최근 들어 자료의 양이 급격하게 늘어났다. 하지만 여전히 이용자들한테 외면당하고 있다. 자료를 공개하는 것에 급급했지, 이용자들의 편의와 요구에 맞추려는 노력이 미흡한 탓이다.

■ 공개 자료 대부분 사용자에게 외면당해

7월말 현재 공공데이터포털에는, 내려받아 이용할 수 있는 자료가 1만2506건(7월29일 오전 기준)이 있다. 지난해 9월까지 9354개에 비해 3000여건 늘었다. 또 사용자로 등록한 뒤 별도의 작업 과정을 거쳐 자료를 조회하는 방식(오픈 API)의 자료는 1390건이다.(다른 사이트 정보 소개 369건 제외, 7월28일 오후 기준) 지난해 9월에 비해 741건 많은 것이다. 이렇게 자료는 많이 늘고 있지만 제대로 활용되고 있는 것은 기껏 5-10% 정도다. 나머지는 거의 외면당하고 있다. 정부는 열심히 공개 건수를 늘려가고 있지만, 이용자들은 별로 관심을 두지 않는 양상이다.

자료 조회 서비스 가운데 200명 이상이 활용 신청을 한 것은 전체의 2.8%밖에 안된다. 서비스별 평균 이용자는 40명이다. 심지어 28건은 이용 신청을 한 이가 아예 없다. 자료 이용 신청이 곧 활용은 아니기 때문에, 실제 활용도는 이보다 더 떨어질 것으로 예상된다. 자료 조회 서비스 형식은, 공공 기관의 자료를 이용해 민간 기업이나 개인이 다양한 형식의 인터넷 정보 서비스를 손쉽게 만들 수 있게 해준다. 묻혀있던 공공 자료를 유용하고 가치있는 정보로 재탄생시킬 잠재력을 지닌 것이다. 정부가 공공 자료를 적극 개방하겠다는 것도 이런 기대 때문이다. 하지만 현재의 저조한 활용 상황은 기대에 어긋난다.

자료를 내려받아 이용하는 상황도 형편은 비슷하다. 가장 많이 내려받은 자료 1000건의 평균 내려받기 횟수는 고작 192회다. 전체의 95%는 100명도 받지 않았다. 이용자들이 200회 이상 받아간 자료는 212건에 불과하다. 아래 그래프가 이런 이용 상황을 잘 보여준다.

data-usage.jpg

어느 기관에서 제공하는 어떤 자료를 이용자들이 많이 활용하는지는 아래 인터랙티브 자료로 확인할 수 있다.(각 칸에 마우스를 가져가면 상세 정보가 뜬다.)

■ 개별 정보 연계 등으로 자료 가치 높여야

정보 이용이 저조한 이유는 무엇보다 종합 정리된 자료가 적다는 데서 찾을 수 있는 것으로 보인다. 조회 서비스용 자료 가운데 전국의 시군구가 직접 제공하는 것이 252건(18%)이나 된다. 이런 개별 시군구의 정보는 같은 종류끼리 묶어 연결하지 않고는 유용한 서비스를 만들어내기 어렵다. 개별 자료만 놓고 보면 활용의 가치가 떨어지는 것이다. 공공기관 제공 자료도 비슷하게 나뉘어 있다. 예컨대, 발전회사들은 자사의 전력 관련 정보를 각자 공개하고 있다.

공공데이터포털 운영을 맡고 있는 공공데이터활용센터가 자체적으로 묶어 놓은 자료가 263건에 이르지만, 포털 사이트에 올라온 것을 수동적으로 모아놓은 것이라는 한계가 있다. 센터 제공 자료의 경우, 전국 자료인줄 알고 이용 신청을 한 뒤 열어보면 일부 시군구 자료만 수록한 경우가 흔하다. 이런 상황을 몇번 겪게 되면, “공공 데이터는 속빈 강정”이라는 부정적인 인식만 늘곤 한다. 지자체나 공공 기관의 자발적인 자료 공개에 의존하지 않고, 정부가 적극 자료를 모으고 정리해서 공개하지 않고는 해결하기 어려운 문제다.


이용 신청 상위 10개 조회 서비스(오픈 API) (2015년 7월28일 기준)
 
순위서비스명조회수활용신청건수제공 기관
1도로명주소조회서비스298495823미래창조과학부 우정사업본부
2국문 관광정보 서비스62952311한국관광공사
3동네예보정보조회서비스161282293기상청
4지번주소조회 서비스64642227미래창조과학부 우정사업본부
5노선정보조회 서비스27062212서울특별시
6서울 버스 위치정보 조회 서비스23691842서울특별시
7서울 버스 도착 정보 조회23961408서울특별시
8정류소정보조회 서비스25391170서울특별시
9대기오염정보 조회 서비스4992908한국환경공단
10버스도착정보 조회(REST)597700경기도

이용 신청이 단 한건인 서비스 77개 중 일부
 
디자인 공보-항목별 검색1111특허청
주택저당채권담보부채권(MBB) 현황611한국주택금융공사
광양항 컨테이너 터미널 혼잡도 정보 제공 서비스321여수광양항만공사
군수품조달정보 조달계획121방위사업청
방사성폐기물 반입 및 처분현황101한국원자력환경공단

■ 기관별 공개자료 사이트 연계도 과제

기관별로 정보 공개 사이트를 따로 만드는 것도 문제의 소지가 있다. 공공데이터포털 외에도 비슷한 형태로 자료를 공개하는 사이트들이 여럿 생겨나고 있다. 정부와 공공 기관 상당수가 공공데이터포털을 통해 자료를 제공하고 있지만, 지방자치단체가 인허가하는 업종별 데이터만 공개하는 사이트(localdata.kr)가 또 따로 있다. 이 사이트 또한 공공데이터포털과 마찬가지로 행정자치부 소관이다. 지방자치 단체 가운데는 서울시가 '서울열린 데이터 광장'(data.seoul.go.kr)을 운영하고 있고, 경기도도 '경기도 공공데이터 공개포털'(data.gg.go.kr)을 통한 정보 공개를 확대할 계획이다. 좀더 전문적인 정보로는 건강보험심사평가원의 '보건의료빅데이터개방시스템'(opendata.hira.or.kr) 등도 있다. 여기에 통계청이 개편 작업을 벌이고 있는 통계지리정보서비스(sgis.kostat.go.kr), 국토교통부의 공간정보 오픈플랫폼 포털 서비스(dev.vworld.kr) 등 지도 중심의 서비스들도 따로 운영되고 있다. 보건의료 정보처럼 전문 정보는 별도 운영이 효율적일 수 있다. 하지만 다른 사이트들은 최대한 연계를 강화함으로써 한곳에서 다른 정보도 손쉽게 이용할 수 있도록 하는 방안이 필요하다. 지금은 각각의 사이트를 방문해 회원으로 가입하고 자료 이용 신청을 해야 한다.

data-sites.jpg

이용 방법의 표준화도 필요하다. 자료 조회 방식(오픈 API) 서비스가 특히 그렇다. 기본 구조는 비슷하지만 세부적으로는 조금씩 다르기 때문에, 사용법을 따로 따로 익혀야 하는 불편이 있다. 이런 차이가 웹서비스 개발업체 등에겐 큰 문제가 되지 않겠지만, 연구자 등 기술에 익숙하지 않는 이들에게는 상당한 걸림돌로 작용한다. 정부는 인터넷 서비스 개발 등 기업의 활용에 강조점을 두고 있지만, 학자나 연구자, 언론 등이 상세 정보를 수집하는 통로로도 활용의 가치가 큰 게 자료 조회 서비스다. 이를 촉진하기 위해서 가장 필요한 것은 이용법을 쉽게 만드는 것이다.

정부는 자료 공개 건수에 집착하지 말고, 공개 자료의 내실을 갖추는 데 더 신경써야 한다. 이 작업은 자료가 쌓이면 쌓일수록 점점 더 많은 노력과 시간이 든다. 아직 초기인 지금이 공공 데이터 공개의 기본 틀을 정비하기 가장 좋은 때다.

■ 글 주소: 한겨레 데이터 블로그 http://plug.hani.co.kr/data/2356207
■ 원 자료 새 창에서 보기: 공공데이터포털 바로가기

신기섭 기자 marishin@hani.co.kr
트위터 계정: twitter.com/Hanidatablog
창작물 저작권은 한겨레신문사에 귀속됩니다.
TAG

댓글 쓰기


태그