Otwarte dane to serwis udostępniający dane publiczne w sposób
przejrzysty, przydatny i zgodny ze standardami. Naszym celem jest
zwiększyć dostępność danych publicznych oraz skalę ich wykorzystania.
Chcemy też demonstrować, jak publikować zasoby zgodnie ze standardami
otwartych danych.
Dane posiadane przez instytucje publiczne, mimo że stanowią często
informację publiczną, to nie są publicznie dostępne. Instytucje te nie
publikują danych w internecie - lub robią to w sposób utrudniający ich
wykorzystanie.
Wierzymy, że publikacja danych w sposób otwarty przynosi zysk społeczny
poprzez zwiększenie ich przydatności, efektywności i innowacyjności
działań opartych na wykorzystaniu tych danych, oraz przejrzystości
działań administracji państwowej.
Celem naszego serwisu jest więc zarówno otwieranie danych publicznych -
jak i demonstrowanie, jak tego dokonać. Tworząc serwis kierowaliśmy się
standardami otwartych danych (takich jak amerykańskie
8 Principles of Open Government Data). W szczególności dołożyliśmy starań, by
udostępniane przez nas dane publiczne były dostępne w surowej postaci,
dostępne poprzez API, oraz dostępne do ściągnięcia w całości.
Mamy nadzieję, że prezentowany przez nas model publikacji otwartych
danych będzie z czasem stosowany przez inne organizacje pracujące z
danymi publicznymi oraz instytucje publiczne.
Pragniemy też, był zasoby serwisu stały się platformą, z której
korzystają inne serwisy. Sami wykorzystujemy otwartedane.pl do
prezentacji danych budzetowych na stronie
otwartybudzet.pl
Oto kolekcje, które udostępniamy
- Budżet Rzeczpospolitej Polskiej wraz ze sprawozdaniami
- Środki europejskie
- Budżety funduszy celowych i agencji państwa
- Budżet Narodowego Funduszu Zdrowia
- Projekty Europejskiego Funduszu Rozwoju Regionalnego
Wkrótce kolejne dane
Ponieżej znajduje się przykładowa sesja na stronie Otwarte dane.
Ma ona na celu pokazanie kilku pierwszych kroków w korzystaniu ze
strony i nie należy jej traktować jak podręcznik opisujący
pełną funkcjonalność dostępną na stronie Otwarte dane
Ile na edukację?
Wybór kolekcji danych i przeglądanie
Spróbujmy zajrzeć w wydatki państwa na edukację. Zacznijmy od
budżetu państwa – wybieram Budżet centralny, a następnie Budżet
zadaniowy 2011. Dane pobierane są z bazy danych, by po chwili
pojawiła się tabela zawierająca dwadzieścia dwie funkcje budżetu
zadaniowego. Może być zaskakujące, że budżet państwa składa się
z tak niewielu pozycji. Jest to jednak spowodowane specyficznym,
hierarchicznym ułożeniem danych w tabeli. Każda z wyświetlonych
pozycji dzieli się na kolejne, bardziej szczegółowe wydatki.
Jeśli zatem klikniemy w Funkcję 3 „Edukacja, wychowanie, opieka”,
w tabeli pojawią się nowe dane – trzy specyficzne zadania jakie
państwo wyznaczyło sobie w dziedzinie edukacji. Jak widzimy każde
z zadań wyświetlone jest w kolorze niebieskim, co sugeruje,
że możemy w nie kliknąć uzyskując kolejne poziomy uszczegółowienia.
I tak np. Stanowiące zdecydowaną większość wydatków „Zadanie 3.2
Szkolnictwo wyższe” podzielone zostało na siedem kolejnych podzadań,
każde przypisane jednemu lub kilku instytucjom państwowym – tzw.
dysponentom. Ponowne kliknięcie w Zadanie 3.2 ukryje przed nami
tę część danych.
Czy tylko MEN?
Otwieranie dodatkowych kolekcji
Zróbmy tak i skupmy się na Zadaniu 3.1, czyli wydatkach na edukację
i wychowanie. Jak widać jest tu sporo konkretnych podzadań. Jeśli
zaczniemy zaglądać wgłąb, by zobaczyć, kto odpowiedzialny jest za
ich realizację, przekonamy się, że nie jest to tylko Ministerstwo
Edukacji Narodowej. Jak zatem sprawdzić, jakiej wielkości środki
płyną z budżetu państwa na edukację i wychowanie do MEN-u? Takie
informacje dostępne są w innej kolekcji – Budżecie instytucjonalnym.
Zajrzyjmy zatem do niego.
Z górnego menu wybieramy zakładkę „Kolekcje danych”. Ponownie widzimy
znany nam już panel wyboru kolekcji. Ponieważ ostatnio wybieraliśmy
jedna z perspektyw budżetu centralnego, ta kolekcja zostanie dla nas
wyświetlona. Wśród nich znajduje się również Budżet instytucjonalny
w dwóch wydaniach – na rok 2011 i 2012. Wybieramy pierwszy z nich.
Ile dla kogo?
Czym są arkusze
Tabela z danymi budżetu instytucjonalnego pojawiła się na
stronie internetowej. Warto w tym miejscu zauważyć, że poprzednia tabela
– ta z budżetem zadaniowym – nigdzie nie zniknęła. Jest gotowa do
użycia w innym arkuszu. To właśnie dzięki arkuszom możemy w łatwy
sposób porównać dane z różnych, często odległych sobie tematycznie
kolekcji. Co więcej – jeśli teraz zmienimy widok na arkusz zawierający
uprzednio oglądany przez nas budżet zadaniowy, zobaczymy tabelę w takim
stanie, w jakim ją poprzednio zostawiliśmy – otwarta jest edukacja i
wychowanie. Wróćmy jednak do budżetu instytucjonalnego.
Po kolei...
Sortowanie danych
W tabeli widzimy alfabetycznie ułożone instytucje uczestniczące w
budżecie państwa. Jest w śród nich i Ministerstwo Edukacji Narodowej z
kwotą 409 582 000 złotych. Czy to dużo, na tle innych instytucji?
Najłatwiej byłoby zobaczyć wszystkie instytucje w kolejności od tej,
która ma największy udział w budżecie państwa do tej, która ma udział
najmniejszy. Do tego posłuży nam sortowanie. Po naciśnięciu w guzik
„Sortuj” pojawi się nieduży panel pozwalający nam wybrać, na podstawie
wartości której kolumny oraz w jakim porządku chcemy dane posortować.
Wybieramy zatem „Budżet państwa” i „Malejąco”, po czym naciskamy
niebieski guzik „Sortuj”. Łatwo teraz zobaczyć, że MEN otrzymuje dużo
mniej od np. GUS-u.
Tylko wybrane...
Filtrowanie danych
Jak jednak wypada na tle innych ministerstw? Ile jest ministerstw, które
otrzymują mniejsze środki? Żeby się przekonać, musimy przefiltrować
nasze dane. Naciskamy guzik „Filtruj”, a w panelu filtrowania podajemy:
„Treść”, „Zawiera”, „Ministerstwo”.
Zanim jednak skończymy, pamiętajmy,
że chodziło nam o te ministerstwa, które otrzymały mniej środków od
MEN-u. Naciskając guzik „Dodaj kolejny klucz” będziemy mogli określić,
że chodzi nam o te pozycje, których suma nie przekracza 400 mln złotych.
W kolejne pola wpisujemy zatem: „Budżet państwa”, „<”, „400000”.
Teraz możemy nacisnąć niebieski guzik „Filtruj”. Jak widać tylko
Ministerstwo Skarbu posiada mniejszy udział w budżecie państwa.
Ciekawe, co na to...
Udostępnianie i pobieranie
W chwili obecnej mamy trzy arkusze - budżet zadaniowy, budżet
instytucjonalny i wynik naszego filtrowania. W czasie tej krótkiej
sesji z Otwartymi danymi udało nam się zauważyć kilka ciekawych
zjawisk: edukacja w budżecie rozdysponowana jest między wiele resortów,
Ministerstwo Edukacji Narodowej jest instytucją posiadającą relatywnie
nieduże udziały w budżecie państwa i plasuje się gdzieś pod koniec
listy ministerstw. Być może zainteresuje to naszego współpracownika
lub sąsiada. Korzystając z zakładki „Udostępnij” łatwo jest
stworzyć tzw. permalink, czyli adres internetowy, pod którym
zapisane zostaną wybrane przez nas arkusze.
Co więcej, zarówno każdy z naszych arkuszy jak i pełne
kolekcje danych zapisać możemy w pliku CSV, czyli
otwartym i powszechnie przyjętym formacie arkusza kalkulacyjnego.
Dzięki temu dalsze zgłębianie tematu będziemy mogli prowadzić za
pomocą naszych ulubionych i najlepiej nam znanych narzędzi - pakietu
biurowego, środowiska statystycznego czy dowolnego języka programowania.
Publiczny API
Serwis otwartedane.pl udostępnia wszystkie zebrane w nim dane poprzez
publiczny interfejs programistyczny.
Pełna dokumentacja API jest dostępna
tutaj.
Oprogramowanie
Strona otwartedane.pl działa w oparciu o Raw Salad, sieciową
przeglądarkę danych stworzoną w Centrum Cyfrowym.
Raw Salad to narzędzie, które pozwala użytkownikom łatwo wyszukiwać i
przeglądać dane, dobierać dane potrzebne im do pracy, dostosować sposób
prezentacji danych do swoich potrzeb oraz wykorzystywać je we własnych
projektach.
Raw Salad oferuje ujednolicony tok pracy z danymi. Bez względu na
strukturę danych i ich treść przeglądanie danych w Raw Salad wygląda tak
samo.
Do pobrania
Kod źródłowy systemu Raw Salad jest przez nas udostępniany na otwartej
licencji BSD. Licencja ta pozwala na jego swobodne wykorzystywanie, do
dowolnych celów, bez dodatkowej naszej zgody.
Więcej informacji o Raw Salad można znaleźć na
stronie projektu.
Kod źródłowy Raw Salad udostępniamy na portalu
GitHub.
Otwartedane.pl is a Polish service that makes public data available in a
way that's transparent, useful and standardized. Our goal is to increase
the opennes: availability and re-use of public data. We also want to
demonstrate how to publish data in accordance to open data standards.
We believe that publication of public data in an open manner brings
social value by increasing their usefulness, effectiveness and
innovation of uses, and transparency of public administration. Our goal
is both to make specific data available in an open way, and to
demonstrate how the open data model works.
Currently we are publishing several collections of data on Polish public
finances, which we consider one of the key datasets that need to be made
available.
Otwartedane.pl is a service built with
Raw Salad,
a data publishing and viewing platform developed by
Centrum Cyfrowe.