Lepszych danych statystycznych, by przegonić Zachód

Udostępniając więcej danych szybciej możemy zwiększyć sprawczość państwa, wartość naszych biznesów, żyć lepiej. Okresem sprawozdawczym dla statystyki publicznej powinna być każda sekunda. Zamiast okresowych ankiety na próbce badanej populacji zbierać należy dane o całości populacji. Dane udostępniać zaś w czasie rzeczywistym.

Informacje społeczno-gospodarcze zbierane są u nas jak w XIX wieku. Firmy i obywatele najpierw coś robią. Na koniec okresu sprawozdawczego firmy i obywatele wypełniają papierowe formularze lub ich elektroniczne odpowiedniki. Wysyłają te formularze do urzędu. Urzędnicy zbierają i podsumowują formularze. Tygodnie jeśli nie miesiące, kwartały czy wręcz lata po wydarzeniu dostajemy informacje o stanie gospodarki i społeczeństwa.

Na świecie nieliczne urzędy nieśmiało wyłamują się z tych ubiegłowiecznych wzorców. Na przykład w USA cotygodniowo udostępniane są dane o wnioskujących o bezrobocie. W Europe standardem jest comiesięcznie udostępnianie informacji o bezrobociu.

W Polsce możemy mieć więcej informacji szybciej! Bariera jest mentalna i organizacyjna. Postępujący od lat 70ych ubiegłego wieku szybki spadek kosztów zbierania, przesyłania i przetwarzania danych powoduje, że nasze prozaiczne codzienne zachowania generują elektroniczny zapis z samego faktu zarabiania, wydawania, czy przemieszczania się.

Kasy w sklepach coraz częściej na bieżąco w czasie realnym raportują ile, po jakiej cenie i kto kupił. Płatności elektroniczne z kart i telefonów opisują popyt, konsumpcję, inflację, itp. Telefony komórkowe codziennie lepiej niż spisy powszechne raz na 10 lat liczą ludność obecną w danym miejscu. Samochody i ciężarówki przemieszczają się po autostradach pod okiem kamer, które mogą je liczyć. Podobnie z ruchem pieszych na ulicach. Ciężarówki na płatnych trasach są szczegółowo rozliczone z przejazdu. Dzień po dniu banki dostają od pracodawców przelewy na konta pracowników. Zanim urzędy zestawią informacje o zatrudnionych, zwolnieniach i wysokości płac banki widzą liczby i sumy wynagrodzeń.

Niedostępność dobrych danych jest widoczna zwłaszcza teraz, gdy dzieje się coś niestandardowego. Likwidowanie i ograniczanie aktywności gospodarczej w rezultacie zakazów związanych z pandemią w oficjalnych statystykach zaczęło się pojawiać dopiero w ostatnich dniach. Za jakiś miesiąc do trzech statystyka publiczna da nam w miarę pełny obraz spowolnienia … z kwietnia i maja.

Brak pełnej informacji to niewiedza, błędne decyzje i nadużycia. Gdy gospodarka będzie wychodzić z dołka za miesiąc czy dwa w mediach będą wypływać negatywne informacje z poprzednich miesięcy. W minionych tygodniach, gdy obywatele przestraszeni COVID odkładali więcej gotówki, sprzedawcy w bankach i innych instytucjach zachęcają do kupna domów, samochodów, dzieł sztuki, itp. strasząc swoich potencjalnych klientów rzekomym wyciąganiem gotówki z kont przez konkurentów do kupna mieszkania czy samochodu. Jeśli chciałbyś sam sprawdzić jak jest z gotówką w danych udostępnianych przez NBP to na koniec maja NBP dawał informacje o gotówce w bankach na koniec …marca.

Każdy z nas może być lepiej poinformowany. By gonić zachód Polacy powinni mieć lepsze dane o naszej gospodarce i społeczeństwie niż społeczeństwa zachodu o swoich gospodarkach. By nasza gospodarka była sprawniejsza. By tworzyć w Polsce nowe lepsze modele biznesowe. By zarabiać na uczeniu innych jak optymalizować gospodarkę przy użyciu danych.

Częściowo w sektorze prywatnym jest już sporo kompletniejszych szybciej dostępnych danych. Na przykład think tank CASE na podstawie danych z internetu daje cotygodniowe odczyty inflacji. Dziś CASE nam mówi co się dzieje z inflacją na początku czerwca, a GUS podaje dane o inflacji za marzec:

Źródło: https://www.case-research.eu/pl/online-case-cpi

Dla europejskich producentów elektryczności dostępne są dzienne dane opisujące produkcję elektryczności godzina po godzinie. Dostępne już chwile po przesłaniu energii:

Źródło: https://transparency.entsoe.eu/

Na tle danych o elektryczności dostępnych w czasie prawie rzeczywistym sprawozdania Głównego Urzędu Statystycznego o elektryczności z 2019 roku wyglądają rozczulająco staroświecko.

Banki, sklepy, restauracje i hotele, porty oraz kolejowe terminale kontenerowe, itp. co dzień, co godzina generują dane przydatne do zrozumienia co się dzieje w społeczeństwie. Liczba statków, które w danym dniu przybiły do portu w Gdańsku i ich ładunek. Liczba kontenerów rozładowanych w terminalu kolejowym w Warszawie. Procent zajętych miejsc w hotelach. Liczba rachunków i przeciętna wartość rachunków w restauracjach.

Oprócz zwyczajowego braku wyobraźni i powolności urzędów statystycznych na drodze do dostępu do lepszej informacji stoi zwyczajowa podejrzliwość. Po co te dane? Komu? Jaka krzywda czeka nas z powodu większej dostępności informacji?

Zamiast złorzeczyć na inwigilację potrzebujemy pomyśleć jak więcej i szybciej danych udostępniać bez szkody dla obywatela. Już dziś w statystyce publicznej dostępna jest suma danych o nas, ale nie są publikowane informacje o którejkolwiek pojedynczej osobie. Nie publikuje się informacji o tym, że Kowalski dostał pracę, a Nowak stracił. Publikuje się zbiorcze zestawienia zatrudnionych i bezrobotnych. W przyszłości będzie tak samo.

To, że Kowalski pojawił się w sklepie jest mało ciekawe dla naświetlenia sytuacji społeczno-gospodarczej. Ale to, że liczba obywateli w sklepach rośnie lub spada w danej godzinie, dniu czy tygodniu, czy też rośnie lub spada przeciętny paragon obrazujący zakupy przeciętnego klienta jak najbardziej potrzebuje być dostępne w statystyce publicznej.

Nowoczesną statystykę publiczna powinniśmy stworzyć w oparciu o trzy zasady:

1. Dane zbierane całej populacji. Obecnie większość danych zbieranych jest w oparciu o mniej lub bardziej reprezentatywne próbki populacji przedsiębiorców, pracujących, rolników, itp. Ograniczenie się do próbek z populacji miało sens gdy zbieranie i przetwarzanie danych było kosztowne. Niebawem każda faktura będzie rejestrowana na serwerach służb podatkowych w czasie rzeczywistym. Możemy na tej podstawie mieć obraz znacznej części gospodarki w czasie rzeczywistym.

2. Dane zbierane i udostępniane w czasie rzeczywistym. Okres sprawozdawczy, w którym zbiera się i sumuje statystyki ma mnie więcej tle sensu, co ruchoma stolica praktykowana we wczesnym średniowieczu, gdy władca krążył od grodu do grodu – ruszał do następnego, gdy wyjadł miejscowe zapasy. Dane powinny być udostępniane natychmiast.

3. Dane administracyjne maksymalnie szeroko i szybko odzwierciedlane w statystyce publicznej. Urzędy zbierają o nas ogromną ilość ważnych informacji. Rejestrowanie samochodów, kupno nieruchomości, narodziny, zgony i choroby. Liczba osób, która w danym dniu i godzinie przekroczyła granicę, w tę czy druga stronę. Dane te jeśli trafiają do statystyki publicznej to z ogromnymi opóźnieniami oraz na tak wysokim stopniu agregacji, że są często mało przydatne.

Ulepszenie dostępu do danych to przede wszystkim wyzwanie organizacyjne i mentalne. Nie potrzeba miliardowych nakładów jak na modernizację infrastruktury. Po prostu trzeba chcieć i zrobić.

Inne wpisy w temacie:

Księgi wieczyste dla wszystkich – 10 marca 2013 – Większa dostępność informacji pozwala obywatelom nadzorować władze, siebie nawzajem oraz łatwiej i taniej załatwiać podstawowe czynności życia. Pełen dostęp do ksiąg wieczystych w wersji full text search pozwalającej każdemu szukać adresem i nazwiskiem powinien być regułą. Każdy Polak powinien mieć możliwość dowiedzieć się po ile chodzą nieruchomości w danej okolicy, kogo będzie miał za sąsiadów jeśli kupi jakąś nieruchomość, czy znaleźć nieruchomości, które mają jego dłużnicy.

0 comments… add one

Leave a Comment