Cum sunt ajustate „din pix“ datele din statisticile COVID-19
Cercetătorul Octavian Jurma a analizat problema numărului de cazuri nealocate, prezent în fiecare raportare zilnică a Grupului de Comunicare Strategică (GCS), iar cei de la Graphs.ro au folosit Legea lui Benford pentru a arăta cum autorităţile adaugă sau scot cifre din bilanţ după cum le este oportun.
Ce se întâmplă cu „numărul cazurilor nealocate”
Autorităţile au decis, pe 15 octombrie, să nu includă focarele în raportările zilnice referitoare la numărul de noi infectări. De asemenea, autorităţile au decis că nu vor ţine seama de persoanele rezidente dintr-o localitate, ci doar de cei care domiciliază acolo.
Ambele decizii au ca rezultat scăderea „din pix” a incidenţei în localităţi şi o manipulare a dimensiunii reale de răspândire a SARS-CoV-2.
GCS raportează, în fiecare bilanţ zilnic, o variabilă numită „numărul de cazuri nealocate” la sfârşitul listei cu noile infectări prezente în fiecare judeţ.
„Acum avem un rezervor de 5.000 de cazuri care atunci când vor fi alocate vor produce scăderi ale valorilor zilnice, din moment ce nu s-au reconciliat săptămâna asta. Probabil se vor reconcilia întâmplător săptămana viitoare, când ne aşteptăm pe curba de prognoză de la începutul lunii să ajungem la valori alocate între 11.000 si 12.000 de cazuri pe zi, dar valori oficiale vor fi tot în jur de 10.000”, a scris pe Facebook Octavian Jurma.
Cercetătorul a arătat, într-un articol publicat pe platforma Republica.ro, că în acest fel autorităţile pot spune că România a intrat în zona de platou a epidemiei, pentru a arăta că măsurile pe care le-au luat au avut succes.
„De la începutul epidemiei au exisat mici diferenţe între totalul pe judeţe şi totalul naţional. Aceste diferenţe erau reconciliate prin atribuirea acestor cazuri unei categorii etichetată “-” sau un judeţ fictiv „judeţul 43″. Este important să înţelegem că acestea erau cazuri care rămâneau permanent nealocate astfel încât apariţia lor avea un impact nesemnificativ asupra curbei epidemice.
Din data de 3 noiembrie însă apare un număr uriaş de cazuri nealocate temporar care se adaugă la numărul celor nealocate permanent. În raportul oficial rubrica “-” este înlocuită cu „cazuri noi nealocate [temporar] pe judeţe” şi primim o explicaţie că acest artefact se datorează „modificărilor aduse platformei electronice”.
E mai simplu de înţeles dacă urmăriţi curba cazurilor noi în raportate oficial (curba roşie) în raport cu suma numărului de cazuri noi pe judeţe (barele albastre).
Deoarece aceste valori se raportau doar după reconciliere până în 3 noiembrie, cele două curbe se suprapun, dar apare o întârziere de câteva zile între momentul măsurătorii şi momentul raportării de care am mai vorbit.
După 3 noiembrie, numărul de cazuri noi raportate la nivel naţional este sistematic mai mare decât numărul cumulat de cazuri noi pe judeţe.
La finalul săptămânii trecute avem un excedent de aproape 5.000 de cazuri noi.
În mod normal, corecţia se face actualizând baza de date cu valoarea corectă, dar pentru asta ar trebui să corectăm săptămâna asta valorile comunicate deja săptămâna trecută. Vă daţi seama ce scandal ar ieşi, deşi ar fi prefect normal pentru un informatician.
Singura alternativă pentru a reconcilia politic corect cele două şiruri de valori este să scazi cazurile pe care le aloci azi pe judeţe din totalul de cazuri noi al zilei sau, evident, să faci ca până acum şi să nu raportezi valori care necesită corecţii ulterioare.
Astfel, joi au fost 8.536 de cazuri, dar s-au raportat 10.142 prin adăugarea a 1.701 de cazuri care au putut fi alocate judeţelor, iar vineri s-au raportat 9.489 în loc de 10.163 cazuri prin scăderea a 674 de cazuri care s-au alocat azi judeţelor din „rezervorul” (buffer) de cazuri nealocate. Iată cum arată numărul de cazuri nealocate (bare roşii) şi realocate (bare albastre), altfel spus adăugate sau scăzute din totalul zilnic în ultimele 3 săptămâni.”, a explicat Octavian Jurma.
Cercetătorul spune că acesta este un sistem care produce ceaţă statistică şi corupe datele zilnice, dar păstrează totalul general corect.
„E ca şi cum un bancher ar lua şi ar adauga bani în fiecare zi din depozitele celor 42 de clienţi ştiind că la un eventual control poate să arate că banii lipsă sunt în seiful băncii şi îi va pune la loc când are timp să îi numere. Avantajul acestui sistem este că lucrezi cu banii clientului, dar niciodată nu eşti pe minus, deci nu poţi fi acuzat de furt”, explică Octavian Jurma.
Explicaţia autorităţilor pentru numărul cazurilor nealocate este următoarea: „Facem precizarea că numărul acestora este determinat de modificările aduse platformei electronice prin care sunt raportate şi centralizate rezultatele testelor pentru noul coronavirus. Astfel, conform noii metodologii, centrele de testare introduc în mod direct rezultatele testelor realizate, urmând ca de la nivelul DSP să fie realizată ancheta epidemiologică şi atribuite cazurile pozitive judeţului/localităţii de care aparţin persoanele infectate”.
Legea lui Benford şi datele raportate de GCS
Statisticienii de la Graphs.ro folosesc o altă metodă, mai complicată, pentru a arăta că datele raportate zilnic nu sunt neapărat cele reale.
Legea lui Benford spune că numerele dintr-o bază de date au, din punct de vedere statistic, anumite caracteristici. Fizicianul Frank Albert Benford a observat că, într-o bază de date, cifra de început în aceste numere este 1 în aproximativ 30% din timp, cifra 2 aproximativ 17,6% din timp, şi aşa mai departe, până la cifra 9 (5% din timp).
Pe baza acestei legi, statisticienii au calculat deviaţii de la regulă, ceea ce înseamnă că şirul de date este, din acest punc de vedere, corupt.
Medicul psihiatru Gabriel Diaconu a explicat ce înseamnă aceste deviaţii.
„Colegii mei de la Geospatial.org, respectiv Dragoş Vana de la Graphs.ro, au făcut posibilă această explorare şi le mulţumesc din suflet pentru efortul depus. Există, pentru fiecare judeţ al României, o curbă Benford care arată cât de «adevărate» au fost cifrele. Veţi vedea că PESTE TOT, la nivelul României, există abateri semnificative de la curba Benford în ce priveşte numărul de cazuri nou anunţate, numărul de teste comunicate, dar şi numărul de decese. Abateri semnificative = cineva a minţit, cineva a falsificat date. Îmi asum această apreciere. Ea nu este o acuzaţie. Dar într-o chestiune de asemenea importanţă publică, şi cu asemenea ramificaţii pentru viaţa atâtor români, nu ne putem nici bate joc, nici ascunde, nici nu putem îmbrobodi oamenii”, a scris pe Facebook medicul Gabriel Diaconu.
SURSA: Comisarul.ro// https://www.comisarul.ro/articol/cum-sunt-ajustate-din-pix-datele-din-statisticile-_1161435.html