Od baseballu k volbám 2020 – FiveThirtyEight | EkonTech.cz


Od baseballu k volbám 2020 – FiveThirtyEight

Ekonom / USA / volby
10. 9. 2020 - 9:02

Každý den lze o jednotkách událostí čerpat o řád více informací a komentářů. Jedná se o výhodu i prokletí věku technologického. Jak píše ve své knize Signál a šum statistik a žurnalista Nate Silver, od knihtisku se šíření informací exponenciálně urychluje a navyšuje co do počtu jednotlivých kanálů. Pamatujme tedy, že událostí ve světe kolem nás (signál) se děje řádově stále stejné množství. Jediné, co se vymyká, jsou četné reportáže, analýzy, komentáře a názory okolo těchto událostí, které často nerespektují hledisko objektivity, poukazují na korelaci bez kauzality, či dokonce informují o neexistujících signálech (šumy).

Politické volby jsou událostí, která plně zaměstnává média a naše informační kapacity. Volby prezidenta USA jsou v jistém slova smyslu divadlem dnešní doby. Nate Silver jako zakladatel blogu FiveThirtyEight (odkazuje se na počet volitelů prezidenta USA – nejedná se totiž o přímou volbu prezidenta) a statistik transparentně objasňuje své predikční modely, díky kterým si získal velkou pozornost ve volbách 2008 (správně predikovány výsledky 49 z 50 států) a 2012 (všech 50 a District of Columbia).

Začínal už v roce 2003 s programem PECOTA (Picher Empirical Comparison and Optimization Test Algorithm) pro modelování výkonu nadhazovačů v baseballu. Tehdy si vedl lépe než konkurence, a proto jej postupně vylepšoval. Tento sport je spojen s jedním z nejbohatších datových souborů obsahující několik desítek let precizních záznamů. Volby prezidenta takový soubor dat mít nemohou, i proto je daleko složitější jejich modelování.

Základem Silverových modelů FiveThirtyEight je tvorba probabilistických předpovědí a „Bayesovská“ statistika, nikoliv využití Fisherova statistického aparátu (ve škole se učíme primárně „Fisherovskou“ statistiku). Nové signály jsou zapracovány na denní bázi – nelze se držet včerejších předpovědí, přestože se zdály „správné“ – je potřeba je upravit. Jako důležité také vnímá hledání shody s dalšími předpověďmi. Souborné předpovědi shledává z dlouhodobého časového hlediska přesnější než předpovědi jednotlivce (jednotlivé agentury).

Silver vnímá jako problém mnoha předpovědí (i ekonomických) neuvědomění si chyb, které vznikají z pouhé extrapolace dat („pokračování v trendu“), zahrnování šumů, které fundamentálně neovlivňují danou předpověď (korelace bez kauzality), stejně jako opomíjení hodnot, které při zohlednění mocninných zákonů nejsou pouze „odlehlé hodnoty“. Při užití dvojité logaritmické škály lze konstatovat relativně dobrou předpovědní schopnost pro četnost a počty úmrtí při zemětřesení, četnost a počty obětí teroristických útoků a další.

 Graf: FiveThirtyEight

Nejistota je element, který nejen v amerických prezidentských volbách 2016, ale i v těchto letošních, bude hrát velmi důležitou roli. S blížícím se volebním dnem bude nejistota klesat a odhadovaný výsledek voleb se bude zpřesňovat (stále v probabilistickém zobrazení). Model FiveThirtyEight je z dlouhodobého pohledu kalibrovaný správně. Rok 2016 byl sice jiný, předpovědní model přisoudil v cca 3 z 10 scénářů výhru Trumpovi, i to byla ovšem daleko větší šance, než jaké mu přisuzovaly modely dalších agentur, institucí či žurnálů. Když se podíváme na aktuální stav předpovědi (začátek září) pro letošní volby, model Trumpovi přisuzuje obdobné šance – ale pozor, význam nejistoty v době koronavirové kaskádovité medializace stoupá, stejně jako počty velmi vážných politicko-sociálně-ekonomických událostí.