Keď údaje zlyhávajú
Diskusia 5
Foto: getty images;YT/BI
29. 8. 2022 - V prípade, že vezmete do úvahy iba podmnožinu dostupných informácií, riskujete zlý výsledok. Ide o problém s ktorým sa stretávame aj inde ako vo finančnom svete.
Začiatkom 20. rokov mali výrobcovia áut veľký problém – klepanie motora. Nerovnomerné spaľovanie vydávalo nepríjemný zvuk a zároveň mohlo spôsobiť trvalé poškodenie motora. Na vyriešenie tohto problému začali automobiloví inžinieri pridávať do benzínu olovo (tetraetylolovo) v nádeji, že stabilizujú spaľovanie. Fungovalo to. Aditívom sa inžinierom podarilo zvýšiť oktánové číslo benzínu, vyrovnať spaľovanie a znížiť klepanie motora.
Bohužiaľ, netrvalo dlho a začali sa objavovať negatívne vedľajšie účinky tohto pridaného olova. Po tom, čo v roku 1924 zomrelo 15 pracovníkov na podozrenie na otravu olovom, lekárske konzílium pozastavilo výrobu olovnatého benzínu a porota mala preskúmať potenciálne nebezpečenstvá. Jedným z tímu bol aj toxikológ Robert Kehoe, ktorý bol pripravený pri odhaľovaní jedovatosti olova zájsť extrémne ďaleko. V nasledujúcich rokoch sa Kehoe pustil do série prepracovaných a nebezpečných experimentov, aby ukázal, že sa olovo v tele nehromadí. Mladým mužom dostával do tela olovo cez dýchací aj tráviaci trakt až päť rokov, pričom meral olovo v ich výkaloch a moči. U všetkých nameral olovo, či už to boli mexickí roľníci, ktorí varili a jedli z oloveného riadu, alebo muži, ktorí pracovali v závodoch na výrobu tetraetylolova. V dôsledku toho sa Kehoe rozhodol, že určité „znečistenie“ olovom je prirodzené a normálne u každého.
Šéf tímu s výsledkom súhlasil a dospel k záveru, že „neexistujú žiadne dôvody na zákaz používania etylbenzínu... ako motorového paliva za predpokladu, že jeho distribúcia a používanie sú riadené správnymi predpismi“. Tým sa otvorili stavidlá pre olovnatý benzín, ktorý mohol voľne prúdiť do nádrží čerpacích staníc po celých USA. Do roku 1960 predstavoval olovnatý benzín takmer 90 percent všetkého automobilového paliva predaného v Spojených štátoch.
Našťastie geochemk Clair Patterson vedel, že všetko toto olovo je pre verejnosť nebezpečné. V polovici 60. rokov teda začal verejnú krížovú výpravu proti používaniu olova v priemyselných procesoch. Jeho úsilie prinútilo Kongres, aby schválil zákon o čistom vzduchu z roku 1970, ktorý prinútil rafinérie začať odstraňovať olovo z benzínu . V roku 1996 bolo olovo oficiálne zakázané v USA na spotrebiteľské použitie.

Keď sa dnes pozrieme späť, môžeme vidieť, že Robert Kehoe sa vo veľkom mýlil. Jeho dáta zlyhali, pretože nemal správne údaje. Hoci Kehoeho merania naznačovali, že olovo sa v tele nehromadilo, prehliadol miesto, kde sa hromadilo — v kostiach. V dôsledku tohto opomenutia sme na naše vlastné zdesenie skončili s vypúšťaním olova do životného prostredia za viac ako 50 rokov.
Kehoeho chyba je ukážkovým príkladom toho, ako nás údaje, keď sa nepoužívajú správne, môžu dostať do omylu. Existujú však aj iné príklady, ako nám môžu údaje zlyhať. Jedným z najbežnejších spôsobov zlyhania údajov je, keď opisujú iba podmnožinu toho, čo sa skutočne pokúšate analyzovať.
Podobne ako pri chybe Roberta Kehoea, ktorý sa zameral iba na časť údajov, aj my môžeme dospieť k nesprávnemu záveru. Jednou z oblastí, kde je to bežné, je vnímanie priemeru. Pri brodení sa riekou môže byť životu nebezpečné poznať iba priemernú hĺbku, oveľa viac napovie maximálna hĺbka.
Existujú však aj prípady zo skutočného sveta. Dátoví vedci z Uberu správne zistili, že priemerný čas čakania nie je najlepším meradlom užitočnosti algoritmu zodpovedajúcej jazde. Predstavte si napríklad algoritmus, ktorý zanedbáva menej obývané oblasti (drasticky zvyšuje čakací čas pre malý počet jazdcov v týchto oblastiach), ale skracuje čakací čas pre všetkých ostatných jazdcov. V tomto prípade sa priemerný čas čakania možno skrátil, no stalo sa tak na úkor ľudí žijúcich v riedko osídlených lokalitách.
Rovnaký problém vidíme vo finančnom svete, keď si niekto vyberie investíciu z dôvodu jej vysokej návratnosti bez ohľadu na jej volatilitu. Ešte raz, keď vezmete do úvahy iba podmnožinu dostupných informácií, riskujete zlý výsledok.

Nakoniec, niekedy „priemerný“ výsledok neplatí pre vašu individuálnu skúsenosť. Určite ste už počuli, že ľudia, ktorí míňajú peniaze na zážitky, sú šťastnejší ako tí, ktorí míňajú peniaze na materiálne statky. Čo ak to však platí len pre určitú časť populácie (extrovertov)? Čo ak tento výsledok neplatí pre každého?
Toto je problém pri použití jednoduchej mierky, ako je priemer. Niekedy vás do problémov nedostane to, čo vidíte, ale to, čo nevidíte.
Ďalším bežným spôsobom, ktorým môžu byť údaje zavádzajúce, je, keď sú tieto údaje odvodené z procesu, ktorý sa časom mení. Kedykoľvek sa zmenia základné mechanizmy, ktoré vytvárajú sériu údajov, vzorce majú tendenciu sa rozpadať. Príkladom môže byť počiatočný investičný štýl Benjamina Grahama pri nákupe firiem, ktoré majú čistú hodnotu bežných aktív vyššiu ako je ich trhová kapitalizácia. Inými slovami, celú spoločnosť môžete kúpiť za menej, ako je jej likvidačná hodnota. Ak by ste predali všetky akcie spoločnosti, dostali by ste späť viac peňazí, než za ktoré sa spoločnosť momentálne predáva. To je ako kúpiť si kufor so 100 000 dolármi len za 50 000 dolárov. Mohlo by sa zdať bláznivé myslieť si, že niečo také by mohlo existovať, ale áno.
Bohužiaľ, vďaka lepšie informovanej triede investorov sú teraz takéto možnosti raritou. Táto stratégia, ktorá bola prvýkrát predstavená Grahamom v analýze bezpečnosti v roku 1934, nemá takú výhodu, ako kedysi. Nielenže dnes viac investorov analyzuje akcie, ale majú aj viac informácií. Konečným výsledkom je to, že sa takéto ponuky objavujú len vo výnimočných prípadoch alebo v špecifických odvetviach.
Ďalším príkladom prelomenia finančného modelu je obľúbený pomer ceny a zisku (P/E). Už takmer desať rokov je pomer P/E nad svojím historickým priemerom, čo mnohým investorom spôsobuje vrásky. Je však tento historický priemer stále aktuálny vzhľadom na to, ako veľmi sa zmenilo zloženie amerických akcií za posledné storočie? Nielenže boli vynájdené nové druhy spoločností a nové spôsoby podnikania, ale vďaka úpravám účtovných pravidiel sa pomery P/E v priebehu času stali menej porovnateľnými. Neznamená to, že pomer P/E je zbytočný, ale asi ho treba brať s rezervou.

Napokon, údaje zlyhajú, keď sú nesprávne. Keď sa spoliehame na správne nápady, môžeme byť uväznení reťazami nevedomosti, keď sa ukážu ako nesprávne. Zoberme si prípad neslávne známeho článku autorov Reinharta a Rogoffa „Rast v čase dlhu“ , ktorý obsahoval veľkú chybu Excelu. Práca Reinharta a Rogoffa ukázala, že priemerný reálny ekonomický rast sa spomaľuje (pokles o 0,1 %), keď dlh krajiny stúpne na viac ako 90 % hrubého domáceho produktu (HDP). A toto 90 % číslo bolo opakovane využívané v politických argumentoch o vysoko profilovaných úsporných opatreniach. Pokles o 0,1 % bol však nepresný, pretože vzorec programu Excel nesprávne zaokrúhľoval. Po úprave vzorca sa z 0,1 % poklesu stal rast o 2,2 %, čím sa úplne zmenil záver článku.
Túto chybu podľa Google Scholar citovalo viac ako 4 500 ďalších akademických prác. A mnohé z týchto akademických prác boli citované tisíckami iných akademických prác a tak ďalej. Dlhý reťazec nevedomosti z jednej chyby Excelu.
To je dôvod, prečo môžu byť chybné údaje také deštruktívne, najmä ak pochádzajú z vplyvného zdroja. Najlepší spôsob, ako zabrániť tomu, aby ste prispeli k takémuto reťazcu nevedomosti, je zostať mierne skeptický voči nedávnym zisteniam, bez ohľadu na to, od koho pochádzajú. Kedykoľvek pracujete s údajmi, mali by ste zvážiť, ako by mohli zlyhať. Chýba tomu niečo? Zmenil sa proces vytvárania v priebehu času? Nie je to jednoducho nesprávne?
Všetky tieto problémy (a ďalšie) môžu ovplyvniť spôsob, akým interpretujete informácie a robíte rozhodnutia. Nikto voči tomu nie je imúnny. Mnohí sme už tieto chyby urobili a možno ich jedného dňa urobíme znova. Zmyslom však nie je usilovať sa o dokonalosť. Ide o to, aby sme boli o niečo lepší v tom, na aké údaje sa spoliehame teraz a v budúcnosti.