Pátrání Sherlocka Bayese a etické kauzy

/ROSTISLAV VODÁK/

Všichni tu scénu dobře známe. Majitel panství je mrtev, leží na zemi s nožem v zádech a vraždu mohli spáchat jen čtyři lidé, z nichž jeden je zahradník. Na Sherlocka Holmese čeká opět těžký úkol. Musí sesbírat důkazy, které jednoho z těch čtyř usvědčí. A nebo taky ne. Sherlocka totiž napadne geniální myšlenka. Obrátí se na svého věrného druha a pronese: „Vyloučíme-li, milý Watsone, vše nemožné, pak pravda je i to, co se zdá vysoce nepravděpodobné“. Vraždu lze tedy jednomu z těch čtyř prokázat i tak, že postupně budeme dokazovat, že ostatní tu vraždu spáchat nemohli. Celý postup vyšetřování je shrnutý na následujícím obrázku, kdy jsou jednotliví potenciální pachatelé postupně vylučováni. Současně na ose y vidíme, že pravděpodobnost, že někdo ze zbývajících lidí je vrahem, postupně roste, přestože náš Sherlock není schopen přesně zjistit, který to je. Proto se sloupečky postupně zvyšují, ale současně jsou u zbývajících lidí vždy stejně vysoké. Každý výsledek pátrání (posterior), je pak použit jako vstup (prior) pro další vyšetřování. Náš Sherlock by se tedy měl spíše jmenovat Sherlock Bayes.

Náš Sherlock ale měl velkou dávku štěstí, protože byl schopen kvantifikovat spoustu informací. To v etických kauzách (např. [2], [3], [4], [5], [6], [7]), které více čí méně lokálně (bohužel) hýbou touto společností často není možné. To může u spousty lidí vyvolat pocit beznaděje a u jiných pocit beztrestnosti. Ve skutečnosti ale pravděpodobnosti odhaduje více či méně hrubě každý z nás, a to s použitím slov „asi“, „možná“, „pravděpodobně“ atd. Myslím, že bychom se neměli bát tato slova používat i v etických kauzách. Pojďme se proto podívat na jednotlivé druhy argumentace, které se v těchto kauzách opakovaně objevují.

Ten obrázek jsme tam vložili omylem. Myslím, že každému z nás je jasné, že toto se může stát. Pravděpodobnost, že se to stane, je sice malá, ale ne nulová. Současně ale cítíme, že za normálních okolností se to děje výjimečně, a tudíž se to moc často neopakuje. Pokud se tedy u někoho tento jev vyskytuje častěji, a to někdy i s více obrázky v jednom článku, tak se logicky stává podezřelým z toho, že to dělá úmyslně. Toto podezření odpovídá tomu, že se na základě dostupných dat v našem myšlení zvyšuje pravděpodobnost, že dotyčný je podvodník, a klesá pravděpodobnost, že je to jen popleta. Toto podezření ještě zesiluje, pokud jsou obrázky různě upravovány. Zkuste si každý sám odpověď na otázku, jak moc náhodná může být následující činnost: Nahraj omylem jiný obrázek, omylem jej uprav (otoč, změň kontrast atd.), ulož a omylem vlož do článku.
„Chybné“ články tvoří nula celá nic z vědecké produkce autora. Tento na pohled primitivní argument je ve skutečnosti velice chytrý. Předpokládá totiž, že veškeré dodatečné informace jsou vlastně irelevantní. Vysvětlím: Pokud na začátku není jasné, zda dotyčný je nebo není podvodník, tak lze předpokládat, že je to pravděpodobně slušný člověk. Pokud se nás někdo
snaží přesvědčit, že všechny jeho „chybné“ články jsou jen zanedbatelnou
částí jeho publikační činnosti, tak nám tím vlastně říká, že ať v nich je
cokoli, tak to nemůže změnit počáteční nastavení a tedy tento člověk je stále slušný. Pokud na to přistoupíme, tak se vlastně zbavujeme informací, které by náš názor mohly změnit. A nejsou-li tyto brány v potaz, nemáme jak upravovat pravděpodobnosti.
Chyby v článku nemají vliv na výsledek. Pomiňme nyní otázku, proč se v článku vyskytují nějaké věci, třeba právě obrázky, které nemají vliv na výsledek, a zkusme celou tuto argumentaci zjednodušit. Představme si, že máme před sebou studenta a chceme se ujisti, že umí sčítat. Požádáme ho, ať vyřeší příklad a výsledek ověří. Jeho postup vypadá takto:

(1+1) + (2+2) = 1 + 5 = 6,
zkouška: (1+1) + (2+2) = 2 + 5 = 6.

Z výše uvedeného příkladu je jasné, že student má sice dobře výsledek, ale současně v nás výrazně vzrostl pocit, že ten výsledek prostě jen uhodl nebo někde opsal. Pokud se tento problém u něj vyskytne opakovaně, pravděpodobně neodmaturuje. Otázkou je, proč by tento postup měl být tolerován ve vědecké práci. Na druhou stranu je třeba připustit, že se to opravdu stát může a zdaleka se nemusí jednat o podvod. Pokud se tak ale děje opakovaně, tak to logicky budí pochybnosti o čistých úmyslech autora.

Závěrem bych chtěl říci, že smyslem tohoto článku bylo upozornit členy etických komisí, že se jim nikdy nepovede s jistotou vyloučit, že se nejednalo o omyl. Mohou ale popsat, jak se měnilo s přicházejícími informacemi jejich vnímání celé kauzy. Tím vlastně popisují změny v pravděpodobnostech podobně jako ve výše uvedeném příkladu. Současně by bylo dobré, aby si potenciální podvodníci uvědomili, že pravděpodobnosti, byť nekvantifikovatelné a subjektivní, jdou s každým podvodem více a více proti nim. A my všichni bychom se neměli bát mluvit o pravděpodobnostech i v těchto případech.

V tomto příspěvku bylo čerpáno z [1].

[1] John Kruschke: Doing Bayesian Data Analysis: A Tutorial with R, JAGS and Stan, Academic Press