Ostatnio: 12.02.2017

Darmowe galerie dla serwisów aukcyjnych

Od prawdopodobieństwa do twierdzenia Bayesa

Jednym ze sposobów obrazowania prawdopodobieństwa jest diagram Venna, gdzie z uniwersum wszystkich możliwych wyników wybieramy interesujący nas podzbiór. Powiedzmy, że prowadzimy badania nad rakiem i myślimy o uniwersum ze zdrowymi i chorymi ludźmi – możemy je podzielić na ludzi z rakiem (A) oraz ludzi, u których tej choroby nie stwierdzono (~A) i przedstawić to na diagramie w następujący sposób:

venn a



Prawdopodobieństwo, że losowo wybrana osoba cierpi na raka, to liczba elementów w A, podzielona przez liczbę elementów w U (uniwersum). Liczbę elementów A oznaczamy jako |A|, zaś prawdopodobieństwo P(A) wynosi:

eq01



Załóżmy, że powstało nowe badanie przesiewowe, które daje wyniki: pozytywny lub negatywny. Jeśli przez B oznaczymy ludzi, których wynik był pozytywny otrzymamy następujący diagram:

venn b



Oczywiście, analogicznie do przypadku wyżej, prawdopodobieństwo B możemy zapisać jako:

eq02



Co jeśli przedstawimy A i B razem?

venn last



Możemy wyliczyć prawdopodobieństwo współwystępowania obu zdarzeń (AB = A∩B) w ten sam sposób:

eq04



I tutaj zaczyna się robić ciekawie. Przy założeniu, że wynik testu dla losowo wybranej osoby wyszedł pozytywny, jakie jest prawdopodobieństwo, że ma ona raka? Na powyższym diagramie opisać to można jako "przy założeniu, że znajdujemy się w B, jakie jest prawdopodobieństwo, iż jesteśmy w AB?” albo “jeśli uczynimy B nowym uniwersum, to jakie jest prawdopodobieństwo A?”. Formalnie zapisuje się to jako P(A|B) i czyta “prawdopodobieństwo A pod warunkiem, że B”.

Mamy więc:

eq03



co po podzieleniu licznika i mianownika przez |U| daje postać:

eq051



co z kolei, używając równań podanych na wstępie, sprowadzić możemy do:

bayes eq1



Odnosi się to oczywiście do tej części diagramu:

venn justb



Jak natomiast przedstawić prawdopodobieństwo, że losowo wybrana osoba ma raka (A), a badanie dla niej dało wynik pozytywny? Analogicznie do przypadku wyżej możemy to przedstawić jako:

bayes eq2



Mamy już wszystko by wyprowadzić twierdzenie Bayesa. Wyznaczając P(AB) z dwóch powyższych równań możemy stwierdzić, iż:

bayes eq3



Co – jeśli interesuje nas prawdopodobieństwo A pod warunkiem, że B – możemy przekształcić do:

bayes eq4



czyli finalnej postaci twierdzenia Bayesa.

Konkretny przykład

Załóżmy, że u 1% kobiet w wieku 40 lat, które biorą udział w badaniu przesiewowym stwierdza się raka piersi. Badanie 80% kobiet z rakiem piersi da pozytywny wynik mammografii. Badanie 9,6% kobiet bez raka piersi także da wynik pozytywny. Jakie jest prawdopodobieństwo, że kobieta w tym wieku, która otrzymała pozytywny wynik mammografii, ma w rzeczywistości raka piersi?

Najpierw rozważmy kobiety z rakiem piersi:

example14



Teraz oznaczmy pozytywne mammogramy, tak by pokryć 80% zdarzenia A oraz 9,6% obszaru poza A.

example21



Na diagramie widzimy jasno, że jeśli ograniczymy nasze uniwersum do B (kobiety z pozytywnym wynikiem mammografii), tylko mała część tej grupy rzeczywiście ma raka.

Większość lekarzy, którym zadano pytanie o prawdopodobieństwo, które rozważamy, szacowało je na 70-80%, co wydaje się nierealne dla nas patrzących na powyższy diagram. Tylko około 15% z nich zna poprawną odpowiedź (Casscells, Schoenberger, Grayboys 1978; Eddy 1982; Gigerenzer, Hoffrage 1995 i inne).

Zwróć uwagę, że efektywność testu podawana jest w kontekście A: badanie 80% kobiet z rakiem piersi da pozytywny wynik mammografi, co w odniesieniu do naszych diagramów opisać możemy jako "ograniczając uniwersum do A, jakie jest prawdopodobieństwo B?", czyli P(B|A).

Nawet bez dokładnego diagramu Venna, wyobrażenie go sobie może być pomocne, ale przejdźmy do rzeczy:

- 1% kobiet z grupy, o której mowa ma raka pierwsi → P(A) = 0,01,

- 80% tych kobiet ma pozytywny wynik mammografii, tak jak 9,6% kobiet zdrowych → P(B) = 0,8 P(A) + 0,096 (1 – P(A)) = 0,008 + 0,09504 = 0,10304,

- możemy odczytać P(B|A) wprost z poprzedniego akapitu, gdzie czytamy, że 80% kobiet z rakiem pierwsi otrzymuje wyniki pozytywne → P(B|A) = 0,8.

Podstawiając te wartości do twierdzenia Bayesa otrzymujemy:

eq06



co daje około 7,8% szans, że pozytywny wynik mammografii oznacza raka piersi (przy powyższych założeniach).

Na podstawie O. Bondilla, Visualizing Bayes’ theorem.

Wykop

Korzystanie z serwisu oznacza akceptację Regulaminu. Copyright – 1999-2017 INTERIA.PL , wszystkie prawa zastrzeżone.