Ostatnio: 02.09.2019

Darmowe galerie dla serwisów aukcyjnych

Kłamstwo, prawda i statystyka.

Premier Wielkiej Brytanii Beniamin Disraeli mawiał: są trzy rodzaje kłamstwa - zwykłe kłamstwo, bezczelne kłamstwo i statystyka. Jak nie dać się statystyce?

Odpowiednio manipulując danymi statystycznymi, można udowodnić każdą z góry przyjętą tezę. Warto więc zrozumieć istotę statystyki, poznać jej narzędzia i pułapki czyhające na niedoświadczonych adeptów tego fachu. Statystyka wciska się wszędzie - do mediów, prac naukowych, reklamy proszków do prania. Jesteśmy na co dzień bombardowani informacjami o sondażach, badaniach opinii publicznej, notowaniach partii politycznych i poszczególnych polityków, indeksów giełdowych. Z wypiekami na twarzy wsłuchujemy się w prognozę pogody (choć i tak wiemy, że nie sprawdzi się w połowie przypadków). Rodzi się nawet pytanie, czy tak powszechnie publikowane wyniki badań i analiz statystycznych (dotyczących niemal każdego aspektu naszego życia) jedynie opisują świat czy już kreują nową rzeczywistość?

Średnia dobra na wszystko.

Ogłoszenie prasowe podpisane przez dyrektora pewnego WIELKIEGO PRZEDSIĘBIORSTWA głosiło, że przeciętna pensja w zakładzie wynosi 3000 złotych. Raport z działu płac (tylko do użytku wewnętrznego) mówił już o typowej pensji równej 750 złotych. Natomiast przedstawiciele związków zawodowych wydali oświadczenie, że wszystko to jest wierutnym kłamstwem, bo przecież typowa pensja w zakładzie wynosi... 500 złotych. Kto kłamał, a kto mówił prawdę? Poproszono statystyka o bezstronną ocenę. Salomonowa odpowiedź brzmiała: WSZYSCY! Jak to jest możliwe? Otóż za każdym razem użyto innej miary typowości. Dyrektor posłużył się średnią arytmetyczną. Dział płac wykorzystał medianę, zaś związki zawodowe wartość modalną (modę).

Niełatwo zdecydować, jaka miara typowości jest najlepsza w określonym przypadku. Zależy to od typu badanej cechy i od celu. który ma zostać osiągnięty. Dla celów podatkowych typowy zarobek miesięczny będzie średnią arytmetyczną: otrzymaną z podzielenia całości dochodów przez 12 miesięcy.

Jednak już dla producenta garniturów typowym rozmiarem nie będzie rozmiar średni (który może się okazać liczbą całkiem egzotyczną), a raczej rozmiar, który się najlepiej sprzedaje. Taką najczęściej pojawiającą się wartość statystycy nazywają (nomen omen) modą lub dominantą. Mediana to taka wartość cechy badanej, która dzieli uporządkowany zbiór obserwacji na dwie równe części: polowa obiektów ma wartość mniejszą, a połowa większą od mediany. W odróżnieniu od średniej arytmetycznej, mediana jest mało czuła na zmianę skrajnych wartości i lepiej opisuje wartość przeciętną cech o wysoce niesymetrycznym rozkładzie.

Jak Pascal z Fermatem.

Rachunek prawdopodobieństwa jest dyscypliną stosunkowo młodą i dopiero od niedawna traktowany jest jako pełnoprawna dziedzina matematyki. Wciąż jednak mówi się jeszcze o matematykach i statystykach. Tak jak w Wielkiej Brytanii wciąż istnieje Towarzystwo Lekarzy i Chirurgów. No cóż, dla niektórych statystycy wciąż nie są „prawdziwymi" matematykami, tak jak chirurdzy nie są „prawdziwymi" lekarzami. Początki rachunku prawdopodobieństwa nie kojarzą się dobrze. Zaczęło się od hazardu. Kawaler de Mere był wielkim miłośnikiem gry w kości. Był to człowiek bystry i inteligentny, a wieloletnie obserwacje nasunęły mu szereg pytań, z którymi nie umiał sobie poradzić. Jednym z tych problemów byt podział puli (bank) pomiędzy uczestników gry w przypadku konieczności nagłego przerwania partii. Drugi problem polegał na zrozumieniu, dlaczego przy rzucie trzema kostkami częściej wypada kombinacja dająca 11 oczek niż 12 oczek. De Mere szukał pomocy u wybitnego matematyka (i filozofa) Blaise'a Pascala. I znalazł! Pascal bardzo zainteresował się tą problematyką, więc zaczął korespondować z innym wybitnym matematykiem (i prawnikiem) Fermatem (to ten od wielkiego twierdzenia Fermata). Nastąpiło chyba jedyne w historii korespondencyjne odkrycie nowej gałęzi matematyki! Pascal i Fermat podali poprawny sposób obliczania prawdopodobieństw różnych zdarzeń i zasugerowali, aby pulę dzielić proporcjonalnie do szans wygrania partii przez poszczególnych graczy.

Błądzić jest rzeczą ludzką.

Oto typowe przykłady błędów popełnianych przez ludzi nie wprawionych w prowadzeniu rozumowania probabilistycznego.

Rzucam monetą już 10 razy i za każdym razem wypadł orzeł. Szansa na otrzymani reszki w kolejnym rzucie jest więc znaczni większa. W przeciwnym razie jak, średnio rzecz biorąc, liczba orłów i reszek może by taka sama? Rozumowanie jest niepoprawne. Rzuty „uczciwą" monetą są niezależne i szansa wyrzucenia reszki jest zawsze 1 Nie oznacza to wcale że nie ma fluktuacji. Wprost przeciwnie Nie wierzcie więc w prawo serii i tym podobne teorie. Uczcie się raczej rachunku prawdopodobieństwa. Prawdopodobieństwo znalezienia dwóch bomb w samolocie jest prawie równe zeru. Ale czy zabieranie ze sobą (na wszelki wypadek) do samolotu bomby uchroni nas przed atakiem terrorystycznym? Skoro nasza bomba jest „pierwsza" to prawdopodobieństwo, że trafi się jeszcze jedna, jest równe zeru.

Paradoks urodzin.

Wyniki analiz probabilistycznych nie zawsze są łatwe do odgadnięcia. Gdy spotykamy kogoś, kto urodził się tego samego dnia miesiąca co my sami. uważamy to za szczególny zbieg okoliczności. Pomyślmy chwilę nad tym zagadnieniem. Dla ułatwienia pomińmy lata przestępne i załóżmy, że każdy rok ma 365 dni. Przyjmiemy również, że prawdopodobieństwo urodzenia się w dowolnym z 365 dni jest jednakowe (1/365)-wszystkie dni są równie dobre, aby przyjść na świat! W grupie liczącej 366 osób na pewno znajdą się co najmniej dwie urodzone tego samego dnia roku. Szansa takiego zdarzenia wynosi 100 procent - mamy pewność, że tak właśnie bę¬dzie. Jak myślicie, ile (co najmniej) osób trzeba zebrać razem, aby szansa na to, że choć dwie z nich obchodzą urodziny tego samego dnia była większa niż 50 procent?

Wystarczą 183 osoby? A może tylko 150? To o wiele za dużo! Już w grupie liczącej... 23 osoby szansa takiego zdarzenia wynosi 50.73 procent. Dla 22 osób szansa ta jest minimalnie mniejsza - 47.57 procent. Nie jest to wynik intuicyjnie oczywisty, choć łatwo go otrzymać. Policzcie sami i pamiętajcie o jednym.

W rachunku prawdopodobieństwa i statystyce matematycznej zarówno chłopski rozum, jak i kobieca intuicja często prowadzą na manowce.

Próba próbie nierówna.

Dane (prawie) nigdy nie są dane (jeśli są, to tym większa ostrożność jest wskazana, na przykład w ocenie wiarygodności źródła). Trzeba je zebrać, przeanalizować i wyciągnąć wnioski. Jedną z możliwości jest zebranie informacji od WSZYSTKICH elementów populacji, którą jesteśmy zainteresowani. Ta¬kie badanie nazywamy całościowym. Przykładem takich badań są spisy powszechne. Inną możliwością jest wybór próby, czyli jakiegoś fragmentu badanej populacji, zebranie informacji na podstawie próby i uogólnienie wyników na całą populację. Są to badania częściowe albo reprezentacyjne. Możliwość sensownego i wiary¬godnego uogólnienia wyników otrzymanych dla próby na całą populację zależy oczywiście od sposobu wyboru próby i jej liczebności. Próba powinna być miniaturką całej populacji. Mówimy wtedy, że jest reprezentatywna. Najlepszym sposobem zagwarantowania reprezentatywności próby jest jej wylosowanie. Numerujemy na przykład wszystkie elementy populacji i wybieramy losowo określoną liczbę numerów. Oczywiście samo wylosowanie nie gwarantuje reprezentatywności. Opinia jednego kolegi z klasy, nawet wybranego losowo, nie musi odzwierciedlać opinii większości. Właściwa liczebność próby zależy od dokładności, z ja¬ką chcemy znać opinię i od zaufania, jakie chcemy mieć do wyciągniętych wniosków. Dlaczego tak często korzystamy z badań reprezentacyjnych? Badania wyczerpujące są znacznie bardziej kosztowne, czasochłonne i pracochłonne, a często wręcz nie¬możliwe do przeprowadzenia. W niektórych sytuacjach musimy opierać się na badaniach częściowych, nawet jeśli badania całościowe są łatwe do przeprowadzenia. Chodzi o kontrolę jakości. Są to najczęściej badania niszczą-ce - nie można ich więc przeprowadzić na całości, bo stracimy całą partię towaru! Trzeba pamiętać, że nie jest doborem losowym zaczepianie "przypadkowych" ludzi, na przykład w sklepie, przy wyjściu z metra, na dworcu kolejowym. Taka próba prawie zawsze jest niereprezentatywna! Na pewno nie ma w niej osób nierobiących zakupów, niekorzystających z metra, niepodróżujących koleją. Również próba złożona z ochotników ma więcej wad niż zalet. Te same zastrzeżenia dotyczą różnych sondaży metoda audiotele, na przykład testy poparcia dla polityków. Dzwonią wyłącznie ludzie, którzy mają silną potrzebę wyrażenia swojej opinii - a więc ludzie o nieobojętnym stosunku emocjonalnym do danej osoby lub zagadnienia.

Bezdroża statystyki.

Nieznajomość podstawowych pojęć i zasad statystyki oraz brak krytycyzmu wobec danych może prowadzić do dziwacznych, nieprawdziwych, a czasem nawet absurdalnych konsekwencji. Pewien amerykański raport doniósł, że stan zdrowia społeczeństwa systematycznie się pogarsza. Dowód? W 1900 roku na jedno łóżko w szpitalu przypadało ponad 240 osób. Dziś - mniej niż 120. Wniosek (błędny!): liczba chorych się podwoiła. Oczywiście wzrost liczby łóżek szpitalnych świadcz)' raczej o wzroście zamożności społeczeństwa i postępie medycyny niż o pogarszaniu się stanu zdrowia obywateli. W czasie bitwy o Anglię w 1940 roku dyskutowano o metodach porównywania strat brytyjskich i niemieckich. Oprócz wartości czysto technicznej, problem miał duże znaczenie propagandowe. Niemcy porównywali tylko liczby zestrzelonych maszyn, pomniejszając swoje faktyczne straty. Straty niemieckie dotyczyły głównie bombowców - samolotów większych, droższych i pilotowanych przez kilkuosobową załogę.

Straty brytyjskie to niemal wyłącznie jedno-osobowe myśliwce, mniejsze, tańsze i prostsze w produkcji. To wszystko było bardzo nieobiektywne. Pewien dyrektor na spotkaniu z nauczycielami powiedział kategorycznym tonem, że nic życzy sobie, aby w jego szkole jakakolwiek klasa otrzymywała oceny poniżej średniej szkolnej. Gdzie leży nonsens tej wypowiedzi? Otóż wymaganie dyrektora świadczy o nieznajomości definicji średniej! Zawsze część wyników będzie większa, a część mniejsza od średniej. Jedynym wyjątkiem jest sytuacja, w której wszystkie klasy osiągnęły dokładnie takie same wyniki. Wtedy każdy wynik jest równy wartości średniej.

W okresie zimnej wojny, w latach 50., często porównywano rozwój krajów socjali¬stycznych i kapitalistycznych. Aby podkreślić wyższość systemu socjalistycznego, przywoływano dane statystyczne. Na przykład w 1957 roku wzrost produkcji w Stanach Zjednoczonych wyniósł siedem procent, a w Związku Radzieckim 17 procent. Nawet jeśli podane liczby są prawdziwe, nie świadczy to jeszcze o niczym istotnym. Wszystko zależy od poziomu wyjściowego. 17 procent ze stu daje 17, a siedem procent z tysiąca daje 70!

W 1981 roku opublikowano w Stanach Zjednoczonych raport mówiący o 30-pro-centowym spadku zachorowań na gruźlicę w jednym z miast w porównaniu z rokiem poprzednim. W 1980 roku zarejestrowano 341 przypadków, a w 1981 - już ..tylko" 239. Przypisano to nowej metodzie terapii. Okazało się jednak, że klucz do wyjaśnienia tak dużego spadku leży w definicji słowa "zarejestrowano"! W 1980 roku rejestrowano wszystkie „podejrzane" przypadki zgłoszone służbie zdrowia, a w 1981 - tylko przypadki ostatecznie poddane leczeniu. Nie tak dawno ogłoszono w Polsce duży spadek przestępczości, przy jednoczesnym wzroście wykrywalności przestępstw. I co się okazało? Wcześniej podawano wszystkie zgłoszone na policję przestępstwa, a w owym raporcie tylko te, w których sprawie wszczęto postępowanie...

Pewien profesor medycyny ogłosił wyniki badań nad długowiecznością amerykańskich dyrygentów. Wyszło mu, że średnia długość życia dyrygenta wynosi 73 lata. Ponieważ średnia długość życia mężczyzny w USA w tym okresie wynosiła 69,5 roku, badacz stwierdził, że długowieczność dyrygentów musi mieć coś wspólnego niezwykłą kombi¬nacją cech osobistych, takich jak talent, motywacja, poczucie spełnienia i uznania własnej wartości. Niestety. Średni wiek - 69,5 - wzięty do porównania dotyczył średniej długości życia od urodzenia. Dyrygentem się nie rodzi - dyrygentem się staje. Najczęściej po 30. roku życia. Gdy zapytamy: jeśli mężczyzna ma 32 lata. to jaka jest oczekiwana średnia długość życia, odpowiedzią będzie 72.5 roku, a nie jak poprzednio 69,5!

Wybór należy do ciebie.

Sondaż przedwyborczy sugeruje, że kandydata partii rządzącej A popiera 51 procent wyborców, a kandydata opozycji B popiera 49 procent wyborców. Prasa rządowa komentuje: nasz kandydat zdecydowanie prowadzi - popiera go aż 51 procent wyborców. Jego przeciwnika - jedynie 49 procent. Ponad połowa wyborców jest za naszym kandydatem. Opozycja pisze: prawie polowa wyborców popiera naszego kandydata. Chwilowa różnica wynosi tylko dwa procent na korzyść konkurencji. Widać, że interpretacja, a nawet wysłowienie tych samych faktów może być bardzo różne. Przysłuchując się tego typu komentarzom, musimy zawsze zapytać: a ile wynosi błąd sondażu? Zwykle jest to dwa - cztery procent, a więc - obiektywnie rzecz biorąc -wyniki naszego przykładowego sondażu niewiele mówią o zwycięzcy wyborów lub wręcz NIC. Dane statystyczne (zbyt) często wykorzystuje się do manipulacji. Powinniśmy być na to przygotowani. Uczmy się statystyki!

Zadanie Eddingtona.

Arthur Eddington wsławił się tym, że na pytanie, czy to prawda, iż teorię względności oprócz Einsteina rozumie tylko dwoje ludzi, na świecie miał odpowiedzieć: a kto jest tym drugim? W 1935 roku postawił on następujący problem: jeżeli z czterech osób - A, B, C i D - każda mówi prawdę (niezależnie od siebie) średnio co trzeci raz. to jakie jest prawdopodobieństwo, że D powiedział prawdę, jeżeli A zapewnia, iż B zaprzecza, że C stwierdził, iż D zełgał. Rozwiązanie wymaga zrobienia pewnych dodatkowych założeń. Spróbujcie sami!


CIEKAWOSTKI STATYSTYCZNE:

Średnie nie wystarczą

Choć wartość średnia jest ważnym parametrem pozwalającym w zwarty sposób opisać zestaw danych, to nie jest to parametr wystarczający. Łatwo podać przykłady zbiorowości mających takie same średnie, a jednak bardzo różniących się od siebie. Średnia ocena z matematyki uczniów mających: 4,4,4,4,4,4,4,4,4 wynosi 4. Tyle samo wynosi średnia innej grupy uczniów, z ocenami: 2,2,3,3,4,5,5,6,6. 0 ile jednak poziom w pierwszej grupie jest bardzo wyrównany, o tyle druga grupa charakteryzuje się dużą różnorodnością.

Średnia, mediana i moda

W firmie jedna osoba zarabia 20 000 złotych; jedna osoba - 5000 złotych; jedna osoba - 3000 złotych; dwie osoby - po 2000 złotych; jedna osoba - 1000 złotych; sześć osób - po 500 złotych.

Średnia arytmetyczna (suma zarobków dzielona przez ilość pracowników) wynosi 3000 złotych; mediana (wartość graniczna: połowa pracowników zarabia poniżej, potowa powyżej wartości medialnej) - 750 złotych; moda (najczęściej powtarzająca się wartość) - 500 złotych.

Statystyka nie kłamie

Chodzi tu o sprawę życia i śmierci. W dwóch miejscowościach liczących po około 100 tysięcy mieszkań¬ców badano wskaźniki umieralności. W miejscowości Pośpiech stwierdzono 1000 zgonów rocznie. W miejscowości Relaks sporo więcej - 1500 zgonów. Czy mieszkańcy Relaksu powinni czym prędzej przenieść się do Pośpiechu? Najwyraźniej życie jest tam zdrowsze - liczby nie kłamią. Jednak pewien student, przyglądając się danym, zauważył coś ciekawego: w każdej grupie wiekowej (0-10 lat, 10-20 lat itd.) procent zgonów w stosunku do liczby mieszkańców w danym wieku był mniejszy w miejscowości Relaks! Znowu jakiś statystyczny paradoks? Nie: statystyka nie kłamie. W miejscowości Pośpiech jest wiele miejsc pracy, więc mieszka tam dużo młodych rodzin. W miejscowości Relaks mieszkają głównie emeryci. Gdy większość mieszkańców jest w podeszłym wieku, nie może dziwić, że wskaźnik zgonów będzie większy - niezależnie od warunków życia w danej miejscowości. Dane dotyczące zgonów w poszczególnych grupach wiekowych sugerują, że to właśnie Relaks jest lepszym miejscem do życia! W powyższym przykładzie wiek był czynnikiem, który istotnie wpływał na zaobserwowane prawidłowości.

Myślenie procentuje

Częstym sposobem prezentowania danych jest wyrażanie ich w procentach. Słyszymy że30 procent społeczeństwa popiera to i owo. A 25 procent nie ma zdania w jakiejś istotnej kwestii. Interpretując dane procentowe, też należy być ostrożnym. Na przykład zawsze trzeba pamiętać, od jakiej wielkości wyjściowej obliczamy procent. Człowiekowi zarabiającemu tysiąc złotych miesięcznie obniżono pensję o 10 procent. Ponieważ bardzo się starał, po miesiącu podwyższono mu ja z powrotem - też o 10 procent. Być może część z was zdziwi się, że ów człowiek odebrał wypłatę w wysokości 990 złotych-10 złotych mniej niż poprzednio Wszystko jest jednak w porządku. Odjęto mu 10 procent od 1000 złotych, zaś dodano mu 10 procent od 900 złotych. Proste, ale pouczające.

Rozum w bucie

Pewien maniak statystyczny badał wpływ różnych czynników na wyniki uczniów w szkole podstawowej. Aby być „obiektywnym", polecił, by wszyscy uczniowie rozwiązali ten sam test. Wyszło mu, że istnieje silny związek między wynikami specjalnie opracowanego testu, a rozmiarem stopy! Wynik był jednoznaczny: uczniowie o dużych stopach wypadali lepiej w przeprowadzonym teście. Już miał opublikować swoje odkrycie, gdy przyszło mu do głowy, że przecież rozmiar stopy jest w naturalny sposób silnie powiązany z wiekiem ucznia! A przecież nie ma nic dziwnego w fakcie, że starsi uczniowie wiedzą więcej od swoich młodszych kolegów...


statystyka



źródło:

Autor: dr hab. Arkadiusz Orłowski, IF PAN

Wiem!

Korzystanie z serwisu oznacza akceptację Regulaminu. Prywatność. Copyright – 1999-2018 INTERIA.PL, wszystkie prawa zastrzeżone.