Om øl og bryggerier og øl-historie og sånt ...

«  Kinin eller humle?   |  De andre arnoldusene  »

2010-10-04

Hvordan lyve med data

Dette er egentlig ikke et innlegg om klimaendringer, men om misbruk av statistikk og vitenskap. På engelsk kalles teknikken «cherry picking», og den går ut på at man plukker de dataene som best passer ens eget synspunkt, og ignorerer resten. Det er selvfølgelig en form for løgn, og en temmelig ufyselig form også.

Men til saken - og her koker jeg temmelig mye fra Skeptical Science, og spesielt dette innlegget - deriblant de tre grafene. Her er en graf som viser at havnivået synker. X-aksen er andeler av 2010, så den starter et par dager inn i 2010, og slutter en gang i april.

Her synes det jo unektelig som om havniået synker, ikke stiger - og det er vel en korrekt tolkning om man ser snevert på disse dataene. Men dersom vi ser på hele datarekken som strekker seg 18 år bakover, blir bildet litt annerledes:

Det er vanskelig å si at dette ikke er en graf som viser en klar stigning. Rett nok er det store variasjoner langs grafen, men det er også innlysende at disse er overlagret en klar lineær stigning. Det er ikke intuitivt at disse to grafene bygger på samme dataene - bare at den ene er et subsett av den andre.

Så kommer det elegante: For å sette søkelyset på hvordan slik cherry picking er en forfalskningsteknikk, har de kombinert de to grafene over, med aksene fra den andre grafen og dataene fra den første grafen. Det blir seende slik ut:

Hups! På et rent teknisk detaljnivå så stemmer det at havnivået sank fra januar til april 2010, men det er egentlig irrelevant, for de effektene man egentlig snakker om er kun målbare over lengre perioder, mens de kortvarige endringene over uker eller måneder nærmest er en naturlig støy.

Dette er analogt med å si at det var varmt i går, mens idag er det kaldt, så derfor går vi mot en istid. Rent bortsett fra å misbruke ekstrapolering, så er slikt å sammenblande naturlige variasjoner i været fra dag til dag eller år til år med de trender som først blir tydelige når man sporer dem over flere tiår.

Se opp for denne teknikken. Den er dessverre hyppig brukt i ulike variasjoner. Det skumle med slik cherry picking, er at den er pakket inn i et format og en form som ser vitenskaplig ut. Dessuten er kjernen her ikke at dataene nødvendigvis er gale, men at seleksjonen av data er tendensiøs. Og nettopp fordi de relevante delene av dataene er ekskludert, så må kjenne dataene like godt som den som begår cherry-pickingen, dersom man skal avsløre det.

Vær skeptisk hver gang noen ønsker å bevise noe rundt klima - dvs svært langvarige fenomener - med data som strekker seg over noen få år - eller bare noen måneder. Klimaendringene er små fra år til år, slik at i den skalaen druker de i naturlige variasjonene. Om de skal måles, må det være som akkumulerte effekter over flere år eller helst tiår.

 
Deriverte - lagt inn av Magne Mæhre - 2010/10/4 19:07:32
En interessant teknikk man også bruker, og som man også ser her er at man presenterer den deriverte eller andrederiverte uten å være klar på at det er det man gjør. Jeg observerer at Y-aksen er "mean sea level rise", altså snittet av den deriverte av havnivået, man ser på. Den var altså negativ frem til 2001, og positiv deretter. Havnivået sank altså frem til for ti år siden, og har siden dess økt, og i raskere tempo.
Den så jeg ikke - lagt inn av Anders Christensen - 2010/10/5 09:22:28
Takk, jeg så ikke den, kanskje fordi jeg var mer opptatt av den snevre plukkingen av dataområde som teknikk. Men jeg stusset på hva som var nullpunktet og antok at det måtte være havnivået pr 2000 som ble brukt som en slags referanseverdi. Men jeg ser at din tolkning også gir mening. Kanskje best å sjekke grunnlagsdataene for finne ut hva som var tolkningen av Y-aksen. Uansett er det uheldig om betydningen av en av aksene er uklar.
ALUTrfPoMIaBrOXPZR - lagt inn av Joni - 2011/6/12 16:45:48
I thank you hulbmy for sharing your wisdom JJWY
eotYxWTQwsqgyXLzKN - lagt inn av unxbjpksw - 2011/6/13 09:56:36
INWNPb <a href="http://vgpbgzvwjxtj.com/">vgpbgzvwjxtj</a>
YZUuRtgEtznYqJLJlQ - lagt inn av mwlggjxhuy - 2011/6/13 13:41:45
M8t7fm , [url=http://oafrzpxmohjj.com/]oafrzpxmohjj[/url], [link=http://gvxhstldmcnw.com/]gvxhstldmcnw[/link], http://nigveasrvumt.com/

Legg igjen en kommentar(obligatorisk)

(valgfri, bruk gjerne http://... eller mailto:...)

(optional)


Hvor mye er to pluss tre - med bokstaver?
Lagre navn og E-postadresse for meg til neste gang

«  Kinin eller humle?   |  De andre arnoldusene  »