Boom Bust

Boom Bust

torsdag 13. februar 2014

Korrelasjon er ikke kausalitet

Alt for ofte kommer jeg over grafer som sammenligner dagens utvikling i finansmarkedene med tidligere episoder som hadde tilsvarende utvikling. Disse grafene gir leseren inntrykk av at siden utviklingen i dag er veldig identisk med hva som har skjedd tidligere, så vil utviklingen fremover bli som den ble den gang. Slike grafer er i mine øyne ofte bare vås.

Under er et eksempel på en graf som har gått sin runde på internett siden desember i fjor. Grafen sammenligner dagens utvikling i aksjemarkedet med årene frem til 1929 da aksjemarkedet krakket.


Her er en oppdatert versjon som viser hvordan utviklingen siden desember har sammenfalt med 1929-krakket.


Når man ser en slik graf vil man som regel umiddelbart tenke: Oi! Utviklingen er jo helt identisk med 1929! Nå kommer det garantert et nytt krakk i markedet!

Dette er derimot en tullete konklusjon å trekke. Feilen man gjør er å blande korrelasjon med kausalitet. (I tillegg skjønner man ikke forskjell på prosentvis endring og nominell indeksverdiendring. Hint: se på verdien på y-aksene i grafen. De er av helt ulike størrelsesorden.) Hva mener jeg med at korrelasjon ikke er kausalitet? Fra Wikipedia:
Korrelasjon medfører kausalitet, på latin cum hoc ergo propter hoc er en feilslutning som er vanlig i statistisk analyse. Feilen består i å forveksle korrelasjon med årsakssammenheng.
Sagt på godt norsk, så er det ikke slik at fordi utviklingen i aksjeprisene er veldig like, så vil det samme som skjedde i 1929 skje igjen. Problemet med denne tankegangen er at det er uendelig mange ting som var forskjellig den gang fra nå. At prisutviklingen er den samme betyr ikke at fremtiden blir den samme. Eller, lar du deg kanskje overbevise av denne korrelasjonen?


Den avdøde økonomen Ludwig von Mises forklarte denne feilslutningen på en bra måte i sin bok Theory and History:
Economics is not..."quantitative." It is not quantitative and does not measure because there are no constants. Statistical figures referring to economic events are historical data. They tell us what happened in a nonrepeatable historical case. Physical events can be interpreted on the ground of our knowledge concerning constant relations established by experiments. Historical events are not open to such an interpretation...
In the mathematical treatment of physics the distinction between constants and variables makes sense; it is essential in every instance of technological computation. In economics there are no constant relations between various magnitudes. Consequently all ascertainable data are variables, or what amounts to the same thing, historical data. The mathematical economists reiterate that the plight of mathematical economics consists in the fact that there are a great number of variables. The truth is that there are only variables and no constants. It is pointless to talk of variables where there are no invariables.  
Så neste gang du ser slike grafer som viser korrelasjoner, tenk deg litt om før du trekker en slutning, og forviss deg om at du ikke forveksler kausalitet med korrelasjon.

2 kommentarer:

  1. Zerohedge er eit eksempel på ein aktør som gjer dette støtt og stadig for å bygge under sitt kroniske katastrofe syn. Før eller seinare kjem det jo in stygg korreksjon, men ikkje dei siste åra altså.

    SvarSlett
    Svar
    1. Enig. Ser de gjør dette ofte på den nettsiden. Jeg synes det blir for lettvint å dra slike korrelasjoner uten å se litt mer nøye "bak tallene."

      Slett