Sannolikheten att 25 okorrelerade par av variabler har |r| > 0.7 är mindre än 0.05%
=> vi kan utesluta (med mer än 99.9% sannolikhet) att breddgrad inte påverkar årsmedeltemperatur
Det är viktigt att minnas att även saker med så låga sannolikheter som 1% kommer i genomsnittatt inträffa en gång på 100. Betraktar vi ett tillräckligt stort antal parametrar och letar efterkorrelationer mellan dessa så kommer vi att hitta till synes korrelerade variabler enbart på grundav slumpmässiga variationer. 15 variabler kan kombineras på över 100 sätt, så väljer vi att letaefter korrelationer mellan dessa så kommer statistiska fluktuationer ner mot 1%-nivån attuppträda!
Allmänt så kan ett högt värde på korrelationskoefficienten bero på en av tre saker:
1: slumpmässiga fluktuationer. Sannolikheten för dessa kan beräknas och finns
listad i tabeller som 7.3 i läroboken.
2: bägge variablerna påverkas av en gemensam faktor. Att sjukskrivningar för
vård av sjukt barn är mycket vanliga kring månadsskiftet augusti-september
beror inte först och främst på att det är särskilt lätt att bli sjuk just denna tid på
året, utan på att terminen i skola och förskola börjar då.
3: en variabel beror av den andra, vi säger då att det finns ett kasualt samband.
Ett viktigt sätt att försöka avgöra vilket som är fallet är att försöka hitta en model förkasualiteten, en modell som har förankring i något man tidigare observerat i andrasammanhang. Detta sätt att resonera har en mycket stark förankring inom naturvetenskapen.