- CORREL Funktionsöversikt
- CORREL -funktion Syntax och ingångar:
- Vad är CORREL -funktionen?
- Vad är korrelationskoefficienten?
- Positiv korrelation
- Negativ korrelation
- Ingen korrelation
- Korrelation är inte orsakssamband
- Hur man använder CORREL
- CORREL -funktion i Google Kalkylark
- Ytterligare anmärkningar
- CORREL Exempel i VBA
Ladda ner exempelarbetsboken
Denna handledning visar hur du använder Excel CORREL -funktion i Excel för att beräkna korrelationen.
CORREL Funktionsöversikt
CORREL -funktionen Beräknar korrelationen mellan två talserier.
Om du vill använda funktionen CORREL Excel -kalkylblad väljer du en cell och skriver:
(Lägg märke till hur formelinmatningarna ser ut)
CORREL -funktion Syntax och ingångar:
1 | = CORREL (array1, array2) |
array1 - Matriser med siffror.
Vad är CORREL -funktionen?
Excel CORREL -funktionen returnerar korrelationskoefficienten (Pearson’s r) av två dataområden.
Vad är korrelationskoefficienten?
Korrelationskoefficienten, vanligtvis kallad Pearsons r (uppkallad efter Karl Pearson, personen som utvecklade den), är en statistik som berättar hur starkt två variabler är relaterade.
Pearson r är en siffra mellan -1 och 1, vilket kan leda till tre möjliga tolkningar: en positiv korrelation, en negativ korrelation och ingen korrelation.
Positiv korrelation
En positiv korrelation (r > 0) betyder att när de två variablerna är i tandem - när du observerar en hög poäng i en variabel tenderar du också att observera en hög poäng i den andra. På samma sätt, när en variabel är låg, tenderar den andra att vara låg också.
Till exempel har höjd och vikt en positiv korrelation. Se diagrammet nedan som visar höjden och vikten på ett litet urval av basebollspelare:
De r av detta lilla urval är 0,73 - en mycket stark positiv korrelation. Detta är logiskt logiskt - högre människor tenderar att vara tyngre i genomsnitt, eftersom den extra höjden består av ben och muskler och annan vävnad som alla väger något.
Men korrelationen är inte perfekt (i en perfekt korrelation med en r av 1 skulle alla poäng falla på trendlinjen). Vissa kortare personer kan vara tyngre - kanske har de på sig lite extra fett eller tränar på gymmet. På samma sätt kan vissa långa människor vara väldigt magra och faktiskt väga mindre än många kortare.
Korrelationen här är förmodligen så hög eftersom vi har att göra med idrottare, det skulle vara lägre i den totala befolkningen. Kom ihåg att ha detta i åtanke när du använder CORREL - the r du får är inte definitivt - du måste tänka på vad din data är och hur du fick den när du gjorde dina tolkningar.
Negativ korrelation
En negativ korrelation (r <0) betyder att när du observerar en hög poäng i en variabel tenderar du att observera en låg poäng i den andra variabeln, och vice versa.
Exempelvis korrelerar elevernas testresultat och antalet frånvaro de hade från skolan. Det vill säga, ju fler dagar de missar, desto lägre blir deras poäng. Ju färre dagar de missar, desto högre blir poängen:
Återigen är korrelationen inte perfekt (som de nästan aldrig är). Vi har en elev här som missade 5 dagar, men ändå lyckades få 85%. Vi har också en som fick 52%, trots att vi bara saknade två dagar.
Vi har fortfarande en tydlig negativ trend. Men det finns fortfarande mycket variation i testresultat som inte kan förklaras av frånvaro ensam. Detta kan bero på andra variabler, som förmåga, motivation, hälsa och många andra potentiella faktorer.
Så när du använder CORREL, kom ihåg att det finns en större bild som dina data kanske inte helt förklarar.
Ingen korrelation
Ingen korrelation (r = 0 eller är nära 0) betyder att du inte kan förutsäga poängen för en variabel baserat på en annan. Om du plottar data ser du ingen märkbar trend och trendlinjen blir platt eller nästan platt.
Här är några uppgifter om ringfingers längd och IQ:
Som du kan se finns det inget samband mellan dessa två variabler i detta urval, så vi kan anta att de inte är relaterade.
I praktiken är det osannolikt att du får en r på exakt 0. Kom ihåg att när du samlar in data finns det ofta en viss variation på grund av fel, kanske i mätning eller rapportering. Så bara för att din r är inte exakt 0, betyder inte att du har hittat något.
Korrelation är inte orsakssamband
Det är viktigt att komma ihåg att CORREL inte kan berätta vilken variabel som påverkar den andra - eller till och med om det finns något orsakssamband överhuvudtaget. Till exempel har en korrelation hittats mellan följande variabler:
- Mängden såld glass och mängden våldsbrott
- Hur lycklig du är och hur framgångsrik du är i din karriär
- Antalet människor som drunknade i en pool och antalet filmer som Nicolas Cage dök upp i per år
Det första exemplet är tredje variabelproblemet. Naturligtvis gör glass inte människor våldsamma, och inte heller utövar ett begär efter fryst mjölk och socker. Den tredje variabeln är vädret. I varmt väder går människor helt enkelt ut mer - det finns mer kontakt mellan människor och därmed större chans att en konflikt växer fram. Vid varmt väder köper folk också mer glass. Så glassförsäljning och våldsbrott korrelerar bara eftersom de båda är kopplade till en tredje variabel.
Det andra kan vara ett exempel på dubbel kausalitet. Att bli framgångsrik på jobbet kan vara bra för din lycka - du tjänar mer pengar och har i allmänhet mer kontroll över vilket arbete du gör och vem du gör det med. Men lycka kan också vara till nytta för framgång, kanske lyckligare människor är lättare att umgås med och utveckla starkare arbetsrelationer, eller kanske är de mer mentalt motståndskraftiga mot motgångar. I det här fallet påverkar båda variablerna varandra.
Det tredje är helt enkelt a falsk korrelation. Bara för att två variabler korrelerar i dina data betyder det inte att de interagerar i alla fall i verkligheten.
Slutsatsen är att en korrelation inte kan berätta om två variabler är orsakssammanhängande.
Hur man använder CORREL
Använd Excel CORREL -funktionen så här:
1 | = CORREL (B3: B15, C3: C15) |
Med CORREL definierar du två argument - de två dataområden som du vill korrelera.
Här är några viktiga punkter att tänka på med CORREL:
- Text, booleskt (SANT/FALSKT) och tomma celler ignoreras.
- Båda dataområdena måste ha lika många datapunkter, annars får du ett #N/A -fel
- Om ett av dataområdena är tomt, om det inte finns någon variation alls i data (dvs. om alla datapunkter är samma nummer) får du en #DIV/0! Fel
CORREL -funktion i Google Kalkylark
CORREL -funktionen fungerar exakt samma sak i Google Kalkylark som i Excel:
Ytterligare anmärkningar
CORREL Exempel i VBA
Du kan också använda CORREL -funktionen i VBA. Typ:application.worksheetfunction.correl (array1, array2)
För funktionsargumenten (array1, etc.) kan du antingen ange dem direkt i funktionen eller definiera variabler som ska användas istället.
Återgå till listan över alla funktioner i Excel