Korrelaatio

Pearsonin korrelaatiokerroin mittaa lineaarista riippuvuutta: neljä tapausta, joissa korrelaatio on 0,81

Korrelaatio on todennäköisyyslaskennassa ja tilastotieteessä käytetty käsite, joka kuvaa kahden muuttujan välistä riippuvuutta. Korrelaatiokerroin on numeerinen mitta satunnaismuuttujien väliselle lineaariselle riippuvuudelle. Riippumattomien muuttujien välillä ei ole korrelaatiota.

Korrelaatiokerroin saadaan standardoimalla muuttujien kovarianssi välille [−1, 1]. Standardointi tehdään jakamalla kovarianssi muuttujien keskihajontojen tulolla.

Korrelaatiokerroin ei siis riipu käytetyistä yksiköistä. Mitä enemmän korrelaatiokerroin poikkeaa nollasta, sitä voimakkaampaa muuttujien välinen riippuvuus on. Arvo 1 tarkoittaa, että muuttujien välillä on täydellinen lineaarinen riippuvuus (−1 tarkoittaa täydellistä negatiivista lineaarista riippuvuutta), ts. toisen muuttujan voi laskea tarkasti lineaarisesti toisen arvosta.

Korrelaatio voidaan laskea usealla eri tavalla muuttujien mitta-asteikosta ja käyttötarkoituksesta riippuen. Tavallisesti sanalla korrelaatiokerroin (joskus vain korrelaatio) tarkoitetaan kuitenkin Pearsonin korrelaatiokerrointa. Nimestä huolimatta sen esitti ensimmäisenä Francis Galton. Jos tarkasteltavat muuttujat on mitattu vain järjestysasteikolla, niin korrelaation mittaamiseen soveltuu paremmin jokin ei-parametrinen korrelaatiokerroin.


© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search