De Pearson correlatiecoëfficiënt is de meest gebruikte correlatiecoëfficiënt binnen de statistiek. Door de Pearson correlatiecoëfficiënt (r) kan worden bepaald wat de lineaire correlatie is tussen twee variabelen. Het geeft geen causatie aan, maar wel de mate van correlatie.
Hier ga ik gebruik maken van deze statistische benadering om te kijken wat de correlatie is tussen windstoten en de uurgemiddelde windsnelheid bij een zeer zware storm (uurgemiddelde windsnelheid van >102.60 km/u). De meetreeks is begonnen in 1901.
De eerste waarde is het volgordegetal (chronologisch), de tweede waarde is de maximaal gemeten uurgemiddelde windsnelheid in km/u en de derde waarde is de maximaal gemeten windstoot in km/u.
| 1 | 108 | 137 |
| 2 | 115 | 151 |
| 3 | 115 | 162 |
| 4 | 104 | 140 |
| 5 | 104 | 144 |
| 6 | 112 | 151 |
| 7 | 112 | 155 |
| 8 | 115 | 144 |
| 9 | 104 | 119 |
| 10 | 108 | 159 |
| 11 | 104 | 152 |
| 12 | 108 | 143 |
| 13 | 108 | 146 |
Het gemiddelde hiervan is:
109.00 km/u voor de windsnelheid.
146.38 km/u voor de windstoten.
1h-AVG wind / x-afwijking / gusts / y-afwijking / productsom
| 108 | -1.0 | 137 | -9.38 | 9.38 |
| 115 | 6.0 | 151 | 4.62 | 27.69 |
| 115 | 6.0 | 162 | 15.62 | 93.69 |
| 104 | -5.0 | 140 | -6.38 | 31.92 |
| 104 | -5.0 | 144 | -2.38 | 11.92 |
| 112 | 3.0 | 151 | 4.62 | 13.85 |
| 112 | 3.0 | 155 | 8.62 | 25.85 |
| 115 | 6.0 | 144 | -2.38 | -14.31 |
| 104 | -5,0 | 119 | -27.38 | 136.92 |
| 108 | -1.0 | 159 | 12.62 | -12.62 |
| 104 | -5.0 | 152 | 5.62 | -28.08 |
| 108 | -1.0 | 143 | -3.38 | -3.38 |
| 108 | -1.0 | 146 | -0.38 | -0.38 |
De productsom is de x-afwijking · de y-afwijking.
Door de productsommen bij elkaar op te tellen kom je uit op 299.97.
De wortel uit de som van de kwadraten van de afwijkingen van x = √230 ≈ 15.16575. De wortel uit de som van de kwadraten van de afwijkingen van y = √1453.0772 ≈ 38.11924.
299.97/(15.16575) · (38.11924) ≈ 0.51889. De Pearson correlatiecoëfficiënt tussen de uurgemiddelde windsnelheid en de windstoten is dus 0.51889 op basis van zeer zware stormen uit het verleden. Er is dus een sterk positieve correlatie (>.5) tussen de maximale uurgemiddelde windsnelheid en de maximale windstoten tijdens een zeer zware storm.
Op basis van voorgaande data kan er ook een eenvoudige enkelvoudige lineaire regressie worden opgesteld. De richtingscoëfficiënt (b) is 299.97/230 ≈ 1.304. De vergelijking voor de intercept is a = y(macronsymbool) - bx(macronsymbool). In dit geval is de vergelijking voor het snijpunt met de y-as a = 146.38 - 1.304 · 109.00. De uitkomst hiervan is 4.244. De vergelijking voor een enkelvoudige lineaire regressie is y = a + bx. In dit geval is de vergelijking y = 4.244 + 1.304b. Deze enkelvoudige lineaire regressie fungeert als een trendlijn voor de samenhang tussen de maximale uurgemiddelde windsnelheid en de maximale windstoten. Bij een grotere dataset, bijvoorbeeld als er ook zware stormen worden gebruikt, wordt deze enkelvoudige lineaire regressie nog wat nauwkeuriger. Een aantal aspecten zoals eventuele verticale uitwisseling bij (convectieve) buien, een isallobarisch effect, een sting jet of juist een hoog uurgemiddelde in combinatie met relatief lage windstoten, maakt dat er soms een significante discrepantie tussen de trendlijn en de metingen is. Statistiek kan dus niet in alle gevallen perfect worden toegepast, maar deze trendlijn zat er bijvoorbeeld goed op met de zeer zware zomerstorm Poly van 5 juli 2023.