Badania eksploracyjne

Kwartet Anscombe'a – ilustracja czterech znacząco różnych zbiorów danych, które mają identyczne podstawowe parametry opisowe (średnią arytmetyczną, wariancję, współczynnik korelacji oraz równanie regresji liniowej). Anscombe użył tego przykładu by podkreślić wagę używania graficznych reprezentacji danych.
Kwartet Anscombe'a – ilustracja czterech znacząco różnych zbiorów danych, które mają identyczne podstawowe parametry opisowe (średnią arytmetyczną, wariancję, współczynnik korelacji oraz równanie regresji liniowej). Anscombe użył tego przykładu by podkreślić wagę używania graficznych reprezentacji danych.

Badania eksploracyjne (EDA, ang. exploratory data analysis) – podejście we wnioskowaniu statystycznym obejmujące opis, wizualizację i badanie zebranych danych bez potrzeby zakładania z góry hipotez badawczych. Jest wstępnym etapem procesu naukowego. Może korzystać z metod modelowania statystycznego i weryfikacji hipotez statystycznych, ale używa ich do odnajdywania, a nie potwierdzania idei[1]. Ma ona na celu wzbogacenia wiedzy naukowej o hipotezy, które mogą nasunąć nieukierunkowana obserwacja i analizy. Badania eksploracyjne obejmują też wstępne sprawdzanie danych w celu skontrolowania założeń modeli statystycznych, lub występowania błędów w danych (np. brakujących odpowiedzi). Jest to klasyczne podejście, z którego wraz z rosnącą dostępnością komputerów wyłoniła się dziedzina komputerowej eksploracji danych (data miningu), oraz data science i big data. Eksplorację danych jako osobne podejście spopularyzował statystyk John Tukey.

  1. Open Science Collaboration, Maximizing the reproducibility of your research, [w:] Scott Owen Lilienfeld, Irwin Douglas Waldman (red.), Psychological Science Under Scrutiny: Recent Challenges and Proposed Solutions, New York: Wiley-Blackwell, marzec 2017, ISBN 978-1-118-66107-9.

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search