Schwertlilien-Datensatz

Der Schwertlilien-Datensatz (engl. Iris flower data set) ist ein multivariater Datensatz, welcher vom britischen Statistiker und Biologen Ronald Fisher erstellt wurde.[1] Der Datensatz wird auch Anderson's Iris data set genannt, da der amerikanische Botaniker Edgar Anderson die Daten sammelte, um die morphologischen Abweichungen von Schwertlilien (Gattung Iris) dreier miteinander verwandter Spezies zu quantifizieren.[2] Zwei der drei Arten wurden in der Gaspésie, "alle von der gleichen Weide, am selben Tag" gesammelt und "zum gleichen Zeitpunkt, von der gleichen Person, mit dem gleichen Apparat gemessen".[3]

Der Datensatz besteht aus je 50 Proben von jeder der drei Schwertlilienarten (Iris setosa, Iris virginica und Iris versicolor). Bei jeder der Proben wurden vier Merkmale gemessen: Die Länge und Breite von Kelchblatt und Kronblatt in Zentimetern. Anhand dieser vier Merkmale entwickelte Fisher ein lineares Modell, um die Arten voneinander zu unterscheiden. Fishers wissenschaftliche Abhandlung hierzu wurde in der wissenschaftlichen Fachzeitschrift Annals of Eugenics (heute Annals of Human Genetics) veröffentlicht.

  1. R.A. Fisher: The use of multiple measurements in taxonomic problems. In: Annals of Eugenics. 7. Jahrgang, Nr. 2, 1936, S. 179–188, doi:10.1111/j.1469-1809.1936.tb02137.x (englisch).
  2. Edgar Anderson: The species problem in Iris. In: Annals of the Missouri Botanical Garden. 23. Jahrgang, Nr. 3, 1936, S. 457–509, doi:10.2307/2394164, JSTOR:2394164 (englisch, biostor.org).
  3. Edgar Anderson: The irises of the Gaspé Peninsula. In: Bulletin of the American Iris Society. 59. Jahrgang, 1935, S. 2–5 (englisch).

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search