Aggregation interagierender Kriterien

Begriff aus der Datenanalyse

Aggregation (von lateinisch aggregare, hinzunehmen) steht hier für Zusammenfassung. Es geht um die geeignete Zusammenfassung verschiedener Kriteriumswerte zu einem globalen Wert, beispielsweise mit dem Ziel, eine möglichst objektive Rangordnung zwischen konkurrierenden Individuen zu erhalten. Dabei können sich die einzelnen Kriterien untereinander beeinflussen (interagieren). Diese Aggregation geschieht durch sog. Aggregationsfunktionen, die häufig geeignete Mittelwerte der Einzelkriterien sind, siehe [1]. Siehe aber auch die unter dem Gesichtspunkt der Datenverdichtung geschriebenen Artikel Aggregatfunktion und Aggregation (OLAP).

Einfaches Beispiel

Bearbeiten

Die folgende Tabelle zeigt in den ersten drei Spalten die Leistungen (in Punkten) von 4 Schülern in den Fächern Mathematik, Physik und Deutsch. Die Zahlenwerte in den weiteren Spalten werden im Laufe des Artikels erklärt.

Name Mathematik Physik Deutsch AM GM OWA(1) OWA(2) CI
Peter 19 16 10 15 16,0 13,6 17,2 13,40
Paul 13 15 17 15 14.6 14,4 16,0 15,07
Petra 19 18 8 15 16,4 13,2 17,6 12,33
Paula 8 19 18 15 14,4 13,2 17,6 15,33

Aggregationsfunktionen

Bearbeiten

Sei   eine Menge von   Kriterien mit den Ausprägungen  , die zu einem globalen Wert   zusammengefasst werden sollen.

Arithmetisches Mittel (AM)

Bearbeiten

Dies ist eine der einfachsten Aggregationsfunktionen:

 .

AM verzichtet völlig auf Schwerpunktsetzung und Interaktion unter den Kriterien, im Beispiel zeigt die Spalte AM keinen Unterschied zwischen den Schülern.

Gewichtetes Mittel (GM)

Bearbeiten

Hier ist durch die unterschiedlichen Gewichte   eine Schwerpunktsetzung möglich:

 .

Wenn man für gewisse Zielstellungen die Naturwissenschaften höher bewerten will und z. B.   wählt, ergibt sich in der Tabelle die Spalte GM. Bei Sprachbevorzugung ergibt sich natürlich ein anderes Bild (nicht in der Tabelle enthalten). Eine Interaktion zwischen den Kriterien wird hier allerdings noch nicht berücksichtigt.

Geordnetes gewichtetes Mittel (OWA)

Bearbeiten

Geordnete gewichtete Mittel (engl. Ordered Weighted Average (OWA)) sind erstmals 1988 von Ronald Robert Yager[2] betrachtet worden, siehe auch [3]. Seien   die der Größe nach geordneten Kriteriumswerte, dann ist OWA definiert durch

 .

Extreme OWA's sind   und  , die man für   bzw.   erhält.

Wenn man im Beispiel eine möglichst gute Allgemeinbildung honorieren möchte, muss man dem kleinsten Kriteriumswert ein hohes Gewicht geben, z. B.  . Dann ergibt sich in der Tabelle die Spalte OWA(1). Wenn man dagegen belohnt, dass wenigstens in einem Fach Spitzenwerte vorliegen, dann gibt man dem höchsten Kriteriumswert ein hohes Gewicht, z. B.  . Dann ergibt sich in der Tabelle die Spalte OWA(2). Bei OWA interagieren die Kriterien, man kann z. B. den kleinsten Kriteriumswert nur bei Kenntnis aller Kriteriumswerte festlegen. Der Nachteil der bisherigen Aggregationsfunktionen ist allerdings, dass sie keine Redundanzen bzw. Synergien zwischen Kriterien berücksichtigen können. Im Beispiel ist kein Unterschied zwischen Petra und Paula festzustellen. Man könnte aber argumentieren, dass ein Schüler, der in Mathematik gut ist, fast automatisch auch in Physik gut sein wird, d. h. die Leistungen in diesen beiden Fächer weisen eine gewisse Redundanz auf.

Diskretes Choquet-Integral (CI)

Bearbeiten

Das diskrete CI ist die flexibelste Aggregationsfunktion. Sie ist definiert durch [1]

 .

Dabei ist   eine normierte Kapazität (d. h.  ).   ist die Menge der Kriterien, deren Werte mindestens so groß sind wie der i-te Wert   in der Rangordnung  . Für drei Kriterien   stellt sich das diskrete CI ausführlich wie folgt dar:

 .

Setzt man für das Beispiel   mit   für Mathematik,   für Physik und   für Deutsch und weiter

  (alle Fächer sind gleichbedeutend)
  (Redundanz zwischen Mathematik und Physik)
  (leichte Synergie),

dann ergibt sich beispielsweise für Peter ( )

 .

Die weiteren Ergebnisse sind in der CI-Spalte der Tabelle zu finden. Für kompliziertere Beispiele, insbesondere praktische Anwendungen, ist Software nötig.[4]

Bearbeiten

Einzelnachweise

Bearbeiten
  1. a b Grabisch,M., Marichal,J.-L., Mesiar,R. and E. Pap (2009): Aggregation Functions. Cambridge University Press
  2. Yager, R.R. (1988): On ordered weighted averaging aggregation operators in multi-criteria decision making, IEEE Transactions on Systems, Man and Cybernetics 18, 183-190
  3. Yager, R.R. and J. Kacprzyk (1997): The Ordered Weighted Averaging Operators: Theory and Application, Kluwer
  4. Simon James (2016): An Introduction to Data Analysis using Aggregation Functions in R, Springer