Objekt-Metadaten
Fuzzy-Clusteranalyse : Methoden zur Exploration von Daten mit fehlenden Werten sowie klassifizierten Daten

Autor :Heiko Timm
Herkunft :OvGU Magdeburg, Fakultät für Informatik
Datum :21.06.2002
 
Dokumente :
Dataobject from HALCoRe_document_00006809
heitimm.pdf ( 1290  kB)    ZIP generieren   Details >>
 
Typ :Dissertation
Format :Text
Kurzfassung :Gruppen/Cluster von homogenen Datenpunkten zu finden, ist eine wichtige Aufgabe der Datenanalyse. Das Ziel der Clusteranalyse ist, einen Datensatz in Gruppen von homogenen Daten zu unterteilen. Doch häufig sind die in den Datensätzen vorliegenden Cluster nicht gut voneinander getrennt. D.h., zwischen ihnen liegen Datenpunkte, die man mehreren Clustern zuordnen kann. Die Fuzzy-Clusteranalyse ist eine Möglichkeit, mit solchen Datenpunkten umzugehen, indem sie den Clustern mit einem Zugehörigkeitsgrad zwischen 0 und 1 zugeordnet werden. Der Zugehörigkeitsgrad beschreibt, wie typisch ein Datum für einen Cluster ist. Aufbauend auf einer kurzen Einführung in die Fuzzy-Clusteranalyse, die die grundlegenden Ideen und die wichtigsten Verfahren vorstellt, werden drei für eine erfolgreiche Datenanalyse wichtige Gebiete untersucht. Erstens wird eine Erweiterung der possibilistischen Fuzzy-Clusteranalyse vorgestellt. Die Erweiterung basiert auf der Modellierung einer Abstoßung zwischen Clustern und führt zu einer wesentlichen Verbesserung des Klassifikationsergebnisses, wenn die Cluster nicht gut separiert sind. Zweitens wird betrachtet, wie man Daten mit fehlenden Werten bei der Fuzzy-Clusteranalyse behandeln kann. Das Entfernen von Daten mit fehlenden Werten vor der Fuzzy-Clusteranalyse führt zu einem größeren Informationsverlust. Daher untersuche ich Ansätze basierend auf einer iterierten Schätzung, der „available case“-Berechnung der Clusterparameter und der Verwendung einer clusterspezifischen Wahrscheinlichkeit für fehlende Werte. Drittens untersuche ich Möglichkeiten, Klasseninformation bei der Fuzzy-Clusteranalyse zu verwenden, wobei eine Klasse aus mehreren Clustern bestehen kann. Das Problem ist, die Klassen (sauber) zu trennen. Hierfür führe ich einen Strafterm für Cluster, die mehrere Klassen umfassen, und eine klassenabhängige Abstoßung ein.
Schlagwörter :Fuzzy-Clusteranalyse Fuzzy-Datenanalyse
Rechte :Dieses Dokument ist urheberrechtlich geschützt.
Größe :163 S.
 
Erstellt am :24.04.2009 - 09:47:03
Letzte Änderung :22.04.2010 - 08:33:44
MyCoRe ID :HALCoRe_document_00006809
Statische URL :http://edoc.bibliothek.uni-halle.de/servlets/DocumentServlet?id=6809