A fast and scalable subspace clustering algorithm

Transcrição

A fast and scalable subspace clustering algorithm
Campus Gengenbach
Klosterstraße 14, 77723
Campus Offenburg
Badstraße 24, 77652
Subspace Clustering ist ein maschinelles Lernverfahren aus dem Bereich des Data Mining.
Prof. Dr. Amitava Datta von der University of Western Australia aus Perth hält am 27. Januar
über dieses Thema eine Gastvorlesung. Da hochdimensionale Datensätze - also solche mit
vielen Merkmalen - in der Praxis keine Cluster über den gesamten Merkmalraum bilden (die
Datenpunkte verteilen hier sich nahezu gleichmäßig im Raum), besteht eine Möglichkeit der
Klassifizierung darin, die Daten in allen Teilräumen (subspaces) auf Cluster zu untersuchen.
Da die Anzahl der Teilräume exponentiell in der Zahl der Dimensionen ist, bedeutet dies
einen extrem hohen Rechenaufwand. Der beste bisherige Algorithmus stößt bereits bei 50006000 Datenpunkten in 25 Dimensionen an seine Grenzen. Im Vortrag wird ein Algorithmus
vorgestellt, der große Datensätze mit hunderten von Dimensionen relativ schnell
verarbeiten kann. Experimente belegen, dass das Verfahren auch mit bis zu 4000
Dimensionen funktioniert.
07 Jan 2015
Von: cd
Guest Lecture: Prof. Dr. Amitava Datta, University of Western Australia, Perth. Subspace
clustering is an unsupervised machine learning technique. Since high-dimensional datasets are
not amenable to clustering in the full-dimensional space (points tend to become almost equally
spaced), one way of understanding a dataset is to cluster it in all possible subspaces. Since there
are an exponential number (exponential in the dimension) of subspaces, this is very expensive
computationally. In fact the best algorithm cannot handle more than 5000-6000 data points and
25 dimensions. We have designed a fast algorithm that can process large datasets of hundreds of
dimensions fairly fast. We have even experimented with up to 4000 dimensions and it works.
Public Lecture by Prof. Dr. Amitava Datta
http://www.hs-offenburg.de/nc/news-detail/archive/2015/january/article/a-fast-and-scalable-subspace-clustering-algorithm/
20 Jan 2017 23:21:36
1/2
Campus Gengenbach
Klosterstraße 14, 77723
Campus Offenburg
Badstraße 24, 77652
University of Western Australia, Perth.
27 January 2015, 17:30 pm,
Campus Offenburg, Building E, Room E 311
For further information please contact:
Dr. rer. nat. Tobias Lauer
← Zurück
http://www.hs-offenburg.de/nc/news-detail/archive/2015/january/article/a-fast-and-scalable-subspace-clustering-algorithm/
20 Jan 2017 23:21:36
2/2