Identifikační kód |
RIV/00216208:11320/21:10431050 |
Název v anglickém jazyce |
GPU-Accelerated Mahalanobis-Average Hierarchical Clustering Analysis |
Druh |
D - Stať ve sborníku |
Jazyk |
eng - angličtina |
Vědní obor |
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8) |
Rok uplatnění |
2021 |
Kód důvěrnosti údajů |
S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku |
2 |
Počet tvůrců celkem |
4 |
Počet domácích tvůrců |
3 |
Výčet všech uvedených jednotlivých tvůrců |
Miroslav Kratochvíl (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 9526531, orcid: 0000-0001-7356-4075, researcherid: D-2492-2017) Martin Kruliš (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 2938359, orcid: 0000-0002-0985-8949, scopusid: 36450838500, researcherid: D-6454-2017) Adam Šmelko (státní příslušnost: SK - Slovenská republika, domácí tvůrce: A, orcid: 0000-0001-8334-2783) Tomáš Sieger (státní příslušnost: CZ - Česká republika) |
Popis výsledku v anglickém jazyce |
Hierarchical clustering is a common tool for simplification, exploration, and analysis of datasets in many areas of research. For data originating in flow cytometry, a specific variant of agglomerative clustering based Mahalanobis-average linkage has been shown to produce results better than the common linkages. However, the high complexity of computing the distance limits the applicability of the algorithm to datasets obtained from current equipment. We propose an optimized, GPU-accelerated open-source implementation of the Mahalanobis-average hierarchical clustering that improves the algorithm performance by over two orders of magnitude, thus allowing it to scale to the large datasets. We provide a detailed analysis of the optimizations and collected experimental results that are also portable to other hierarchical clustering algorithms; and demonstrate the use on realistic high-dimensional datasets. |
Klíčová slova oddělená středníkem |
CUDA;GPU;parallel;Mahalanobis distance;high-dimensional;clustering |
Stránka www, na které se nachází výsledek |
https://link.springer.com/book/10.1007/978-3-030-85665-6 |
DOI výsledku |
10.1007/978-3-030-85665-6_36 |
Odkaz na údaje z výzkumu |
- |