AbstractsComputer Science

Návrh rozhodovacích stromů na základě evolučních algoritmů

by Ondřej Benda




Institution: Brno University of Technology
Department:
Year: 0
Keywords: Rozohovací strom; Klasifikátor; VFDT; CVFDT; Genetické programování; Viola-Jones; Detekce objektů; Decision Tree; Classifier; VFDT; CVFDT; Genetic Programming; Viola-Jones; Object detection
Record ID: 1097929
Full text PDF: http://hdl.handle.net/11012/9127


Abstract

Tato diplomová práce pojednává o dvou algoritmech pro dolování z proudu dat - Very Fast Decision Tree (VFDT) a Concept-adapting Very Fast Decision Tree (CVFDT). Je vysvětlen princip klasifikace rozhodovacím stromem. Je popsána základní myšlenka konstrukce stromu Hoeffding Tree, který je základem pro algoritmy VFDT a CVFDT. Tyto algoritmy jsou poté rozebrány detailněji. Dále se tato práce zabývá návrhem algoritmu Genetického Programování (GP), který je použit pro vytváření klasifikátoru obrazových dat. Vytvořený klasifikátor je použit jako alternativní způsob klasifikace objektů v obraze ve frameworku Viola-Jones. V práci je rozebrána implementace algoritmů, které jsou implementovány v jazyce Java. Algoritmus GP je integrován do knihovny “Image Processing Extension” programu RapidMiner. Algoritmy VFDT a CVFDT jsou testovány na syntetických a reálných textových datech. Algoritmus GP je testován na klasifikaci obrazových dat a následně vytvořený klasifikátor je otestován na detekci obličejů v obraze.; This thesis deals with two algorithms for data stream mining - the Very Fast Decision Tree (VFDT) and the Concept-adapting Very Fast Decision Tree (CVFDT). The decision tree based classification is explained. The essential idea of the Hoeffding Tree, which is the base of VFDT and CVFDT algorithms is described. Both algorithms VFDT and CVFDT are explained in more detail. Further this work deals with the design of the Genetic Programming algorithm, which is used for an image object classifier evolving. This classifier is used as alternative approach of object classification in the Viola-Jones framework. All algorithms are implemented in programming language Java. The implementation is described. The algorithm GP is integrated into the “Image Processing Extension” library of the program RapidMiner. The VFDT and CVFDT are tested on the synthetic and real text data. The GP algorithm is tested on the image data for the object classification. The evolved classifier is tested on the object in image detection.