Random Subspace Feature Selection for Analysis of Data with Missing Features

Random Subspace Feature Selection for Analysis of Data with Missing Features Presented by: Joseph DePasquale Student Activities Conference 2007 This material is based upon work supported by the National Science Foundation under Grant No ECS-0239090. Any opinions, findings, and conclusions or recommendations expressed in this material are those of the author(s) and do not necessarily reflect the views of the National Science Foundation.

Outline • Motivation • Missing feature algorithm • Selecting features for training • Finding usable classifiers for testing • Impact of free parameters • Number of features used for training • Distribution update parameter β

Motivation • Missing data is a real world issue • Failed equipment • Human error • Natural phenomena • Matrix multiplication can not be used if a single data value is left out Missing Feature

Training

Training Usable Classifiers fi Ci X Feature used in training Usable classifier Feature not used in training

Experimental Setup • Research has been done for static selection of features used for training

Volatile Organic Compound Database

Pen Digits Recognition Database

Ionosphere Database

Wisconsin Breast Cancer Database

Conclusions • β does not significantly impact the algorithm, the number of features used for training does have an impact

References [1]Hussein, S., “Random feature subspace ensemble based approaches for the analysis of data with missing features,” Submitted Spring 2006. [2] Haykin, S., “Neural Networks A Comprehensive Foundation,” New Jersey: Prentice Hall, 1999. [3] “UCI repository,” [Online Document], Accessed: 25 Nov 2006. http://www.ics.uci.edu/~mlearn/MLRepository.html

Learn++.MF • Training • Selecting features from distribution • Training the network • Update likelihood of selecting features • Testing • Data corruption • Identify usable classifiers • Simulation

Random Subspace Feature Selection for Analysis of Data with Missing Features

Random Subspace Feature Selection for Analysis of Data with Missing Features

Presentation Transcript

Meta-analysis with missing data: metamiss

Feature Selection of DNA Micrroarray Data

Sensitivity Analysis of Randomized Trials with Missing Data

Error Tolerance and Feature Selection for the Logical Analysis of Data

Feature Selection and Error Tolerance for the Logical Analysis of Data

Feature selection

Feature Selection

Sensitivity Analysis of Randomized Trials with Missing Data

Data Mining Feature Selection

Feature Selection

Unsupervised Feature Selection for Multi-Cluster Data

Partially missing at random and ignorable inferences for parameter subsets with missing data

Feature Selection

Feature Selection

Feature Selection Stability Analysis for Classification Using Microarray Data

Feature Selection

Feature selection

Feature Selection

Feature Selection

Feature selection

Partially Missing At Random and Ignorable Inferences for Parameter Subsets with Missing Data