Ch5 alternative classification

Data Mining Classification: Alternative Techniques Lecture Notes for Chapter 5 Introduction to Data Mining by Tan, Steinbach, Kumar © Tan,Steinbach, Kumar Introduction to Data Mining 4/18/2004

Chapter 5: Classification: Alternative Techniques ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Rule-Based Classifier ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5.1, page 207]

Rule-based Classifier (Example) ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5.1, page 209]

Application of Rule-Based Classifier ,[object Object],R1: (Give Birth = no)  (Can Fly = yes)  Birds R2: (Give Birth = no)  (Live in Water = yes)  Fishes R3: (Give Birth = yes)  (Blood Type = warm)  Mammals R4: (Give Birth = no)  (Can Fly = no)  Reptiles R5: (Live in Water = sometimes)  Amphibians The rule R1 covers a hawk => Bird The rule R3 covers the grizzly bear => Mammal [Chapter 5.1, page 208]

Rule Coverage and Accuracy ,[object Object],[object Object],[object Object],[object Object],(Status=Single)  No Coverage = 40%, Accuracy = 50% [Chapter 5.1, page 208]

How does Rule-based Classifier Work? R1: (Give Birth = no)  (Can Fly = yes)  Birds R2: (Give Birth = no)  (Live in Water = yes)  Fishes R3: (Give Birth = yes)  (Blood Type = warm)  Mammals R4: (Give Birth = no)  (Can Fly = no)  Reptiles R5: (Live in Water = sometimes)  Amphibians A lemur triggers rule R3, so it is classified as a mammal A turtle triggers both R4 and R5 A dogfish shark triggers none of the rules [Chapter 5 . 1 . 1, page 209]

Characteristics of Rule-Based Classifier ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 1, page 210]

From Decision Trees To Rules Rules are mutually exclusive and exhaustive Rule set contains as much information as the tree [Optional]

Rules Can Be Simplified Initial Rule: (Refund=No)  (Status=Married)  No Simplified Rule: (Status=Married)  No [Optional]

Effect of Rule Simplification ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Optional]

Ordered Rule Set ,[object Object],[object Object],[object Object],[object Object],[object Object],R1: (Give Birth = no)  (Can Fly = yes)  Birds R2: (Give Birth = no)  (Live in Water = yes)  Fishes R3: (Give Birth = yes)  (Blood Type = warm)  Mammals R4: (Give Birth = no)  (Can Fly = no)  Reptiles R5: (Live in Water = sometimes)  Amphibians [Chapter 5 . 1 . 1, page 211]

Rule Ordering Schemes ,[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 2, page 212]

Building Classification Rules ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 3 – 5 . 1. 5, page 213]

Direct Method: Sequential Covering ,[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4, page 213]

Example of Sequential Covering [Chapter 5 . 1 . 4, page 214]

Example of Sequential Covering… [Chapter 5 . 1 . 4, page 214]

Aspects of Sequential Covering ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4, page 215 - 218]

Rule Growing ,[object Object],[Chapter 5 . 1 . 4, page 215]

Rule Growing (Examples) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4 ]

Instance Elimination ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Optional]

Rule Evaluation ,[object Object],[object Object],[object Object],[object Object],n : Number of instances covered by rule n c : Number of instances covered by rule k : Number of classes p : Prior probability [Chapter 5 . 1 . 4, page 216]

Stopping Criterion and Rule Pruning ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4, page 216]

Summary of Direct Method ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4 ]

Direct Method: RIPPER ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4, page 220]

Direct Method: RIPPER ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4, page 220]

Direct Method: RIPPER ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4, page 220]

Direct Method: RIPPER ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 4, page 220]

Indirect Methods [Chapter 5 . 1 . 5, page 221]

Indirect Method: C4.5rules ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 5, page 222]

Indirect Method: C4.5rules ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 5, page 222]

C4.5 versus C4.5rules versus RIPPER C4.5rules: (Give Birth=No, Can Fly=Yes)  Birds (Give Birth=No, Live in Water=Yes)  Fishes (Give Birth=Yes)  Mammals (Give Birth=No, Can Fly=No, Live in Water=No)  Reptiles ( )  Amphibians RIPPER: (Live in Water=Yes)  Fishes (Have Legs=No)  Reptiles (Give Birth=No, Can Fly=No, Live In Water=No)  Reptiles (Can Fly=Yes,Give Birth=No)  Birds ()  Mammals [Chapter 5 . 1 . 5, page 222]

C4.5 versus C4.5rules versus RIPPER C4.5 and C4.5rules: RIPPER: [Optional]

Advantages of Rule-Based Classifiers ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 1 . 6, page 223]

Instance-Based Classifiers ,[object Object],[object Object],[Optional]

5.2 Nearest-Neighbor Classifiers

Instance Based Classifiers ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 2, page 223]

Nearest Neighbor Classifiers ,[object Object],[object Object],[Chapter 5 . 2, page 223] Training Records Test Record Compute Distance Choose k of the “nearest” records

Nearest-Neighbor Classifiers ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 2]

Definition of Nearest Neighbor K-nearest neighbors of a record x are data points that have the k smallest distance to x [Chapter 5 . 2, page 224]

1 nearest-neighbor Voronoi Diagram [Chapter 5 . 2]

Nearest Neighbor Classification ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 2 . 1, page 226]

Nearest Neighbor Classification… ,[object Object],[object Object],[object Object],[Chapter 5 . 2 . page 225]

Nearest Neighbor Classification… ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Optional]

Nearest Neighbor Classification… ,[object Object],[object Object],[object Object],[object Object],1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 vs d = 1.4142 d = 1.4142 ,[object Object],[Optional]

Nearest neighbor Classification… ,[object Object],[object Object],[object Object],[object Object],[Optional]

Example: PEBLS ,[object Object],[object Object],[object Object],[object Object],[object Object],[Optional]

Example: PEBLS Distance between nominal attribute values : d(Single,Married) = | 2/4 – 0/4 | + | 2/4 – 4/4 | = 1 d(Single,Divorced) = | 2/4 – 1/2 | + | 2/4 – 1/2 | = 0 d(Married,Divorced) = | 0/4 – 1/2 | + | 4/4 – 1/2 | = 1 d(Refund=Yes,Refund=No) = | 0/3 – 3/7 | + | 3/3 – 4/7 | = 6/7 [Optional] 1 4 2 No 1 0 2 Yes Divorced Married Single Marital Status Class 4 3 No 3 0 Yes No Yes Refund Class

Example: PEBLS Distance between record X and record Y: where: w X  1 if X makes accurate prediction most of the time w X > 1 if X is not reliable for making predictions [Optional]

Bayes Classifier ,[object Object],[object Object],[object Object],[Chapter 5 . 3, page 227]

Example of Bayes Theorem ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 3 . 1, page 228]

Bayesian Classifiers ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 3 . 2, page 229]

Bayesian Classifiers ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 3 . 2]

Naïve Bayes Classifier ,[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 3 . 2]

How to Estimate Probabilities from Data? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],k [Chapter 5 . 3 . 2, page 230]

How to Estimate Probabilities from Data? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],k [Chapter 5 . 3 . 3, page 232]

How to Estimate Probabilities from Data? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 3 . 3, page 235]

Example of Naïve Bayes Classifier ,[object Object],[object Object],[object Object],[object Object],Given a Test Record: [Chapter 5 . 3 . 3, page 235]

Naïve Bayes Classifier ,[object Object],[object Object],c: number of classes p: prior probability m: parameter [Optional]

Example of Naïve Bayes Classifier A: attributes M: mammals N: non-mammals P(A|M)P(M) > P(A|N)P(N) => Mammals [Optional]

Naïve Bayes (Summary) ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 3 . 5, page 240]

5.4 Artificial Neural Network (ANN)

Artificial Neural Networks (ANN) Output Y is 1 if at least two of the three inputs are equal to 1. [Chapter 5 . 4, page 247]

Artificial Neural Networks (ANN) [Chapter 5 . 4]

Artificial Neural Networks (ANN) ,[object Object],[object Object],[object Object],Perceptron Model or [Chapter 5 . 4 ]

General Structure of ANN Training ANN means learning the weights of the neurons [Chapter 5 . 4 . 2, page 251]

Algorithm for learning ANN ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 4 . 2, page 253]

5.5 Support Vector Machine (SVM)

Support Vector Machines ,[object Object],[Chapter 5 . 5, page 256]

Support Vector Machines ,[object Object],[Chapter 5 . 5 ]

Support Vector Machines ,[object Object],[object Object],[Chapter 5 . 5 ]

Support Vector Machines [Chapter 5 . 5 ]

Support Vector Machines ,[object Object],[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 5 ]

Support Vector Machines ,[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 5 ]

Nonlinear Support Vector Machines ,[object Object],[Chapter 5 . 5 . 4, page 270]

Nonlinear Support Vector Machines ,[object Object],[Chapter 5 . 5 . 4 ]

Ensemble Methods ,[object Object],[object Object],[Chapter 5 . 6, page 276]

General Idea [Chapter 5 . 6 . 1, page 278]

Why does it work? ,[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 6 . 1, page 277]

Examples of Ensemble Methods ,[object Object],[object Object],[object Object],[Chapter 5 . 6 . 2, page 279]

Bagging ,[object Object],[object Object],[object Object],[Chapter 5 . 6 . 4, page 283]

Boosting ,[object Object],[object Object],[object Object],[Chapter 5 . 6 . 5, page 285]

Boosting ,[object Object],[object Object],[object Object],[object Object],[Chapter 5 . 6 . 5, page 287]

Example: AdaBoost ,[object Object],[object Object],[object Object],[Chapter 5 . 6 . 5, page 288-289]

Example: AdaBoost ,[object Object],[object Object],[object Object],[Chapter 5 . 6 . 5, page 288]

Illustrating AdaBoost [Chapter 5 . 6 . 5 ] Data points for training Initial weights for each data point

Illustrating AdaBoost [Chapter 5 . 6 . 5 ]

Ch5 alternative classification

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (6)

Ähnlich wie Ch5 alternative classification

Ähnlich wie Ch5 alternative classification (20)

Kürzlich hochgeladen

Kürzlich hochgeladen (20)

Ch5 alternative classification