Exkurs: Evaluation binärer Klassiﬁkatoren

[ Zurück ] [ Zurück (Seitenende) ] [ Seitenende ] [ Überkapitel ] [ Bitte Skript-Fehler melden ]

6.5
Exkurs: Evaluation binärer Klassiﬁkatoren

Lernziele

Kenntnis über True Positive, True Negative, False Positive sowie False Negative
Kenntnis über Fehlertypen und ihre Gefahr
Kenntnis über Unterschiede von Recall, Precision, F-Measure und Accuracy in Form der TP:FP:FN:TN-Darstellung

6.5.1
True/False Positives/Negatives

Evaluation von binären Klassiﬁkatoren

		Truth
		Positive	Negative

Test	Positive	True Positive (TP)	False Positive (FP)
	Negative	False Negative (FN)	True Negative (TN)

Tabelle 6.3:

Schema zum Abgleich von Test-Klassiﬁkator und Wahrheit

Legende zur Tabelle ???

True: Übereinstimmung zwischen “Test” und “Truth”
False: Keine Übereinstimmung zwischen “Test” und “Truth”
FP: Fehlertyp I : Test ist positiv, wo er nicht sollte.
FN: Fehlertyp II : Test ist negativ, wo er nicht sollte.

6.5.2
Fehlerparadoxe

Problem der Fehlerabschätzung I

Beispiel 6.5.1 (FP: Fehlertyp I). Ein syntaktischer Test zur Identiﬁzierung einer seltenen Konstruktion, welche nur in 1 von 100’001 Sätzen auftaucht, ﬁndet zwar alle vorhandenen Konstruktionen, liefert aber leider 1% Falsch-Positive. D.h die Korrektheit (accuracy) ist 99%.

Wie wahrscheinlich ist es, dass der Test tatsächlich eine gesuchte Konstruktion gefunden hat, wenn er ein positives Resultat vermeldet?

Man überlege:

Wie oft wird ein positives Testresultat bei 100’001 Sätzen gemeldet? Wieviele TP sind im Schnitt darunter?

Problem der Fehlerabschätzung II

Beispiel 6.5.2 (FN: Fehlertyp II). Ein syntaktischer Test zur Identiﬁzierung einer häuﬁgen Konstruktion, welche in 80’000 von 100’000 Sätzen auftaucht, ﬁndet 12.5% der Fälle nicht, produziert jedoch keine falschen Treﬀer.

Wie wahrscheinlich ist es, dass ein Satz die Konstruktion trotzdem enthält, obwohl der Test ein negatives Resultat vermeldet?

Man überlege:

Wie oft wird ein negatives Testresultat bei 100’000 Sätzen gemeldet? Wieviele FN sind darunter?