Severe Class Imbalance: Why Better Algorithms Aren't the Answer

Par Conseil national de recherches du Canada

Téléchargement	Voir le manuscrit accepté : Severe Class Imbalance: Why Better Algorithms Aren't the Answer (PDF, 306 Kio)
Auteur	Rechercher : Drummond, Chris; Rechercher : Holte, R.C.
Format	Texte, Article
Conférence	16th European Conference of Machine Learning, October 3-7, 2005, Porto, Portugal
Résumé	Cet article soutient que le fort déséquilibre des classes ne constitue pas seulement un défi technique intéressant, que pourront prendre en charge des algorithmes d'apprentissage améliorés, mais qu'il est beaucoup plus grave. Pour s'avérer utile, un classificateur doit nettement surpasser une solution triviale, comme le choix de la classe majoritaire. Toute application intrinsèquement bruyante limite le taux d'erreur et le coût qu'il est possible d'atteindre. Lorsque les données sont réparties normalement, même un classificateur optimal de Bayes produit une réduction infinitésimale du taux d'erreur et du coût du classificateur majoritaire à mesure que le déséquilibre augmente. Dans le cas des distributions à queue épaisse et lorsqu'on utilise des classificateurs pratiques, aucune réduction n'est souvent possible.
Date de publication	2005
Dans	Proceedings of the 16th European Conference of Machine Learning [Proceedings].
Langue	anglais
Numéro du CNRC	NRCC 48258
Numéro NPARC	9190916
Exporter la notice	Exporter en format RIS
Signaler une correction	Signaler une correction (s'ouvre dans un nouvel onglet)
Identificateur de l’enregistrement	f0b7a37b-d7c5-470c-b6e5-eb7321281478
Enregistrement créé	2009-06-30
Enregistrement modifié	2020-10-09

Date de modification :: 2024-07-07