IMIST


Feature Selection Methods for High Dimensional Data / (notice n° 57937)

000 -LEADER
fixed length control field 06253nam a2200421 i 4500
003 - CONTROL NUMBER IDENTIFIER
control field IMIST
005 - DATE AND TIME OF LATEST TRANSACTION
control field 20220919154727.0
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION
fixed length control field 220912s2021 mr m 000 0 eng
040 ## - CATALOGING SOURCE
Original cataloging agency IMIST
Language of cataloging fre
Transcribing agency IMIST
Description conventions rda
041 ## - LANGUAGE CODE
Language code of text/sound track or separate title eng
044 ## - COUNTRY OF PUBLISHING/PRODUCING ENTITY CODE
MARC country code MA
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER
Edition number 22
Classification number 006.312
100 ## - MAIN ENTRY--PERSONAL NAME
Personal name Akhiat, Yassine
9 (RLIN) 210262
Relator term Auteur
245 10 - TITLE STATEMENT
Title Feature Selection Methods for High Dimensional Data /
Statement of responsibility, etc Yassine Akhiat
260 ## - PUBLICATION, DISTRIBUTION, ETC. (IMPRINT)
Place of publication, distribution, etc Fès:
Name of publisher, distributor, etc Université Sidi Mohamed Ben Abdellah,
Date of publication, distribution, etc 2021
300 ## - PHYSICAL DESCRIPTION
Extent 160 pages
336 ## - CONTENT TYPE
Source rdacontent
Content Type Term text
Content Type Code txt
337 ## - MEDIA TYPE
Source rdamedia
Media Type Term unmediated
Media Type Code n
338 ## - CARRIER TYPE
Source rdacarrier
Carrier Type Term volume
Carrier Type Code nc
500 ## - GENERAL NOTE
General note Nfaoui, El Habib (Président)||Ouhbi, Brahim (Rapporteur)||Berrada, Ismaïl (Rapporteur)||El Far, Mohamed (Rapporteur)||Frikh, Bouchra (Examinatrice)||Bouayad, Anass (Examinateur)||Zinedine, Ahmed (Directeur de la thèse)||Chahhou, Mohamed (Co-Directeur de la thèse)
502 ## - DISSERTATION NOTE
Degree type PH.D -
Name of granting institution Université Sidi Mohammed Ben Abdellah - Fès
Year degree granted 2021
520 ## - SUMMARY, ETC.
Summary, etc Avec la croissance rapide des données de grande dimension, de nombreuses attributs sont généralement non pertinentes, redondantes et bruyantes pour une tâche d’apprentissage donnée, ce qui a des conséquences néfastes en termes de performances et / ou de coût de calcul. De plus, un grand nombre d’attributs nécessite une grande quantité de mémoire ou d’espace de stockage. Par conséquent, la ré- duction de la dimensionnalité des données est devenue indispensable dans les scénarios du monde réel pour réussir à construire des modèles plus simples et précis, à améliorer les performances d’exploration de données et à améliorer l’interprétabilité des modèles. La sélection de caractéristiques est l’une des techniques de réduction de dimensionnalité les plus fondamentales dans de nombreux domaines, notamment : la classification de texte, la reconnaissance d’images, les puces à ADN et la bio-informatique. Il peut être défini comme le processus d’identification et de sélection des caractéristiques pertinentes et de suppression de celles qui ne sont pas pertinentes et bruyantes, dans le but d’obtenir un petit sousensemble (dimensionnalité inférieure) de caractéristiques qui décrit correctement un problème donné en maintenant ou même en améliorant les performances. Ce travail de thèse s’inscrit dans le cadre de la réduction de la dimensionnalité en particulier, il est consacré à la recherche de sélection des attributs fonctionnels et à son application à des données réelles de haute dimension où plusieurs défis spécifiques sont abordés. La première partie de ce travail présente une analyse approfondie de la procédure de sélection des fonctionnalités et fournit un examen critique de ses méthodes de pointe et de sa catégorisation afin de fournir aux lecteurs et aux chercheurs une vision claire, des recommandations pertinente et quelques lignes directrices pour une sélection d’attributs efficace. La deuxième partie de cette thèse est consacrée à la proposition de nouvelles techniques de sé- lection de fonctionnalités visant à résoudre certains des problèmes détectés sur le terrain. Dans ce stade, nous avons proposé cinq contributions différentes pour améliorer la sélection des attributs dans les grandes dimensions. Les expérimentations menées prouvent que les résultats sont prometteurs. La première proposition est une méthode de sélection de caractéristiques d’enveloppe de filtre hybride basée sur l’évaluation de caractéristiques par paires. Il bé- néficie de la simplicité des filtres ainsi que de la haute performance des méthodes wrappers. La deuxième proposition repose sur une représentation graphique où chaque nœud correspond à chaque caractéristique, et le score par paire entre deux caractéristiques est utilisé comme poids de l’arête entre deux nœuds. Puisque la stabilité de l’algorithme de sélection de caractéristiques est un problème souvent négligé dans la littérature, le troisième algorithme proposé consiste à utiliser une technique d’ensemble pour assurer la stabilité de la sélection de caractéristiques.vi Parfois, le modèle de forêt aléatoire (RF) surajuste les caractéristiques bruyantes, ce qui conduit à choisir les caractéristiques bruyantes comme variables informatives et à éliminer les plus significatives. Pour résoudre ce problème, nous avons proposé une nouvelle variante de RF qui fournit une sélection de variables non biaisée où une astuce de fonctionnalité bruyante est utilisée. Ensuite, le meilleur sous-ensemble de caractéristiques est sélectionné parmi les caractéristiques les mieux classées en ce qui concerne l’impureté Gini de cette nouvelle variante de RF. Enfin, dans la cinquième contribution, nous avons développé une nouvelle approche basée sur l’apprentissage par renforcement pour la sélection de caracté- ristiques. Ce dernier agit comme un agent qui parcourt l’espace des fonctionnalités pour apprendre et explorer en permanence des règles (sous-ensembles) afin de sélectionner correctement les fonctionnalités les plus performantes. Nos propositions sont évaluées sur une configuration expérimentale de référence qui prend en compte de grands ensembles de données standard et largement utilisé pour la sélection des attributs qui sont accessibles au public sur le référentiel UCI et la plate-forme kaggle. Les résultats expérimentaux confirment la validité de nos contributions.
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Apprentissage automatique
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Fouille de données
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Informatique
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Réduction de dimension
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term High Dimensional data
700 1# - MEMBRES DE JURY
Personal name Zinedine, Ahmed
9 (RLIN) 209585
Relator term Directeur de thèse
700 1# - MEMBRES DE JURY
Personal name Chahhou, Mohamed
Relator term Directeur de thèse
9 (RLIN) 213282
700 1# - MEMBRES DE JURY
Personal name Nfaoui, El Habib
9 (RLIN) 203163
Relator term Collaborateur
700 1# - MEMBRES DE JURY
Personal name Berrada, Ismaïl
9 (RLIN) 210424
700 1# - MEMBRES DE JURY
Personal name El Far, Mohamed
9 (RLIN) 210264
700 1# - MEMBRES DE JURY
Personal name Frikh, Bouchra
9 (RLIN) 210265
700 1# - MEMBRES DE JURY
Personal name Ouhbi, Brahim
9 (RLIN) 34014
710 2# - ADDED ENTRY--CORPORATE NAME
Université Université Sidi Mohammed Ben Abdellah - Fès
Faculté Faculté des sciences
Relator term Directeur de production
856 4# - ELECTRONIC LOCATION AND ACCESS
Uniform Resource Identifier <a href="http://toubkal.imist.ma/handle/123456789/15004">http://toubkal.imist.ma/handle/123456789/15004</a>
Link text Voir dans Toubkal
942 ## - ADDED ENTRY ELEMENTS (KOHA)
Source of classification or shelving scheme
Koha item type Thèse universitaire
Exemplaires
Withdrawn status Lost status Source of classification or shelving scheme Damaged status Not for loan Permanent Location Current Location Date acquired Total Checkouts Full call number Barcode Date last seen Price effective from Koha item type
          La bibliothèque des sciences de l'ingénieur La bibliothèque des sciences de l'ingénieur 09/19/2022   TH-006.312 AKH 0000000035233 09/19/2022 09/19/2022 Thèse universitaire
© Tous droits résérvés IMIST/CNRST
Angle Av. Allal Al Fassi et Av. des FAR, Hay Ryad, BP 8027, 10102 Rabat, Maroc
Tél:(+212) 05 37.56.98.00
CNRST / IMIST

Propulsé par Koha