Feature Selection Methods for High Dimensional Data / (notice n° 57937)
| 000 -LEADER | |
|---|---|
| fixed length control field | 06253nam a2200421 i 4500 |
| 003 - CONTROL NUMBER IDENTIFIER | |
| control field | IMIST |
| 005 - DATE AND TIME OF LATEST TRANSACTION | |
| control field | 20220919154727.0 |
| 008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION | |
| fixed length control field | 220912s2021 mr m 000 0 eng |
| 040 ## - CATALOGING SOURCE | |
| Original cataloging agency | IMIST |
| Language of cataloging | fre |
| Transcribing agency | IMIST |
| Description conventions | rda |
| 041 ## - LANGUAGE CODE | |
| Language code of text/sound track or separate title | eng |
| 044 ## - COUNTRY OF PUBLISHING/PRODUCING ENTITY CODE | |
| MARC country code | MA |
| 082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER | |
| Edition number | 22 |
| Classification number | 006.312 |
| 100 ## - MAIN ENTRY--PERSONAL NAME | |
| Personal name | Akhiat, Yassine |
| 9 (RLIN) | 210262 |
| Relator term | Auteur |
| 245 10 - TITLE STATEMENT | |
| Title | Feature Selection Methods for High Dimensional Data / |
| Statement of responsibility, etc | Yassine Akhiat |
| 260 ## - PUBLICATION, DISTRIBUTION, ETC. (IMPRINT) | |
| Place of publication, distribution, etc | Fès: |
| Name of publisher, distributor, etc | Université Sidi Mohamed Ben Abdellah, |
| Date of publication, distribution, etc | 2021 |
| 300 ## - PHYSICAL DESCRIPTION | |
| Extent | 160 pages |
| 336 ## - CONTENT TYPE | |
| Source | rdacontent |
| Content Type Term | text |
| Content Type Code | txt |
| 337 ## - MEDIA TYPE | |
| Source | rdamedia |
| Media Type Term | unmediated |
| Media Type Code | n |
| 338 ## - CARRIER TYPE | |
| Source | rdacarrier |
| Carrier Type Term | volume |
| Carrier Type Code | nc |
| 500 ## - GENERAL NOTE | |
| General note | Nfaoui, El Habib (Président)||Ouhbi, Brahim (Rapporteur)||Berrada, Ismaïl (Rapporteur)||El Far, Mohamed (Rapporteur)||Frikh, Bouchra (Examinatrice)||Bouayad, Anass (Examinateur)||Zinedine, Ahmed (Directeur de la thèse)||Chahhou, Mohamed (Co-Directeur de la thèse) |
| 502 ## - DISSERTATION NOTE | |
| Degree type | PH.D - |
| Name of granting institution | Université Sidi Mohammed Ben Abdellah - Fès |
| Year degree granted | 2021 |
| 520 ## - SUMMARY, ETC. | |
| Summary, etc | Avec la croissance rapide des données de grande dimension, de nombreuses attributs sont généralement non pertinentes, redondantes et bruyantes pour une tâche d’apprentissage donnée, ce qui a des conséquences néfastes en termes de performances et / ou de coût de calcul. De plus, un grand nombre d’attributs nécessite une grande quantité de mémoire ou d’espace de stockage. Par conséquent, la ré- duction de la dimensionnalité des données est devenue indispensable dans les scénarios du monde réel pour réussir à construire des modèles plus simples et précis, à améliorer les performances d’exploration de données et à améliorer l’interprétabilité des modèles. La sélection de caractéristiques est l’une des techniques de réduction de dimensionnalité les plus fondamentales dans de nombreux domaines, notamment : la classification de texte, la reconnaissance d’images, les puces à ADN et la bio-informatique. Il peut être défini comme le processus d’identification et de sélection des caractéristiques pertinentes et de suppression de celles qui ne sont pas pertinentes et bruyantes, dans le but d’obtenir un petit sousensemble (dimensionnalité inférieure) de caractéristiques qui décrit correctement un problème donné en maintenant ou même en améliorant les performances. Ce travail de thèse s’inscrit dans le cadre de la réduction de la dimensionnalité en particulier, il est consacré à la recherche de sélection des attributs fonctionnels et à son application à des données réelles de haute dimension où plusieurs défis spécifiques sont abordés. La première partie de ce travail présente une analyse approfondie de la procédure de sélection des fonctionnalités et fournit un examen critique de ses méthodes de pointe et de sa catégorisation afin de fournir aux lecteurs et aux chercheurs une vision claire, des recommandations pertinente et quelques lignes directrices pour une sélection d’attributs efficace. La deuxième partie de cette thèse est consacrée à la proposition de nouvelles techniques de sé- lection de fonctionnalités visant à résoudre certains des problèmes détectés sur le terrain. Dans ce stade, nous avons proposé cinq contributions différentes pour améliorer la sélection des attributs dans les grandes dimensions. Les expérimentations menées prouvent que les résultats sont prometteurs. La première proposition est une méthode de sélection de caractéristiques d’enveloppe de filtre hybride basée sur l’évaluation de caractéristiques par paires. Il bé- néficie de la simplicité des filtres ainsi que de la haute performance des méthodes wrappers. La deuxième proposition repose sur une représentation graphique où chaque nœud correspond à chaque caractéristique, et le score par paire entre deux caractéristiques est utilisé comme poids de l’arête entre deux nœuds. Puisque la stabilité de l’algorithme de sélection de caractéristiques est un problème souvent négligé dans la littérature, le troisième algorithme proposé consiste à utiliser une technique d’ensemble pour assurer la stabilité de la sélection de caractéristiques.vi Parfois, le modèle de forêt aléatoire (RF) surajuste les caractéristiques bruyantes, ce qui conduit à choisir les caractéristiques bruyantes comme variables informatives et à éliminer les plus significatives. Pour résoudre ce problème, nous avons proposé une nouvelle variante de RF qui fournit une sélection de variables non biaisée où une astuce de fonctionnalité bruyante est utilisée. Ensuite, le meilleur sous-ensemble de caractéristiques est sélectionné parmi les caractéristiques les mieux classées en ce qui concerne l’impureté Gini de cette nouvelle variante de RF. Enfin, dans la cinquième contribution, nous avons développé une nouvelle approche basée sur l’apprentissage par renforcement pour la sélection de caracté- ristiques. Ce dernier agit comme un agent qui parcourt l’espace des fonctionnalités pour apprendre et explorer en permanence des règles (sous-ensembles) afin de sélectionner correctement les fonctionnalités les plus performantes. Nos propositions sont évaluées sur une configuration expérimentale de référence qui prend en compte de grands ensembles de données standard et largement utilisé pour la sélection des attributs qui sont accessibles au public sur le référentiel UCI et la plate-forme kaggle. Les résultats expérimentaux confirment la validité de nos contributions. |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Apprentissage automatique |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Fouille de données |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Informatique |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Réduction de dimension |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | High Dimensional data |
| 700 1# - MEMBRES DE JURY | |
| Personal name | Zinedine, Ahmed |
| 9 (RLIN) | 209585 |
| Relator term | Directeur de thèse |
| 700 1# - MEMBRES DE JURY | |
| Personal name | Chahhou, Mohamed |
| Relator term | Directeur de thèse |
| 9 (RLIN) | 213282 |
| 700 1# - MEMBRES DE JURY | |
| Personal name | Nfaoui, El Habib |
| 9 (RLIN) | 203163 |
| Relator term | Collaborateur |
| 700 1# - MEMBRES DE JURY | |
| Personal name | Berrada, Ismaïl |
| 9 (RLIN) | 210424 |
| 700 1# - MEMBRES DE JURY | |
| Personal name | El Far, Mohamed |
| 9 (RLIN) | 210264 |
| 700 1# - MEMBRES DE JURY | |
| Personal name | Frikh, Bouchra |
| 9 (RLIN) | 210265 |
| 700 1# - MEMBRES DE JURY | |
| Personal name | Ouhbi, Brahim |
| 9 (RLIN) | 34014 |
| 710 2# - ADDED ENTRY--CORPORATE NAME | |
| Université | Université Sidi Mohammed Ben Abdellah - Fès |
| Faculté | Faculté des sciences |
| Relator term | Directeur de production |
| 856 4# - ELECTRONIC LOCATION AND ACCESS | |
| Uniform Resource Identifier | <a href="http://toubkal.imist.ma/handle/123456789/15004">http://toubkal.imist.ma/handle/123456789/15004</a> |
| Link text | Voir dans Toubkal |
| 942 ## - ADDED ENTRY ELEMENTS (KOHA) | |
| Source of classification or shelving scheme | |
| Koha item type | Thèse universitaire |
| Withdrawn status | Lost status | Source of classification or shelving scheme | Damaged status | Not for loan | Permanent Location | Current Location | Date acquired | Total Checkouts | Full call number | Barcode | Date last seen | Price effective from | Koha item type |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| La bibliothèque des sciences de l'ingénieur | La bibliothèque des sciences de l'ingénieur | 09/19/2022 | TH-006.312 AKH | 0000000035233 | 09/19/2022 | 09/19/2022 | Thèse universitaire |
