Accès à l'information dans les grandes collections textuelles en langue arabe / (notice n° 55799)
| 000 -LEADER | |
|---|---|
| fixed length control field | 04751nam a22003617i 4500 |
| 003 - CONTROL NUMBER IDENTIFIER | |
| control field | IMIST |
| 005 - DATE AND TIME OF LATEST TRANSACTION | |
| control field | 20220926121732.0 |
| 008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION | |
| fixed length control field | 220801s2017 mr ||||| m||| 00| 0 fre |
| 040 ## - CATALOGING SOURCE | |
| Original cataloging agency | IMIST |
| Language of cataloging | fre |
| Transcribing agency | IMIST |
| Description conventions | rda |
| 044 ## - COUNTRY OF PUBLISHING/PRODUCING ENTITY CODE | |
| MARC country code | MA |
| 082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER | |
| Edition number | 22 |
| Classification number | 006.35 |
| 100 1# - MAIN ENTRY--PERSONAL NAME | |
| Personal name | El Mahdaouy, Abdelkader |
| Relator term | Auteur |
| 9 (RLIN) | 203387 |
| 245 10 - TITLE STATEMENT | |
| Title | Accès à l'information dans les grandes collections textuelles en langue arabe / |
| Statement of responsibility, etc | Abdelkader, El Mahdaouy |
| 264 #0 - Production, Publication, Distribution, Manufacture, and Copyright Notice | |
| Place of production, publication, distribution, manufacture | Fès: |
| Name of producer, publisher, distributor, manufacturer | Université Sidi Mohammed Ben Abdellah - Fès |
| Date of production, publication, distribution, manufacture, or copyright notice | 2017 |
| 300 ## - PHYSICAL DESCRIPTION | |
| Extent | 136 pages |
| 336 ## - CONTENT TYPE | |
| Source | rdacontent |
| Content Type Term | text |
| Content Type Code | txt |
| 337 ## - MEDIA TYPE | |
| Source | rdamedia |
| Media Type Term | unmediated |
| Media Type Code | n |
| 338 ## - CARRIER TYPE | |
| Source | rdacarrier |
| Carrier Type Term | volume |
| Carrier Type Code | nc |
| 500 ## - GENERAL NOTE | |
| General note | Thèse en cotutelle avec l'Université Grenoble Alpes. |
| 502 ## - DISSERTATION NOTE | |
| Degree type | PH.D |
| Name of granting institution | Université Sidi Mohammed Ben Abdellah - Fès |
| Year degree granted | 2017 |
| 520 ## - SUMMARY, ETC. | |
| Summary, etc | Face `a la quantité d’information textuelle disponible sur le web en langue arabe, le développement des Systèmes de Recherche d’Information (SRI) efficaces est devenu incontournable pour retrouver l’information pertinente. La plupart des SRIs actuels de la langue arabe reposent sur la représentation par sac de mots et l’indexation des documents et des requêtes est effectuée souvent par des mots bruts ou des racines. Ce qui conduit `a plusieurs problèmes tels que l’ambiguïté et la disparité des termes, etc. Dans ce travail de thèse, nous nous sommes intéressés `a apporter des solutions aux problèmes d’ambiguïté et de disparité des termes pour l’amélioration de la représentation des documents et le processus de l’appariement des documents et des requêtes. Nous apportons quatre contributions au niveau de processus de représentation, d’indexation et de recherche d’information en langue arabe. La première contribution consiste à représenter les documents `a la fois par des termes simples et des termes complexes. Cela est justifié par le fait que les termes simples seuls et isolés de leur contexte sont ambigus et moins précis pour représenter le contenu des documents. Ainsi, nous avons proposé une méthode hybride pour l’extraction de termes complexes en langue arabe, en combinant des propriétés linguistiques et des modèles statistiques. Le filtre linguistique repose `a la fois sur l’étiquetage morphosyntaxique et la prise en compte des variations pour sélectionner les termes candidats. Pour sectionner les termes candidats pertinents, nous avons introduit une mesure d’association permettant de combiner l’information contextuelle avec les degrés de spécificité et d’unité. La deuxième contribution consiste à explorer et évaluer les systèmes de recherche d’informations permettant de tenir compte de l’ensemble des éléments d’indexation (termes simples et complexes). Par conséquent, nous étudions plusieurs extensions des modèles existants de RI pour l’intégration des termes complexes. En outre, nous explorons une panoplie de modèles de proximité. Pour la prise en compte des dépendances de termes dans les modèles de RI, nous introduisons une condition caractérisant de tels modèles et leur validation théorique. La troisième contribution permet de pallier le problème de disparité des termes en proposant une méthode pour intégrer la similarité entre les termes dans les modèles de RI en s’appuyant sur les représentations distribuées des mots (RDMs). L’idée sous-jacente consiste `a permettre aux termes similaires `a ceux de la requête de contribuer aux scores des documents. Les extensions des modèles de RI proposées dans le cadre de cette méthode sont validées en utilisant les contraintes heuristiques d’appariement sémantique. La dernière contribution concerne l’amélioration des modèles de rétro-pertinence (Pseudo Relevance Feedback PRF). Etant basée également sur les RDM, notre méthode permet d’intégrer la similarité entre les termes d’expansions et ceux de la requête dans les modèles standards PRF. La validation expérimentale de l’ensemble des contributions apportées dans le cadre de cette thèse est effectuée en utilisant la collection standard TREC 2002/2001 de la langue arabe. |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Information textuelle |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Arabe |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Accès à l'information |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Indexation |
| 653 1# - INDEX TERM--UNCONTROLLED | |
| Uncontrolled term | Informatique |
| 700 1# - MEMBRES DE JURY | |
| 9 (RLIN) | 34017 |
| Personal name | Ouatik El Alaoui, Saïd |
| Relator term | Directeur de thèse |
| 700 1# - MEMBRES DE JURY | |
| Personal name | Gaussier, Eric |
| Relator term | Directeur de thèse |
| 9 (RLIN) | 203388 |
| 700 ## - MEMBRES DE JURY | |
| Personal name | Cherkaoui Malki, Mohammed Ouçamah |
| Relator term | Collaborateur |
| 9 (RLIN) | 203389 |
| 710 2# - ADDED ENTRY--CORPORATE NAME | |
| Université | Université Sidi Mohammed Ben Abdellah - Fès |
| Faculté | Faculté des sciences |
| Relator term | Directeur de production |
| Laboratoire | Laboratoire Informatique et modélisation ( L I M ) |
| 9 (RLIN) | 203390 |
| 856 4# - ELECTRONIC LOCATION AND ACCESS | |
| Uniform Resource Identifier | <a href="https://toubkal.imist.ma/handle/123456789/12739?show=full">https://toubkal.imist.ma/handle/123456789/12739?show=full</a> |
| Link text | Voir dans Toubkal |
| 942 ## - ADDED ENTRY ELEMENTS (KOHA) | |
| Source of classification or shelving scheme | |
| Koha item type | Thèse universitaire |
| Withdrawn status | Lost status | Source of classification or shelving scheme | Damaged status | Not for loan | Permanent Location | Current Location | Date acquired | Total Checkouts | Full call number | Barcode | Date last seen | Price effective from | Koha item type |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| La bibliothèque des sciences de l'ingénieur | La bibliothèque des sciences de l'ingénieur | 08/01/2022 | TH-006.35 MAH | 0000000034272 | 08/01/2022 | 08/01/2022 | Thèse universitaire |
