IMIST


Accès à l'information dans les grandes collections textuelles en langue arabe / (notice n° 55799)

000 -LEADER
fixed length control field 04751nam a22003617i 4500
003 - CONTROL NUMBER IDENTIFIER
control field IMIST
005 - DATE AND TIME OF LATEST TRANSACTION
control field 20220926121732.0
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION
fixed length control field 220801s2017 mr ||||| m||| 00| 0 fre
040 ## - CATALOGING SOURCE
Original cataloging agency IMIST
Language of cataloging fre
Transcribing agency IMIST
Description conventions rda
044 ## - COUNTRY OF PUBLISHING/PRODUCING ENTITY CODE
MARC country code MA
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER
Edition number 22
Classification number 006.35
100 1# - MAIN ENTRY--PERSONAL NAME
Personal name El Mahdaouy, Abdelkader
Relator term Auteur
9 (RLIN) 203387
245 10 - TITLE STATEMENT
Title Accès à l'information dans les grandes collections textuelles en langue arabe /
Statement of responsibility, etc Abdelkader, El Mahdaouy
264 #0 - Production, Publication, Distribution, Manufacture, and Copyright Notice
Place of production, publication, distribution, manufacture Fès:
Name of producer, publisher, distributor, manufacturer Université Sidi Mohammed Ben Abdellah - Fès
Date of production, publication, distribution, manufacture, or copyright notice 2017
300 ## - PHYSICAL DESCRIPTION
Extent 136 pages
336 ## - CONTENT TYPE
Source rdacontent
Content Type Term text
Content Type Code txt
337 ## - MEDIA TYPE
Source rdamedia
Media Type Term unmediated
Media Type Code n
338 ## - CARRIER TYPE
Source rdacarrier
Carrier Type Term volume
Carrier Type Code nc
500 ## - GENERAL NOTE
General note Thèse en cotutelle avec l'Université Grenoble Alpes.
502 ## - DISSERTATION NOTE
Degree type PH.D
Name of granting institution Université Sidi Mohammed Ben Abdellah - Fès
Year degree granted 2017
520 ## - SUMMARY, ETC.
Summary, etc Face `a la quantité d’information textuelle disponible sur le web en langue arabe, le développement des Systèmes de Recherche d’Information (SRI) efficaces est devenu incontournable pour retrouver l’information pertinente. La plupart des SRIs actuels de la langue arabe reposent sur la représentation par sac de mots et l’indexation des documents et des requêtes est effectuée souvent par des mots bruts ou des racines. Ce qui conduit `a plusieurs problèmes tels que l’ambiguïté et la disparité des termes, etc. Dans ce travail de thèse, nous nous sommes intéressés `a apporter des solutions aux problèmes d’ambiguïté et de disparité des termes pour l’amélioration de la représentation des documents et le processus de l’appariement des documents et des requêtes. Nous apportons quatre contributions au niveau de processus de représentation, d’indexation et de recherche d’information en langue arabe. La première contribution consiste à représenter les documents `a la fois par des termes simples et des termes complexes. Cela est justifié par le fait que les termes simples seuls et isolés de leur contexte sont ambigus et moins précis pour représenter le contenu des documents. Ainsi, nous avons proposé une méthode hybride pour l’extraction de termes complexes en langue arabe, en combinant des propriétés linguistiques et des modèles statistiques. Le filtre linguistique repose `a la fois sur l’étiquetage morphosyntaxique et la prise en compte des variations pour sélectionner les termes candidats. Pour sectionner les termes candidats pertinents, nous avons introduit une mesure d’association permettant de combiner l’information contextuelle avec les degrés de spécificité et d’unité. La deuxième contribution consiste à explorer et évaluer les systèmes de recherche d’informations permettant de tenir compte de l’ensemble des éléments d’indexation (termes simples et complexes). Par conséquent, nous étudions plusieurs extensions des modèles existants de RI pour l’intégration des termes complexes. En outre, nous explorons une panoplie de modèles de proximité. Pour la prise en compte des dépendances de termes dans les modèles de RI, nous introduisons une condition caractérisant de tels modèles et leur validation théorique. La troisième contribution permet de pallier le problème de disparité des termes en proposant une méthode pour intégrer la similarité entre les termes dans les modèles de RI en s’appuyant sur les représentations distribuées des mots (RDMs). L’idée sous-jacente consiste `a permettre aux termes similaires `a ceux de la requête de contribuer aux scores des documents. Les extensions des modèles de RI proposées dans le cadre de cette méthode sont validées en utilisant les contraintes heuristiques d’appariement sémantique. La dernière contribution concerne l’amélioration des modèles de rétro-pertinence (Pseudo Relevance Feedback PRF). Etant basée également sur les RDM, notre méthode permet d’intégrer la similarité entre les termes d’expansions et ceux de la requête dans les modèles standards PRF. La validation expérimentale de l’ensemble des contributions apportées dans le cadre de cette thèse est effectuée en utilisant la collection standard TREC 2002/2001 de la langue arabe.
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Information textuelle
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Arabe
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Accès à l'information
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Indexation
653 1# - INDEX TERM--UNCONTROLLED
Uncontrolled term Informatique
700 1# - MEMBRES DE JURY
9 (RLIN) 34017
Personal name Ouatik El Alaoui, Saïd
Relator term Directeur de thèse
700 1# - MEMBRES DE JURY
Personal name Gaussier, Eric
Relator term Directeur de thèse
9 (RLIN) 203388
700 ## - MEMBRES DE JURY
Personal name Cherkaoui Malki, Mohammed Ouçamah
Relator term Collaborateur
9 (RLIN) 203389
710 2# - ADDED ENTRY--CORPORATE NAME
Université Université Sidi Mohammed Ben Abdellah - Fès
Faculté Faculté des sciences
Relator term Directeur de production
Laboratoire Laboratoire Informatique et modélisation ( L I M )
9 (RLIN) 203390
856 4# - ELECTRONIC LOCATION AND ACCESS
Uniform Resource Identifier <a href="https://toubkal.imist.ma/handle/123456789/12739?show=full">https://toubkal.imist.ma/handle/123456789/12739?show=full</a>
Link text Voir dans Toubkal
942 ## - ADDED ENTRY ELEMENTS (KOHA)
Source of classification or shelving scheme
Koha item type Thèse universitaire
Exemplaires
Withdrawn status Lost status Source of classification or shelving scheme Damaged status Not for loan Permanent Location Current Location Date acquired Total Checkouts Full call number Barcode Date last seen Price effective from Koha item type
          La bibliothèque des sciences de l'ingénieur La bibliothèque des sciences de l'ingénieur 08/01/2022   TH-006.35 MAH 0000000034272 08/01/2022 08/01/2022 Thèse universitaire
© Tous droits résérvés IMIST/CNRST
Angle Av. Allal Al Fassi et Av. des FAR, Hay Ryad, BP 8027, 10102 Rabat, Maroc
Tél:(+212) 05 37.56.98.00
CNRST / IMIST

Propulsé par Koha