Apprentissage à base de Noyaux Sémantiques pour le Traitement de Données Textuelles

Par Sujeevan Aseervatham

Format : A4 (210x297)

Nombre de pages : 220

Disponibilité : En stock

Livre papier

Prix conseillé : 28,00 €

Prix : 26,60 €

Economisez : 1,40 € (5%)



ISBN : 9782356076434

Résumé

Depuis le début des années 80, les méthodes d'apprentissage automatique appliquées au traitement de données textuelles connaissent un intérêt grandissant. Cette tendance est principalement due au fait que la taille des corpus est en perpétuelle croissance. Ainsi, les méthodes utilisant le travail d'experts sont devenues coûteuses perdant peu à peu de leur popularité au profit des systèmes d'apprentissage.
Dans cette thèse, nous nous intéressons à deux axes. Le premier axe porte sur l'étude des problématiques liées au traitement de données textuelles structurées par des approches à noyaux. Nous présentons un noyau sémantique pour les documents structurés au format XML. Le noyau tire ses informations sémantiques d'une source de connaissances externe, à savoir un thésaurus. Ce noyau a été testé sur un corpus de documents médicaux avec le thésaurus médical UMLS. Il a été classé, lors d'un challenge international de catégorisation de documents, parmi les 10 méthodes les plus performantes sur 44.
Le second axe porte sur l'étude des concepts latents extraits par des méthodes statistiques telles que l'Analyse Sémantique Latente (LSA). Nous présentons, dans une première partie, des noyaux exploitant des concepts linguistiques provenant d'une source externe et des concepts statistiques issus de la LSA. Nous montrons qu'un noyau intégrant les deux types de concepts permet d'améliorer les performances. Puis, dans une deuxième partie, nous présentons un noyau utilisant des LSA locaux afin d'extraire des concepts latents permettant d'obtenir une représentation plus fine des documents.

Nos lecteurs ont aussi aimé

Méthodes et outils d'aide au diagnostic et à la maintenance des tableaux électriques basse tension

De Kahan N'Gouan N'Guessan

Le tableau électrique est un élément clé de toute installation électrique. Il incorpore des dispositifs destinés à distribuer l'électricité et à protéger les circuits et les personnes. …

L'écriture de l'histoire : un dialogue entre les deux rives

De Benaoumeur Khelfaoui

Beaucoup d'eau a coulé entre les deux rives méditerranéennes et plusieurs vagues d'actualités franco-algériennes ont ricoché sur les récifs des deux rivages, depuis que l'Algérie s'est …

PORTRAIT DE LA COMMUNAUTÉ JUIVE DE SOUSSE (TUNISIE)

De Claire Rubinstein-Cohen

La communauté juive de Sousse constituée de 1500 personnes en 1857 était soumise au statut de la Dhimma, tolérance accordée par les Musulmans aux Gens du Livre, (Ahl el kittab), Juifs et …

Polymérisation radicalaire contrôlée en émulsion et dispersion sans tensioactif

De Guillaume Delaittre

Une macroalocxyamine hydrosoluble (poly(acide acrylique) fonctionnalisé par le nitroxyde SG1) a été utilisée en polymérisation radicalaire contrôlée en milieux aqueux dispersés. En …

Architecture réseau sécurisé pour une ouverture à l'Internet et processus qualité

De Félix Guy ANOMA-KANIE

Cette soutenance fut présentée dans le cadre de l'étude et de la mise en place d'une architecture Réseau sécurisé pour une ouverture à l'Internet de la société Albiran. Je présente …

Développement financier, instabilité financière et croissance économique : impli

De Kangni Kpodar

La théorie économique suggère que le développement financier est favorable à la croissance économique. Cependant, certaines expériences de politiques de libéralisation financière se sont …

La formation de la plaine deltaïque de Petite Camargue à l'Holocène

De Tony Rey

L'étude des témoins paléoenvironnementaux et archéologiques a permis la reconstitution des milieux fluvio-deltaïques durant l'Holocène, suivant une approche multi-sites entre les Costières …

L'Ecriture de l'histoire dans les autobiographies de soldats de l'Espagne Moderne

De Alexandra Bouchet

Tout en restant des écritures de leur époque, les quatre récits de vie évoqués dans cet ouvrage présentent des caractéristiques communes avec l'autobiographie actuelle. L'analyse des …

La Comptabilité Analytique intégrée à la Comptabilité Générale dans une Organisation multidimensionnelle

De Joseph Hounsa

La Comptabilité Analytique intégrée à la Comptabilité Générale dans une Organisation multidimensionnelle montre comment mettre en place dans une structure complexe une comptabilité …

Essays on Trade Liberalization and Income Inequality in Developing Countries

De Julien Gourdon

This thesis “Essays on Trade Liberalization and Income Inequality in Developing Countries” is in three essays. The first deals with the hypothesis that countries trade according to their …

Avis des lecteurs

Aucun avis n'a été déposé pour cet ouvrage, vous pouvez ecrire un commentaire sur cet ouvrage.

Informations sur l'ouvrage

Collection Universitaire
Nom Apprentissage à base de Noyaux Sémantiques pour le Traitement de Données Textuelles
Langue Français
Auteur Sujeevan Aseervatham

Livre Papier

Nombre de pages
ISBN 9782356076434

Mots clés

D'autres personnes ont marqué ce produit avec ces mots clés :

Utilisez un espace pour separer vos mots clés. Utilisez l'apostrophe (') pour rédiger une phrase.