Blue ThemeGreen ThemeRed ThemeRed ThemeRed Theme
RSS Feeds:
Posts
Comments


Les logiciels
Dans le cadre de mes activités éditoriales ou de recherche, je conçois des logiciels en Perl, Java ou C++. Vous les trouverez dans cette page avec éventuellement leur documentation. Ils sont réputés du domaine public : vous pouvez donc les utiliser librement et les modifier, sans supprimer les références de l'auteur. Attention, ces programmes sont des prototypes, et généralement  assez fastidieux à utiliser. Me contacter pour plus d'informations .
Mise à jour le  Vendredi  6 juillet 2007

Classifieur de texte
Langage : Java Documentation / article : (archive) Archive
Initialement conçu pour la classification de textes et la détection de langues, ce logiciel a été légèrement modifié pour participer à la campagne d'évaluation Deft 07. Il permet notamment de construire des classes puis de calculer des scores de précision, rappel et Fscore en utilisant une méthode cosine ou de cumul de poids TF.IDF. Les corpus de Deft doivent être prétraités pour lui être soumis (voir à ce sujet l'archive de Deft avec les convertisseurs Perl dédiés à cette tâche). Les exemples de démonstration fournis sont utilisés pour détecter la langue d'un document.
Prototypes d'un système de Questions Réponses
Langage : Perl Documentation / article:(archive) Archive
Ce système de question réponse utilise un corpus étiqueté pour mettre en rapport une question avec des "entités réponses candidates". L'algorithme repose sur le CWS (confidence weighted score).
Prototypes mis au point dans le cadre de Deft 07
Langage : Perl Documentation / article: http://deft07.limsi.fr Archive
Les utilitaires perl présentés ici ont été utilisés dans le cadre du défi Deft 07. Ils permettent de préparer les textes pour le classifieur de texte (mise au format des fichiers XML, lemmatisation, n grammes, etc.), dans le cadre de l'évaluation par similarité cosine. Le second jeu de programmes est utilisé pour étudier le système de question réponse inversé (lire l'article des actes de Deft pour plus d'informations)

Cette publication est conçue entièrement avec des outils logiciels Open Source.
Document made with Nvu
Elle utilise les standards actuels du Web (CSS, XHTML)

Sauf avis contraire, les contenus proposés sur ce site peuvent être librement repris sous license Creative Commons

Contrat Creative Commons