Computer processing of relations between geographical proper names by transitive closure on a boolean
matrix
Résumé.
Ce travail se situe dans le cadre du Projet Prolex de traitement automatique des Noms Propres en Français.
Il concerne les noms propres toponymiques, soit les toponymes ou noms de lieux et les gentilés ou noms
d'habitants et présente le traitement des relations entre ces mots dans un texte en Français se
rapportant à la politique étrangère. Le texte est étiqueté. Nous avons constitué une Base de Données de
Noms Propres toponymiques et enregistré les liens entre eux. L'algorithme présenté regroupe les mots du
texte qui concernent la même entité (tels que Pékin-Chinois-Pékinois-Chine,
Amérique-Etats-Unis-Washington). Il construit une matrice Booléenne des associations entre les mots puis
calcule la fermeture transitive de cette matrice. La méthode est illustrée par un exemple.
Abstract.
We present results of the project Prolex. The aim of the project is the automated analysis of proper
names, especially a description of relations between different proper names in a French text. The
effect of this work is to tag the text. The system currently works with geographical proper names (place
names, derived adjectives and names of inhabitants) in French. It consists of a database containing
specific types of proper names and relations between the different names. Using these names and relations,
the program can group the proper names appearing in a text that may belong together (such as
Beijing-Chinese-Pekinese-China ; American-United States-Wahington). This is done by constructing an
association matrix between them and by computing the transitive closure of this Boolean matrix. The method
is explained with an example.
*LI, Laboratoire d'Informatique de l'Université de Tours, E3i, 64 Avenue Jean-Portalis, 37200 Tours, France. |