Computer processing of relations between geographical proper names by transitive closure on a boolean matrix

Odile Piton, CERMSEM
Denis Maurel*, LI

Résumé. Ce travail se situe dans le cadre du Projet Prolex de traitement automatique des Noms Propres en Français. Il concerne les noms propres toponymiques, soit les toponymes ou noms de lieux et les gentilés ou noms d'habitants et présente le traitement des relations entre ces mots dans un texte en Français se rapportant à la politique étrangère. Le texte est étiqueté. Nous avons constitué une Base de Données de Noms Propres toponymiques et enregistré les liens entre eux. L'algorithme présenté regroupe les mots du texte qui concernent la même entité (tels que Pékin-Chinois-Pékinois-Chine, Amérique-Etats-Unis-Washington). Il construit une matrice Booléenne des associations entre les mots puis calcule la fermeture transitive de cette matrice. La méthode est illustrée par un exemple.
Mots clés : Base de Données, Noms Propres toponymiques, Matrice Booléenne, fermeture transitive, Traitement Automatique des Langues (TAL).

Abstract. We present results of the project Prolex. The aim of the project is the automated analysis of proper names, especially a description of relations between different proper names in a French text. The effect of this work is to tag the text. The system currently works with geographical proper names (place names, derived adjectives and names of inhabitants) in French. It consists of a database containing specific types of proper names and relations between the different names. Using these names and relations, the program can group the proper names appearing in a text that may belong together (such as Beijing-Chinese-Pekinese-China ; American-United States-Wahington). This is done by constructing an association matrix between them and by computing the transitive closure of this Boolean matrix. The method is explained with an example.
Keywords : Database, toponymic Proper Names, Boolean Matrix, transitive closure, Natural Language Processing (NLP).

*LI, Laboratoire d'Informatique de l'Université de Tours, E3i, 64 Avenue Jean-Portalis, 37200 Tours, France.