Etude des relations entre noms propres géographiques et de leurs règles de dérivation

Denis Maurel*, LI/E3i
Odile Piton, CERMSEM
Elmar Eggert**, Wilhelms-Universität


Résumé. Cet article présente une étude des Noms Propres Géographique dans le cadre du Projet Prolex qui a pour objectif le traitement automatique des Noms Propres. L'étude des relations entre Toponymes (noms de lieux) et Gentilés (noms d'habitants) nous conduit à une organisation des données sous forme d'une Base de Données Relationnelle et à la construction d'un "Dictionnaire électronique relationnel" sous forme d'un transducteur minimal qui reconnaît les noms propres de la Base et leur associe des liens entre eux. Nous montrons comment les règles de dérivation morphologique d'un toponyme en un nom d'habitant peuvent être utilisées pour la reconnaissance automatique de mots inconnus porteurs d'un suffixe de gentilé.
Mots clés : Nom Propre, morphologie dérivationnelle, toponyme, gentilé, traitement Automatique de la Langue (TAL), automate fini, transducteur fini.

Abstract. This paper presents a study of geographical Proper Names made for the Prolex Project, the purpose of which is to deal with Proper Nouns in Natural Language Processing. We have built a Database that take our study of relations between Place Names and Inhabitant Names into account. From that Database we have automatically built a transducer that recognizes the proper names and associates a relational list to each of them. We study morphological derivation rules from Place Names to Inhabitant Names. We show how to recognize automatically unknown words that have a suffix looking like the suffix of an Inhabitant Name.
Keywords : Proper Names, morphological derivation, place name, inhabitant name, Natural Language Processing (NLP), finite state automata, finite state transducer.

*LI/E3i, Université François-Rabelais, 64 Avenue Jean Portalis, 37200 Tours, France.
**Westfälische, Wilhelms-Universität, Romanisches Seminar, Bispinghof 3a, 48143 Münster, RFA