A prpous de nousàutres

TelPoS (Textes Electroniques en Langue Poitevine-Saintongeaise) est une base textuelle, dont la création a été initiée par Liliane Jagueneau, alors enseignante-chercheuse à l’université de Poitiers et membre du laboratoire FoReLLIS.

L’objectif est alors de rassembler l’ensemble de la production littéraire écrite en poitevin-saintongeais, afin de remédier à la dispersion et la rareté de certaines ressources, pour jouer le rôle d’un « trésor de la langue poitevine-saintongeaise ». C’est ainsi que le projet TelPoS a vu le jour en 2006, porté par la MSHS de Poitiers et le laboratoire FoReLLIS, et soutenu par la région Poitou-Charentes dans le cadre d’une dynamique générale autour de la préservation du patrimoine culturel et de sa promotion par le numérique. En 2012, la base TeLPos est consultable localement pour les enseigant.es-chercheur.es de l’université de Poitiers.

L’enrichissement de la base et la mise en ligne ont été réalisée sous l’impulsion de Marianne Vergez-Couret, alors enseignante-chercheuse à l’université de Poitiers et membre du laboratoire FoReLLIS (2018-2025).

TelPoS est le résultat de nombreuses collaborations entre des linguistes, le Centre de Documentation et de Recherche sur l’Oralité (CERDO, UPCP-Métive, Parthenay) et le club des langues régionales de l’université de Poitiers.

Qu’est-ce qu’une base textuelle ?

Les bases textuelles (ou bases de textes), peuvent se définir comme des réservoirs ou collections les plus larges possibles de textes numériques authentiques. Ces derniers sont traités d’un point de vue informatique, encodés, organisés et documentés, ce qui permet, à l’aide d’outils de sélection appropriés, à quiconque de sélectionner des documents au sein de la base et de les interroger. Leur conception va généralement de pair avec la construction d’outils de consultation des données (cf. Section Outils de consultation des données).

TelPoS rassemble aujourd’hui essentiellement des textes littéraires, du 16ème siècle à nos jours, de l’ensemble de l’aire géographique (Vendée, Deux-Sèvres, Vienne, Charente-Maritime, centre et ouest de la Charente, Nord-Gironde), d’une grande variété de genres (pièces de théâtre, textes en vers et en prose : dialogues, lettres fictives, compliments, chansons) et écrits dans leur graphie d’origine. La base contient actuellement 129 textes de 93 auteurs différents, ce qui fait un total de plus de 2 millions de mots (le contenu de la base est progressivement intégré pour consultation via ce site web).

Les objectifs pour TelPoS sont d’obtenir :

– la couverture la plus large possible, et toute production écrite en poitevin-saintongeais est la bienvenue, quel que soit son genre textuel, son époque, sa variante ou sa graphie ;

– une description fine et détaillée concernant les écrits, la variante qui y est représentée ainsi que leur auteur (naissance) pour offrir des données contextualisées géographiquement et temporellement ;

– des formats informatiques garantissant l’utilisation des données pour d’autres projets, leur pérennité et leur exploitation ;

– la mise à disposition pour l’ensemble de ses utilisateurs potentiels.

TelPos est consultable gratuitement en ligne et sans avoir besoin de créer un compte.

Le site de consultation fournit un outil permettant de faire des requêtes dans les textes, autrement dit d’extraire une expression (mot ou séquence de mots) dont vous souhaitez observer les contextes d’utilisation.

La base textuelle est enrichie d’informations métalinguistiques (lemmatisation, catégories morphosyntaxiques et dépendances syntaxiques). Attention, ces informations sont générées automatiquement grâce aux développements récents en traitement automatique de la langue poitevine-saintongeaise. Des outils ont été constitués pour annoter automatiquement la base et permettre des recherches plus approfondies (par exemple effectuer une recherche sur un lemme (bea pour extraire toutes les formes fléchies possibles bea, beas, béle, béles). Étant donné que le TAL du poitevin-saintongeais en est à un stade très initial, les annotations automatiques contiendront un nombre assez conséquent d’erreurs. Cependant, cette situation est appelée à évoluer, la ressource s’enrichissant régulièrement, tant sur le plan qualitatif que quantitatif.