Appel à communications

Colloque ConCorDial III (2026) – Continuités, innovations, transitions : enjeux linguistiques et méthodologiques

Depuis plusieurs décennies, l’étude diachronique des langues s’appuie sur des corpus numériques (cf. Prévost 2020 ou encore Marchello-Nizia 2004), dont la diversité, la taille et la sophistication vont croissant. Si les premiers grands corpus diachroniques (dont par exemple Frantext pour le français, disponible dès les années 1980) ont souvent été conçus à partir d’éditions imprimées, le développement parallèle des éditions numériques savantes, fondées sur la représentation fine des sources et de leur matérialité, a progressivement fait émerger un paysage documentaire dense, pluriel et parfois fragmenté. Les évolutions récentes des humanités numériques, l’essor des approches quantitatives en linguistique, en littérature ou en analyse du discours d’une manière plus générale, ainsi que la diffusion rapide des technologies fondées sur les grands modèles de langage (LLM) et l’IA générative, invitent désormais à porter un nouveau regard sur les frontières entre constitution, modélisation et exploration des données textuelles (Brezina 2025), y compris celles à dimension diachronique.

Dans ce contexte, la troisième édition du colloque ConCorDial, tout en s’inscrivant dans la lignée des deux premières éditions (Grenoble 2022 et Lyon 2024), propose d’approfondir la réflexion sur les corpus diachroniques en articulant quatre axes principaux :

les problèmes posés par l’hétérogénéité des données et leur traitement ;
les méthodologies d’analyse, quantitatives comme qualitatives, adaptées à la variation diachronique ;
l’évolution historique des genres textuels, envisagée comme un élément structurant notamment l’organisation et l’interprétation des corpus ;
les nouvelles potentialités offertes par les technologies d’IA pour la création, l’enrichissement et l’exploitation des ressources textuelles.

Les contributions pourront porter sur toutes les périodes de l’histoire du français ou d’autres langues et sur tout type de données textuelles, avec une attention particulière aux propositions articulant enjeux linguistiques, philologiques ou technologiques.

Axes thématiques

Axe 1 – Constitution, traitement et interopérabilité des corpus diachroniques

Dans la continuité des précédentes éditions, ce premier axe accueille des contributions portant sur les défis posés par l’hétérogénéité des corpus diachroniques (Denoyelle et al. 2024) : diversité des sources, formats, métadonnées, systèmes d’annotation, variations graphiques et morphologiques. Les propositions pourront aborder des questions ayant trait à (i) la normalisation, l’interopérabilité entre ressources et la mise en œuvre de référentiels communs ; (ii) la gestion des variations diachroniques affectant les unités lexicales, les choix de lemmatisation ou encore les phénomènes de grammaticalisation ; (iii) les enjeux de documentation, de pérennisation et de curation des données dans un contexte de croissance et de diversification continues des corpus.

Axe 2 – Études quantitatives, qualitatives et hybrides pour l’analyse diachronique

Cet axe concerne l’étude et l’exploration des corpus en diachronie longue ou courte. Les communications pourront s’inscrire dans toute thématique concernant (i) les études menées sur corpus ciblant l’évolution de différents phénomènes de langue d’ordre lexicologique, morpho-syntaxique, sémantique ou discursif/stylistique ; (ii) l’articulation entre analyses quantitatives et qualitatives, et les niveaux d’annotation nécessaires à l’étude des phénomènes diachroniques ; (iii) les approches quantitatives adaptées à l’analyse de données diachroniquement structurées ; (iv) les relations entre contraintes philologiques et analyses outillées.

Axe 3 – Genres textuels en diachronie : continuités, émergences et transformations

L’axe est consacré à l’évolution diachronique des genres textuels, envisagés comme traditions discursives historiquement situées et en constante transformation (Winter-Froemel 2023). Les communications pourront aborder (i) l’émergence, la disparition ou la mutation de genres dans une perspective longitudinale ; (ii) l’impact de ces évolutions sur la constitution des corpus, leur segmentation et leur annotation ; (iii) la modélisation et la classification des genres et sous-genres dans des corpus hétérogènes ; (iv) les relations entre genres, pratiques éditoriales et interprétation de contextes socio-historiques en évolution.

Axe 4 – Apports des grands modèles de langage et de l’IA générative pour le traitement et l’annotation des ressources textuelles

Ce dernier axe porte sur les usages des technologies fondées sur les LLM et l’IA générative dans la constitution, l’enrichissement et l’exploitation des corpus diachroniques. Les contributions pourront traiter différentes thématiques relevant de (i) l’utilisation des LLM pour le balisage, la segmentation, la lemmatisation ou l’étiquetage morphosyntaxique de textes anciens ; (ii) l’extraction automatique de métadonnées, de la normalisation assistée ou de l’alignement de variantes textuelles ; (iii) la classification automatique des genres ou traditions discursives ; (iv) des limites et biais que soulèvent ces technologies dans le domaine des humanités diachroniques.

Modalités

La durée des présentations sera de 30 minutes, suivies d’une discussion de 10 minutes. Le colloque se déroulera en mode hybride (le présentiel étant souhaité pour les intervenants). Les langues de communication acceptées sont le français et l’anglais.

Les résumés doivent comprendre entre 300 et 500 mots (sans compter les références bibliographiques) et seront rédigés dans la langue de communication. Ils doivent être déposés sur le site de la conférence (https://concordial.sciencesconf.org) en deux versions : une version anonymisée (à copier-coller dans le formulaire) et une version précisant le nom et l’affiliation de l’auteur ou des auteurs dans un document Word ou PDF. Merci d'utiliser le modèle de document proposé.

Frais d’inscription :

Les frais d’inscription s’élèveront à 50 € pour les enseignants-chercheurs et à 25 € pour les post-doctorants et doctorants. Bénéficieront d’une exonération les participants en ligne et les membres des laboratoires organisateurs.

Dates et lieu : Le colloque se tiendra les 12 et 13 novembre 2026 à l’Université de Montpellier Paul-Valéry, sur le site Saint-Charles.

Calendrier :

Date limite de soumission de résumé : 14 juin 2026
Retour des évaluations : 12 juillet 2026
Soumission de la version définitive des résumés : 1^er octobre 2026
Inscription au colloque : du 1^er septembre au 15 octobre 2026

Références

Brezina, V. (2025). Corpus linguistics and AI: #LancsBox X in the context of emerging technologies. International Journal of Language Studies, 19(2), 75–90.

Denoyelle, C., Kraif, O., Mounier, P., Renwick, A., Sorba, J. & Souvay, G. (2024). Le corpus PhraséoRoChe : les défis de l’établissement des textes et de l’hétérogénéité des états de la langue, Corpus [En ligne], 25 | 2024, mis en ligne le 26 janvier 2024, consulté le 24 novembre 2025. URL : http://journals.openedition.org/corpus/8501 ; DOI : https://doi.org/10.4000/corpus.8501.

Marchello-Nizia, C. (2004). Linguistique historique, linguistique outillée : les fruits d’une tradition. Le français moderne 72(1), 58–70.

Prévost, S. (2020). Une grammaire fondée sur un corpus numérique. In: Marchello-Nizia, C., Combettes, B., Prévost, S. & Scheer, T. (eds) Grande Grammaire Historique du Français (GGHF). Berlin, Boston: De Gruyter, 37 53.

Winter-Froemel, E. (2023). Discourse traditions research: foundations, theoretical issues and implications. In: Winter-Froemel, E. & Octavio De Toledo Y Huerta, Á. S. (eds): Manual of Discourse Traditions in Romance. De Gruyter, 25–58.

Vie privée | Accessibilité