Taylor Arnold

Taylor Arnold
01/09/2006
Résidents Labex RFIEA+
pas Eurias

dates de séjour

01/09/2019 - 30/06/2020

discipline

Sciences du langage et linguistique

Fonction d’origine

professeur assistant

Institution d’origine

Université de Richmond (États-Unis)

pays d'origine

États-Unis

projet de recherche

MODELISATION DES CHANGEMENTS LINGUISTIQUES ET DE LA FORMATION D'UNE COMMUNAUTE DANS DE GRANDS CORPUS TEXTUELS

Ce projet porte sur la modélisation, la compréhension et la visualisation de l'évolution du langage au fil du temps. L'objectif du projet est de comprendre comment les changements intra-auteurs reflètent l'émergence de sous-communautés et de formes de pouvoir dans des contextes discursifs spécifiques. Ce projet de recherche offre un aperçu particulier de la manière dont les gens interagissent dans les espaces numériques, une tâche particulièrement importante compte tenu de la prévalence accrue des interactions sociales qui se produisent sur des plateformes numériques en apparence anonymes. Mon projet reprend des travaux antérieurs portant sur le changement linguistique temporel dans le traitement du langage naturel et des humanités numériques. Le fait que les communautés d'expertise se construisent autour de termes et de constructions linguistiques particuliers est un phénomène connu. Les membres extérieurs à la communauté acquièrent activement ces caractéristiques afin d'être acceptés dans une sphère d'influence. Le droit, le monde universitaire, la médecine et la politique sont des exemples de communautés avec des signaux linguistiques forts. Comprendre les changements de langage intra-auteurs permet de détecter et de modéliser ce phénomène. Il a également des implications plus larges pour l’étude de la formation de communautés et des structures d’expertise et de formation de sujets.

Deux ensembles de données servent d’applications directes pour le projet. Le premier est constitué du grand ensemble multilingue de commentaires d'édition de Wikipedia. Le deuxième ensemble de données est un recueil de biographies orales des années 1930. Les résultats du projet de recherche comprennent trois éléments : (1) la formulation de modèles statistiques décrivant les tendances observées dans les données ; (2) un logiciel open source qui exécute les modèles sur de nouveaux corpus et en visualise le résultat ; et (3) une analyse critique montrant comment les résultats se rapportent à la formation de communautés discursives et à la construction sociale d'une expertise de domaine.

biographie

Taylor Arnold est professeur assistant à l’université de Richmond (Virginie, États-Unis), au sein du programme de linguistique du département de mathématiques et d'informatique. En 2013, il a reçu un doctorat en statistiques de l’université de Yale. Avant son poste actuel, il était scientifique senior au sein des laboratoires de recherche d’AT&T, à New York. Il étudie les grands ensembles de données culturelles dans le cadre de projets de recherche en sciences humaines et sociales, à la fois nouveaux et existants. Il est à ce titre spécialisé dans l’application de statistiques de calcul à de grandes collections de textes et d'images. L’étude de données comprenant ces deux éléments, comme les journaux et la télévision, est d'un intérêt particulier dans le cadre de sa recherche.