Des graphes sont utilisés pour modéliser des relations entre différentes entités de langage dans une phrase, un texte ou un corpus de textes. La construction de ces graphes peut faire appel à des techniques de machine learning prenant en compte des processus du langage naturel. Une approche consiste à apprendre des représentations pour les textes et leurs relations. Pour cela, des plongements des mots (word embeddings) dans des espaces vectoriels sont réalisés. Mariana Vargas Vieyra, doctorante au sein de l'équipe-projet MAGNET, travaille sur ces méthodes de plongement de mots ou de phrases (sentence embeddings) dans le but de construire des graphes à partir de corpus de textes et induire des propriétés sémantiques et relationnelles.
|