Passer au contenu

/ Department of Computer Science and Operations Research

Je donne

Rechercher

Navigation secondaire

Soutenance de thèse - Frédéric Piedboeuf

Bonjour à tous,

Vous êtes cordialement invités à la soutenance de thèse de Frédéric Piedboeuf , telle qu'annoncée ci-dessous


Title:  La génération d'exemples pour réduire le coût d'annotation.

Date: Mercredi 20 Mars à 11 h 30

Location: Salle 3195 Pavillon André-Aisenstadt

 

Jury

PrésidenteAimeur, Esma
Directrice de rechercheLanglais, Philippe
Membre
Nie, Jian-Yun 
Examinatrice externe
Gaussier, Éric, Univ. de Grenoble, France

Résumé:

L’apprentissage machine moderne s’appuie souvent sur l’utilisation de jeux de données massifs, mais il existe de nombreux contextes où l’acquisition et la manipulation de grandes données n’est pas possible, et le développement de techniques d’apprentissage avec de petites données est donc essentiel. Dans cette thèse, nous étudions comment diminuer le nombre de données nécessaires à travers deux paradigmes d’apprentissage : l’augmentation de données et l’apprentissage par requête synthétisée.

La thèse s’organise en quatre volets, chacun démontrant une nouvelle facette concernant la génération d’exemples pour réduire le coût d’annotation. Le premier volet regarde l’augmentation de données pour des textes en anglais, ce qui nous permet d’établir une comparaison objective des techniques et de développer de nouveaux algorithmes. Le deuxième volet regarde ensuite l’augmentation de données dans les langues autres que l’anglais, et le troisième pour la tâche de génération de mots-clés en français. Finalement, le dernier volet s’intéresse à l’apprentissage par requête synthétisée, où les exemples générés sont annotés, en contraste à l’augmentation de données qui produit des exemples sans coût d’annotation supplémentaire. Nous montrons que cette technique permet de meilleures performances, particulièrement lorsque le jeu de données est large et l’augmentation de données souvent inefficace.