Séminaire équipe A – Bilel Benbouzid : « Enquête numérique sur l’algorithme de recommandation YouTube? Le cas de la sphère médiatique et politique »
Bilel Benbouzid : « Enquête numérique sur l’algorithme de recommandation YouTube? Le cas de la sphère médiatique et politique »
Enquête sur le système de recommandation de YouTube. Le cas de l’espace médiatique et politique.
Ces dernières années ont été marquées par de très fortes controverses sur le système de recommandation de YouTube. Alors que du côté de la presse traditionnelle, on accuse l’algorithme d’être favorable aux contenus litigieux (désinformation, discours de haine, etc.), du côté des créateurs, on s’indigne, au contraire, d’une machine inégalitaire concentrant la recommandation sur une minorité de contenus qui présente un intérêt économique pour YouTube, au détriment de vidéos alternatives à caractère politique, au contenu orignal et souvent « amateur ». Nous avons saisi l’occasion de ce débat pour mener une enquête quantitative sur ce qui se passe sur YouTube en matière de recommandation de l’information. Comment le système de recommandation d’une des plateformes les plus visitées au niveau mondial diffuse, distribue et ordonne l’information ?
Cette présentation vise à rendre compte des résultats d’une recherche sur l’espace politique et médiatique de la plateforme YouTube. Nous proposons de présenter la structuration des chaînes sur YouTube en trois dimensions: le réseau social qui correspond au réseau des chaînes abonnées ou recommandées par les chaînes elles-mêmes (à la manière du blogroll) : le réseau des chaînes qui partagent des communautés de fans (des commentateurs en commun) ; et le réseau de chaînes formé par les vidéos recommandées (un mois de collecte de vidéos recommandées à partir d’une liste de vidéos correspondant aux dernières publications de 1400 chaines représentant la sphère politique et médiatique). Ces trois dimensions donnent à voir les facettes multiples de YouTube. Alors que la première permet de comprendre la manière dont les humains se recommandent les chaînes entre eux, la seconde montre les publics partagés par les chaînes, la troisième rend compte de l’espace médiatique et politique formé par une machine (la recommandation algorithmique non-personnalisée (cold start), c’est-à-dire correspondant à un utilisateur anonyme, sans historique de navigation).
Dans cette étude, nous avons comparé ces trois dimensions selon la diversité des contenus qu’elles valorisent (la catégorisation des 1400 chaînes a été réalisée manuellement). Nous montrerons tout d’abord les réseaux de chaînes qui se donnent à voir selon les trois dimensions ce qui nous permettra de rendre compte des topologies différenciés selon les trois réseaux. Ensuite, nous comparons les distributions des catégories de chaines selon les trois dimensions à partir des résultats des expériences de marche aléatoire et des calculs de la perplexité (entropie de Shannon) qui leur sont associés.
Nous montrons que les réseaux de chaînes produits par les humains (les réseaux de chaînes amis et celui des publics de fan) polarisent moins que le réseau produit par la recommandation algorithmique. Nous montrons aussi que si bulle de filtre il y a, elle ne se situe pas où elle est attendue : c’est moins les contenus à caractère sensationnels et « complotistes » qui sont les plus recommandés par la plateforme (ce qui est souvent dénoncé dans le débat public), mais les chaines de médias traditionnels – un des effets sans doute de l’action menée par YouTube faire évoluer le système de recommandation.
Ces résultats invitent à discuter de la nature de l’espace public que construit YouTube dans ce contexte de problème de désinformation. YouTube semble accorder un soutien particulier aux contenus des professionnels de l’information, bien plus qu’à celui des chaînes alternatives de YouTubeur amateurs.