Newsletter du Lundi
11/12/23

Paru le

M. Krieger, Instagram « Le machine learning ne suffit pas, c’est l’humain qui fait la différence »

Qui ?
Mike Krieger, cofondateur et CTO d'Instagram.

Quoi ?
Les dessous de la construction des outils de recommandation d'Instagram, présentés au Web Summit 2015.

[adrotate banner="78"]
Comment ?

Clin d'oeil au hashtag du #ThrowbackThursday - une tradition du réseau, publier une photo ancienne le jeudi - Mike Krieger est revenu en 1915, date de la première collection d'images par la bibliothèque du Congrès. Les clichés étaient manuellement étiquetées"poignée de main" ou "moustaches" - ancêtres des hashtags. Le catalogue (numérisé) de la bibliothèque a accumulé en 100 ans 1,2 millions d'images et de photographies. Soit autant qu'Instagram... en 25 minutes. Le digital a changé les échelles, 80 millions de vidéos et photos sont uploadées chaque jour via l'application mobile, qui a du apprendre à gérer la masse pour ne pas dénaturer l'expérience utilisateur.

Socle des premiers succès du réseau social, la rubrique "Explore" était éditorialisée à la main par Josh, community manager, pour mettre en lumière les plus belles publications des utilisateurs. Il a même été le tout premier recrutement de la start-up en 2010. L'explosion du nombre de publications a rendu impossible le traitement manuel des contenus. "Vous pensez peut-être que c'est facile, il suffit de mettre un peu de big data et de machine learning dans tout ça pour fabriquer une expérience personnalisée. En réalité, il nous a fallu 5 ans pour construire un moteur efficace et trouver le bon équilibre entre l'éditorial pur et le machine learning."

L'éditorialisation est au centre du modèle d'Instagram, pour engager la communauté d'utilisateurs mais aussi pour accompagner l'adoption des nouveaux : lorsqu'un utilisateur crée son compte, son premier contact avec le réseau social est la suggestion d'images et de comptes à suivre. S'ils ne correspondent pas à ce qu'attend la personne, les défections sont massives.

"Par ailleurs, avec la croissance de la communauté, la curation manuelle nous plaçait dans la position inconfortable de ceux qui font et défont les rois et les reines du réseau". Pour répondre aux défis du temps réel, de l'équilibre entre les échelles locales et internationales et de la personnalisation de l'expérience sur le réseau, Instagram a du automatiser les recommandations de sa rubrique.

FullSizeRender (1)

Dans un premier essai, "Discover" est devenue la page des publications les plus populaires (combinaison du nombre de likes, et du ratio abonnés/abonnements). "Cela a marché pendant quelques mois mais avec l'évolution des usages, la page s'est remplie de selfies, macarons, et photos de stars." Peu personnalisée, l'expérience a été descendue en flamme par la communauté sur Twitter.

Après cet épisode, Instagram a commencé à mixer algorithmes, curation et personnalisation. "La prise en compte du pays de résidence et des photos aimées par les personnes auxquelles l'utilisateur est abonné ont amélioré l'expérience de l'ordre de 10% mais elles ont mis à jour d'autres biais. Tous vos abonnements n'ont pas le même poids. Il y a les gens que vous suivez parce que ce sont vos amis et ceux dont les photos vous intéressent vraiment parce que vos goûts sont similaires. On a progressivement complexifié les algorithmes en prenant par exemple plutôt les photos aimées par les comptes auxquels l'utilisateur est abonné et dont il aime les photos. Aujourd'hui l'algorithme est composé de plus de 90 paramètres et les interactions avec les images proposées sont analysées en continu pour améliorer le moteur."

Retour à l'éditorialisation

Cependant le CTO d'Instagram le reconnaît, "les progrès en pur machine learning ne feront pas tout, c'est la touche d'humain qui fait la différence. Les suggestions ne peuvent pas être basées sur les amis d'amis ou les photos similaires à celles qui ont été appréciées, sinon cela ne fonctionnerait pas pour les nouveaux utilisateurs. Or ce sont eux qui ont le plus besoin d'un outil de recommandation. Nous devons accroître le plus possible leur engagement dès le début pour diminuer le taux de churn". Le nouveau projet crée des liens entre les utilisateurs partageant les mêmes intérêts en allant lire et interpréter leur mini-biographie de profil, même si elle est composée d'emojis (chez Instagram, ça s'appelle l'emojineering). Cela permet de créer "des clusters", que les équipes valident en allant vérifier que les intérêts ont bien été interprétés. Elles s'occupent aussi de baptiser les centres d'intérêt découverts, de façon à ce que les utilisateurs s'y reconnaissent.

FullSizeRender (2)

Autre aventure mixant humain et machine learning : la création de chaînes vidéo de contenus en temps réel à l'occasion d'un événement. Le premier test a eu lieu le 31 octobre 2015 aux Etats-Unis, à l'occasion d'Halloween, l'un des 4 événements phares de l'année. Cette nouvelle fonctionnalité du réseau, alliant temps réel et agrégation de contenus autour d'un thème fait bien sûr écho aux "Live Stories" de Snapchat, curation humaine de snaps liés à un concert ou à un événement sportif.

20151031-instagram-halloween

"Aidés par des outils de requêtes complexes, la curation des photos et vidéos a été effectuée par une équipe de community managers, en temps réel. Le moteur s'occupait de la détection des hashtags et des tendances ainsi que de l'analyse des interactions avec les contenus proposés pour les faire remonter ou disparaître du flux". Aucun chiffre sur cette opération n'a été révélé, mais Mike Krieger l'annonce : ce virage vers le storytelling n'est qu'un début.

Monelle Barthélemy

[adrotate banner="78"]

Publicite

XX résultats

Oups! votre recherche
n’a donné aucun résultat !