Qui ?
Mathieu Rouif , co-fondateur et Pdg de photo Room et Igor Carron, Pdg de Light On.
Quoi ?
Deux entreprises françaises de l'IA ont participé à la matinée d'Artefact sur le sujet (voir aussi le papier introductif)
Comment ?
Mathieu Rouif a co-fondé Photoroom en 2019. Nous éditons 2 millards d'images par an. Photoroom commercialise ces images à des commerçants, des entreprises, des market places. Elle compte 80 millions d'utilisateurs, dont 12 millions d'utilisateurs actifs, qui vont de Warner Bros à Selency, en passant par The cool Republic ou Volt, un concurrent d'Uber. "Les places de marché constatent que leurs tierces parties ne savent pas prendre des photos. Avec Photoroom, plus besoin d'envoyer un photographe dans les restaurants." explique Mathieu Rouif. Le 4 avril dernier, Warner Bros a lancé son générateur de selfies Barbie avec Photoroom (voir ici), générant des dizaines de millions de selfies. "Warner a utilisé l'IA de Photoroom pour placer différents objets dans l'univers de Barbie".
So I just made these with the Barbie Selfie Generator #TheSuperMarioBrosMovie #Mario #Luigi #Toad #PrincessPeach #Bowser #DonkeyKong #BarbieTheMovie pic.twitter.com/zBX96lsOrd
— A Timelord Named James (@JamesGrosvenor2) April 14, 2023
Autre exemple, Campsider, une market place de vêtements, a utilisé Photoroom pour augmenter les performances de ses publicités sur Google ads. "Ils ont baissé de 15 % leurs couts d'acquisition en utilisant notre solution. Au lieu de faire une shooting à 10 000 €, ils dépensent quelques centimes pour créer des pub et voir lesquelles performent le mieux".Si vous vendez des meubles, la solution permet de créer un fond réaliste pour le fauteuil en question, d'ajouter des ombres... "Chaque utilisateur crée son image pour se projeter". A noter, Photoroom utilise l'IA pour la photo, mais aussi, dans son organisation interne : "Le marketing, le design ou la tech sont tous branchés IA. Pour développer, tout le monde chez nous utilise Copilot". Pour Mathieu Rouif, l'IA n'a pas besoin d'apprendre sur l'utilisateur, il s'agit plutôt de comprendre ce qui intéresse l'humain. "Le succès de Photoroom est de savoir quelle image a le plus d'impact auprès du public ".
Igor Carron a donné Light On, l'Asterix de l'IA générative. "Nous nous sommes demandés en 2020, comment un hardware pouvait être utilisé pour le Large Language Model (LLM). Nous en avons conclu qu'il fallait savoir faire ces modèles nous-mêmes. Nous avons commencé à le faire sur un calculateur du CNRS, avec des données françaises. Et nous avons commencé à vendre ce modèle en 2022.". A l'époque, les professionnels ne savaient pas ce que c'était. mais depuis ChatGPT a rendu la notion d'IA générative presque grand public.
Aujourd'hui, Light On est un concurrent crédible à Chat GPT 3, avec moins de paramètres, moins d'infrastructures lourdes, "On peut l'utiliser pour moins cher. Et surtout, en toute sécurité".
Un sujet d'actualité : le 4 avril 2023, Samsung a essuyé les plâtres : ses salariés ont révélé de l'information confidentielle en utilisant ChatGPT (voir ici). "Quand on envoie des données, les modèles qui viennent après peuvent être réentrainés avec la donnée envoyée. Igor Carron donne un exemple : Des consultants en minerais savent où sont les gisements d'or. S'ils passent par une API publique pour les données de rapports techniques, deux ans plus tard, chat GPT révèle à tous où on peut trouver de l'or. Ce que vous faites fuire est votre savoir faire. Vous ne devez pas faire sortir vos données. Car aujourd'hui, l'entreprise, fondamentalement, c'est son savoir-faire".
De fait, la propriété intellectuelle de ces modèles LLM est actuellement un vide juridique, même si des procès comme celui de Getty Image contre Open AI pourraient apporter des réponses.
1 le modèle chatgpt est public : tout peut être utilisé à des fins commerciales
2 le modèle chat GPT Google etc est privé, mais sans propriété intellectuelle
3 le modèle open source installés chez vous vous appartient.
L'utilisation de l'intelligence artificielle en entreprise peut aboutir à l'entreprise augmentée, comme l'explique le papa de Light On : " Quand vous faites entrer les e mail envoyés par l'entreprise, vous avez une connaissance intime de l'entreprise d'un plan technique marketing etc. Et l'intelligence artificielle peut prendre en charge certaines tâches sans beaucoup de valeur ajoutée. Les professionnels commencent à comprendre qu'au delà du data Lake, on peut utiliser les données internes de l'entreprises pour aboutir à des sociétés qui seront fondées sur le LLM. Light On propose de sortir de la dépendance Open IA et d'accueillir ces LLM en Europe. On peut utiliser des modèles déjà entrainés et entrainer pour vous, et c’est beaucoup moins cher que les millions d'euros évoqués (voir notre papier). On peut aussi utiliser de l’open source, qualifier les données. Les réutiliser comment faire en sorte que LLM deviennent un moteur chez vous."
Reste la question de l'échelle : "l'Europe n'a pas la capacité de plusieurs milliers de GPU. Sauf Leonardo (auguré en novembre 2022 à Bologne, en Italie, voir cet article) Nous voulons dépenser 10 M€ chez eux mais ils ne répondent pas à nos e mail"" confie Igor Carron.
Yohan Ralle, responsable de la Stratégie nationale pour l’intelligence artificielle au ministère de l'économie et des finances le rassure "Nous allons aider le message à parvenir à son destin aire". Il rappelle que le Rapport Villani , en 2018 a abouti calculateur Jean Zay qui a permis d’entrainer le modèle Hugging Face rassemblant 1 000 chercheurs-passé depuis sous pavillon américain.
La guerre des GPU
"Aujourd'hui, il y a des gens dont le travail est de trouver des GPU". Pour l'instant Nvidia a un monopole et fait les prix pour le monde entier. Mais AMD d'Amazon pourrait constituer une réponse. Amazon, comme tous les acteurs du cloud, s'est aperçu qu'elle avait un intérêt vital à proposer des solution LLM, et a annoncé Bedrock, il y a une semaine. Jean Zay à Saclay dispose de 3 000 GPU (mis à disposition des chercheurs), Open AI et Musk, 10 000.Laion , initiative européenne , propose une base de données open source pour entrainer Chat GPT.
Une chose est sûre : la nouvelle guerre stratégique concerne ces cartes graphiques, car le software progresse plus vite que la production de hardware.