Les publications et conversations privées ont été exclues
Une patate chaude : Meta a annoncé avoir utilisé des publications publiques de Facebook et Instagram pour former certaines parties de son nouvel assistant virtuel IA. Le géant des médias sociaux a souligné qu’il n’incluait pas les publications privées des utilisateurs ni les messages partagés avec leurs amis et leur famille dans ses données d’entraînement.
S’exprimant dans une interview avec Reuters lors de la conférence Meta’s Connect la semaine dernière, Nick Clegg, président des affaires mondiales de l’entreprise, a déclaré : « Nous avons essayé d’exclure les ensembles de données qui contiennent une forte prépondérance d’informations personnelles ». L’ancien vice-Premier ministre britannique a ajouté que la « grande majorité » des données utilisées par Meta pour la formation étaient accessibles au public.
Meta a annoncé mercredi dernier l’introduction d’une version bêta de Meta AI, un assistant conversationnel avancé disponible sur WhatsApp, Messenger et Instagram, et disponible sur les lunettes intelligentes Ray-Ban Meta et Quest 3. Disponible uniquement aux États-Unis, l’assistant propose informations en temps réel et génère des images photoréalistes à partir d’invites textuelles.
Meta AI est alimenté par son modèle de langage LLaMA 2 publié en juillet, ainsi que par le modèle texte-image Emu, tous deux formés sur des publications publiques sur Facebook et Instagram.
Clegg a déclaré que LinkedIn était un exemple de site Web dont Meta n’avait délibérément pas utilisé le contenu pour la formation des données en raison de problèmes de confidentialité.
L’un des nombreux éléments controversés de l’IA générative reste les questions de droits d’auteur liées au contenu sur lequel leurs LLM sont formés. Cette année, des artistes ont intenté des poursuites pour droits d’auteur contre Stable Diffusion et Midjourney, tandis que des auteurs, dont John Grisham et George RR Martin, ont poursuivi OpenAI. Clegg a déclaré qu’il s’attend à « un nombre considérable de litiges » sur la question de « si le contenu créatif est couvert ou non par la doctrine existante de l’utilisation équitable ».
« Nous pensons que c’est le cas, mais je soupçonne fortement que cela va se jouer dans le cadre d’un litige », a déclaré Clegg.
Meta n’est pas la seule entreprise à utiliser le contenu des utilisateurs pour entraîner son IA. Le xAI d’Elon Musk fait la même chose avec les tweets des utilisateurs, tandis que la mise à jour de la politique de Google en juillet a confirmé que tout le contenu publié par les utilisateurs sera utilisé pour la formation en IA.
Mercredi dernier, le patron de Meta, Mark Zuckerberg, a également annoncé une variété de chatbots basés sur l’IA représentant des célébrités et des influenceurs, notamment Tom Brady, M. Beast, Paris Hilton, Kendall Jenner et Snoop Dogg. Meta a annoncé qu’elle lancerait 28 de ces robots, qui sont également alimentés par LLaMA 2. L’événement n’a pas été vraiment un succès retentissant.



