Une utilisation discutable du mot « hack »
WTF ?! Le procès pour atteinte aux droits d’auteur du New York Times contre OpenAI a pris une tournure inattendue après que l’entreprise technologique a accusé le journal d’avoir embauché quelqu’un pour « pirater » ChatGPT et d’autres produits afin de générer des preuves trompeuses à l’appui de ses affirmations. L’utilisation par OpenAI du terme « hack » peut cependant être exagérée.
Le New York Times a poursuivi OpenAI et Microsoft en décembre pour avoir utilisé des millions de ses articles pour entraîner leurs systèmes sans autorisation ni compensation. La poursuite indique que des millions d’articles d’actualité protégés par le droit d’auteur, d’enquêtes approfondies, d’articles d’opinion, de critiques, de guides pratiques et bien plus encore du Times ont été utilisés pour former les chatbots, qui rivalisent désormais avec le média en tant que source d’information.
Dans un dossier déposé lundi devant le tribunal fédéral de Manhattan, OpenAI a allégué que le Times « avait payé quelqu’un pour pirater » ses produits afin de générer 100 exemples de violation du droit d’auteur.
OpenAI affirme qu’il a fallu au Times des dizaines de milliers de tentatives pour générer des « résultats hautement anormaux » et qu’il y est parvenu en utilisant « des invites trompeuses qui violent de manière flagrante les conditions d’utilisation d’OpenAI ».
« Ils n’ont pu le faire qu’en ciblant et en exploitant un bug (qu’OpenAI s’est engagé à corriger) en utilisant des invites trompeuses qui violent de manière flagrante les conditions d’utilisation d’OpenAI », a écrit l’avocat d’OpenAI. « Et même dans ce cas, ils ont dû alimenter les outils en utilisant les articles mêmes dont ils cherchaient à obtenir des passages textuels, dont la quasi-totalité apparaît déjà sur plusieurs sites Web publics. »
« Les gens normaux n’utilisent pas les produits d’OpenAI de cette manière (…) Dans le cours normal des choses, on ne peut pas utiliser ChatGPT pour diffuser à volonté des articles du Times », a poursuivi OpenAI.
OpenAI ne nomme pas le « mercenaire » que le Times prétend avoir embauché pour manipuler les résultats de ChatGPT, et n’accuse pas non plus le journal de véritable piratage. Cela ressemble davantage à une ingénierie d’invite standard, et le Times est d’accord.
« Ce qu’OpenAI qualifie bizarrement de ‘piratage’, c’est simplement l’utilisation des produits d’OpenAI pour rechercher des preuves qu’ils ont volé et reproduit les œuvres protégées par le droit d’auteur du Times. Et c’est exactement ce que nous avons découvert. En fait, l’ampleur de la copie d’OpenAI est bien plus grande que celle Plus de 100 exemples sont présentés dans la plainte », a déclaré Ian Crosby, associé de Susman Godfrey et avocat principal de la publication. « Dans ce dossier, OpenAI ne conteste pas – et ne peut pas non plus le faire – avoir copié des millions d’œuvres du Times pour construire et alimenter ses produits commerciaux sans notre autorisation. «
L’utilisation d’œuvres protégées par le droit d’auteur dans la formation d’IA génératives a donné lieu à de nombreuses poursuites judiciaires de la part d’auteurs, d’artistes et de créateurs. OpenAI a déclaré dans son dossier qu’elle pensait que les entreprises d’IA gagneraient des cas comme ceux-ci sur la base d’une utilisation équitable. Il note que le Times « ne peut pas empêcher les modèles d’IA d’acquérir des connaissances sur les faits ».
Il a été rapporté en août que le Times avait mené des « négociations tendues » pour parvenir à un accord de licence avec OpenAI et Microsoft qui permettrait au premier d’entraîner légalement son modèle GPT à partir de documents publiés par le Times, ce que le journal avait précédemment décidé de faire. interdire. Mais les négociations ont échoué, ce qui a conduit au procès actuel. OpenAI a déjà conclu un accord avec Reuters et Axel Springer pour utiliser leur contenu à des fins de formation, et serait en pourparlers avec CNN, Fox Corp. et Time pour conclure des accords de licence.