Une fonctionnalité basée sur l’IA pour offrir une expérience d’écoute plus authentique et personnelle
En un mot: Spotify rapporte que le nombre de personnes écoutant des podcasts a dépassé les 100 millions et continue de croître. Le service de streaming explore désormais de nouvelles méthodes pour élargir l’accès à son service de podcast à un public encore plus large de créateurs et de langues. Il vise à y parvenir en tirant parti des capacités des algorithmes d’IA pour traduire automatiquement le contenu de certaines personnalités du secteur.
Spotify a dévoilé Voice Translation for podcasts, un nouveau service pilote qui utilise l’IA pour traduire des émissions audio dans différentes langues. Grâce à l’application de techniques d’apprentissage automatique, les podcasts peuvent conserver la voix originale du podcasteur, ce qui donne un son plus naturel.
Voice Translation s’appuie sur un outil développé par Spotify et intègre les avancées de pointe de la technologie audio IA, y compris les contributions d’OpenAI. OpenAI, dont le siège est à San Francisco, a développé un modèle de reconnaissance vocale polyvalent appelé « Whisper », qui a suivi une formation sur un ensemble important de données audio diverses. Cette formation lui permet d’effectuer des tâches telles que la reconnaissance vocale multilingue, la traduction vocale et l’identification des langues.
Grâce à Whisper et à son modèle d’IA, Spotify affirme que les podcasts traduits semblent plus naturels que le doublage conventionnel. Selon le service de streaming, un podcast enregistré en anglais peut désormais être proposé dans d’autres langues tout en préservant les « caractéristiques distinctives de la parole » de l’orateur.
La collection initiale de podcasts traduits par l’IA, compilée sur un hub de traduction vocale dédié, présente des épisodes de podcasteurs bien connus tels que Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons et Steven Bartlett. À ce stade, seul un nombre limité d’épisodes du catalogue et de sorties à venir seront traduits. Spotify s’est engagé à fournir des traductions en espagnol, français, allemand et dans d’autres langues non spécifiées. La société collabore également avec d’autres podcasteurs pour inclure leurs émissions dans le service de traduction.
Selon Ziad Sultan, vice-président de la personnalisation chez Spotify, proposer des podcasts traduits qui conservent la voix originale du créateur permet aux auditeurs du monde entier de découvrir et de s’inspirer de nouveaux podcasteurs de manière plus authentique. Spotify adopte une approche réfléchie de l’IA pour favoriser une connexion plus profonde entre les auditeurs et les créateurs, ce qui semble être un élément clé de la mission de l’entreprise visant à libérer le potentiel de la créativité humaine.
Les épisodes traduits vocalement seront accessibles dans le monde entier pour les abonnés premium et gratuits. Dans un premier temps, les traductions seront disponibles en espagnol, et les versions française et allemande devraient être introduites dans les jours et semaines à venir.