Les algorithmes de recommandation musicale : ne bougez pas, on s’occupe de tout

Concoctées par les algorithmes de recommandations, les playlists personnalisées font fureur sur les plateformes de streaming musical, prisées par les utilisateurs. Les logiciels développés étant de plus en plus performants et intrusifs, leur succès est ombragé par des critiques, plus ou moins fondées…

La plateforme française Deezer arbore plus de 53 millions de titres ; les Suédois de Spotify en revendiquent plus de 75 millions. Alors qu’hier la consommation musicale se faisait avec une bibliothèque physique de CD, cassettes et vinyles limitée, le tout dématérialisé créé une saturation, la quantité fulgurante nécessitant une certaine forme de tri.

Les mastodontes du streaming culturel ont mis en place des services de recommandation musicale se basant sur des algorithmes : Flow pour Deezer, Discover Weekly pour Spotify, Apple music, Google Play music, Pandora aux États-Unis… C’est un marché qui fleurit tous les jours.

L’intelligence artificielle au service de l’industrie culturelle

Les algorithmes de recommandation sont des outils d’intelligence artificielle : il s’agit d’analyser les données des utilisateurs et d’en extraire des informations pertinentes. Ainsi, les comportements, les tendances et les profils sont pris en compte par le système de recommandation, qui va peaufiner ses suggestions afin qu’elles correspondent au client. Se basant sur le principe du machine learning, les algorithmes vont s’affiner avec le temps, apprenant davantage à mesure qu’ils incorporent de données.

Ce système s’applique donc très bien à l’industrie culturelle : tant à la musique qu’au cinéma d’ailleurs, car Netflix ou Amazon Premium utilisent le même concept. Le principe de sélection n’est pas nouveau, mais désormais le logiciel se substitue (partiellement) aux programmateurs  dont on proposait les sélections générales.

L’idée est simple : proposer une playlist personnalisée, adaptée au client et à ses préférences musicales. Ainsi, les goûts sont ciblés, l’offre est différente pour chacun. Cette personnalisation a pour but de fidéliser les clients de ces plateformes, en les séduisant avec des suggestions pertinentes pour eux. C’est notamment très développé sur les plateformes payantes, mais c’est aussi le cas sur Youtube ou sur des services dédiés à la recommandation comme Last.fm.

Quelles données sont prises en compte par l’algorithme ?

Il semble évident en premier lieu que l’algorithme qui compile les données des utilisateurs se sert de l’historique des titres et des artistes écoutés. Ainsi, si un utilisateur écoute régulièrement Cat Stevens, il y a tout à parier qu’un algorithme lui proposera très rapidement d’écouter Simon & Garfunkel. Dans ce cas, la recommandation se base essentiellement sur les données des autres utilisateurs, tout particulièrement de ceux qui ont tendance à aimer le folk rock anglo-saxon des années 60.

Les algorithmes peuvent également s’aider des préférences des contacts enregistrés par l’utilisateur. Ainsi, si les amis du fan de Cat Stevens ont beaucoup plus écouté Paul Simon que Simon & Garfunkel, l’algorithme de recommandation adaptera sa suggestion pour faire remonter Paul Simon dans la liste.

Plus intrusif encore, l’algorithme peut s’aider des pratiques d’écoute des utilisateurs. Selon l’heure ou l’endroit auxquels un auditeur écoute sa musique, les recommandations seront différentes. Le matin, à la salle de sport, en soirée, tard dans la nuit, selon la météo…etc., l’utilisateur n’aura pas les mêmes suggestions. Dans ce cas, l’algorithme se base également sur les habitudes d’écoute de l’utilisateur en question, et celle des autres.

Enfin, et là est le progrès technologique inhérent à la montée en puissance de ces algorithmes, d’autres critères, moins évidents car tout sauf numériques, peuvent être pris en compte par ces systèmes. Les timbres des voix, les fréquences, les rythmes des chansons qui peuvent faire l’objet d’une catégorisation. Et cela peut totalement dépasser les styles de musiques ! L’algorithme peut repérer que les chansons les plus écoutées par notre utilisateur ne répondent pas du tout d’un goût pour la folk rock anglo-saxonne, mais seulement pour le timbre de voix de Cat Stevens, qui se retrouve dans d’autres genres musicaux. Il va donc lui suggérer d’autres artistes s’en rapprochant, outre la question du style.

L’ensemble de ces données (dont la liste est exponentielle) sont analysées et cumulées selon un calcul précis, différent pour chacun des logiciels.

Des formules mathématiques et des hommes

La question qui semble essentielle, alors que l’intelligence artificielle est arrivée à ce stade d’analyse des pratiques d’écoute, est celle de l’exactitude de ces algorithmes. Malgré l’addition permanente de critères aux calculs, subsiste une certaine part de hasard dans les comportements humains. Ainsi, la fiabilité des données comportementales, même établies selon des profils, n’est pas totalement certaine.

Au delà des imprécisions, certaines voix s’élèvent contre le processus “déshumanisant, sans âme” de sélection qui crée des playlists : à essayer de prédire le comportement humain à tout prix, l’algorithme l’enfermerait dans des schémas d’écoute auquel il ne correspond pas. Ce fan de Cat Stevens pourrait se réveiller un matin avec une furieuse envie d’écouter Katy Perry, sans que cela ait pu être prévu par qui que ce soit.

Il est nécessaire cependant de préciser que les algorithmes ne sont ni plus ni moins que des formules. Ils ne sont pas à blâmer en tant que tels, et se doivent d’être un minimum pertinents (au risque de courir à leur perte dans le cas contraire). À cela s’ajoute le fait qu’ils n’ont pas vraiment fait disparaître les playlists de spécialistes, mais seulement évoluer leur métier. Ainsi, l’algorithme de Spotify développé par The Echo Nest, est géré par des programmateurs musicaux, qui ont pu étendre leurs services à l’aide des algorithmes. L’algorithme est pour eux un outil de travail, qu’ils développent avec des chercheurs.

Pour ce qui est des nostalgiques du rapport à l’humain, rien de mieux que de retourner chez votre disquaire, qui sera ravi de vous conseiller de vive voix. Les algorithmes, eux, resteront quoiqu’il advienne des suites logiques froides et sans cœur, même avec les meilleures trouvailles en marketing !

Un manque de diversité ?

Toutefois, les reproches faits à ces systèmes de recommandations concernent aussi la peur de l’enfermement, musicalement parlant. Les algorithmes ne sont pas capables de prévoir nos instincts et nos désirs irrationnels en terme de musique, certes. Mais ils ne peuvent pas non plus garantir l’absolue diversité dans les propositions. De fait, le risque est de restreindre l’auditeur à un carcan prédéfini de musiques : les chansons qui marchent le mieux ou qui sont agréables à l’écoute dans les premières dizaines de secondes (comme à la radio), ou celles qui correspondent le plus au style de musique attribué ou au profil établi…

Quoi qu’il en soit, c’est négatif. Et si ça l’est pour l’utilisateur, ça l’est aussi pour les plateformes. Ainsi, elles essaient tout de même de lutter contre ces carcans, dans un but purement commercial : celui de conserver ses abonnés. Mais cela fait ressortir une idée principale : l’algorithme n’est pas conscient ; il ne se rend pas compte des artistes qu’il met en avant, ou au contraire qu’il relègue au rang d’inconnus. Et c’est sa force comme sa faiblesse : ainsi aucun artiste ne sera favorisé par choix ou par réseaux. D’un autre côté, les barons du monde de la musique pourrait payer pour faire en sorte que leurs artistes pèsent plus dans la balance.

La conséquence, à terme, serait de nuire à l’originalité des profils d’utilisateurs mais aussi d’artistes, créant une homogénéité ennuyeuse au niveau de la production musicale même. La musique « de niche » et les styles musicaux marginaux risquent de ne pas trouver leur place dans ces systèmes. Cela dit, tout dépend de qui les gère et selon quelle éthique.

Deux contre exemples sont intéressant à ce propos. Le premier est Forgoty, un logiciel permettant de mettre en lumière les titres qui n’ont jamais ou presque jamais été joué par un utilisateur. L’autre est l’outil Premier de Spotify, qui félicite les « précurseurs », à savoir les 10% qui ont écouté un artiste avant qu’il ne devienne connu (encourageant donc la découverte hors cadre).

Faire confiance à la machine

Les critiques dont sont sujets les algorithmes répondent peut être à un certain désir de liberté : chacun a envie de croire qu’il est libre de développer ses propres goûts, tout particulièrement en matière culturelle, et qu’il n’est pas entièrement déterminé par des circonstances extérieures. Il y a évidemment un certain charme à être tout autre chose qu’une compilation de facteurs essentialisables. Ainsi les préférences musicales tendent à se laisser bercer par une part de hasard et peut être d’inné. Et au delà du charme du hasard, les réactions humaines ne répondent pas absolument à des lois intangibles, et sont soumise à la contingence.

Mais plus que la liberté, c’est aussi dans le rapport de l’humain à l’intelligence artificielle que se fonde la réticence. Le chercheur Vyacheslav Polonski écrit dans un article intitulé Humans don’t trust AI predictions – here’s how to fix it que « beaucoup d’experts croient que notre société future se construira sur une collaboration homme-machine efficace. Mais le manque de confiance reste le facteur le plus important qui empêche cela de se produire. La confiance humaine est souvent basée sur notre compréhension de la façon dont les autres pensent et sur notre expérience de leur fiabilité. Cela aide à créer un sentiment psychologique de sécurité. L’IA, par contre, est encore relativement nouvelle et peu familière à la plupart des gens. »

Deux points sont peut être essentiels à retenir : les algorithmes de recommandation musicale fonctionnent bien s’ils reposent sur une collaboration humain-machine, et si les utilisateurs ont confiance en eux. Une des solutions évoquée est celle de la transparence totale des systèmes, et une potentielle mainmise sur ceux-ci de la part des utilisateurs, qui pourraient adapter les calculs en fonction de leurs préférences, et donner plus ou moins de poids à tel ou tel critère. La ministre de la Culture Françoise Nyssen a à ce propos signé le 16 mars 2018 un Déclaration commune sur la diversité culturelle dans le numérique avec la ministre du patrimoine canadien visant à entre autres « promouvoir la transparence dans la mise en œuvre des traitements algorithmiques ».

Pas encore de commentaires

Les commentaires sont fermés

Demain commence aujourd’hui.
Depuis 2011, Maze rassemble les jeunesses, en parle, et les fait parler. Média gratuit en ligne.