Codeorgan Interprète la Musique de Fond du Web
Au détour d’un lien dans mon flux rss je suis tombé sur Codeorgan (via synthgear) qui, comme son nom l’indique presque, transforme n’importe quelle page web en musique!! L’application se base sur le nombre et la fréquence de caractères dans la balise < body > d’une page HTML pour déterminer la tonalité du morceau, les instruments et les pattern rythmiques à appliquer.
Tu t’en doutes bien, j’ai pris la peine de passer la page d’acceuil du blog, et voilà Muzicosphère en musique interprétée par Codeorgan. Pas mal non? Vu comme ça c’est inutile à souhait mais j’aimerai quand même un peu plus comprendre l’algorithme derrière tout ça. Les étapes de base de l’algorithme:
- Scan du contenu de la page web.
- Filtrage des caractères: seuls les lettres A à G, qui correspondent à des notes de musique, sont gardées.
- Analyse du nombre de caractères: si le nombre est pair la musique est interprétée suivant une pentatonique majeure, si le nombre est impair alors c’est une pentatonique mineure.
- Choix du synthétiseur à partir du nombre total de caractères
- La boucle de batterie est choisie en fonction du ratio entre le nombre total de caractères et le nombre de caractères correspondant à une note de musique.
J’aime bien ce genre de petites expérimentations, même si l’algorithme m’échappe un peu (et je me demande même s’il fait ce qu’il prétend faire), parce que cela peut rejoindre tout ce qui se fait en matière d’analyse de tonalité d’un contenu textuel. Evidemment pour arriver à cela, il faut que le texte analysé soit subdivisé en mots et non en caractères et que le filtrage soit suffisamment élaboré.
Bref un vrai remue-méninge à l’image de ce qui existe déjà comme projets dans le domaine du sentiment analysis et de text mining (un secteur qui a le vent en poupe pour cause de web 2.0), et sincérement si on devait arriver à voir ce genre d’analyse se développer, je préfèrerai largement entendre les résultats en musique, plutôt qu’un simple score du type positif/négatif.
M’enfin là c’est de la pure spéculation, surtout lorsqu’on commence à prendre en compte le fait que le language est tellement flexible qu’il est de toute façon difficile de déterminer le sentiment général d’un texte de façon automatisé. Du moins à ce jour…






