AMUSE: COMPORRE MUSICA CON AI MULTIMODALE

Amuse scrittura collaborativa di canzoni con intelligenza artificiale

Un assistente che trasforma input multimodali di alto livello in progressioni armoniche.

I musicisti s’ispirano spesso ad immagini, narrazioni o brani preesistenti. Mussorgsky, ad esempio, scrisse Quadri di un’esposizione prendendo spunto da una serie di dipinti, mentre l’album Biophilia di Björk nacque da riflessioni sulle relazioni tra musica, natura e tecnologia.

Gli attuali sistemi di AI che generano musica da testo producono pezzi audio completi, ma non aiutano chi procede in maniera progressiva e personalizzata. I modelli basati su elementi musicali editabili supportano meglio la composizione, ma non integrano fonti d’ispirazione multimodali, lasciando scoperto questo aspetto del processo creativo.

Gli sviluppatori di Amuse
Da sinistra: assist.prof. Chris Donahue, dottoranda Yewon Kim e prof. Sung-Ju Lee

I ricercatori Yewon Kim e Sung-Ju Lee del KAIST (Korea Advanced Institute of Science and Technology con sede a Daejeon) e Chris Donahue della Carnegie Mellon University (CMU) hanno sviluppato una tecnologia d’intelligenza artificiale simile, nella logica, a quella di un cantautore.

Uno dei principali obiettivi progettuali è stato quello di tradurre idee astratte in elementi modulari e modificabili. In tal modo, l’utente ha la garanzia di mantenere il controllo sull’elaborazione iterativa e la corrispondenza con le proprie intenzioni.

Risultati

La maggiore novità di Amuse risiede nella capacità di generare progressioni armoniche diversificate e coerenti a partire da input multimodali, anche in assenza di dati di addestramento costituiti da coppie d’input multimodali e accordi. Questo è reso possibile da un approccio in due fasi che si traducono nelle funzionalità di base del software:

Amuse funzionalità

  • Generatore di Accordi
    Un metodo suddiviso in due parti. Nella prima sono ricavati concetti musicali rilevanti (come Moonlight) dagli input multimodali dell’utente (testo, immagine o audio) tramite un LLM come GPT-4o. Poi si creano progressioni armoniche iniziali guidate da queste parole chiavi.

  • Trascrizione di Accordi
    Le keyword estratte pilotano l’ideazione delle prime sequenze che vengono poi filtrate attraverso un modello unimodale di accordi, addestrato su progressioni armoniche composte da esseri umani.

Benefici

Uno studio con 10 compositori ha evidenziato che l’uso di Amuse ha migliorato la sensazione di orientamento ed allineamento con i propri obiettivi, rispetto all’utilizzo di mezzi tradizionali, facilitando l’esplorazione di variabili modificabili.

Ai principianti, il software fornisce un punto di partenza senza la necessità di conoscenze approfondite. L’efficacia del sistema varia in base all’esperienza dell’utente e alla familiarità con gli strumenti e la teoria musicale.

Download e compatibilità

Amuse interfaccia

Il codice sorgente può essere scaricato da GitHub ed è integrato in Hookpad, un editor per la scrittura di accordi e melodie. In combinazione con Aria, un assistente di composizione musicale contestuale e unidimensionale in Hookpad, Amuse aiuta ad integrare differenti fonti d’ispirazione oltre al contesto preesistente.

 

RIPRODUZIONE RISERVATA – © 2025 SHOWTECHIES – Quando la Tecnologia è spettacolo™ –  E’ vietata la riproduzione e redistribuzione, anche parziale, dell’articolo senza autorizzazione scritta. Se desideri riprodurre i contenuti pubblicati, contattaci.

Copertina: immagine creata con AI, prompt engineering Simona Braga

Commenta per primo

Lascia un commento

L'indirizzo email non sarà pubblicato.


*