L’IA al servizio del broadcast: una selezione di soluzioni pratiche

(20 maggio 2024)   L’intelligenza artificiale sta rapidamente trasformando il mondo del broadcasting radiofonico e televisivo, ad ogni livello, offrendo nuove possibilità per la creazione, la distribuzione e la fruizione dei contenuti.

In questa sede presentiamo una rassegna di siti e soluzioni che sfruttano l’IA per migliorare l’efficienza nelle attività di produzione e gestione del lavoro, sotto differenti aspetti.

Dall’automazione dei compiti ripetitivi alla personalizzazione dei contenuti, l’IA offre un’ampia gamma di vantaggi per le emittenti radiofoniche e televisive.

In particolare, l’IA può essere utilizzata per migliorare la qualità dei contenuti, ottimizzando l’audio e il video e generando contenuti personalizzati, quali contributi audiovisivi o spot; rende, inoltre, possibile l’automazione di compiti ripetitivi, quali la creazione di palinsesti, la gestione dei diritti o la distribuzione dei contenuti.

Permette, altresì, di personalizzare l’esperienza di ascolto e visione: l’IA può anche essere utilizzata per consigliare agli utenti i contenuti che potrebbero interessarli maggiormente, in base alle loro preferenze, determinate in base alla loro cronologia di fruizione.

Responsabilità e cautela

L’intelligenza artificiale sta aprendo nuove frontiere per la creatività e l’innovazione, ma è importante che questa evoluzione avvenga nel rispetto del diritto d’autore e di ogni diritto connesso all’utilizzo dei contenuti tutelati.

Quindi ricordiamo che l’utilizzo di strumenti basati sull’IA non assolve dall’uso improprio o non autorizzato dei contenuti e la massima attenzione va posta nell’uso pubblico di quanto prodotto.

Ecco perché, in premessa, ci raccomandiamo, prima di iniziare ad utilizzare tali strumenti, del fatto che ciascuno sia consapevole e aggiornato in merito alle normative da rispettare, alla regolamentazione europea sull’IA, alle norme di tutela del diritto d’autore e dei diritti connessi.

L’uso di queste opportunità informatiche richiede anche un approccio etico, al fine di non generare e diffondere fake news o contenuti lesivi di terze parti; peraltro va anche detto che l’IA può essere utilizzata per identificare materiale protetto da copyright o generato in modo artificiale.

Interessanti ed utili

Iniziamo dunque con questa rassegna di strumenti informatici, così da passare da una discussione teorica sul tema ad una serie di opportunità pratiche, segnalando soluzioni già disponibili e utili ai fini della realizzazione e della gestione dei programmi. Alcune di queste segnalazioni potrebbero rivestire un interesse prevalentemente “accademico”, ma la maggior parte può essere direttamente ed immediatamente impiegata nella quotidianità lavorativa.

Sottolineiamo anche che questa selezione è frutto di una ricerca di mercato, ma non ha certo la pretesa di rappresentare tutte le opzioni disponibili, né presuppone che le soluzioni presentate siano migliori di altre analoghe, pure disponibili e che potrebbero essere presentate in future occasioni.

RASSEGNA DI SOLUZIONI AI PER IL BROADCAST

Adobe podcast

Adobe podcast è una piattaforma di editing audio basata su intelligenza artificiale che permette di creare contributi vocali di alta qualità con un’interfaccia intuitiva e strumenti avanzati.

Consente di realizzare registrazioni audio sia con un singolo conduttore, sia con ospiti da remoto, controllando il microfono e l’audio in tempo reale, per assicurare una registrazione ottimale. Rimuove l’eventuale rumore di fondo, elimina errori e imperfezioni, e regola il volume e l’intonazione grazie all’IA.

Permette anche di aggiungere musica di sottofondo, effetti sonori e usa l’intelligenza artificiale per migliorare la qualità della voce del conduttore con la funzione “Enhance Speech”.

Rimuove automaticamente le pause, elimina gli “ehm” e le parole cosiddette “di riempimento”, gli intercalare. La versione base di Adobe Podcast è completamente gratuita, è intuitiva e facile da usare, anche per chi non ha particolare esperienza di editing audio.

Sito web: https://podcast.adobe.com/

AMA – A Millions Ads

Questo software rende possibile produrre e programmare centinaia di versioni diverse dello stesso spot (pubblicità dinamica), sulle piattaforme online, adattandolo in base al singolo ascoltatore.

Per ogni contatto analizza la cronologia degli acquisti, le preferenze musicali, la posizione geografica, il dispositivo di ascolto utilizzato; a quel punto AMA trasforma tali dati in parametri che determinano ogni aspetto dell’annuncio: dallo stile, genere e tono della voce narrante, alla scelta della musica e degli effetti sonori.

Questo livello granulare di personalizzazione fa risultare l’annuncio “fatto apposta” per ciascun ascoltatore. Per lo stesso spot potrebbero generarsi migliaia di possibili versioni creative.

Sito web: https://www.amillionads.com/

AudioStack

AudioStack è una piattaforma di intelligenza artificiale capace di creare, personalizzare e distribuire audio di alta qualità; è in grado di generare audio da testo, utilizzando una vasta gamma di voci sintetiche realistiche, in oltre 60 lingue.

Permette di modificare l’audio aggiungendo effetti sonori, musica di sottofondo e regolazioni di pitch e intonazione per perfezionare il risultato. Crea anche flussi di lavoro automatizzati per generare e modificare l’audio in base a dati e input dinamici, ma può occuparsi anche della distribuzione, integrando l’audio generato in siti web, app e altri canali di distribuzione.

Demo video a questo link: https://www.youtube.com/@AudioStack/featured

Sito web: https://audiostack.ai/

Auphonic

Auphonic è una piattaforma per la produzione di programmi parlati di alta qualità; è come se si disponesse di un assistente personale che si occupa di tutto il lavoro tecnico della produzione.

Si registra da soli o con ospiti in remoto, direttamente su Auphonic, gestendo i livelli audio e monitorando la qualità audio in tempo reale. In un secondo momento, il sistema è in grado di eliminare i rumori di fondo e le imperfezioni con un solo clic, oltre che di regolare volume, intonazione e velocità di riproduzione.

Consente di aggiungere musica, effetti sonori, transizioni e di trascrivere automaticamente l’audio. La soluzione è disponibile con piani gratuiti e a pagamento.

Dimostrazione video: https://www.youtube.com/watch?v=HV6NiCtGUAQ

Sito web: https://auphonic.com/

ChatGPT

ChatGPT può essere un utile strumento per una stazione radiofonica o televisiva in diversi modi. ChatGPT può generare tracce di lavoro su temi specifici per programmi, definire argomenti di discussione, domande per gli ospiti, e persino intere bozze di script per programmi radiofonici o televisivi.

Può aiutare nella scrittura di articoli per il sito web della stazione, la creazione di post sui social media, la redazione di newsletter o e-mail promozionali.

ChatGPT può essere usato anche nella creazione di annunci pubblicitari o sponsorizzazioni, aiutando a scrivere i testi.

Sito web: https://chat.openai.com/

CleanFeed

CleanFeed è un’applicazione basata su web e progettata per semplificare la registrazione e la trasmissione di audio in alta qualità attraverso Internet. È particolarmente popolare tra i professionisti dell’audio, inclusi giornalisti radiofonici e registi di produzioni audiovisive.

In buona sostanza, permette di connettersi e registrare dal vivo, con chiunque nel mondo. Cleanfeed ha anche vinto un Primetime Emmy Award.

La versione gratuita non è soggetta ad alcun limite di tempo per le sessioni o per la durata della registrazione, include l’uso commerciale, ma offre le sole funzionalità di base. La versione premium è disponibile da soli 22 dollari al mese.

Sito web: https://cleanfeed.net/

Descript

Descript è un nuovo tipo di editor video che rende facile la gestione e manipolazione dell’audiovisivo al pari di quella di un documento di testo.

Le funzionalità basate sull’intelligenza artificiale di Descript e l’interfaccia intuitiva rendono possibile con semplicità la creazione di contenuti video per broadcaster, così come l’alimentare canali YouTube o TikTok, o la realizzazione di podcast o rubriche.

Descript può trascrivere un video per poi consentire di modificarlo come si farebbe con un documento testuale; è in grado di creare un clone vocale ultra realistico e di generare sintesi vocali in pochi secondi; rimuove il rumore di fondo e migliora immediatamente l’audio con la funzione Studio Sound; grazie all’effetto green screen, rimuove lo sfondo del video e posiziona il soggetto ovunque, con un semplice clic.

Sito web: https://www.descript.com/

Dexa

Dexa è una piattaforma che utilizza l’intelligenza artificiale per realizzare rubriche sonore e podcast. In pratica, funziona come un motore di ricerca specializzato per i podcast, utilizzando degli assistenti virtuali basati sull’intelligenza artificiale per fornire risposte personalizzate tratte dagli episodi dei podcast disponibili online.

Dexa consente di cercare argomenti specifici menzionati in vari podcast, filtrando per parole chiave, argomenti o ospiti. È inoltre in grado di suddividere gli episodi dei podcast in capitoli più piccoli e più facilmente fruibili.

Utile per chi volesse attingere ai contenuti podcast per poi riprendere determinati argomenti, temi o dichiarazioni.

Dimostrazione video: https://www.youtube.com/watch?v=CDXg_2t10MQ

Sito web: https://dexa.ai/

ElevenLabs

ElevenLabs è probabilmente la soluzione più utilizzata per la clonazione vocale, la sintesi vocale e le voci sintetiche, in grado di generare un discorso realistico in una trentina di lingue diverse.

Le 120 voci disponibili sono prodotte da una potente tecnologia di sintesi vocale (TTS) che combina un’intelligenza artificiale avanzata capace di una resa emotiva delle voci che tiene conto del significato del testo e della punteggiatura utilizzata.

Permette di generare un parlato molto realistico per i video o per contributi sonori, praticamente indistinguibili dal linguaggio umano. Si possono regolare facilmente gli output vocali tramite un’interfaccia molto intuitiva e si può scegliere una miscela sonora che può prediligere la chiarezza vocale e la stabilità, oppure amplificare gli stili vocali, per una resa più animata e teatrale.

Dimostrazione in inglese a questo link:
https://www.youtube.com/watch?v=03I3DPHWPQA

Sito web: https://elevenlabs.io/

Free Podcast Transcription

Free Podcast Transcription è una soluzione online, gratuita, per trascrivere qualsiasi file audio vocale (non solo un podcast). Funziona online, ma promette di garantire il massimo livello di privacy e di sicurezza.

Certamente performante in inglese, funziona abbastanza bene anche in italiano, seppure la trascrizione necessiti inevitabilmente di una successiva revisione manuale.

Sito web: https://freepodcasttranscription.com/

Futuri Audio Ai

Futuri Audio Ai è una piattaforma di produzione di contenuti basata sull’intelligenza artificiale che è in grado di generare rubriche, voci di conduttori radiofonici virtuali, podcast e ogni altro contenuto sonoro caratterizzante un’emittente radiofonica.

A titolo esemplificativo, Futuri aveva prodotto e trasmesso online per un lungo periodo RadioGPT (ora il canale non risulta essere più disponibile).

Oltre alla produzione sonora, l’azienda propone soluzioni per effettuare ricerche commerciali, al fine di ottimizzare l’azione di vendita, anche generando presentazioni coinvolgenti basate sui dati d’ascolto, e di produrre spot pubblicitari di particolare efficacia sonora.

Video del lancio di RadioGPT: https://vimeo.com/801620131

Sito web: https://futurimedia.com/

Gemini

Gemini è il modello di intelligenza artificiale di Google, originariamente chiamato Bard, al pari di ChatGPT può essere utilizzato in una stazione radiotelevisiva in diversi modi per migliorare l’efficienza e la creatività.

Per esempio, per la creazione di contenuti, può occuparsi della generazione di testi per spot pubblicitari, trailer e promo. Oppure può suggerire playlist musicali, dato un tema, un argomento o un genere.

Sito web: https://gemini.google.com/app

HeyGen

HeyGen è una soluzione che consente la creazione di avatar dinamici e di voci sintetiche da integrare in un video, il tutto originalmente generato dall’intelligenza artificiale.

Per prendere dimestichezza con la piattaforma è disponibile un piano gratuito che pure offre una postazione di lavoro, oltre 60 avatar di base e oltre 300 voci tra le quali scegliere.

Inoltre il servizio offre la clonazione di voci; è sufficiente fornire un video di buona qualità, della durata di almeno due minuti, con lo speaker che si intende clonare e il sistema ne permetterà la rispoduzione.

Link agli avatar disponibili: https://www.heygen.com/avatars

Sito web: https://www.heygen.com/

Kapwing

Piattaforma per la creazione rapida, l’editing e la sottotitolazione di contenuti video. Kapwing semplifica il processo di creazione video e lo concentra in un’unica base di contenuti, automatizzando le attività di routine con strumenti e modelli di intelligenza artificiale.

Nella versione gratuita l’export è filigranato con il logo dell’azienda, si possono esportare video a 720p lunghi fino a 4 minuti, utilizzare il sottotitolatore automatico per 10 minuti al mese e generare fino a 8 minuti di sintesi vocale al mese.

Un salto notevole di qualità e quantità di produzione, oltre a video senza marker, è possibile a partire da soli 16 dollari al mese.

Sito web: https://www.kapwing.com/

Lalal.ai

Lalal.ai permette di estrarre voce, accompagnamento e vari strumenti in tracce separate, da qualsiasi audio e video. In pratica è un servizio di nuova generazione per la rimozione vocale e la separazione delle sorgenti musicali tramite un processo di estrazione veloce, facile e preciso.

Si possono rimuovere le sole tracce vocali o quelle strumentali, di batteria, basso, pianoforte, chitarra elettrica, chitarra acustica e sintetizzatore, senza perdita di qualità.

Il piano individuale è da 18 dollari per 90 minuti complessivi di audio da trattare, in file da massimo 2 GB ciascuno.

Il piano aziendale da 50 dollari offre 750 minuti di audio da trattare, sempre caricando singoli file da massimo 2 GB.

Sito web: https://www.lalal.ai/

Opus Clip

Opus Clip è uno strumento di videoclipping che consente, partendo da un video lungo, di ricavarne sino a 10 clip brevi. Lo fa molto più velocemente di come potrebbe farlo un editor umano, manualmente.

Lo strumento è stato sviluppato ed è offerto da OpenAI e supporta i collegamenti video da Youtube, Vimeo, Facebook, LinkedIn, X, StreamYard e da altre piattaforme; inoltre supporta video in inglese, tedesco, spagnolo, francese, portoghese e in un’altra quindicina di lingue, tra le quali l’italiano, se pure ancora in versione Beta.

Sito web: https://www.opus.pro/

Podcastle

Podcastle è un software nato per favorire la creazione di podcast, ma che può essere utilizzato anche per creare contenuti audio destinati a diventare voicetrack radiofonici.

Il software è intuitivo ed è basato sull’intelligenza artificiale per creare, modificare e distribuire i file.

Sito web: https://podcastle.ai/

Radio.cloud

Radio.cloud si propone quale piattaforma online per una completa automazione radiofonica non in studio, ma sul cloud, il che rappresenta un’opportunità in merito agli aspetti di disaster recovery e upgrade.

Dal punto di vista produttivo, permette di costruire tracce vocali con diversi elementi (intro e outro, notizie, meteo, sport, ID della stazione, interventi promozionali) partendo da un semplice script modificabile.

Si possono produrre tali interventi in tempo reale, oppure si possono prepararne svariati e programmarli nella playlist. L’IA migliora l’efficienza, per esempio preoccupandosi di riempire in autonomia le fasce orarie che non hanno programmazione definita, con scelte musicali e inserimenti comunque coerenti con la programmazione ‘pensata’.

Anche gli interventi umani possono essere registrati e caricati con facilità, poi il sistema permette di perfezionarli, regolando il guadagno e il livello del volume con pochi clic. Sul sito si trovano tutte le funzionalità offerte, che possono essere testate liberamente.

Sito web: https://www.radio.cloud/

RadioAdMaker

RadioAdMaker è una soluzione ‘made in Germany’ che promette di realizzare uno spot radiofonico in soli 3 minuti, on line.

Tutto quello che si deve fare è fornire al sistema uno schematico elenco per punti in cui inserire le caratteristiche del prodotto o del servizio che si vuole pubblicizzare, oltre alle informazioni pratiche di riferimento.

A quel punto l’intelligenza artificiale genera in modo completamente automatico un testo originale, che viene poi sonorizzato dall’IA vocale con tanto di musica in sottofondo. Il risultato è disponibile subito.

Sito web: https://radioadmaker.de/

SquadCast

SquadCast è una soluzione associata al già citato Descript, che permette di creare contenuti audio e video di alta qualità, con un software integrato nel browser, per registrazioni premium che vengono anche salvate automaticamente con l’archiviazione nel cloud.

Consente di registrare interviste audio o video a distanza, così come di realizzare dei voice over.

Sito web: https://squadcast.fm/

Suno.ai

Suno.ai rende possibile a chiunque realizzare produzioni musicali, strumentali o cantate, di ottima qualità. Non necessita di alcuno strumento esterno.

La soluzione è stata sviluppata da un team che ha sede negli Stati Uniti, a Cambridge, in Massachusetts, composto da musicisti che sono anche esperti di intelligenza artificiale. Provengono da aziende tecnologiche quali Meta, TikTok e Kensho, dove il team ha lavorato insieme prima di avviare Suno.

Basta cliccare sul tasto “Crea una canzone” e ci si ritrova nella piattaforma vera e propria. Ci sono moltissimi esempi di produzioni originali, poi dal tasto “create” si passa alla produzione vera e propria.

Se non serve un brano strumentale, si crea il testo da cantare, si sceglie il genere musicale e con un semplice clic, dopo un paio di minuti, il sistema propone una coppia di brani, tra i quali scegliere e che sono poi perfezionabili.

Sito web: https://app.suno.ai/

VerificAudio

VerificAudio è lo strumento di intelligenza artificiale sviluppato dal gruppo editoriale spagnolo Prisa Media per combattere la disinformazione audio, una minaccia crescente.

VerificAudio combina tecniche di verifica e modelli di intelligenza artificiale avanzati per rilevare e analizzare l’affidabilità dei file sonori con contenuti informativi. Per il momento l’uso dello strumento non è pubblico, ma attraverso il sito è possibile sottoporre file audio sospetti per un’analisi. Il modello potrebbe essere ripreso da altre realtà editoriali indipendenti.

Sito web: https://verificaudio.ai/

Wavacity

Quello che troverete a questo indirizzo web è un vero e proprio editor audio online gratuito. Di fatto, è un clone del noto Audacity, solo che non richiede l’installazione di alcun file o app sul proprio computer, ma è comodamente utilizzabile direttamente attraverso il proprio browser Internet.

È un software open source gratuito, rilasciato sotto licenza GNU GPL v2 . Off-topic rispetto al tema stringente dell’AI, è comunque un tool degno di segnalazione in questo contesto, per la sua praticità ed efficienza.

Sito web: https://wavacity.com/

Whisper

Whisper è un sistema di riconoscimento vocale automatico (ASR) in fase di sviluppo, basato su una rete neurale addestrata, ad ora, con quasi settecentomila ore di file audio controllati, multilingue e multitasking, raccolti dal web.

L’uso di un set di dati così ampio e diversificato porta a una migliore robustezza degli accenti, della gestione del rumore di fondo e anche del linguaggio tecnico. Inoltre, consente la trascrizione in più lingue, nonché la traduzione da tali lingue all’inglese.

Sviluppato da OpenAI di ChatGPT, sta lavorando a modelli open source che fungano da base per la creazione di applicazioni utili e per ulteriori ricerche sull’elaborazione vocale più efficace.

Sito web: https://openai.com/research/whisper    (AR)

 

Vedi anche:

NAB Show 2024: dal dire al fare, con l’IA

Adobe GenAI per creare audio personalizzato

AI Week 2024: scenario globale, implicazioni specifiche, anche per l’audiovisivo

Radiodays Europe 2024: l’AI al centro del dibattito

Rivoluzione Sora da OpenAI

Artificial Intelligence Act in UE e deregulation USA: scenario complessivo e implicazioni per i broadcaster.

Spot Tv generati dall’AI: opportunità interessante, ma da gestire

ChatGPT come ‘fonte’ giornalistica? Meglio andarci cauti.

L’AI negli studi televisivi alleata preziosa