Costruire la mia pipeline di contenuti AI: Dal parlare a vanvera alla pubblicazione in 12 lingue
Ho completato questa pipeline ieri sera, e ne sono sinceramente orgoglioso. Tre modelli AI, un bot Telegram, riconoscimento vocale locale e un layer di traduzione – tutto per trasformare un traballante monologo di 10 minuti dal telefono in un articolo di blog rifinito pubblicato in 12 lingue. Molti lo definirebbero troppo complesso. Io lo chiamo l'unico modo per riuscire a pubblicare con costanza.
Il problema: non sono ancora una personalità di YouTube
Il mio cervello non lavora velocemente davanti alla telecamera. Non sono uno di quelli che riescono a improvvisare naturalmente per un pubblico. Così, invece, filmo me stesso mentre parlo lentamente per circa 10 minuti con il telefono – divago, mi fermo, penso ad alta voce. Non è bello da vedere. Ma è autentico, e questa è la parte che conta.
La crudezza è dove vive il pensiero vero. I primi pensieri non scritti e non rifiniti spesso contengono le intuizioni più oneste. Il problema è che nessuno vuole leggere la trascrizione di qualcuno che pensa ad alta voce. Quindi ho costruito un sistema che mantiene l'autenticità e rimuove il disordine.
La pipeline: cosa succede realmente
Ho scritto uno script Python che estrae l'audio dal video del mio telefono come file M4A. Questo viene caricato su un bot Telegram che ho costruito e che ospito sul mio VPS. Telegram è diventato il mio hub di automazione – riceve il file, lo scarica e lo passa attraverso Whisper, il modello open-source di riconoscimento vocale di OpenAI, eseguito localmente. Ne esce una trascrizione grezza.
Quella trascrizione entra in una pipeline AI a quattro fasi, ciascuna fase controllata dalla mia approvazione su Telegram:
Fase 1—Claude redige. La trascrizione grezza arriva per prima a Claude. Il prompt chiede di scrivere un articolo di blog coinvolgente con la mia voce – informale, onesto, tecnicamente fondato. Aggiunge struttura e flusso, estraendo le idee chiave. Ricevo un link di anteprima e due pulsanti: Approva o Modifica.
Fase 2—DeepSeek contesta. Se approvo, DeepSeek riceve la bozza di Claude e la analizza. Il prompt chiede fact-checking, maggiore profondità tecnica e una prospettiva analitica leggermente contraria – mantenendo però la storia personale. DeepSeek è sorprendentemente bravo in questo. Ribatte dove Claude è stato troppo accomodante.
Fase 3—Claude sintetizza. Claude riceve entrambe le bozze e le fonde. Voce personale dalla versione di Claude, profondità tecnica dalla versione di DeepSeek. Questo è il post finale. Un altro passaggio di approvazione prima che qualcosa vada online.
Pubblicazione—DeepSeek traduce. Quando clicco su pubblica, DeepSeek traduce l'HTML finale in 12 lingue, preservando tutta la formattazione. Ogni traduzione ottiene una propria pagina sul blog con un selettore di lingua, un footer per gli iscritti e link di affiliazione integrati.
Perché tre modelli invece di uno
Perché ogni modello ha una diversa modalità di errore. Claude scrive magnificamente ma può essere troppo accomodante – luciderà la tua brutta idea fino a farla sembrare convincente. DeepSeek è più analitico e mette in discussione le ipotesi, ma può perdere la voce personale. Usarli in sequenza crea un sistema di controlli e contrappesi.
La vera magia avviene nella Fase 3, dove Claude sintetizza entrambe le prospettive. È come avere un buon editore che sa quando mantenere la personalità e quando aggiungere il rigore.
Ciò che esce
Una sessione di 10 minuti di vaneggiamento si trasforma in un post di 900 parole che sembra scritto in ore. Ancora più importante, suona come me – non come un generico post AI – perché il materiale di partenza è genuinamente il mio pensiero non filtrato e i prompt sono calibrati per preservare quella voce.
La distribuzione in 12 lingue significa che ogni post raggiunge pubblico che non raggiungerei mai scrivendo solo in inglese, con zero sforzo extra da parte mia.
Il vero punto
Questo sistema ottimizza per la cosa giusta – rimuove ogni attrito dalla parte che conta davvero, cioè il pensiero. Quando so che la pipeline gestisce tutto a valle, smetto di preoccuparmi di come suono e mi limito a pensare ad alta voce. Questo è tutto il punto.
Get new posts
Subscribe in your language
New posts delivered to your inbox. Unsubscribe anytime.
Receive in: