codebuddy.tech

building in public from Vancouver

Construction de mon pipeline de contenu IA : Du bafouillage à la publication en 12 langues

J'ai terminé ce pipeline la nuit dernière, et j'en suis sincèrement fier. Trois modèles d'IA, un bot Telegram, une reconnaissance vocale locale et une couche de traduction – tout cela pour transformer un monologue téléphonique tremblant de 10 minutes en un article de blog soigné publié en 12 langues. La plupart des gens qualifieraient cela de sur-ingénierie. Moi, j'appelle cela la seule façon de me forcer à publier régulièrement.

Le problème : Je ne suis pas encore une personnalité YouTube

Mon cerveau ne réagit pas rapidement devant une caméra. Je ne fais pas partie de ces personnes qui peuvent improviser naturellement devant un public. Alors, à la place, je me filme en train de parler lentement pendant environ 10 minutes sur mon téléphone – en divaguant, en hésitant, en pensant à voix haute. Ce n'est pas joli. Mais c'est authentique, et c'est ce qui compte.

C'est dans cette matière brute que réside la véritable pensée. Les premières idées non scriptées et non polies contiennent souvent les réflexions les plus honnêtes. Le problème, c'est que personne ne veut lire la transcription de quelqu'un qui pense à voix haute. J'ai donc construit un système qui conserve l'authenticité et supprime le désordre.

Le pipeline : Ce qui se passe réellement

J'ai écrit un script Python qui extrait l'audio de ma vidéo téléphonique en fichier M4A. Celui-ci est téléchargé vers un bot Telegram que j'ai construit et hébergé sur mon VPS. Telegram est devenu mon hub d'automatisation – il reçoit le fichier, le télécharge et le traite via Whisper, le modèle de reconnaissance vocale open source d'OpenAI, qui tourne en local. Il en sort une transcription brute.

Cette transcription est injectée dans un pipeline IA en quatre étapes, chacune étant validée par mon approbation via Telegram :

Étape 1—Claude rédige. La transcription brute arrive d'abord chez Claude. La consigne demande d'écrire un article de blog captivant dans ma voix – décontracté, honnête, techniquement solide. Il ajoute de la structure et du flux, et en extrait les idées clés. Je reçois un lien d'aperçu et deux boutons : Approuver ou Modifier.

Étape 2—DeepSeek conteste. Si j'approuve, DeepSeek reçoit le brouillon de Claude et le décortique. La consigne demande de vérifier les faits, d'ajouter de la profondeur technique et une perspective analytique légèrement provocante – tout en gardant l'histoire personnelle. DeepSeek est étonnamment bon pour cela. Il conteste là où Claude était trop conciliant.

Étape 3—Claude synthétise. Claude reçoit les deux brouillons et les fusionne. La voix personnelle de la version de Claude, la profondeur technique de la version de DeepSeek. C'est l'article final. Un dernier point de validation avant la publication.

Publication—DeepSeek traduit. Quand j'appuie sur publier, DeepSeek traduit le HTML final en 12 langues, en préservant toute la mise en forme. Chaque traduction obtient sa propre page sur le blog avec un sélecteur de langue, un pied de page d'abonnés et des liens d'affiliation intégrés.

Pourquoi trois modèles au lieu d'un

Parce que chaque modèle a un mode de défaillance différent. Claude écrit magnifiquement mais peut être trop conciliant – il va polir votre mauvaise idée jusqu'à ce qu'elle paraisse convaincante. DeepSeek est plus analytique et remet en question les hypothèses, mais peut perdre la voix personnelle. Les utiliser en séquence crée un système de contrôles et d'équilibres.

La vraie magie opère à l'étape 3, où Claude synthétise les deux perspectives. C'est comme avoir un bon éditeur qui sait quand garder la personnalité et quand ajouter la rigueur.

Ce qui en ressort

Une session de divagation de 10 minutes devient un article de 900 mots qui donne l'impression d'y avoir passé des heures. Plus important encore, ça ressemble à moi – pas à un article de blog IA générique – parce que le matériau source est véritablement ma pensée non filtrée et que les consignes sont calibrées pour préserver cette voix.

Le déploiement en 12 langues signifie que chaque article atteint des publics que je n'aurais jamais touchés en écrivant uniquement en anglais, sans effort supplémentaire de ma part.

Le véritable objectif

Ce système optimise la bonne chose – il supprime toute friction de la partie qui compte vraiment, à savoir la réflexion. Quand je sais que le pipeline gère tout en aval, j'arrête de me soucier de la façon dont je sonne et je pense simplement à voix haute. C'est tout l'intérêt.

Get new posts

Subscribe in your language

New posts delivered to your inbox. Unsubscribe anytime.

Receive in: