codebuddy.tech

building in public from Vancouver

Construyendo mi pipeline de contenido de IA: de divagar a publicar en 12 idiomas

Terminé este pipeline anoche y estoy genuinamente orgulloso de él. Tres modelos de IA, un bot de Telegram, reconocimiento de voz local y una capa de traducción, todo para convertir un monólogo vacilante de 10 minutos desde el teléfono en una publicación de blog pulida y publicada en 12 idiomas. La mayoría de la gente lo llamaría sobredimensionado. Yo lo llamo la única manera de lograr que yo mismo publique de manera consistente.

El problema: aún no soy una personalidad de YouTube

Mi cerebro no reacciona rápido frente a la cámara. No soy de esas personas que pueden improvisar naturalmente para una audiencia. Así que, en cambio, me grabo hablando lentamente durante unos 10 minutos en mi teléfono: divagando, deteniéndome, pensando en voz alta. No es bonito. Pero es auténtico, y eso es lo que importa.

La crudeza es donde habita el pensamiento real. Los primeros pensamientos sin guion ni pulir suelen contener las percepciones más honestas. El problema es que nadie quiere leer la transcripción de alguien pensando en voz alta. Así que construí un sistema que conserva la autenticidad y elimina el desorden.

El pipeline: lo que realmente sucede

Escribí un script en Python que extrae el audio de mi video del teléfono como un archivo M4A. Eso se sube a un bot de Telegram que construí y alojo en mi VPS. Telegram se ha convertido en mi centro de automatización: recibe el archivo, lo descarga y lo procesa con Whisper, el modelo de reconocimiento de voz de código abierto de OpenAI, ejecutándose localmente. Sale una transcripción en bruto.

Esa transcripción pasa por un pipeline de IA de cuatro etapas, cada una controlada por mi aprobación en Telegram:

Etapa 1—Claude redacta. La transcripción en bruto llega primero a Claude. El prompt le pide que escriba una publicación de blog atractiva en mi voz: informal, honesta, con fundamento técnico. Añade estructura y fluidez y extrae las ideas clave. Recibo un enlace de vista previa y dos botones: Aprobar o Editar.

Etapa 2—DeepSeek desafía. Si apruebo, DeepSeek recibe el borrador de Claude y lo analiza a fondo. El prompt pide verificación de datos, profundidad técnica añadida y una perspectiva analítica ligeramente contraria, manteniendo la historia personal. DeepSeek es sorprendentemente bueno en esto. Contradice donde Claude era demasiado complaciente.

Etapa 3—Claude sintetiza. Claude recibe ambos borradores y los fusiona. Voz personal de la versión de Claude, profundidad técnica de la versión de DeepSeek. Esta es la publicación final. Una compuerta de aprobación más antes de que algo se publique.

Publicar—DeepSeek traduce. Cuando presiono publicar, DeepSeek traduce el HTML final a 12 idiomas, conservando todo el formato. Cada traducción tiene su propia página en el blog con un selector de idioma, un pie de página para suscriptores y enlaces de afiliados incorporados.

Por qué tres modelos en lugar de uno

Porque cada modelo tiene un modo de fallo diferente. Claude escribe hermosamente pero puede ser demasiado complaciente: pulirá tu mala idea hasta que suene convincente. DeepSeek es más analítico y desafía suposiciones, pero puede perder la voz personal. Usarlos en secuencia crea un sistema de contrapesos.

La magia real ocurre en la Etapa 3, donde Claude sintetiza ambas perspectivas. Es como tener un buen editor que sabe cuándo mantener la personalidad y cuándo añadir el rigor.

Lo que resulta

Una sesión de divagación de 10 minutos se convierte en un artículo de 900 palabras que se lee como si hubiera pasado horas en él. Más importante aún, suena como yo, no como una publicación genérica de IA, porque el material de origen es genuinamente mi pensamiento sin filtrar y los prompts están ajustados para preservar esa voz.

El despliegue en 12 idiomas significa que cada publicación llega a audiencias que nunca alcanzaría escribiendo solo en inglés, con cero esfuerzo adicional de mi parte.

El punto real

Este sistema optimiza lo correcto: elimina toda fricción de la parte que realmente importa, que es el pensamiento. Cuando sé que el pipeline maneja todo lo que viene después, dejo de preocuparme por cómo sueno y solo pienso en voz alta. Ese es el punto.

Get new posts

Subscribe in your language

New posts delivered to your inbox. Unsubscribe anytime.

Receive in: