Cómo entrenamos al agente para escribir en tu tono (y por qué la mayoría falla)

La objeción que más se repite cuando una agencia GHL evalúa meter un agente en sus cuentas: "no va a sonar como mi cliente". Es una objeción legítima y la mayoría de productos que prometen "personalización en tu voz" la resuelven mal. Esto va de qué funciona realmente y qué se queda en demo.

Por qué los style guides escritos a mano fallan

El primer instinto es lógico: pides al cliente un documento que describa su tono ("conversacional, directo, sin tecnicismos, evita corporate-speak"), lo metes en el system prompt del agente, y esperas que escriba como él.

No funciona, y no funciona por una razón estructural: los adjetivos que usamos para describir tono son demasiado vagos para que un LLM los aplique consistentemente. "Conversacional" significa cosas distintas en boca de un fundador madrileño de 35 que de un coach californiano de 50. "Directo" puede ser brusco o claro. "Sin tecnicismos" puede ser plano o accesible. El agente promedia hacia un genérico de marketing — la voz por defecto que todos los modelos de lenguaje gravitan a producir cuando reciben instrucciones ambiguas.

El problema no es el modelo. Es que la entrada está mal especificada. Los style guides escritos son buenos para humanos que ya tienen oído de marca; son insuficientes para un sistema que aprende de patrones.

Las cuatro variables que importan en serio

Lo que sí funciona es ejemplificar. No describir el tono — mostrarlo en las cuatro dimensiones donde un LLM puede aprenderlo bien.

Largo medio del mensaje. Es la variable más visible y la que más diferencia un tono de otro. Algunos operadores escriben mensajes de 2 frases consistentemente; otros mandan párrafos de 80 palabras. El agente debe respetar ese rango y no defaultear a su largo cómodo (que tiende a ser "explicación completa de 4 párrafos"). Esto se enseña con 8-15 ejemplos reales.

Vocabulario característico. Cada operador tiene 20-40 expresiones que usa una y otra vez — saludos ("¿qué tal?", "buenos días"), conectores ("dicho esto", "vamos al grano"), cierres ("hablamos", "un abrazo"), muletillas ("básicamente", "la verdad"). Capturar y reproducir esas expresiones es lo que más rápido convence al cliente cuando lee un draft del agente. Esto se aprende con un corpus de 30-50 mensajes reales del operador.

Estructura por canal. Operadores escriben distinto en email, WhatsApp y LinkedIn. La misma persona puede escribir párrafos en email pero responder con frases sueltas en WhatsApp. El agente necesita aprender la estructura por canal — no extrapolar desde el email.

Patrones de saludo, signing y formato. Si el operador firma "Roberto" en email pero "R." en WhatsApp, el agente lo respeta. Si nunca usa exclamaciones, no las pone. Si pone emojis solo a clientes con confianza, aprende ese gradiente.

Estas cuatro se entrenan con ejemplos. Con cero adjetivos. Con prompt engineering convencional tipo few-shot, pero usando un corpus real, no fabricado.

Las dos variables que no importan tanto

Hay dos cosas que la gente cree que definen su tono y en realidad no afectan al resultado del agente lo suficiente para preocuparse.

"Personalidad". "Amistoso pero profesional", "cálido pero asertivo". Esto el lector no lo lee, lo siente — y el agente, si tiene las cuatro variables anteriores correctas, lo refleja sin que lo enseñes. La personalidad emerge del vocabulario y la estructura, no de instrucciones explícitas.

"Valores de marca". Lo que la marca representa — innovación, transparencia, cercanía. Esto es importante para el copy de marketing, no para los mensajes 1:1 del agente. Cuando un agente está respondiendo a un lead concreto, los valores son irrelevantes; importa que suene como Roberto, no como una marca.

Mi recomendación práctica: cuando un cliente quiere hablar de personalidad y valores, escucha, asiente, y luego pide los 50 mensajes reales. Los valores se manifiestan en cómo escribió, no en cómo describe que escribe.

El proceso que sí funciona

Tres semanas, tres rondas.

Semana 1 — Captura. Pides al operador 30-50 mensajes reales que considera representativos de su tono. Email + WhatsApp + LinkedIn, separados. Sin filtrar, sin pulir. El corpus que obtienes es el tono real, no el aspiracional.

Esto es donde la mayoría de proyectos fallan: el cliente envía mensajes "limpios" que cree que reflejan su mejor versión. Lo que necesitas es la versión real, incluso con sus tropiezos. Hay que insistir y explicar por qué.

Semana 2 — Entrenamiento por few-shot. Construyes un system prompt para el agente con 8-12 ejemplos seleccionados del corpus, organizados por canal y por tipo de mensaje (primer toque vs followup vs respuesta a objeción). El system prompt no describe tono; muestra tono.

El agente produce drafts. Los comparas con cómo habría escrito el operador. Iteras los ejemplos seleccionados — quitas los que no representan, añades los que faltan. Tres-cuatro iteraciones suelen alcanzar 85-90% de fidelidad subjetiva.

Semana 3 — Validación con el operador. El operador revisa 50 drafts del agente sin saber cuáles son del agente y cuáles serían de él. Los etiqueta. Si confunde más del 70% — es decir, no sabe distinguir cuáles escribió el agente — el tono está aprendido.

Si la fidelidad es menor, vuelves a la semana 2. No saltes adelante.

El error de querer "afinar" un modelo desde cero

Una pregunta común: "¿no convendría fine-tunear un modelo con todos los mensajes de mi cliente?". La respuesta práctica para 2026 es: no, casi nunca.

Razones. Fine-tuning es caro (en orden de magnitud el coste mensual del agente entero), lento de iterar (cada cambio de tono requiere re-entrenamiento), y no maneja bien la separación por canal o por contexto. Few-shot prompting con un corpus bien curado da resultados equivalentes o mejores en este uso, con la flexibilidad de poder ajustar tono en minutos cuando el cliente pide ("hazlo un poco más informal en WhatsApp").

Hay casos donde fine-tuning sí compensa — cuando hablas de millones de mensajes muy uniformes y un dominio muy específico. Para una agencia que gestiona 20 cuentas con tonos distintos, el coste no compensa el beneficio.

Lo que esto cambia para una agencia multi-cuenta

Una agencia GHL gestiona 5-30 cuentas, cada una con su tono distinto. Si tienes que mantener 30 system prompts con su corpus, es trabajo serio — no imposible, pero requiere disciplina.

Las tres claves operativas:

Onboarding de tono como parte del kickoff con cada cliente nuevo. No es opcional. Sin corpus, el agente escribe genéricamente y el cliente cancela en el mes 2. Los 50 mensajes son tan obligatorios como acceder al GHL.

Memoria del corpus por workspace. Cada cuenta tiene su corpus aislado. El agente nunca cruza tonos entre clientes — es un riesgo legal y reputacional grave.

Re-validación trimestral. El tono del cliente puede haber evolucionado en seis meses (cambios en el equipo, lanzamiento de nuevo segmento). Sin re-validación, el agente se queda viejo.

Las agencias que adoptan esto ven una reducción de la fricción inicial con sus propios clientes — los drafts del agente son aceptados sin reescribir desde la primera semana. Sin esto, el agente queda como herramienta de "primer borrador" que el humano siempre reescribe — un problema que no merece pagar el plan agentic.

El test final que aplicamos a cada cuenta

Antes de declarar el tono entrenado, le pasamos al agente un caso difícil: un cliente del operador real escribe algo emocional, ambiguo, o fuera de patrón. El agente tiene que responder en el tono del operador, no en su default friendly LLM.

Si responde "I understand your frustration. Let me help you" — está fallando. Si responde con la mezcla precisa de seriedad y cercanía que ese operador concreto usaría — está aprendido.

Ese test es simple y honesto. Y es la diferencia entre un agente que el operador deja escribir solo y uno que sigue revisando cada draft a mano. El segundo no merece existir.

Si estás evaluando agentic para un cliente y quieres una sesión de calibración de tono, escríbenos a hola@closergaas.com. Tenemos plantillas para acelerar la captura del corpus y el few-shot prompt.

Lecturas relacionadas

Los 3 workflows de GoHighLevel que un agente reemplaza primero — donde el tono importa más en el día a día de una cuenta GHL.
Reactivar leads dormidos sin quemarlos — el follow-up de reactivación exige tono perfectamente afinado.
Consultoría high-ticket sin CRM — el operador solopreneur necesita su propio tono replicado.

¿Eres agencia gestionando 5-30 cuentas con tonos distintos? Únete a la waitlist — el onboarding de tono es parte del kickoff con cada cliente nuevo.

Cómo entrenamos al agente para escribir en tu tono (y por qué la mayoría falla)

Por qué los style guides escritos a mano fallan

Las cuatro variables que importan en serio

Las dos variables que no importan tanto

El proceso que sí funciona

El error de querer "afinar" un modelo desde cero

Lo que esto cambia para una agencia multi-cuenta

El test final que aplicamos a cada cuenta

Lecturas relacionadas

§ Artículos relacionados

Los 3 workflows de GoHighLevel que un agente reemplaza primero

Reactivar leads dormidos sin quemarlos: lo que aprendimos en la primera cohorte

Consultoría high-ticket sin CRM: el playbook para no perder un cliente de €15.000 por silencio