La inconsistencia no viene del modelo. Viene de pedirle demasiado, demasiado pronto.
Esta es la versión en español del sistema que usamos cuando queremos que un carrusel deje de sentirse random y empiece a comportarse como un sistema visual. No le pedís magia al generador. Le das una estructura.
Primero cerrás la idea. Después el copy. Después las referencias. Recién ahí generás imágenes.
El error clásico es este: abrir GPT Image, pegar un párrafo, subir cinco referencias y esperar seis slides consistentes en una sola corrida. El modelo puede acertar una. Dos con suerte. Pero no te va a construir una familia visual estable si vos mismo no la definiste primero.
Copy first, image later. Si no cerraste el mensaje slide por slide, todavía no estás listo para renderizar nada.
No trabajes con un tema amplio. Bajalo a una afirmación puntual que pueda vivir en un hook.
Cerrá headline, support line y CTA slide por slide. Si el mensaje está borroso, la imagen también.
No más. El sweet spot es pocas referencias, bien elegidas, con roles distintos.
Una referencia puede prestar tipografía, otra spacing, otra color, otra estructura. Nunca “hacelo como esto”.
La slide 1 fija la familia visual. No avances con una sola idea sin contraste.
Refiná la mejor versión hasta que se convierta en el ancla visual del set.
Las slides 2-N tienen que nacer referenciando el anchor, no una moodboard vaga.
Poné todas juntas, detectá las flojas y regenerá solo esas. No tires abajo todo el batch.
Es el esqueleto más útil para explicar un sistema sin perder ritmo. Después lo podés adaptar, pero esta secuencia ya resuelve gran parte del pacing.
El salto de calidad aparece cuando dejás de pedir “inspiración” y empezás a pedir préstamos concretos.
Tomá la forma en que ordena el título, el peso visual y qué palabras reciben el acento.
Pedile cómo reparte blancos, bordes, márgenes, bloques y respiración general.
Usala para la paleta, el grano, la temperatura y la atmósfera, no para el mensaje exacto.
Es la que te presta el ritmo de cierre, la lógica de prueba o la resolución final del sistema.
Borrow: tipografía, spacing, color, textura, lógica de layout. Do not copy: branding exacto, texto exacto, composición exacta, assets exactos.
La cover no es “la primera slide”. Es la pieza que define la densidad, el contraste, el carácter y la gramática visual del resto. Por eso la cover se explora en variantes.
Quiero 3 versiones distintas de la slide 1 de un carrusel editorial 4:5. Idea central: [PEGÁ ACÁ TU TESIS] Copy exacto de la portada: [PEGÁ ACÁ EL HEADLINE] [PEGÁ ACÁ LA SUPPORT LINE] [PEGÁ ACÁ EL CTA INFERIOR] Referencias y jobs: - Reference 1 → borrow typography hierarchy - Reference 2 → borrow layout and spacing - Reference 3 → borrow colour, texture, mood - Reference 4 → borrow CTA or proof logic Do not copy: - no texto exacto de las referencias - no branding exacto - no composición calcada Necesito 3 hipótesis visuales reales de la misma portada. Todas tienen que sentirse parte de la misma familia, pero resolver la jerarquía de forma distinta. No generes el resto del carrusel todavía.
Una vez que elegiste el anchor, el juego cambia. Ya no le hablás al modelo desde una moodboard. Le hablás desde una familia visual cerrada.
Usá esta slide anchor como referencia principal del sistema visual. Objetivo: Generar la slide [N] del mismo carrusel, manteniendo la misma familia visual. Anchor slide: - typography feel - spacing - colour treatment - texture - mood - visual hierarchy Copy exacto de esta slide: [PEGÁ ACÁ EL HEADLINE] [PEGÁ ACÁ LA SUPPORT LINE] [PEGÁ ACÁ EL CTA O LABEL SI EXISTE] Esta slide cumple este rol: [mistake / sauce / formula / CTA / etc.] Mantené consistencia con el anchor. No reinventes la paleta. No cambies la lógica tipográfica. No conviertas esta slide en una cover reciclada. Resolvé solo esta slide.
Los mejores prompts de refinamiento no dicen “mejoralo”. Dicen exactamente qué se queda, qué se mueve y qué no se toca.
Todo lo que ya funciona y define la familia visual: el contraste, la jerarquía, la densidad, el mood.
Una cantidad chica de cosas: por ejemplo tamaño del remate, peso del proof o posición del módulo inferior.
La parte del sistema que si la movés te rompe el set entero. Normalmente: paleta, lógica tipográfica, textura y ritmo de blancos.
Poné las 6 slides juntas. Detectá cuáles rompen familia. Regenerá solo esas. La consistencia no se arregla rerenderizando todo; se arregla atacando las piezas flojas.
Si la slide necesita precisión tipográfica fina, el modelo te puede dar una base visual buenísima, pero no siempre te va a cerrar el detalle. En esos casos, cambiá de modo.
En `hybrid-text-safe` el modelo genera fondo, objetos, textura y safe areas. La tipografía final la componés vos después, de forma determinista.
Esta guía es la traducción al español del método Reference-First, adaptada para el workflow que usamos en Morfeo Academy.
Adaptado desde The Reference-First Carousel Workflow. Traducción, estructura y ejemplos localizados por Morfeo Academy para uso práctico con GPT Image y carruseles editoriales.