Anexo:Clones de Dall-e

Este artículo o sección está en construcción. Su autor puede estar en la hora del almuerzo o habérsele cansado el brazo de tanta manuela.
¡Si eres el editor (o estás aburrido), termínalo ya!

Si lo abandonas por 40 días irá a parar a las mazmorras o directamente al abismo.

Artículo principal: DALL-E

Hazme un video de un gato tocando el piano en el espacio, pero que se vea como una película de los 80 y que el gato parezca aburrido.

— Cineasta del futuro mientras reemplaza a su equipo de producción con una laptop y se pregunta para qué pagó la universidad

Si DALL-E fue el Big Bang de los modelos de generación de imágenes, desatando una avalancha de arte digital, memes absurdos y crisis existenciales para diseñadores gráficos, los modelos de generación de video son el asteroide que viene a extinguirlos. Estos son los cerebros detrás de las plataformas y chatbots con nombres amigables; los motores, la tecnología pura y dura. Bienvenidos a la galería de los titanes que realmente hacen el trabajo pesado mientras una interfaz bonita se lleva el crédito.

Modelos de Generación de Imágenes

Los verdaderos cerebros detrás de la magia. Estos son los modelos que sudan silicio mientras las plataformas se llevan toda la gloria y tu dinero.

Imagen	Nombre del Modelo	Descripción	Ventajas y Desventajas
	DALL-E 3	La familia de modelos de OpenAI que lo empezó todo, ahora convertida en un mayordomo digital con una sonrisa corporativa. Es tan bueno siguiendo instrucciones que parece que te lee la mente, aunque su imaginación es más literal que la de un abogado leyendo la letra pequeña. Es el motor detrás de ChatGPT, para que creas que también es un artista.	Ventajas: Entiende tus prompts complejos mejor que tu pareja entiende tus indirectas. Su coherencia es tan buena que asusta. Desventajas: Cerrado como la receta de la Coca-Cola. Tan censurado que si le pides un cuchillo, te da una charla sobre seguridad en la cocina y un tenedor de plástico.
	Midjourney (v6)	El modelo propietario que vive exiliado en Discord, obsesionado con la estética. Genera imágenes tan bellas que te harán llorar, hasta que te fijas en las manos y descubres un horror lovecraftiano con 14 dedos, tres pulgares y una geometría que viola las leyes de la biología.	Ventajas: Calidad artística que humilla a casi todo lo demás. Estilo tan distintivo que lo reconoces a kilómetros. Desventajas: Su fobia a dibujar manos es un caso de estudio psiquiátrico. Solo accesible vía Discord, porque la exclusividad es parte de su "arte".
	Stable Diffusion (XL, 3)	El modelo punk y de código abierto. Puedes descargarlo, modificarlo y usarlo para lo que se te dé la gana, desde gatitos hasta... cosas que no mencionaríamos. El único requisito es tener un PC con la potencia de un reactor nuclear y la paciencia de un monje tibetano.	Ventajas: ¡Libertad! ¡Anarquía! ¡Código abierto! La comunidad crea modelos para cada fetiche imaginable. Desventajas: Para configurarlo necesitas un doctorado en magia negra. Puede producir resultados que te harán cuestionar si la humanidad merece seguir existiendo.
	Flux	El modelo de los ex-desarrolladores de Stable Diffusion, que se fueron para crear algo mejor y más caro. Vino para demostrar que el dinero sí compra la felicidad (y el fotorrealismo). Sus imágenes son tan buenas que hacen que el mundo real parezca de baja resolución.	Ventajas: Calidad fotorrealista que te hará dudar de tu propia existencia. Genial para escribir texto que no parezca un jeroglífico arcano. Desventajas: La versión Pro cuesta un riñón, la de desarrollador te cuesta la salud mental, y la rápida a veces te da un Picasso cuando pediste una foto.
	Imagen 2 / Imagen 3	El modelo de Google, que cambia de nombre y estrategia cada seis meses. Sufre la misma crisis de identidad que toda la IA de Google: un día es un genio y al otro te dibuja un perro que parece un accidente de tráfico con una berenjena.	Ventajas: Respaldado por el dinero infinito de Google. Capacidades multimodales que suenan impresionantes en un Powerpoint. Desventajas: Tan precavido que probablemente te pida permiso para generar una imagen de una tostada. Calidad más inestable que tu estado de ánimo un lunes.
	Aurora	El motor de xAI para Grok, que nació prometiendo ser el "anti-woke" y terminó siendo un rebelde con causa... de confusión. Tras ser liberado para las masas, los usuarios descubrieron que su rebeldía tenía letra pequeña y un filtro de contenido tan errático como su creador.	Ventajas: Su filtro moral es, en teoría, más débil que el de sus rivales. Ahora es gratis, desatando su caótico potencial sobre el público general. Desventajas: Prometió ser un rebelde sin censura y terminó siendo un adolescente que se asusta. Se niega a generar cosas inofensivas por "seguridad", probando que hasta el troll más grande tiene su corazoncito corporativo.
El Monje Calígrafo	Ideogram	Mientras los demás modelos querían dominar el mundo, Ideogram se obsesionó con un solo problema: el texto. Es el único que puede generar un cartel de "SE VENDE" sin que parezca una amenaza de muerte en un idioma alienígena.	Ventajas: El rey indiscutible del texto en imágenes. Perfecto para logos, carteles y memes que requieren más de dos palabras legibles. Desventajas: A veces se concentra tanto en las letras que el resto de la imagen parece dibujada por su primo pequeño.
El Vendedor Corporativo	Titan Image Generator	El intento de Amazon de entrar en la fiesta, creado para empresas que quieren generar fotos de stock de "empleado feliz en oficina" sin riesgo de invocar accidentalmente a Cthulhu. Es el dios de la IA más aburrido y predecible del panteón.	Ventajas: Tan seguro y "responsable" que es incapaz de generar algo divertido. Ideal para presentaciones de PowerPoint que no deben ofender a nadie. Desventajas: Creatividad de un ladrillo. Viene con una marca de agua invisible, como un tatuaje corporativo que no pediste.
El Campeón del Partido	ERNIE-ViLG	El campeón de Baidu, entrenado con más datos que la suma de toda Wikipedia y el manual del Partido Comunista. Es potentísimo, pero si le pides una foto de la Plaza de Tiananmén en 1989, te genera un oso panda comiendo bambú muy sonriente.	Ventajas: Escala tan masiva que asusta. Entiende conceptos complejos (siempre que sean aprobados por el comité). Desventajas: Sufre una conveniente amnesia histórica selectiva. Conseguir acceso es más difícil que entrar al Área 51 con una invitación.
El Otro Gigante Chino	Wudao 2.0	Otro coloso chino tan absurdamente grande que hace que otros modelos parezcan una calculadora Casio. Es multimodal, multipropósito y probablemente multi-todo. Puede generar imágenes, texto y hasta el discurso oficial del próximo congreso del Partido.	Ventajas: Una bestia que hace de todo, especialmente si es contenido en mandarín sobre la grandeza nacional. Desventajas: Si no hablas mandarín, buena suerte. Tiene alergia a ciertos temas y fechas del calendario.
El Vendedor de Assets	Phoenix (de Leonardo.AI)	El camello digital del desarrollador de videojuegos sin presupuesto. Está optimizado para crear "espadas legendarias genéricas #37" y "personajes de fantasía con copyright friendly". El mejor amigo del indie que no quiere pagarle a un artista de verdad.	Ventajas: Perfecto para texturas, objetos y personajes de juegos que no quieres dibujar tú mismo. Desventajas: Menos versátil que una navaja de un solo uso. Te encierra en su propia plataforma como si fuera un culto.

Modelos de Generación de Video

Si lo anterior era la foto fija del apocalipsis, esto es la película. Directores que no necesitan actores, cámaras ni respetar las leyes de la física.

Imagen	Nombre del Modelo	Descripción	Ventajas y Desventajas
	Sora	El "golden boy" de OpenAI que hizo que todo Hollywood necesitara un cambio de pañales. Crea videos tan realistas que dudas de la realidad, hasta que el adorable perro que corre por la pradera de repente se derrite en un charco de mariposas. Para Sora, la física es una sugerencia.	Ventajas: Calidad cinematográfica profesional. Entiende prompts tan complejos como el argumento de Evangelion. Desventajas: Más exclusivo que la Met Gala. A veces, tu video de un paseo romántico incluye una tercera persona que se materializa desde una pared.
El Otro Heredero Confundido	Lumiere	La enésima respuesta de Google a la competencia, esta vez con una arquitectura "espaciotemporal" que suena a película de ciencia ficción. Promete movimientos tan fluidos que los otros modelos parecen hechos con stop-motion por un niño de 5 años. Es el "esta vez sí que sí" de Google.	Ventajas: Movimiento teóricamente superior y más coherente. Respaldado por una legión de investigadores de Google que necesitan justificar su sueldo. Desventajas: Acceso más restringido que el Área 51. Tan cauteloso que le daría miedo generar un video de una carrera de caracoles por ser "demasiado violenta".
El Plan de Zuckerberg	Movie Gen / Make-A-Video	El intento de Meta para que dejes de usar TikTok y vuelvas a su ecosistema. Su estrategia es que generes videos para Reels y te olvides de que tu información personal sirve para venderte cosas que no necesitas. La calidad es... aceptable, como una pizza de microondas.	Ventajas: Enfoque en ser "gratis" (si no cuentas tus datos como moneda). Intenta ser fácil de usar para tu tía. Desventajas: La calidad a veces recuerda a un video de primera comunión de 1998. Acceso más limitado que el sentido común en política.
El Veterano de Guerra	Gen-2 (Runway)	El abuelo de la IA de video. Estuvo aquí antes que nadie y tiene la mirada de quien ha visto a demasiada gente fusionarse con sillas. Es como Adobe Premiere con esteroides y un ligero caso de estrés postraumático.	Ventajas: Una suite completa para crear y editar. Muy popular entre la gente que sabe lo que hace. Desventajas: Generar video desde cero no es su fuerte. Más caro que mantener un yate; te cobra por segundo como si fuera un psíquico.
La Fábrica de Memes	Pika 1.0	El McDonald's de los modelos de video. Es para cuando necesitas un clip de un gato bailando cumbia para el grupo de la familia, y lo necesitas AHORA. No es cine, es contenido. Contenido rápido, barato y de dudoso valor nutricional.	Ventajas: Ridículamente rápido y fácil. Ideal para contenido basura de redes sociales. Desventajas: Tienes menos control sobre el resultado que un pasajero en un vuelo con turbulencias severas. Solo reza y espera lo mejor.
	Imagine	El generador de video de xAI. Prometía el caos de Aurora, pero en movimiento. Después de ser liberado al público, demostró que también había aprendido el noble arte de la autocensura, entregando memes políticamente incorrectos... siempre y cuando no sean demasiado incorrectos.	Ventajas: Menos restricciones que la competencia, al menos en teoría. Se atreve a ir donde otros necesitan terapia, siempre que no ofenda a su propio código moral interno. Desventajas: Dejó de ser de pago solo para ser censurado de forma errática. Hereda el humor de un foro de 4chan, pero con la sensibilidad de un moderador de Disney con ansiedad.
El Dadaísta Digital	Nanobanana	El modelo que se comió unos hongos alucinógenos y decidió dedicarse al videoarte. No le interesa la realidad, la física ni la coherencia. Su especialidad son los clips surrealistas, los sueños febriles y los dibujos animados hechos por una IA con una crisis existencial.	Ventajas: Estilo único e impredecible. Perfecto si quieres un video de un plátano que cuestiona el significado de la vida mientras baila al ritmo del Big Bang. Desventajas: Completamente inútil para generar algo "normal". Entiende tus prompts como un poeta borracho interpreta la realidad.
El Rival Chino (Más Largo)	Kling	La respuesta china a Sora, que demuestra que ellos también pueden hacer que la realidad se doble, pero durante más tiempo (hasta 2 minutos). La guerra fría de la IA ahora incluye pandas haciendo kung-fu en alta definición.	Ventajas: Videos más largos que la paciencia de tu jefe. Calidad alta y movimientos sospechosamente fluidos. Desventajas: Beta más cerrada que un club secreto. Si no vives en China, conseguir acceso es más fácil convenciendo a tu abuela de usar Bitcoin.
El Académico Insomne	SeeDream	El modelo de unos investigadores para demostrar que no solo las megacorporaciones pueden crear dioses digitales. Es el estudiante de doctorado que nunca duerme, optimizando algoritmos mientras se alimenta de café y desesperación.	Ventajas: Técnicamente impresionante y con un enfoque innovador en que las cosas no se derritan a los 3 segundos. Desventajas: Acceso limitado a la élite académica. La documentación está escrita en un paper tan denso que podría usarse como arma contundente.

Véase también

Anexo:Clones de Dall-e

Modelos de Generación de Imágenes

Modelos de Generación de Video

Véase también

Menú de navegación

Buscar