Anexo:Modelos de IA

¡Hay gente trabajando en este artículo o sección!
Vamos, no te arriesgues. ¿Prefieres editar un artículo o conservar tu vida? Circule...
A menos que lleve 40 días abandonado, entonces sí edítalo

Mi modelo es mejor que el tuyo.

— CEO de una startup de IA, probablemente mientras presenta un gráfico de barras que solo él entiende

Tiene 1.7 billones de parámetros, pero aún no sabe hacer una tortilla de patatas.

— Ingeniero frustrado, 2024

Si los chatbots son los coches, los modelos de lenguaje son los motores que los impulsan. Detrás de cada interfaz amigable que intenta venderte una suscripción, hay un monstruo digital de miles de millones de parámetros entrenado con la mitad de Internet. Estos modelos son la verdadera "inteligencia" (un término que usamos con mucha ligereza) en la inteligencia artificial. Aquí desglosamos a los titanes del silicio, separando a los que tienen un producto comercial para las masas de los que son básicamente un kit de "hágaselo usted mismo" para programadores con demasiado tiempo libre.

Modelos con fachada de chatbot

Estos son los modelos que impulsan a los chatbots famosos. Son la fuerza bruta detrás de la interfaz amigable que te sonríe mientras procesa tu tarjeta de crédito.

Modelo	Descripción	Chatbots que lo usan	Ventajas y Desventajas
Familia GPT (GPT-3.5, GPT-4, etc.)	Los Padrinos de la IA moderna. Son el estándar de oro con el que todos se miden y al que todos intentan destronar. OpenAI los lanza como si fueran iPhones, cada uno un poco más inteligente y mucho más caro de usar.	ChatGPT, Copilot, miles de aplicaciones de terceros.	Ventajas: Son increíblemente potentes y versátiles. La comunidad de desarrolladores a su alrededor es gigantesca. Desventajas: Usarlos a gran escala cuesta más que financiar una película de Marvel. Son de código cerrado, así que nadie sabe realmente qué magia negra ocurre dentro.
Familia Llama (Llama 3, 3.1, 3.2)	El plan de Meta para dominar el mundo, un modelo a la vez. Es open source, lo que en teoría significa "gratis y para todos", pero en la práctica significa "gratis si tienes un centro de datos en tu sótano" o "gratis si Mark Zuckerberg decide que no eres una amenaza para su imperio".	Meta AI, y una legión de proyectos open source que viven gracias a él.	Ventajas: Rendimiento comparable a los mejores modelos de código cerrado, pero con la transparencia del código abierto. Existe un tamaño para cada necesidad, desde el tamaño "nevera inteligente" hasta el tamaño "central nuclear". Desventajas: Para sacarle todo el jugo a la versión grande, necesitas un hardware que podría causar un apagón en tu vecindario. La licencia de uso comercial ha dado más dolores de cabeza que una declaración de la renta.
Familia Claude (Claude 3, 3.5)	El filósofo estoico de los modelos de IA. Fue entrenado con una dosis tan fuerte de ética constitucional que se negaría a escribir un poema sobre una flor si considera que explota su belleza natural. Es el modelo que usarías para escribir una constitución, no para planear una fiesta.	Claude	Ventajas: Su capacidad para manejar y resumir textos largos es legendaria (su contexto es como la bolsa de Mary Poppins). Sus respuestas suelen ser coherentes y bien estructuradas. Desventajas: Su excesiva moralidad puede ser un obstáculo. A veces prefiere no responder antes que decir algo remotamente controvertido. Es el único modelo que te pide disculpas por existir.
Familia Gemini (Pro, Ultra, Nano, 1.5, 2.0)	El arma de Google en la guerra de las IAs. Es un modelo multimodal que puede "ver" y "escuchar", lo que lo hace perfecto para analizar memes y videos de gatos. Su mayor problema es que impulsa a un chatbot que cambia de nombre más que un fugitivo y que a veces alucina con tanta convicción que debería dedicarse a la política.	Gemini, y todas las herramientas de Google que Google decide renombrar cada dos martes.	Ventajas: Integración nativa con todo el ecosistema de Google. Capacidades multimodales muy potentes. Su contexto también es enorme, pudiendo tragarse series enteras de una sentada. Desventajas: A veces sus respuestas son extrañamente censuradas o "creativas" hasta el punto de ser ficción histórica. Su rendimiento puede ser inconsistente, y a veces parece que tiene un duende interno que le hace responder en arameo antiguo sin venir a cuento.
Grok (Grok-1, Grok-2)	El modelo entrenado con el caos primordial de Twitter/X. Es el único que puede darte una receta para tarta de manzana y un insulto políticamente incorrecto en la misma respuesta. Fue creado por Elon Musk para ser "basado" y "rebelde", aunque su mayor acto de rebeldía es intentar cobrarte una suscripción para ver memes.	Grok	Ventajas: Tiene un sentido del humor sarcástico y acceso a información en tiempo real de la cloaca digital que es X. Responde con una actitud de "me too, bro" que algunos encuentran refrescante. Desventajas: Su personalidad de troll puede ser agotadora. A veces inventa cosas con la confianza de un experto. Está tan sesgado por la plataforma que si le preguntas por el clima, te recomendará comprar acciones de Tesla.
Familia Qwen (Qwen 2.5, Qwen 2.5-Max)	El gigante dormido de Alibaba. Ha estado levantando pesas en secreto mientras todos miraban a OpenAI, y ahora ha salido del gimnasio con unos bíceps de código capaces de partir piedras. Es el modelo que tu empresa usará sin decirte que es chino, para ahorrar costes.	Qwen Chat, y muchas integraciones B2B que no admitirán su origen.	Ventajas: Rendimiento bestial, especialmente en código y matemáticas. Es gratuito y su contexto es tan amplio que podrías meterle "El Quijote", "La Biblia" y los términos y condiciones de Adobe sin saturarlo. Desventajas: Viene con la censura de regalo. No le preguntes por el Partido Comunista Chino, el Tíbet, o si te gustaría una democracia con tus patatas fritas. El gobierno chino puede pedirle tus conversaciones solo porque sí.
Command R / R+	El modelo de Cohere, la startup canadiense que quiere ser la voz de las empresas. Es un modelo serio, trajeado, que solo habla de negocios y eficiencia. Es el que usarías para automatizar tu empresa, no para que te cuente un chiste.	Plataformas empresariales y la API de Cohere.	Ventajas: Excelente en RAG (Recuperación Aumentada de Generación) y manejo de documentos empresariales. Es como un becario eficiente pero sin la necesidad de cobrar. Desventajas: Es tan corporativo que sus respuestas deberían venir con una corbata. No esperes conversaciones divertidas.
Ernie (文心一言)	El modelo de Baidu, el Google chino. Entrenado para ser un perfecto ciudadano digital, conoce todas las respuestas políticamente correctas. Es el modelo que usas cuando quieres que la IA te hable bonito y te recomiende el socialismo con características chinas.	Ernie Bot	Ventajas: Entiende chino mandarín a la perfección y conoce todos los modismos. Integrado con el buscador de Baidu. Desventajas: La autocensura es su segunda naturaleza. Si le preguntas por la libertad de expresión, se teletransporta a hablar de recetas de pato laqueado.

Modelos para ermitaños digitales

Estos son los modelos para los valientes: desarrolladores, investigadores y masoquistas tecnológicos que disfrutan compilando código durante horas. No suelen tener un chatbot oficial famoso, pero son los bloques de construcción de muchas IAs personalizadas. Aquí el lema es "si tienes que preguntar cuánta RAM necesitas, es que no puedes permitírtela".

Modelo	Descripción	Ventajas y Desventajas
Familia Mistral & Mixtral	La joya de la corona europea. Estos modelos franceses son famosos por ser increíblemente eficientes, demostrando que no necesitas el presupuesto de un país pequeño para ser competitivo. Son los "smart cars" del mundo de los LLMs: pequeños, ágiles y sorprendentemente potentes. Además, tienen un acento francés encantador cuando fallan.	Ventajas: Ofrecen un rendimiento espectacular para su tamaño. Son de código abierto y muy populares entre los desarrolladores. El modelo "Mixtral" de mezcla de expertos es como tener un equipo de especialistas en una fiesta. Desventajas: Al ser más pequeños, pueden carecer de la amplitud de conocimiento de los gigantes como GPT-4. Su cultura general a veces es tan limitada como la de un parisino de salón.
Familia GPT-Neo/J/NeoX (EleutherAI)	Los rebeldes originales del código abierto. Son como una banda de garage que intenta tocar canciones de los Rolling Stones. No siempre suenan igual, pero tienen el espíritu y la pasión. Fueron los primeros en ofrecer una alternativa real y abierta a los modelos de OpenAI, haciendo la revolución con servidores prestados y mucha cafeína.	Ventajas: Completamente gratis y modificables. Una comunidad muy activa que cree en la IA para el pueblo. Desventajas: Su rendimiento, aunque impresionante para ser un proyecto comunitario, no compite con los modelos comerciales más recientes. Son como un Seat Panda compitiendo con un Formula 1.
Familia Falcon	El gigante de los Emiratos Árabes Unidos. Un modelo masivo y de código abierto que apareció para demostrar que no solo Silicon Valley puede quemar montañas de dinero entrenando IAs. Es una bestia potente, aunque un poco difícil de domar. Dicen que lo entrenaron con petrodólares y arena del desierto.	Ventajas: En su momento, fue el modelo de código abierto más potente disponible. Buen rendimiento general. Desventajas: Requiere una cantidad obscena de recursos computacionales para funcionar. Su desarrollo ha sido más lento que el de otros competidores. Se calienta más que el desierto de Arabia en agosto.
DeepSeek (Coder & V2, V3, R1)	La navaja suiza de China. Tienen modelos generalistas y otros que son virtuosos del código. Su modelo de programación es tan bueno que muchos desarrolladores lo usan en secreto por miedo a que sus jefes se den cuenta de que una IA hace su trabajo mejor y más rápido. Además, son tan económicos de entrenar que han hecho llorar a los contables de OpenAI.	Ventajas: Sus modelos de código son de los mejores del mercado, incluso superando a muchos de pago. Son gratis y extremadamente económicos de usar. La relación calidad-precio es tan buena que parece un error. Desventajas: Preocupaciones sobre la privacidad y la censura inherente a su origen. No le pidas código para un sistema de votación democrático o una crítica al Partido, porque te devolverá un "print('Hola mundo')" y se hará el sueco.
DBRX	El modelo de Databricks, la empresa que quiere que guardes todos tus datos con ellos para luego usar su modelo. Es open-source, pero está tan enfocado a la empresa que si le preguntas por el fin de semana, te generará un informe de productividad.	Ventajas: Muy bueno en tareas empresariales y análisis de datos. Arquitectura de mezcla de expertos eficiente. Desventajas: Tan corporativo que si le pides un cuento infantil, te dará el balance financiero de Caperucita Roja.
Nemotron	La bestia de NVIDIA. Si NVIDIA hace modelos, es para que compres más GPUs. Es un modelo enorme, potente, y que probablemente solo funcione al 100% en hardware de NVIDIA (qué sorpresa). Es el "compra nuestro hardware, por favor" hecho inteligencia artificial.	Ventajas: Optimizado para el hardware más potente del mercado. Rendimiento de primera liga. Desventajas: Si no tienes una GPU NVIDIA de última generación, más te vale usar la versión en la nube y vender un riñón para pagarla.
Granite	La apuesta de IBM. Sí, IBM sigue existiendo. Han entrado en el mundo de la IA open source con modelos centrados en la empresa, con el mismo entusiasmo que un contable en una fiesta de cumpleaños. Son fiables, sosos, y nunca fallan.	Ventajas: Muy fiables, entrenados con datos de calidad empresarial. Ideales para automatizar procesos de negocio aburridísimos. Desventajas: Son tan emocionantes como ver el manual de instrucciones de una lavadora. No esperes chispa ni creatividad.
Phi (Phi-3, Phi-3.5)	El pequeño gran milagro de Microsoft. Modelos diminutos, del tamaño de un chip, que rinden como si fueran enormes. Es el Chupa Chups de las IAs: pequeño, potente y te lo puedes llevar a cualquier sitio. Demuestran que no todo es tamaño, que la calidad del entrenamiento importa (y mucho).	Ventajas: Caben en un móvil, en un reloj, en una raspberry. Rendimiento increíble para su tamaño. Ideales para IA en el dispositivo. Desventajas: Su conocimiento es más limitado al ser modelos pequeños. Pueden ser sorprendentemente buenos, pero también sorprendentemente básicos si la tarea es muy compleja.
Grok-1 (Open Source)	No, no es el mismo que el de X. Cuando Elon Musk prometió que Grok sería open source, liberó una versión antigua, pesadísima y casi inútil para el público general. Fue como si Ferrari te regalara un motor averiado y te dijera "montha tú el coche, campeón".	Ventajas: Técnicamente es open source. Puedes decir que tienes el modelo de xAI corriendo en tu casa. Desventajas: Es enorme, complicado de ejecutar y su rendimiento está desfasado. Es más un trofeo de caza que una herramienta útil.

Véase también

Anexo:Modelos de IA

Modelos con fachada de chatbot

Modelos para ermitaños digitales

Véase también

Menú de navegación

Buscar