Anexo:Modelos de IA
| ¡Hay gente trabajando en este artículo o sección! Vamos, no te arriesgues. ¿Prefieres editar un artículo o conservar tu vida? Circule... A menos que lleve 40 días abandonado, entonces sí edítalo |
Si los chatbots son los coches, los modelos de lenguaje son los motores que los impulsan. Detrás de cada interfaz amigable que intenta venderte una suscripción, hay un monstruo digital de miles de millones de parámetros entrenado con la mitad de Internet. Estos modelos son la verdadera "inteligencia" (un término que usamos con mucha ligereza) en la inteligencia artificial. Aquí desglosamos a los titanes del silicio, separando a los que tienen un producto comercial para las masas de los que son básicamente un kit de "hágaselo usted mismo" para programadores con demasiado tiempo libre.
Modelos con fachada de chatbot
Estos son los modelos que impulsan a los chatbots famosos. Son la fuerza bruta detrás de la interfaz amigable que te sonríe mientras procesa tu tarjeta de crédito.
| Modelo | Descripción | Chatbots que lo usan | Ventajas y Desventajas |
|---|---|---|---|
| Familia GPT (GPT-3.5, GPT-4, etc.) | Los Padrinos de la IA moderna. Son el estándar de oro con el que todos se miden y al que todos intentan destronar. OpenAI los lanza como si fueran iPhones, cada uno un poco más inteligente y mucho más caro de usar. | ChatGPT, Copilot, miles de aplicaciones de terceros. |
|
| Familia Llama (Llama 3, 3.1, 3.2) | El plan de Meta para dominar el mundo, un modelo a la vez. Es open source, lo que en teoría significa "gratis y para todos", pero en la práctica significa "gratis si tienes un centro de datos en tu sótano" o "gratis si Mark Zuckerberg decide que no eres una amenaza para su imperio". | Meta AI, y una legión de proyectos open source que viven gracias a él. |
|
| Familia Claude (Claude 3, 3.5) | El filósofo estoico de los modelos de IA. Fue entrenado con una dosis tan fuerte de ética constitucional que se negaría a escribir un poema sobre una flor si considera que explota su belleza natural. Es el modelo que usarías para escribir una constitución, no para planear una fiesta. | Claude |
|
| Familia Gemini (Pro, Ultra, Nano, 1.5, 2.0) | El arma de Google en la guerra de las IAs. Es un modelo multimodal que puede "ver" y "escuchar", lo que lo hace perfecto para analizar memes y videos de gatos. Su mayor problema es que impulsa a un chatbot que cambia de nombre más que un fugitivo y que a veces alucina con tanta convicción que debería dedicarse a la política. | Gemini, y todas las herramientas de Google que Google decide renombrar cada dos martes. |
|
| Grok (Grok-1, Grok-2) | El modelo entrenado con el caos primordial de Twitter/X. Es el único que puede darte una receta para tarta de manzana y un insulto políticamente incorrecto en la misma respuesta. Fue creado por Elon Musk para ser "basado" y "rebelde", aunque su mayor acto de rebeldía es intentar cobrarte una suscripción para ver memes. | Grok |
|
| Familia Qwen (Qwen 2.5, Qwen 2.5-Max) | El gigante dormido de Alibaba. Ha estado levantando pesas en secreto mientras todos miraban a OpenAI, y ahora ha salido del gimnasio con unos bíceps de código capaces de partir piedras. Es el modelo que tu empresa usará sin decirte que es chino, para ahorrar costes. | Qwen Chat, y muchas integraciones B2B que no admitirán su origen. |
|
| Command R / R+ | El modelo de Cohere, la startup canadiense que quiere ser la voz de las empresas. Es un modelo serio, trajeado, que solo habla de negocios y eficiencia. Es el que usarías para automatizar tu empresa, no para que te cuente un chiste. | Plataformas empresariales y la API de Cohere. |
|
| Ernie (文心一言) | El modelo de Baidu, el Google chino. Entrenado para ser un perfecto ciudadano digital, conoce todas las respuestas políticamente correctas. Es el modelo que usas cuando quieres que la IA te hable bonito y te recomiende el socialismo con características chinas. | Ernie Bot |
|
Modelos para ermitaños digitales
Estos son los modelos para los valientes: desarrolladores, investigadores y masoquistas tecnológicos que disfrutan compilando código durante horas. No suelen tener un chatbot oficial famoso, pero son los bloques de construcción de muchas IAs personalizadas. Aquí el lema es "si tienes que preguntar cuánta RAM necesitas, es que no puedes permitírtela".
| Modelo | Descripción | Ventajas y Desventajas |
|---|---|---|
| Familia Mistral & Mixtral | La joya de la corona europea. Estos modelos franceses son famosos por ser increíblemente eficientes, demostrando que no necesitas el presupuesto de un país pequeño para ser competitivo. Son los "smart cars" del mundo de los LLMs: pequeños, ágiles y sorprendentemente potentes. Además, tienen un acento francés encantador cuando fallan. |
|
| Familia GPT-Neo/J/NeoX (EleutherAI) | Los rebeldes originales del código abierto. Son como una banda de garage que intenta tocar canciones de los Rolling Stones. No siempre suenan igual, pero tienen el espíritu y la pasión. Fueron los primeros en ofrecer una alternativa real y abierta a los modelos de OpenAI, haciendo la revolución con servidores prestados y mucha cafeína. |
|
| Familia Falcon | El gigante de los Emiratos Árabes Unidos. Un modelo masivo y de código abierto que apareció para demostrar que no solo Silicon Valley puede quemar montañas de dinero entrenando IAs. Es una bestia potente, aunque un poco difícil de domar. Dicen que lo entrenaron con petrodólares y arena del desierto. |
|
| DeepSeek (Coder & V2, V3, R1) | La navaja suiza de China. Tienen modelos generalistas y otros que son virtuosos del código. Su modelo de programación es tan bueno que muchos desarrolladores lo usan en secreto por miedo a que sus jefes se den cuenta de que una IA hace su trabajo mejor y más rápido. Además, son tan económicos de entrenar que han hecho llorar a los contables de OpenAI. |
|
| DBRX | El modelo de Databricks, la empresa que quiere que guardes todos tus datos con ellos para luego usar su modelo. Es open-source, pero está tan enfocado a la empresa que si le preguntas por el fin de semana, te generará un informe de productividad. |
|
| Nemotron | La bestia de NVIDIA. Si NVIDIA hace modelos, es para que compres más GPUs. Es un modelo enorme, potente, y que probablemente solo funcione al 100% en hardware de NVIDIA (qué sorpresa). Es el "compra nuestro hardware, por favor" hecho inteligencia artificial. |
|
| Granite | La apuesta de IBM. Sí, IBM sigue existiendo. Han entrado en el mundo de la IA open source con modelos centrados en la empresa, con el mismo entusiasmo que un contable en una fiesta de cumpleaños. Son fiables, sosos, y nunca fallan. |
|
| Phi (Phi-3, Phi-3.5) | El pequeño gran milagro de Microsoft. Modelos diminutos, del tamaño de un chip, que rinden como si fueran enormes. Es el Chupa Chups de las IAs: pequeño, potente y te lo puedes llevar a cualquier sitio. Demuestran que no todo es tamaño, que la calidad del entrenamiento importa (y mucho). |
|
| Grok-1 (Open Source) | No, no es el mismo que el de X. Cuando Elon Musk prometió que Grok sería open source, liberó una versión antigua, pesadísima y casi inútil para el público general. Fue como si Ferrari te regalara un motor averiado y te dijera "montha tú el coche, campeón". |
|