Meta Platforms lanzó el martes Llama 3, la mayor versión de sus modelos de inteligencia artificial en su mayoría gratuitos, con habilidades multilingües y métricas generales de rendimiento que pisan los talones a los modelos de pago de rivales como OpenAI.
El nuevo modelo Llama 3 puede conversar en ocho idiomas, escribir código informático de mayor calidad y resolver problemas matemáticos más complejos que las versiones anteriores, explicó la matriz de Facebook en un blog y en un documento de investigación en los que anuncia el lanzamiento.
Sus 405.000 millones de parámetros, o variables que el algoritmo tiene en cuenta para generar respuestas a las consultas de los usuarios, empequeñecen la versión anterior lanzada el año pasado, aunque siguen siendo más pequeños que los principales modelos ofrecidos por la competencia. El modelo GPT-4 de OpenAI, por ejemplo, tiene un billón de parámetros y Amazon está invirtiendo en un modelo con 2 billones de parámetros.
«Ahora, estamos iniciando una nueva era en la que el código abierto lidera el camino. Estamos lanzando públicamente Meta Llama 3.1 405B, que creemos que es el modelo de base disponible abiertamente más grande y con más capacidades del mundo. Con más de 300 millones de descargas totales de todas las versiones de Llama hasta la fecha, esto es solo el comienzo», publicó Meta en sus redes.
La preocupación por los altos costos
La publicación se produce en un momento en el que las empresas tecnológicas se apresuran a demostrar que sus crecientes carteras de modelos de lenguaje de gran tamaño, que consumen muchos recursos, pueden ofrecer ganancias suficientemente significativas en áreas problemáticas conocidas, como el razonamiento avanzado, para justificar las gigantescas sumas que se han invertido en ellos.
Además de su modelo insignia de 405.000 millones de parámetros, Meta también lanza versiones actualizadas de sus modelos más ligeros Llama 3, de 8.000 y 70.000 millones de parámetros, presentados inicialmente en la primavera boreal.
Los tres nuevos modelos son multilingües y pueden gestionar solicitudes de usuarios de mayor tamaño a través de una «ventana contextual» ampliada que, según Ahmad Al-Dahle, responsable de IA generativa de Meta, mejorará la experiencia de generación de código informático en particular. «Ese fue el principal comentario que recibimos de la comunidad», dijo Al-Dahle en una entrevista, señalando que las ventanas de contexto más grandes dan a los modelos algo parecido a una memoria más larga que ayuda a procesar las solicitudes de varios pasos.
Firme competencia de Meta a los rivales pioneros de IA
Meta pone a disposición de los desarrolladores sus modelos Llama de forma gratuita, una estrategia que, según el presidente ejecutivo Mark Zuckerberg, dará sus frutos en forma de productos innovadores y una mayor participación en las principales redes sociales de la empresa. Sin embargo, algunos inversores se han mostrado preocupados ante los costos que conlleva.
Aunque el progreso en el desarrollo de la IA es notoriamente difícil de medir, los resultados de las pruebas proporcionados por Meta parecían sugerir que su mayor modelo Llama 3 casi igualaba y, en algunos casos, superaba a Claude 3.5 Sonnet, de Anthropic, y a GPT-4o, de OpenAI, ampliamente considerados como los dos modelos fronterizos más potentes del mercado.
En la prueba MATH de problemas matemáticos de nivel competitivo, por ejemplo, el modelo de Meta obtuvo una puntuación de 73,8, frente a los 76,6 de GPT-4o y los 71,1 de Claude 3.5 Sonnet. El modelo obtuvo una puntuación de 88,6 en MMLU, una prueba de referencia que abarca docenas de asignaturas de matemáticas, ciencias y humanidades, mientras que GPT-4o obtuvo 88,7 y Claude 3.5 Sonnet 88,3.