Claude 3: El LLM que quiere destronar a ChatGPT

Autor: | Última modificación: 10 de abril de 2024 | Tiempo de Lectura: 4 minutos
Temas en este post:

Algunos de nuestros reconocimientos:

Premios KeepCoding

Desde su creación en 2021, Anthropic ha luchado con OpenAI por llevarse el primer puesto en investigación, desarrollo y creación de inteligencias artificiales. Hoy este sueño parece materializado con la llegada de Claude 3, un modelo de lenguaje de gran tamaño (Large language model o LLM, por sus siglas en inglés) del cual sus creadores dicen que puede superar al modelo GPT-4 (probablemente también al GPT5) de OpenAI e inclusive a Gemini (anteriormente Bard) de Google.

Origen de Claude 3

Anthropic es una empresa bastante nueva en el mercado. Fue fundada en el 2021 por Darío y Daniela Amodei, ex empleados de OpenAI que renunciaron a su antiguo empleo en un intento por mostrar su desacuerdo debido a la unión entre OpenAI y Microsoft. El claude 3 ia , su mejor producto hasta ahora, empezó a gestarse apenas hace un año y desde entonces Anthropic empezó a ganar popularidad en el campo de la inteligencia artificial, haciéndole competencia a empresas como Microsoft con su Copilot.

Ya anteriormente los hermanos Amodei habían creado otros modelos de IA, como era de esperarse debido a su nombre, la ia claude 3 es el tercero en la lista y es un compilado de varias herramientas: Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus.

Claude 3: El LLM que quiere destronar a ChatGPT
Análisis comparativo entre Claude 3 con sus pares, en diferentes puntos de referencia

Las herramientas de Claude 3

Dentro de la suite de Claude 3 se presentan tres herramientas que son:

Haiku

Anthropic lo declara como su modelo más rápido y compacto, ofreciendo una respuesta casi instantánea. Tiene la capacidad de responder a consultas y peticiones simples con una velocidad inigualable, esto permite construir experiencias con la IA que imiten en gran medida las interacciones humanas.

Haiku puede leer un artículo de investigación denso en información y datos sobre arXiv (~10.000 tokens), con cuadros y gráficos, en menos de tres segundos. La empresa dice que la idea es aumentar esta capacidad eventualmente.

Aun no está disponible para su uso, pero Anthropic anuncia que pronto lo estará.

Costo0.225 – 1.25 dólares
Ventana de contexto*200 tokens
Algunos de sus usos– Interacciones con los clientes: soporte rápido y preciso en interacciones en vivo, traducciones.
– Moderación de contenido: en conductas de riesgo o peticiones de clientes.
– Tareas de ahorro de costos: logística optimizada, gestión de inventarios, extracción de datos no estructurados.
Diferencia con la competenciaEs más inteligente, más rápido y más asequible que otros modelos.
Características de Claude 3 Haiku

*El término ventana de contexto es bastante usado en el contexto de los LLM para definir la cantidad de tokens que el modelo puede procesar cuando interpreta una secuencia de texto. Los tokens son pequeñas porciones de texto, ya sea una palabra o una pequeña parte de una palabra.

Sonnet

Esta herramienta logra un equilibrio ideal entre inteligencia y velocidad, en especial si hablamos de cargas de trabajo a nivel empresarial. Esto debido a que Sonnet ofrece una relación costo beneficio mucho mejor que algunas de sus competencias y su rendimiento puede llegar a ser mejor, ya que está diseñado para poseer una alta resistencia en despliegues de IA a gran escala.

En la gran mayoría de cargas de trabajo, Sonnet es dos veces más rápido que los modelos predecesores de claude 3 (Claude 2 y Claude 2.1), logrando niveles más altos de inteligencia. En este aspecto se destacan tareas que exigen respuestas rápidas, como la recuperación de información o la automatización de ventas.

Este modelo, al igual que el Opus, ya está disponible para su uso en la API y también a través de Amazon Bedrock y Vertex AI Model Garden de Google Cloud.

Costo3 – 15 dólares
Ventana de contexto*200 tokens
Algunos de sus usos– Procesamiento de datos: RAG o búsqueda y recuperación de grandes cantidades de información.
– Ventas: recomendaciones de productos, pronósticos, marketing dirigido.
– Tareas que ahorran tiempo: generación de código, control de calidad, análisis de texto a partir de imágenes.
Diferencia con la competenciaEs más asequible que otros modelos con inteligencia similar y mucho mejor en procesos a gran escala
Características de Claude 3 Sonnet

Opus

Es el modelo más inteligente de los 3 y supera a sus pares en la gran mayoría de tareas. Tiene conocimientos expertos a nivel de pregrado (con datos del Massive Multitask Language Understanding o MMLU), razonamiento experto en nivel de posgrado (con el dataset GPQA) y matemáticas básicas (con el dataset GSM8K).

El claude 3 opus posee niveles de comprensión y fluidez casi humanos en tareas complejas, lo cual representa un avance enorme en materia de inteligencia artificial y modelos de lenguaje.

Parte de entender que es claude 3 opus, es comprender que, en materia de respuesta rápida y precisión a preguntas abiertas desafiantes, el opus claude 3 muestra una doble mejora en la misma medida en que reduce los niveles de respuestas incorrectas.

Para procesar el contexto largo se produce con eficacia, los modelos requieren capacidades de recuperación sólidas. La evaluación de Needle In A Haystack (NIAH) mide la capacidad de un modelo para recordar con precisión la información de un vasto corpus de datos. Se mejoró la robustez de este punto de referencia mediante el uso de uno de los 30 pares de agujas/preguntas aleatorias por cásper y pruebas en un corpus de documentos de diversos crowdsourced. Claude 3 Opus no sólo logró un recuerdo casi perfecto, superando la precisión del 99%, sino que en algunos casos, incluso identificó las limitaciones de la propia evaluación al reconocer que la frase «necesaria» parecía ser insertada artificialmente en el texto original por un humano.

Claude 3 opus accuracy
Imagen sacada de Anthropic

Todos los modelos de Claude 3 pueden brindar respuestas precisas en chats de clientes, autocompletar diferentes oraciones y realizar tareas de extracción de datos donde las respuestas deban ser inmediatas y en tiempo real.

La inteligencia artificial sigue avanzando a gran escala, por eso, si no te quieres quedar atrás en materia de conocimiento, te invitamos a unirte a nuestro Bootcamp de inteligencia artificial, en donde aprenderás todo lo necesario para incursionar en un mercado laboral lleno de oportunidades tecnológicas.

¡Contáctanos ahora y cambia tu futuro!

Posts Relacionados

¡CONVOCATORIA ABIERTA!

Inteligencia Artificial

Full Stack Bootcamp

Clases en Directo | Profesores en Activo | Temario 100% actualizado