top of page
Buscar

NVIDIA le pone competencia a chat gpt y cloude con Nemotron

  • Foto del escritor: juan felipe beltran diaz
    juan felipe beltran diaz
  • 18 oct 2024
  • 2 Min. de lectura

[0]

 

Nemotron es un modelo de lenguaje desarrollado por NVIDIA, basado en el Llama-3.1 de Meta, que ha sido optimizado a través de un proceso de fine-tuning para mejorar la calidad y utilidad de las respuestas generadas. Este modelo cuenta con 70 mil millones de parámetros y ha demostrado un rendimiento superior en varios benchmarks en comparación con otros modelos líderes como GPT-4o de OpenAI y Claude 3.5 de Anthropic.


Rendimiento comparativo


El Nemotron ha superado a sus competidores en las siguientes métricas:


  • Arena hard benchmark: 85.0 (Nemotron) vs. 79.3 (GPT-4o) y 79.2 (Claude 3.5).


  • AlpacaEval 2 LC: 57.6 (Nemotron) vs. 52.4 (Claude) y 57.5 (GPT-4o).


  • MT-Bench: 8.98 (Nemotron) vs. 8.81 (Claude) y 8.74 (GPT-4o) [1][2][3].


Estos resultados indican que, a pesar de tener menos parámetros que GPT-4o, Nemotron ha sido ajustado para proporcionar respuestas más relevantes y alineadas con las preferencias humanas, utilizando técnicas como el aprendizaje por refuerzo con retroalimentación humana (RLHF).

Costos y requisitos


Para utilizar Nemotron, se pueden seguir dos enfoques:


  • Uso local: Para ejecutar el modelo localmente, se requieren:

    • Hardware: Al menos cuatro GPUs con 40 GB de VRAM cada una o dos GPUs con 80 GB.

    • Espacio en disco: Se necesitan aproximadamente 150 GB de espacio libre.

    • Software: Compatible con la biblioteca HuggingFace Transformers y versiones específicas de PyTorch.


  • Uso en la nube: NVIDIA ofrece acceso a Nemotron a través de su plataforma en la nube, donde se pueden realizar inferencias sin necesidad de hardware local avanzado [2][4].


Costos


No hay costos para poder usarlo, de hecho, es de código abierto, lo que quiere decir que es gratuito, Y se puede acceder desde la página oficial de NVIDIA, o descargarlo desde huggingface para poder usarlo de manera local, o hugging chat para acceder a Nemotron.


Conclusiones


Nemotron representa un avance significativo en la tecnología de modelos de lenguaje, mostrando que no solo el tamaño del modelo importa, sino también la calidad del entrenamiento y las técnicas utilizadas para su ajuste. Esto abre nuevas posibilidades para los modelos de código abierto en el ámbito de la inteligencia artificial, permitiendo a NVIDIA continuar liderando el desarrollo en este campo al ofrecer soluciones accesibles y efectivas tanto para desarrolladores como para empresas [3][5].


Accede al modelo por medio del siguiente imágenes:

HuggingChat:

NVIDIA



Fuentes:


 IAs que ayudaron a hacer esto posible:

  • Asistencia de flux IA para la generación de imagen.

  • Asistencia para la investigación con Perplexity IA.

  • Asistencia para el contenido media con GPT assistant (fine tuned).

Todo el contenido has sido creado por un humano con la ayuda de inteligencia artificial.

 
 
 

Comentarios


Recibe actualizaciones en tu correo

¡Gracias!

  • Facebook
  • Instagram
  • X

© 2024 Creado por Juan Beltran con Wix.com

bottom of page