Suscríbete a Merca2.0. Haz clic aquí

DeepSeek lanza DeepEP como biblioteca para entrenar modelos

DeepSeek AI sigue rompiendo barreras en el desarrollo de inteligencia artificial con el lanzamiento de DeepEP, una biblioteca diseñada para revolucionar la comunicación en modelos Mixture of Experts.
  • Este lanzamiento forma parte de la estrategia de código abierto de DeepSeek, que recientemente presentó FlashMLA, un kernel de decodificación optimizado para GPUs Hopper.

  • Según los estudios de Statista Consumer Insights realizados entre 2022 y 2024, ChatGPT ha mantenido su liderazgo, aunque el panorama se ha vuelto más competitivo con el tiempo.

  • Estados Unidos se ha coronado como el líder de las inversiones de inteligencia artificial, destinando alrededor de 248.900 millones de dólares, según AI Index Report.

DeepSeek AI quiere seguir liderando en el desarrollo de inteligencia artificial con el lanzamiento de DeepEP, una biblioteca de comunicación diseñada para mejorar la eficiencia en el entrenamiento e inferencia de modelos basados en la arquitectura Mixture of Experts.

Fue Probado en GPUs NVIDIA H800 con tarjetas de red CX7 InfiniBand RDMA, DeepEP ha alcanzado un rendimiento de 153 GB/s en NVLink, acercándose al máximo teórico de 160 GB/s, y 43 GB/s en RDMA, en comparación con el máximo de 50 GB/s. Además, la compatibilidad con cálculos en formato 8-bit floating point permite reducir el consumo de memoria y acelerar las operaciones, beneficiando el entrenamiento de modelos a gran escala y disminuyendo los costos computacionales.

Esta tecnología permite a los modelos seleccionar dinámicamente los expertos más adecuados para cada tarea, optimizando los recursos computacionales y mejorando el rendimiento. Sin embargo, la comunicación entre las diferentes unidades de procesamiento gráfico representa un desafío, y DeepEP aborda este problema con kernels optimizados para el reenvío asimétrico de ancho de banda.

En ese sentido, la comunidad de inteligencia artificial ha recibido con entusiasmo esta iniciativa, destacando su papel en la transparencia y accesibilidad de la tecnología.
Hay que tener en cuenta que DeepEP es la segunda de cinco bibliotecas de código abierto que DeepSeek lanzará de su Open Source Week.

Con la introducción de DeepEP, DeepSeek quiere competir on los gigantes tecnológicos, lo cual se demuestra en sus recientes desarrollos, como DeepSeek-R1 y DeepSeek-V3, que han demostrado un rendimiento competitivo con costos reducidos, marcando una diferencia en el sector. La documentación y los recursos de DeepEP ya están disponibles en GitHub, permitiendo que más desarrolladores exploren su potencial y contribuyan al avance de la IA.

Y es que, la última encuesta realizada a desarrolladores de Stack Overflow, incluyó una nueva sección  relacionada con las herramientas de búsqueda basadas en IA, “para capturar qué piensan los desarrolladores al respecto y cómo las utilizan en sus flujos de trabajo”. Dicho análisis arrojó que la principal elección de los encuestados fue sin duda ChatGPT, con un porcentaje del 83 por ciento de los programadores que la ha utilizado con regularidad el último año. Aunque, en el segundo lugar se proyectó Bing AI, con un 20 por ciento, seguido por Wolfram Alpha con el 11,2 por ciento.

Una de las principales ventajas de OpenAI es que va un paso adelante, pues se ha actualizado velozmente, y es que no tiene mucho que surgió esta inteligencia que de por sí es impactante y ya han presentado a GPT-4 que sorprende aún más ya que puede manejar más de 25 mil palabras de texto, lo que permite generar, editar e iterar con los usuarios en tareas de escritura técnica y creativa, como componer canciones, escribir guiones o aprender el estilo de escritura de un usuario.

Aunque, a pesar del gran éxito de OpenAI, DeepSeek ha llegado para quedarse y hacer frente a la tecnología con su procesamiento que ha crecido rápidamente, ganando cada vez más popularidad.

 

 

 

Ahora lee: 

Reviven a Duolingo con ayuda de las esferas del dragón

Cajera de Bodega Aurrerá recibe propuesta de matrimonio y fortalece la fidelización de marca

Elon Musk revala cómo suena la impresionante y sarcástica voz de Grok

 

Obtén un més gratis a Merca2.0 premium

Cancela en cualquier momento
Acceso exclusivo a rankings y radiografías.
Análisis profundos y casos de estudio de éxito.
Historial de la revista impresa en formato digital.

¡Disfruta de lo mejor del marketing sin costo alguno por un mes!

Más de 150,000 mercadólogos inscritos en nuestros boletín de noticias diarias.

Premium

Populares

Únete a más de 150,000 lectores

Regístrate a nuestro newsletter en la siguiente forma y recibe a primera hora las noticias más importantes de mercadotecnia, publicidad y medios en tu correo.

Más de Merca2.0

Artículos relacionados

Belinda y NU lanzan campaña “Toma la Decisión”

La campaña “Toma la decisión Nu” está dirigida por Fran Colombatti y producida por Landia, el video “Tinta Nu” está dirigido por Salvador Espinosa y la experiencia inmersiva está producida por la casa productora Bomba.

You don't have credit card details available. You will be redirected to update payment method page. Click OK to continue.