Introducción a DeepSeek
La startup china de inteligencia artificial DeepSeek no está desperdiciando su impulso en este momento. Justo después de superar a ChatGPT en la posición número uno en la App Store para aplicaciones gratuitas más descargadas, la empresa lanzó el modelo de inteligencia artificial de texto a imagen multimodal Janus-Pro el lunes. Al igual que R1, el modelo insignia de DeepSeek, Janus-Pro es de código abierto bajo una licencia MIT (haciéndolo viable comercialmente) y se puede descargar a través de HuggingFace y GitHub.
Características de Janus-Pro
Similar al lanzamiento de R1, DeepSeek lanzó varias versiones de Janus-Pro, que van desde 1B hasta 7B-parámetros en tamaño. Las pruebas propias de DeepSeek afirman que Janus-Pro-7B, la versión más grande de las dos, supera a generadores de imágenes establecidos como Stable Diffusion y DALL-E en los benchmarks GenEval y DPG-Bench. DeepSeek afirma que el modelo utiliza un marco autoregresivo y supera a los modelos unificados. Janus-Pro se basa en Janus, su versión original lanzada el año pasado, y puede crear y analizar imágenes. Los modelos con parámetros más pequeños de la familia están limitados a analizar imágenes de resolución 384 x 384, lo que es una desventaja.
Ventajas y desventajas de Janus-Pro
A pesar de esto, el rendimiento de Janus-Pro sigue siendo competitivo, especialmente dado que los costos de capacitación reportados por DeepSeek son más bajos en comparación con los de las empresas de inteligencia artificial con sede en EE. UU. En diciembre, un artículo de investigación de la empresa afirmó que su modelo V3 solo costó $5,6 millones para crear, lo que sería una fracción de lo que Google y OpenAI han gastado en sus modelos estrella. Algunos han expresado preocupación de que este número sea incompleto (dejando fuera los costos de investigación y desarrollo, datos y personal) o difícil de creer. Nvidia incluso le dijo a CNBC que el modelo es “un excelente avance en inteligencia artificial“.
Impacto de Janus-Pro en la industria
En el contexto de los lanzamientos rápidos de DeepSeek, las primeras impresiones de la familia de modelos son mixtas pero en general positivas. Estas pueden cambiar a medida que más usuarios prueben Janus-Pro por sí mismos en comparación con otros modelos de imágenes. El lanzamiento de Janus-Pro cuestiona planes como Stargate, una iniciativa de $500 mil millones entre varios gigantes de la inteligencia artificial y promovida por la administración Trump, ya que la inteligencia artificial competitiva puede no requerir la energía y la escala de los centros de datos propuestos por la iniciativa. El enfoque de DeepSeek también puede ser más eficiente en términos de energía que el de sus contrapartes estadounidenses, lo que sería otro cambio significativo para la industria de la inteligencia artificial y la inversión en este espacio.
Conclusión
En resumen, el lanzamiento de Janus-Pro por parte de DeepSeek es un avance significativo en la inteligencia artificial, que ofrece un modelo de texto a imagen multimodal competitivo y de código abierto. Aunque hay algunas limitaciones y preocupaciones sobre los costos de capacitación, el rendimiento de Janus-Pro es prometedor y puede tener un impacto importante en la industria de la inteligencia artificial. A medida que más usuarios prueban Janus-Pro, es probable que se descubran nuevas aplicaciones y usos para este modelo, lo que puede llevar a un futuro más interesante y competitivo en el campo de la inteligencia artificial.