Las mejores IA open source bajo demanda en un Cloud soberano

Descubre las mejores alternativas open source a ChatGPT, Gemini, Midjourney o Claude para procesar datos confidenciales en total conformidad con la legislación europea y suiza.

LLM

Embeddings

Audio

Imagen

Grandes modelos de lenguaje (LLM)

Las mejores alternativas open source a ChatGPT, Gemini y Microsoft Copilot para interactuar, analizar y generar contenido con IA.

Qwen/Qwen3.5-122B-A10B-FP8

Qwen/Qwen3.5-122B-A10B-FP8

El más potente

Beta

  • Diseñado para tareas complejas que requieren una amplia perspectiva contextual y una mayor precisión en el razonamiento lógico.

  • Arquitectura optimizada para una inferencia más rápida y un menor consumo energético, lo que libera importantes recursos de cálculo.

  • Entrenado con millones de agentes y tareas de complejidad creciente para ofrecer una gran adaptabilidad al mundo real.

Modalidad

Image-Text to Text

Max input tokens

200’000

Idiomas

Más de 100 idiomas

Consulta de funciones

Categoría de modelo

chat_large

  • Diseñado para tareas complejas que requieren una amplia perspectiva contextual y una mayor precisión en el razonamiento lógico.

  • Arquitectura optimizada para una inferencia más rápida y un menor consumo energético, lo que libera importantes recursos de cálculo.

  • Entrenado con millones de agentes y tareas de complejidad creciente para ofrecer una gran adaptabilidad al mundo real.

Modalidad

Image-Text to Text

Max input tokens

200’000

Idiomas

Más de 100 idiomas

Consulta de funciones

Categoría de modelo

chat_large

Apertus-70B-Instruct-2509

Apertus-70B-Instruct-2509

El más ético

Beta

  • Ideal para servicios multilingües, autoridades públicas y equipos de I+D que buscan un modelo fiable y adaptable

  • Datos y métodos documentados para una transparencia sin precedentes

  • Cumple con la Ley de IA y protege tanto la privacidad como la propiedad intelectual

  • Una versión 70B con un rendimiento comparable al de los líderes actuales del mercado

Modalidad

Text to Text

Max input tokens

65’536

Idiomas

Más de 100 idiomas

Consulta de funciones

No

Categoría de modelo

chat_medium

  • Ideal para servicios multilingües, autoridades públicas y equipos de I+D que buscan un modelo fiable y adaptable

  • Datos y métodos documentados para una transparencia sin precedentes

  • Cumple con la Ley de IA y protege tanto la privacidad como la propiedad intelectual

  • Una versión 70B con un rendimiento comparable al de los líderes actuales del mercado

Modalidad

Text to Text

Max input tokens

65’536

Idiomas

Más de 100 idiomas

Consulta de funciones

No

Categoría de modelo

chat_medium

google/gemma-4-31B-it

google/gemma-4-31B-it

El equilibrio perfecto

Beta

  • El equilibrio perfecto entre rapidez y potencia, diseñado para destacar en el razonamiento lógico, el análisis documental en profundidad y la generación de código fiable.

  • Aprovecha una arquitectura de vanguardia para ofrecer una comprensión detallada de contextos amplios e instrucciones complejas.

  • Ideal para chatbots avanzados y flujos de trabajo empresariales que requieren una gran versatilidad sin sacrificar la velocidad de ejecución.

Modalidad

Texto a texto (optimizado para la enseñanza)

Max input tokens

100’000

Idiomas

Más de 140 idiomas

Consulta de funciones

Sí (nativo y optimizado)

Categoría de modelo

chat_medium

  • El equilibrio perfecto entre rapidez y potencia, diseñado para destacar en el razonamiento lógico, el análisis documental en profundidad y la generación de código fiable.

  • Aprovecha una arquitectura de vanguardia para ofrecer una comprensión detallada de contextos amplios e instrucciones complejas.

  • Ideal para chatbots avanzados y flujos de trabajo empresariales que requieren una gran versatilidad sin sacrificar la velocidad de ejecución.

Modalidad

Texto a texto (optimizado para la enseñanza)

Max input tokens

100’000

Idiomas

Más de 140 idiomas

Consulta de funciones

Sí (nativo y optimizado)

Categoría de modelo

chat_medium

moonshotai/Kimi-K2.6

moonshotai/Kimi-K2.6

El más potente para el vibe coding

Beta

  • Multimodal nativo: convierte texto, imágenes o maquetas en código totalmente funcional.

  • Diseñado para el desarrollo a gran escala: incorpora una ventana de contexto ampliada de hasta 256k tokens para gestionar proyectos complejos

  • Optimizado para el vibe coding: rápido, fluido y creativo, pensado para desarrolladores y diseñadores de productos

  • Compatible con flujos de trabajo de agentes: automatiza el análisis, la generación de código y su ejecución de principio a fin

Modalidad

Image-Text to Text

Max input tokens

256’000

Idiomas

Multilingüe

Consulta de funciones

Categoría de modelo

code

  • Multimodal nativo: convierte texto, imágenes o maquetas en código totalmente funcional.

  • Diseñado para el desarrollo a gran escala: incorpora una ventana de contexto ampliada de hasta 256k tokens para gestionar proyectos complejos

  • Optimizado para el vibe coding: rápido, fluido y creativo, pensado para desarrolladores y diseñadores de productos

  • Compatible con flujos de trabajo de agentes: automatiza el análisis, la generación de código y su ejecución de principio a fin

Modalidad

Image-Text to Text

Max input tokens

256’000

Idiomas

Multilingüe

Consulta de funciones

Categoría de modelo

code

mistralai/Ministral-3-14B-Instruct-2512

mistralai/Ministral-3-14B-Instruct-2512

El más versátil

Beta

  • Optimizado para una implementación rápida y económica, ideal para bots de conversación, análisis de documentos y tareas especializadas.

  • Ofrece un rendimiento similar al del Mistral Small 3.2 24B con un mínimo de recursos.

  • Capaz de analizar imágenes y proporcionar información basada en el contenido visual, además del texto.

Modalidad

Image-Text to Text

Max input tokens

100’000

Idiomas

EN, ES, FR, DE, IT...

Consulta de funciones

Categoría de modelo

chat_small

  • Optimizado para una implementación rápida y económica, ideal para bots de conversación, análisis de documentos y tareas especializadas.

  • Ofrece un rendimiento similar al del Mistral Small 3.2 24B con un mínimo de recursos.

  • Capaz de analizar imágenes y proporcionar información basada en el contenido visual, además del texto.

Modalidad

Image-Text to Text

Max input tokens

100’000

Idiomas

EN, ES, FR, DE, IT...

Consulta de funciones

Categoría de modelo

chat_small

Modelos de reordenación

Las mejores alternativas de código abierto compatibles para optimizar la relevancia de tus resultados de búsqueda. Perfecciona la clasificación de tus documentos, mejora la precisión de tus sistemas RAG y garantiza una recuperación de información más inteligente y contextual.

BAAI/bge-reranker-v2-m3

BAAI/bge-reranker-v2-m3

El más versátil

  • Modelo multilingüe avanzado capaz de procesar simultáneamente consultas breves, párrafos y documentos largos de hasta 8192 s de tokens

  • Combina el análisis léxico (palabras clave) y semántico (significado) para lograr una precisión de clasificación sin igual en corpus complejos

  • La solución ideal para motores de búsqueda corporativos y aplicaciones RAG que requieren una comprensión detallada del contexto

Modalidad

Text to Text

Max input tokens

8192

Idiomas

Más de 100 idiomas

Consulta de funciones

No

Tipo

Clasificación

  • Modelo multilingüe avanzado capaz de procesar simultáneamente consultas breves, párrafos y documentos largos de hasta 8192 s de tokens

  • Combina el análisis léxico (palabras clave) y semántico (significado) para lograr una precisión de clasificación sin igual en corpus complejos

  • La solución ideal para motores de búsqueda corporativos y aplicaciones RAG que requieren una comprensión detallada del contexto

Modalidad

Text to Text

Max input tokens

8192

Idiomas

Más de 100 idiomas

Consulta de funciones

No

Tipo

Clasificación

Qwen/Qwen3-Reranker-0.6B

Qwen/Qwen3-Reranker-0.6B

El más eficaz

  • Arquitectura ultraligera (600 millones de parámetros) diseñada para una inferencia con latencia muy baja y un consumo energético mínimo

  • Mantiene una alta precisión en la relevancia incluso con una ventana de contexto ampliada hasta los tokens de 32768

  • Ideal para flujos de datos en tiempo real, agentes autónomos e implementaciones a gran escala

Modalidad

Text to Text

Max input tokens

32768

Idiomas

Más de 100 idiomas

Consulta de funciones

No

Tipo

Clasificación

  • Arquitectura ultraligera (600 millones de parámetros) diseñada para una inferencia con latencia muy baja y un consumo energético mínimo

  • Mantiene una alta precisión en la relevancia incluso con una ventana de contexto ampliada hasta los tokens de 32768

  • Ideal para flujos de datos en tiempo real, agentes autónomos e implementaciones a gran escala

Modalidad

Text to Text

Max input tokens

32768

Idiomas

Más de 100 idiomas

Consulta de funciones

No

Tipo

Clasificación

Modelo de embedding

Los mejores modelos de embedding de código abierto para transformar tus datos en vectores inteligentes. Mejora la precisión de tus búsquedas, personaliza tus recomendaciones, simplifica el análisis de datos, explora los vínculos semánticos y clasifica fácilmente el texto.

Bge Multilingual Gemma2

Bge Multilingual Gemma2

La más alta calidad

  • El modelo de embedding de código abierto más potente del mercado

  • La referencia para las tareas de búsqueda semántica y búsqueda aumentada (ASR)

  • Ideal para el uso avanzado de vectores de embedding en usos diversos

  • Rendimiento excepcional, sea cual sea el idioma del texto (100+ idiomas)

Max input tokens

8192

Parámetros

9.2 B

Dimensiones

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

  • El modelo de embedding de código abierto más potente del mercado

  • La referencia para las tareas de búsqueda semántica y búsqueda aumentada (ASR)

  • Ideal para el uso avanzado de vectores de embedding en usos diversos

  • Rendimiento excepcional, sea cual sea el idioma del texto (100+ idiomas)

Max input tokens

8192

Parámetros

9.2 B

Dimensiones

3584

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

All MiniLM L12 v2

All MiniLM L12 v2

La mejor relación calidad-precio

  • Este modelo es el resultado de un trabajo comunitario basado en un modelo publicado por Microsoft.

  • Excelente relación calidad-precio, ideal para la creación de prototipos y tareas sencillas con recursos limitados

  • Buen rendimiento en tareas relativamente sencillas, sea cual sea el idioma del texto

  • Velocidad extrema para indexar enormes bases de datos o tratamientos en tiempo real

  • Alta eficiencia energética para reducir el impacto medioambiental

Max input tokens

512

Parámetros

33 M

Dimensiones

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

  • Este modelo es el resultado de un trabajo comunitario basado en un modelo publicado por Microsoft.

  • Excelente relación calidad-precio, ideal para la creación de prototipos y tareas sencillas con recursos limitados

  • Buen rendimiento en tareas relativamente sencillas, sea cual sea el idioma del texto

  • Velocidad extrema para indexar enormes bases de datos o tratamientos en tiempo real

  • Alta eficiencia energética para reducir el impacto medioambiental

Max input tokens

512

Parámetros

33 M

Dimensiones

384

Idiomas

EN, ES, FR, DE, IT...

Tipo

Texto

Reconocimiento de voz

La mejor IA open source para transcribir archivos de audio a texto o generar voces humanas realistas.

Whisper V3

Whisper V3

Para las transcripciones complejas

  • Modelo entrenado con más de 1 millón de horas de datos

  • Los errores de transcripción se reducen hasta un 20% en comparación con Whisper V2

  • Mejor gestión de acentos, ruido de fondo y discursos complejos (por ejemplo, llamadas o videoconferencias)

  • Soporte multilingüe mejorado y traducción de transcripciones a idiomas distintos del inglés

Tamaño máximo de un archivo

25 MB

Formatos admitidos

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

  • Modelo entrenado con más de 1 millón de horas de datos

  • Los errores de transcripción se reducen hasta un 20% en comparación con Whisper V2

  • Mejor gestión de acentos, ruido de fondo y discursos complejos (por ejemplo, llamadas o videoconferencias)

  • Soporte multilingüe mejorado y traducción de transcripciones a idiomas distintos del inglés

Tamaño máximo de un archivo

25 MB

Formatos admitidos

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Generación y procesamiento de imágenes

Las mejores alternativas open source a Midjourney, Microsoft Copilot Designer o Gemini para generar, fusionar o interpretar imágenes.

Photomaker V2

Photomaker V2

Ideal para generar imágenes

  • La mejor combinación de calidad y velocidad en la creación de imágenes con IA generativa

  • Generación rápida de imágenes fotorrealistas en 1, 2, 4 u 8 pasos a partir de prompts

  • Funciona por destilación, lo que aumenta la eficiencia energética garantizando una excelente calidad

  • Optimizado para el inglés, con un conocimiento limitado de otros idiomas (FR, DE, ES, IT...)

Max input tokens

77

Max output image

5

Idiomas

EN

Resolución máxima

1024x1024, 1792x1024, 1024x1792

  • La mejor combinación de calidad y velocidad en la creación de imágenes con IA generativa

  • Generación rápida de imágenes fotorrealistas en 1, 2, 4 u 8 pasos a partir de prompts

  • Funciona por destilación, lo que aumenta la eficiencia energética garantizando una excelente calidad

  • Optimizado para el inglés, con un conocimiento limitado de otros idiomas (FR, DE, ES, IT...)

Max input tokens

77

Max output image

5

Idiomas

EN

Resolución máxima

1024x1024, 1792x1024, 1024x1792

Flux schnell

Flux schnell

Ideal para modificar y fusionar retratos de personas

  • Creación de fotos en varios estilos a partir de una o más fotos de perfil

  • Potente y flexible: recontextualización, coloración, cambio de edad y género, mezcla de identidades...

Max input tokens

77

Max input image

6

Max output image

5

Idiomas

EN

Resolución máxima

1024x1024, 1792x1024, 1024x1792

  • Creación de fotos en varios estilos a partir de una o más fotos de perfil

  • Potente y flexible: recontextualización, coloración, cambio de edad y género, mezcla de identidades...

Max input tokens

77

Max input image

6

Max output image

5

Idiomas

EN

Resolución máxima

1024x1024, 1792x1024, 1024x1792