Las mejores IA open source bajo demanda en un Cloud soberano
Descubre las mejores alternativas open source a ChatGPT, Gemini, Midjourney o Claude para procesar datos confidenciales en total conformidad con la legislación europea y suiza.
LLM↓
Embeddings↓
Audio↓
Imagen↓
Grandes modelos de lenguaje (LLM)
Las mejores alternativas open source a ChatGPT, Gemini y Microsoft Copilot para interactuar, analizar y generar contenido con IA.
Qwen/Qwen3.5-122B-A10B-FP8
El más potente
Beta
- ●
Diseñado para tareas complejas que requieren una amplia perspectiva contextual y una mayor precisión en el razonamiento lógico.
- ●
Arquitectura optimizada para una inferencia más rápida y un menor consumo energético, lo que libera importantes recursos de cálculo.
- ●
Entrenado con millones de agentes y tareas de complejidad creciente para ofrecer una gran adaptabilidad al mundo real.
Modalidad
Image-Text to Text
Max input tokens
200’000
Idiomas
Más de 100 idiomas
Consulta de funciones
Sí
Categoría de modelo
chat_large
- ●
Diseñado para tareas complejas que requieren una amplia perspectiva contextual y una mayor precisión en el razonamiento lógico.
- ●
Arquitectura optimizada para una inferencia más rápida y un menor consumo energético, lo que libera importantes recursos de cálculo.
- ●
Entrenado con millones de agentes y tareas de complejidad creciente para ofrecer una gran adaptabilidad al mundo real.
Modalidad
Image-Text to Text
Max input tokens
200’000
Idiomas
Más de 100 idiomas
Consulta de funciones
Sí
Categoría de modelo
chat_large
Apertus-70B-Instruct-2509
El más ético
Beta
- ●
Ideal para servicios multilingües, autoridades públicas y equipos de I+D que buscan un modelo fiable y adaptable
- ●
Datos y métodos documentados para una transparencia sin precedentes
- ●
Cumple con la Ley de IA y protege tanto la privacidad como la propiedad intelectual
- ●
Una versión 70B con un rendimiento comparable al de los líderes actuales del mercado
Modalidad
Text to Text
Max input tokens
65’536
Idiomas
Más de 100 idiomas
Consulta de funciones
No
Categoría de modelo
chat_medium
- ●
Ideal para servicios multilingües, autoridades públicas y equipos de I+D que buscan un modelo fiable y adaptable
- ●
Datos y métodos documentados para una transparencia sin precedentes
- ●
Cumple con la Ley de IA y protege tanto la privacidad como la propiedad intelectual
- ●
Una versión 70B con un rendimiento comparable al de los líderes actuales del mercado
Modalidad
Text to Text
Max input tokens
65’536
Idiomas
Más de 100 idiomas
Consulta de funciones
No
Categoría de modelo
chat_medium
google/gemma-4-31B-it
El equilibrio perfecto
Beta
- ●
El equilibrio perfecto entre rapidez y potencia, diseñado para destacar en el razonamiento lógico, el análisis documental en profundidad y la generación de código fiable.
- ●
Aprovecha una arquitectura de vanguardia para ofrecer una comprensión detallada de contextos amplios e instrucciones complejas.
- ●
Ideal para chatbots avanzados y flujos de trabajo empresariales que requieren una gran versatilidad sin sacrificar la velocidad de ejecución.
Modalidad
Texto a texto (optimizado para la enseñanza)
Max input tokens
100’000
Idiomas
Más de 140 idiomas
Consulta de funciones
Sí (nativo y optimizado)
Categoría de modelo
chat_medium
- ●
El equilibrio perfecto entre rapidez y potencia, diseñado para destacar en el razonamiento lógico, el análisis documental en profundidad y la generación de código fiable.
- ●
Aprovecha una arquitectura de vanguardia para ofrecer una comprensión detallada de contextos amplios e instrucciones complejas.
- ●
Ideal para chatbots avanzados y flujos de trabajo empresariales que requieren una gran versatilidad sin sacrificar la velocidad de ejecución.
Modalidad
Texto a texto (optimizado para la enseñanza)
Max input tokens
100’000
Idiomas
Más de 140 idiomas
Consulta de funciones
Sí (nativo y optimizado)
Categoría de modelo
chat_medium
moonshotai/Kimi-K2.6
El más potente para el vibe coding
Beta
- ●
Multimodal nativo: convierte texto, imágenes o maquetas en código totalmente funcional.
- ●
Diseñado para el desarrollo a gran escala: incorpora una ventana de contexto ampliada de hasta 256k tokens para gestionar proyectos complejos
- ●
Optimizado para el vibe coding: rápido, fluido y creativo, pensado para desarrolladores y diseñadores de productos
- ●
Compatible con flujos de trabajo de agentes: automatiza el análisis, la generación de código y su ejecución de principio a fin
Modalidad
Image-Text to Text
Max input tokens
256’000
Idiomas
Multilingüe
Consulta de funciones
Sí
Categoría de modelo
code
- ●
Multimodal nativo: convierte texto, imágenes o maquetas en código totalmente funcional.
- ●
Diseñado para el desarrollo a gran escala: incorpora una ventana de contexto ampliada de hasta 256k tokens para gestionar proyectos complejos
- ●
Optimizado para el vibe coding: rápido, fluido y creativo, pensado para desarrolladores y diseñadores de productos
- ●
Compatible con flujos de trabajo de agentes: automatiza el análisis, la generación de código y su ejecución de principio a fin
Modalidad
Image-Text to Text
Max input tokens
256’000
Idiomas
Multilingüe
Consulta de funciones
Sí
Categoría de modelo
code
mistralai/Ministral-3-14B-Instruct-2512
El más versátil
Beta
- ●
Optimizado para una implementación rápida y económica, ideal para bots de conversación, análisis de documentos y tareas especializadas.
- ●
Ofrece un rendimiento similar al del Mistral Small 3.2 24B con un mínimo de recursos.
- ●
Capaz de analizar imágenes y proporcionar información basada en el contenido visual, además del texto.
Modalidad
Image-Text to Text
Max input tokens
100’000
Idiomas
EN, ES, FR, DE, IT...
Consulta de funciones
Sí
Categoría de modelo
chat_small
- ●
Optimizado para una implementación rápida y económica, ideal para bots de conversación, análisis de documentos y tareas especializadas.
- ●
Ofrece un rendimiento similar al del Mistral Small 3.2 24B con un mínimo de recursos.
- ●
Capaz de analizar imágenes y proporcionar información basada en el contenido visual, además del texto.
Modalidad
Image-Text to Text
Max input tokens
100’000
Idiomas
EN, ES, FR, DE, IT...
Consulta de funciones
Sí
Categoría de modelo
chat_small
Modelos de reordenación
Las mejores alternativas de código abierto compatibles para optimizar la relevancia de tus resultados de búsqueda. Perfecciona la clasificación de tus documentos, mejora la precisión de tus sistemas RAG y garantiza una recuperación de información más inteligente y contextual.
BAAI/bge-reranker-v2-m3
El más versátil
- ●
Modelo multilingüe avanzado capaz de procesar simultáneamente consultas breves, párrafos y documentos largos de hasta 8192 s de tokens
- ●
Combina el análisis léxico (palabras clave) y semántico (significado) para lograr una precisión de clasificación sin igual en corpus complejos
- ●
La solución ideal para motores de búsqueda corporativos y aplicaciones RAG que requieren una comprensión detallada del contexto
Modalidad
Text to Text
Max input tokens
8192
Idiomas
Más de 100 idiomas
Consulta de funciones
No
Tipo
Clasificación
- ●
Modelo multilingüe avanzado capaz de procesar simultáneamente consultas breves, párrafos y documentos largos de hasta 8192 s de tokens
- ●
Combina el análisis léxico (palabras clave) y semántico (significado) para lograr una precisión de clasificación sin igual en corpus complejos
- ●
La solución ideal para motores de búsqueda corporativos y aplicaciones RAG que requieren una comprensión detallada del contexto
Modalidad
Text to Text
Max input tokens
8192
Idiomas
Más de 100 idiomas
Consulta de funciones
No
Tipo
Clasificación
Qwen/Qwen3-Reranker-0.6B
El más eficaz
- ●
Arquitectura ultraligera (600 millones de parámetros) diseñada para una inferencia con latencia muy baja y un consumo energético mínimo
- ●
Mantiene una alta precisión en la relevancia incluso con una ventana de contexto ampliada hasta los tokens de 32768
- ●
Ideal para flujos de datos en tiempo real, agentes autónomos e implementaciones a gran escala
Modalidad
Text to Text
Max input tokens
32768
Idiomas
Más de 100 idiomas
Consulta de funciones
No
Tipo
Clasificación
- ●
Arquitectura ultraligera (600 millones de parámetros) diseñada para una inferencia con latencia muy baja y un consumo energético mínimo
- ●
Mantiene una alta precisión en la relevancia incluso con una ventana de contexto ampliada hasta los tokens de 32768
- ●
Ideal para flujos de datos en tiempo real, agentes autónomos e implementaciones a gran escala
Modalidad
Text to Text
Max input tokens
32768
Idiomas
Más de 100 idiomas
Consulta de funciones
No
Tipo
Clasificación
Modelo de embedding
Los mejores modelos de embedding de código abierto para transformar tus datos en vectores inteligentes. Mejora la precisión de tus búsquedas, personaliza tus recomendaciones, simplifica el análisis de datos, explora los vínculos semánticos y clasifica fácilmente el texto.
Bge Multilingual Gemma2
La más alta calidad
- ●
El modelo de embedding de código abierto más potente del mercado
- ●
La referencia para las tareas de búsqueda semántica y búsqueda aumentada (ASR)
- ●
Ideal para el uso avanzado de vectores de embedding en usos diversos
- ●
Rendimiento excepcional, sea cual sea el idioma del texto (100+ idiomas)
Max input tokens
8192
Parámetros
9.2 B
Dimensiones
3584
Idiomas
EN, ES, FR, DE, IT...
Tipo
Texto
- ●
El modelo de embedding de código abierto más potente del mercado
- ●
La referencia para las tareas de búsqueda semántica y búsqueda aumentada (ASR)
- ●
Ideal para el uso avanzado de vectores de embedding en usos diversos
- ●
Rendimiento excepcional, sea cual sea el idioma del texto (100+ idiomas)
Max input tokens
8192
Parámetros
9.2 B
Dimensiones
3584
Idiomas
EN, ES, FR, DE, IT...
Tipo
Texto
All MiniLM L12 v2
La mejor relación calidad-precio
- ●
Este modelo es el resultado de un trabajo comunitario basado en un modelo publicado por Microsoft.
- ●
Excelente relación calidad-precio, ideal para la creación de prototipos y tareas sencillas con recursos limitados
- ●
Buen rendimiento en tareas relativamente sencillas, sea cual sea el idioma del texto
- ●
Velocidad extrema para indexar enormes bases de datos o tratamientos en tiempo real
- ●
Alta eficiencia energética para reducir el impacto medioambiental
Max input tokens
512
Parámetros
33 M
Dimensiones
384
Idiomas
EN, ES, FR, DE, IT...
Tipo
Texto
- ●
Este modelo es el resultado de un trabajo comunitario basado en un modelo publicado por Microsoft.
- ●
Excelente relación calidad-precio, ideal para la creación de prototipos y tareas sencillas con recursos limitados
- ●
Buen rendimiento en tareas relativamente sencillas, sea cual sea el idioma del texto
- ●
Velocidad extrema para indexar enormes bases de datos o tratamientos en tiempo real
- ●
Alta eficiencia energética para reducir el impacto medioambiental
Max input tokens
512
Parámetros
33 M
Dimensiones
384
Idiomas
EN, ES, FR, DE, IT...
Tipo
Texto
Reconocimiento de voz
La mejor IA open source para transcribir archivos de audio a texto o generar voces humanas realistas.
Whisper V3
Para las transcripciones complejas
- ●
Modelo entrenado con más de 1 millón de horas de datos
- ●
Los errores de transcripción se reducen hasta un 20% en comparación con Whisper V2
- ●
Mejor gestión de acentos, ruido de fondo y discursos complejos (por ejemplo, llamadas o videoconferencias)
- ●
Soporte multilingüe mejorado y traducción de transcripciones a idiomas distintos del inglés
Tamaño máximo de un archivo
25 MB
Formatos admitidos
mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a
- ●
Modelo entrenado con más de 1 millón de horas de datos
- ●
Los errores de transcripción se reducen hasta un 20% en comparación con Whisper V2
- ●
Mejor gestión de acentos, ruido de fondo y discursos complejos (por ejemplo, llamadas o videoconferencias)
- ●
Soporte multilingüe mejorado y traducción de transcripciones a idiomas distintos del inglés
Tamaño máximo de un archivo
25 MB
Formatos admitidos
mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a
Generación y procesamiento de imágenes
Las mejores alternativas open source a Midjourney, Microsoft Copilot Designer o Gemini para generar, fusionar o interpretar imágenes.
Photomaker V2
Ideal para generar imágenes
- ●
La mejor combinación de calidad y velocidad en la creación de imágenes con IA generativa
- ●
Generación rápida de imágenes fotorrealistas en 1, 2, 4 u 8 pasos a partir de prompts
- ●
Funciona por destilación, lo que aumenta la eficiencia energética garantizando una excelente calidad
- ●
Optimizado para el inglés, con un conocimiento limitado de otros idiomas (FR, DE, ES, IT...)
Max input tokens
77
Max output image
5
Idiomas
EN
Resolución máxima
1024x1024, 1792x1024, 1024x1792
- ●
La mejor combinación de calidad y velocidad en la creación de imágenes con IA generativa
- ●
Generación rápida de imágenes fotorrealistas en 1, 2, 4 u 8 pasos a partir de prompts
- ●
Funciona por destilación, lo que aumenta la eficiencia energética garantizando una excelente calidad
- ●
Optimizado para el inglés, con un conocimiento limitado de otros idiomas (FR, DE, ES, IT...)
Max input tokens
77
Max output image
5
Idiomas
EN
Resolución máxima
1024x1024, 1792x1024, 1024x1792
Flux schnell
Ideal para modificar y fusionar retratos de personas
- ●
Creación de fotos en varios estilos a partir de una o más fotos de perfil
- ●
Potente y flexible: recontextualización, coloración, cambio de edad y género, mezcla de identidades...
Max input tokens
77
Max input image
6
Max output image
5
Idiomas
EN
Resolución máxima
1024x1024, 1792x1024, 1024x1792
- ●
Creación de fotos en varios estilos a partir de una o más fotos de perfil
- ●
Potente y flexible: recontextualización, coloración, cambio de edad y género, mezcla de identidades...
Max input tokens
77
Max input image
6
Max output image
5
Idiomas
EN
Resolución máxima
1024x1024, 1792x1024, 1024x1792


