Le migliori IA open source on demand in un Cloud sovrano

Scopri le migliori alternative open source a ChatGPT, Gemini, Midjourney o Claude per trattare i dati sensibili in piena conformità al diritto europeo e svizzero.

LLM↓

Embedding↓

Audio↓

Immagine↓

Grandi modelli di linguaggio (LLM)

Le migliori alternative open source a ChatGPT, Gemini e Microsoft Copilot per interagire, analizzare e generare contenuti con l’IA.

Qwen/Qwen3.5-122B-A10B-FP8

Il più efficiente

Inizia gratuitamente

Consulta la documentazione API

●
Progettato per attività complesse che richiedono una grande finestra di contesto e una maggiore precisione nel ragionamento logico.
●
Architettura ottimizzata per un'inferenza più rapida e un consumo energetico ridotto, che libera notevoli risorse di calcolo.
●
Addestrato su milioni di agenti e attività sempre più complesse per garantire una solida adattabilità al mondo reale.

Modalità

Image-Text to Text

Token di input max

200’000

Lingue

Più di 100 lingue

Chiamata di funzioni

Categoria del modello

chat_large

Inizia gratuitamente

Consulta la documentazione API

●
Progettato per attività complesse che richiedono una grande finestra di contesto e una maggiore precisione nel ragionamento logico.
●
Architettura ottimizzata per un'inferenza più rapida e un consumo energetico ridotto, che libera notevoli risorse di calcolo.
●
Addestrato su milioni di agenti e attività sempre più complesse per garantire una solida adattabilità al mondo reale.

Modalità

Image-Text to Text

Token di input max

200’000

Lingue

Più di 100 lingue

Chiamata di funzioni

Categoria del modello

chat_large

Apertus-70B-Instruct-2509

Il più etico

Beta

Inizia gratuitamente

Consulta la documentazione API

●
Ideale per i servizi multilingue, le amministrazioni e i team R&D alla ricerca di un modello affidabile e adattabile
●
Dati e metodi documentati per una trasparenza senza precedenti
●
Conforme all’AI Act e rispettoso della privacy e della proprietà intellettuale
●
Una versione 70B con prestazioni paragonabili agli attuali leader del mercato

Modalità

Text to Text

Token di input max

65’536

Lingue

Più di 100 lingue

Chiamata di funzioni

Non

Categoria del modello

chat_medium

Inizia gratuitamente

Consulta la documentazione API

●
Ideale per i servizi multilingue, le amministrazioni e i team R&D alla ricerca di un modello affidabile e adattabile
●
Dati e metodi documentati per una trasparenza senza precedenti
●
Conforme all’AI Act e rispettoso della privacy e della proprietà intellettuale
●
Una versione 70B con prestazioni paragonabili agli attuali leader del mercato

Modalità

Text to Text

Token di input max

65’536

Lingue

Più di 100 lingue

Chiamata di funzioni

Non

Categoria del modello

chat_medium

google/gemma-4-31B-it

L'equilibrio perfetto

Inizia gratuitamente

Consulta la documentazione API

●
Il compromesso ideale tra reattività e potenza, progettato per eccellere nel ragionamento logico, nell'analisi approfondita della documentazione e nella generazione del codice affidabile.
●
Sfrutta un'architettura all'avanguardia per offrire una comprensione approfondita di contesti avanzati e istruzioni complesse.
●
Ideale per agenti conversazionali avanzati e flussi di lavoro aziendali che richiedono grande versatilità senza sacrificare la velocità di esecuzione.

Modalità

Text-to-Text (ottimizzato per l'insegnamento)

Token di input max

100’000

Lingue

Più di 140 lingue

Chiamata di funzioni

Sì (nativo e ottimizzato)

Categoria del modello

chat_medium

Inizia gratuitamente

Consulta la documentazione API

●
Il compromesso ideale tra reattività e potenza, progettato per eccellere nel ragionamento logico, nell'analisi approfondita della documentazione e nella generazione del codice affidabile.
●
Sfrutta un'architettura all'avanguardia per offrire una comprensione approfondita di contesti avanzati e istruzioni complesse.
●
Ideale per agenti conversazionali avanzati e flussi di lavoro aziendali che richiedono grande versatilità senza sacrificare la velocità di esecuzione.

Modalità

Text-to-Text (ottimizzato per l'insegnamento)

Token di input max

100’000

Lingue

Più di 140 lingue

Chiamata di funzioni

Sì (nativo e ottimizzato)

Categoria del modello

chat_medium

moonshotai/Kimi-K2.6

Il più potente per il vibe coding

Beta

Inizia gratuitamente

Consulta la documentazione API

●
Multimodale nativo: converte testo, immagini o modelli in codice del tutto funzionante.
●
Concepito per lo sviluppo su larga scala: integra una finestra contestuale estesa fino a 256k token per gestire progetti complessi
●
Ottimizzato per il vibe coding: un'esperienza rapida, fluida e creativa, pensata per sviluppatori e designer di prodotti
●
Compatibile con i workflow agentici: automatizza l'analisi, la generazione del codice e la sua esecuzione end-to-end

Modalità

Image-Text to Text

Token di input max

256’000

Lingue

Multilingue

Chiamata di funzioni

Categoria del modello

code

Inizia gratuitamente

Consulta la documentazione API

●
Multimodale nativo: converte testo, immagini o modelli in codice del tutto funzionante.
●
Concepito per lo sviluppo su larga scala: integra una finestra contestuale estesa fino a 256k token per gestire progetti complessi
●
Ottimizzato per il vibe coding: un'esperienza rapida, fluida e creativa, pensata per sviluppatori e designer di prodotti
●
Compatibile con i workflow agentici: automatizza l'analisi, la generazione del codice e la sua esecuzione end-to-end

Modalità

Image-Text to Text

Token di input max

256’000

Lingue

Multilingue

Chiamata di funzioni

Categoria del modello

code

mistralai/Ministral-3-14B-Instruct-2512

Il più versatile

Beta

Inizia gratuitamente

Consulta la documentazione API

●
Ottimizzato per un'implementazione rapida ed economica, ideale per agenti conversazionali, l'analisi dei documenti e le attività specializzate.
●
Offre prestazioni paragonabili a Mistral Small 3.2 24B con un minimo di risorse.
●
In grado di analizzare le immagini e fornire informazioni basate sul contenuto visivo, oltre che sul testo.

Modalità

Image-Text to Text

Token di input max

100’000

Lingue

EN, ES, FR, DE, IT...

Chiamata di funzioni

Categoria del modello

chat_small

Inizia gratuitamente

Consulta la documentazione API

●
Ottimizzato per un'implementazione rapida ed economica, ideale per agenti conversazionali, l'analisi dei documenti e le attività specializzate.
●
Offre prestazioni paragonabili a Mistral Small 3.2 24B con un minimo di risorse.
●
In grado di analizzare le immagini e fornire informazioni basate sul contenuto visivo, oltre che sul testo.

Modalità

Image-Text to Text

Token di input max

100’000

Lingue

EN, ES, FR, DE, IT...

Chiamata di funzioni

Categoria del modello

chat_small

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

L'architettura più efficiente

Beta

Inizia gratuitamente

Consulta la documentazione API

●
Un'innovativa architettura ibrida che offre la potenza di un grande modello con la velocità e i costi di un piccolo modello.
●
Eccelle nel ragionamento logico, nella sintesi di dati complessi e nella generazione di codice strutturato grazie all'addestramento su corpus tecnici di alta qualità.
●
Ideale per implementazioni su larga scala che richiedono un equilibrio tra prestazioni all'avanguardia e controllo dei costi infrastrutturali.

Modalità

Text to Text

Token di input max

1’000’000

Lingue

EN, ES, FR, DE, IT, JP

Chiamata di funzioni

Categoria del modello

chat_medium

Inizia gratuitamente

Consulta la documentazione API

●
Un'innovativa architettura ibrida che offre la potenza di un grande modello con la velocità e i costi di un piccolo modello.
●
Eccelle nel ragionamento logico, nella sintesi di dati complessi e nella generazione di codice strutturato grazie all'addestramento su corpus tecnici di alta qualità.
●
Ideale per implementazioni su larga scala che richiedono un equilibrio tra prestazioni all'avanguardia e controllo dei costi infrastrutturali.

Modalità

Text to Text

Token di input max

1’000’000

Lingue

EN, ES, FR, DE, IT, JP

Chiamata di funzioni

Categoria del modello

chat_medium

mistralai/Mistral-Small-4-119B-2603

Il più efficace per l'istruzione e il ragionamento

Inizia gratuitamente

Consulta la documentazione API

●
Modello versatile in grado di passare facilmente dall'istruzione generale al ragionamento complesso.
●
Destinato a flussi di lavoro agentici avanzati e ad applicazioni aziendali che richiedono la massima affidabilità e coerenza.
●
Supera di gran lunga Mistral Small 3 in termini di latenza e velocità di elaborazione delle richieste.

Modalità

Image-Text to Text

Token di input max

256’000

Lingue

Multilingue

Chiamata di funzioni

Categoria del modello

chat_large

Inizia gratuitamente

Consulta la documentazione API

●
Modello versatile in grado di passare facilmente dall'istruzione generale al ragionamento complesso.
●
Destinato a flussi di lavoro agentici avanzati e ad applicazioni aziendali che richiedono la massima affidabilità e coerenza.
●
Supera di gran lunga Mistral Small 3 in termini di latenza e velocità di elaborazione delle richieste.

Modalità

Image-Text to Text

Token di input max

256’000

Lingue

Multilingue

Chiamata di funzioni

Categoria del modello

chat_large

Qwen/Qwen3.5-397B-A17B-FP8

Il più potente

Beta

Inizia gratuitamente

Consulta la documentazione API

●
Architettura MoE all'avanguardia progettata per attività di estrema complessità che offre una precisione senza pari nel ragionamento scientifico, nella pianificazione in più fasi e nell'esecuzione degli strumenti.
●
Beneficia di una knowledge base mondiale di notevole entità per una migliore padronanza delle conoscenze generali avanzate e della generazione di codice complesso.
●
Supera i modelli precedenti nei benchmark di intelligenza rigorosa.

Modalità

Image-Text to Text

Token di input max

200’000

Lingue

Oltre 100 lingue

Chiamata di funzioni

Categoria del modello

chat_large

Inizia gratuitamente

Consulta la documentazione API

●
Architettura MoE all'avanguardia progettata per attività di estrema complessità che offre una precisione senza pari nel ragionamento scientifico, nella pianificazione in più fasi e nell'esecuzione degli strumenti.
●
Beneficia di una knowledge base mondiale di notevole entità per una migliore padronanza delle conoscenze generali avanzate e della generazione di codice complesso.
●
Supera i modelli precedenti nei benchmark di intelligenza rigorosa.

Modalità

Image-Text to Text

Token di input max

200’000

Lingue

Oltre 100 lingue

Chiamata di funzioni

Categoria del modello

chat_large

Modelli di riclassificazione

Le migliori alternative open source compatibili per ottimizzare la pertinenza dei tuoi risultati di ricerca. Ottimizza la classificazione dei tuoi documenti, migliora la precisione dei tuoi sistemi RAG e garantisci un recupero delle informazioni più intelligente e contestuale.

BAAI/bge-reranker-v2-m3

Il più versatile

Beta

Inizia gratuitamente

Consulta la documentazione API

●
Modello multilingue avanzato in grado di elaborare contemporaneamente richieste brevi, paragrafi e documenti lunghi fino a 8192 token
●
Combina l'analisi lessicale (parole chiave) e quella semantica (significato) per una precisione di classificazione senza pari su corpus complessi
●
La soluzione ideale per i motori di ricerca aziendali e le applicazioni RAG che richiedono una profonda comprensione del contesto

Modalità

Text to Text

Token di input max

8192

Lingue

Oltre 100 lingue

Chiamata di funzioni

Non

Tipo

Posizione

Inizia gratuitamente

Consulta la documentazione API

●
Modello multilingue avanzato in grado di elaborare contemporaneamente richieste brevi, paragrafi e documenti lunghi fino a 8192 token
●
Combina l'analisi lessicale (parole chiave) e quella semantica (significato) per una precisione di classificazione senza pari su corpus complessi
●
La soluzione ideale per i motori di ricerca aziendali e le applicazioni RAG che richiedono una profonda comprensione del contesto

Modalità

Text to Text

Token di input max

8192

Lingue

Oltre 100 lingue

Chiamata di funzioni

Non

Tipo

Posizione

Qwen/Qwen3-Reranker-0.6B

Il più efficace

Beta

Inizia gratuitamente

Consulta la documentazione API

●
Architettura ultraleggera (0,6 miliardi di parametri) progettata per un'inferenza a bassissima latenza e un consumo energetico minimo
●
Mantiene un'elevata precisione di pertinenza anche con una finestra di contesto estesa fino a 32768 token
●
Ideale per flussi di dati in tempo reale, agenti autonomi e implementazioni su larga scala

Modalità

Text to Text

Token di input max

32768

Lingue

Oltre 100 lingue

Chiamata di funzioni

Non

Tipo

Posizione

Inizia gratuitamente

Consulta la documentazione API

●
Architettura ultraleggera (0,6 miliardi di parametri) progettata per un'inferenza a bassissima latenza e un consumo energetico minimo
●
Mantiene un'elevata precisione di pertinenza anche con una finestra di contesto estesa fino a 32768 token
●
Ideale per flussi di dati in tempo reale, agenti autonomi e implementazioni su larga scala

Modalità

Text to Text

Token di input max

32768

Lingue

Oltre 100 lingue

Chiamata di funzioni

Non

Tipo

Posizione

Modelli di embedding

I migliori modelli di embedding open source per trasformare i tuoi dati in vettori intelligenti. Migliora l'accuratezza delle tue ricerche, personalizza le tue raccomandazioni, semplifica l'analisi dei dati, esplora i collegamenti semantici e classifica facilmente il testo.

Bge Multilingual Gemma2

Il più qualitativo

Inizia gratuitamente

Consulta la documentazione API

●
Il modello di embedding open source più potente del mercato
●
Il riferimento per le attività di ricerca semantica e di ricerca aumentata (RAG)
●
Ideale per un uso avanzato dei vettori di embedding in vari casi di utilizzo
●
Prestazioni eccezionali, indipendentemente dalla lingua del testo (100+ lingue)

Token di input max

8192

Parametri

9.2 B

Dimensioni

3584

Lingue

EN, ES, FR, DE, IT...

Tipo

Testo

Inizia gratuitamente

Consulta la documentazione API

●
Il modello di embedding open source più potente del mercato
●
Il riferimento per le attività di ricerca semantica e di ricerca aumentata (RAG)
●
Ideale per un uso avanzato dei vettori di embedding in vari casi di utilizzo
●
Prestazioni eccezionali, indipendentemente dalla lingua del testo (100+ lingue)

Token di input max

8192

Parametri

9.2 B

Dimensioni

3584

Lingue

EN, ES, FR, DE, IT...

Tipo

Testo

All MiniLM L12 v2

Il miglior rapporto qualità-prezzo

Inizia gratuitamente

Consulta la documentazione API

●
Questo modello è il risultato di un lavoro congiunto basato su un modello pubblicato da Microsoft
●
Ottimo rapporto qualità-prezzo, ideale per la prototipazione e per attività semplici con risorse limitate
●
Prestazioni interessanti per attività relativamente semplici, indipendentemente dalla lingua del testo
●
Estrema velocità per l'indicizzazione di enormi database o per l'elaborazione in tempo reale
●
Alta efficienza energetica per ridurre l'impatto ambientale

Token di input max

512

Parametri

33 M

Dimensioni

384

Lingue

EN, ES, FR, DE, IT...

Tipo

Testo

Inizia gratuitamente

Consulta la documentazione API

●
Questo modello è il risultato di un lavoro congiunto basato su un modello pubblicato da Microsoft
●
Ottimo rapporto qualità-prezzo, ideale per la prototipazione e per attività semplici con risorse limitate
●
Prestazioni interessanti per attività relativamente semplici, indipendentemente dalla lingua del testo
●
Estrema velocità per l'indicizzazione di enormi database o per l'elaborazione in tempo reale
●
Alta efficienza energetica per ridurre l'impatto ambientale

Token di input max

512

Parametri

33 M

Dimensioni

384

Lingue

EN, ES, FR, DE, IT...

Tipo

Testo

Riconoscimento vocale

Le migliori IA open source per trascrivere file audio in testo o creare voci umane realistiche.

Whisper V3

Per trascrizioni complesse

Inizia gratuitamente

Consulta la documentazione API

●
Modello addestrato su oltre 1 milione di ore di dati
●
Riduzione degli errori di trascrizione fino al 20% rispetto a Whisper V2
●
Migliore gestione degli accenti, del rumore di fondo e dei discorsi complessi (ad esempio, chiamate o videoconferenze)
●
Supporto multilingue migliorato e traduzione di trascrizioni in lingue diverse dall'inglese

Dimensione massima di un file

25 MB

Formati supportati

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Inizia gratuitamente

Consulta la documentazione API

●
Modello addestrato su oltre 1 milione di ore di dati
●
Riduzione degli errori di trascrizione fino al 20% rispetto a Whisper V2
●
Migliore gestione degli accenti, del rumore di fondo e dei discorsi complessi (ad esempio, chiamate o videoconferenze)
●
Supporto multilingue migliorato e traduzione di trascrizioni in lingue diverse dall'inglese

Dimensione massima di un file

25 MB

Formati supportati

mp3, mp4, aac, wav, flac, ogg, opus, wma, m4a

Creazione ed elaborazione di immagini

Le migliori alternative open source a Midjourney, Microsoft Copilot Designer o Gemini per creare, unire o interpretare immagini.

Photomaker V2

Ideale per creare immagini

Inizia gratuitamente

Consulta la documentazione API

●
La migliore combinazione di qualità e velocità nella creazione di immagini tramite IA generativa
●
Creazione rapida di immagini fotorealistiche in 1, 2, 4 o 8 passaggi da prompt
●
Funziona per distillazione, che aumenta l’efficienza energetica garantendo una qualità eccellente
●
Ottimizzato per l’inglese, con conoscenze limitate delle altre lingue (FR, DE, ES, IT…)

Token di input max

Immagine di output max

Lingue

Risoluzione massima

1024x1024, 1792x1024, 1024x1792

Inizia gratuitamente

Consulta la documentazione API

●
La migliore combinazione di qualità e velocità nella creazione di immagini tramite IA generativa
●
Creazione rapida di immagini fotorealistiche in 1, 2, 4 o 8 passaggi da prompt
●
Funziona per distillazione, che aumenta l’efficienza energetica garantendo una qualità eccellente
●
Ottimizzato per l’inglese, con conoscenze limitate delle altre lingue (FR, DE, ES, IT…)

Token di input max

Immagine di output max

Lingue

Risoluzione massima

1024x1024, 1792x1024, 1024x1792

Flux schnell

Ideale per modificare e unire ritratti di persone

Inizia gratuitamente

Consulta la documentazione API

●
Creazione di foto in più stili da una o più foto del profilo
●
Potente e flessibile: ricontestualizzazione, colorazione, cambiamento di età e genere, mix di identità...

Token di input max

Immagine di input max

Immagine di output max

Lingue

Risoluzione massima

1024x1024, 1792x1024, 1024x1792

Inizia gratuitamente

Consulta la documentazione API

●
Creazione di foto in più stili da una o più foto del profilo
●
Potente e flessibile: ricontestualizzazione, colorazione, cambiamento di età e genere, mix di identità...

Token di input max

Immagine di input max

Immagine di output max

Lingue

Risoluzione massima

1024x1024, 1792x1024, 1024x1792