Connect with us

Notizie

Microsoft presenta Phi-3, un modello linguistico ridotto e conveniente

Microsoft presenta Phi-3, un modello linguistico ridotto e conveniente

Microsoft ha presentato Phi-3, una nuova famiglia di Small Language Models (SLM). Questi modelli di intelligenza artificiale possono aiutare gli sviluppatori con casi d’uso specifici, che non richiedono tutto il potenziale dei modelli linguistici di grandi dimensioni (LLM). Gli SLM Phi-3 vengono addestrati su dati simili di alta qualità su cui sono stati addestrati i modelli AI di fascia alta di Microsoft. Ecco tutto quello che devi sapere

Phi-3 SLM di Microsoft: dettagli

Microsoft afferma che il suo Phi-3 SLM può sovraperformare modelli di dimensioni simili offrendo benchmark migliori in termini di linguaggio, ragionamento, codifica e matematica. Possono soddisfare bene gli sviluppatori che necessitano di un utilizzo ripetitivo delle stesse funzioni, invece di utilizzare un intero LLM.

Phi-3 SLM sarà disponibile in tre sottomodelli; mini, piccolo e medio. Microsoft ha rilasciato Phi-3-mini su Azure AI Studio, Hugging Face e Ollama. Gli sviluppatori possono utilizzare SLM per funzionalità AI specifiche per il loro software. Supporta token compresi tra 4K e 128K.

Anche Phi-3-mini lo è ottimizzato per GPU Nvidia e Windows DirectML per la massima compatibilità tra vari sistemi. È ottimizzato per le istruzioni ed è quindi pronto per l’implementazione in qualsiasi software poiché può seguire le istruzioni contestualmente. Può essere implementato anche localmente su dispositivi mobili senza una connessione attiva ai server cloud.

Microsoft lo farà rilasciano anche Phi-3-piccolo (7B) e Phi-3-medio (14B) nelle prossime settimane. Tutti questi modelli sono inoltre conformi agli standard di intelligenza artificiale responsabile di Microsoft.

In che modo Phi-3 differisce da GPT, Llama e Gemini?

La più grande differenza tra Phi-3 SSM e LLM come ChatGPT, Gemini e Llama è la quantità di dati che possono elaborare. La maggior parte dei modelli linguistici legacy come GPT e Llama sono progettati per applicazioni su larga scala. Sono più adatti per attività che richiedono ragionamento, logica e altri parametri simili aggiuntivi.

fi 3fi 3
Confronto di Microsoft Phi-3 con altri SLM

Tuttavia, Phi-3 è un modello linguistico ridotto che si concentra su uno specifico insieme di istruzioni. Quindi, può risparmiare tempo di elaborazione, risorse di calcolo ed energia, riducendo così i costi di gestione del modello AI. L’implementazione e il funzionamento di ciascun modello sono più o meno gli stessi, in quanto alimentano un chatbot AI per rispondere a qualsiasi domanda.

Microsoft ha affermato che gli SLM non sostituiranno gli LLM. Invece, questi modelli piccoli e mini offrono ulteriore flessibilità agli sviluppatori per avere modelli di intelligenza artificiale, appositamente curati per determinate applicazioni. La società ha inoltre affermato che gli LLM forniscono la massima precisione possibile nel ragionamento di livello avanzato. Tuttavia, un SLM attentamente addestrato è sufficiente per la maggior parte degli usi pratici nella vita quotidiana.

Phi-3 è migliore di altri modelli linguistici?

Se un determinato modello linguistico viene addestrato su dati di migliore qualità, fornirà risposte più pertinenti e accurate. Tuttavia, un utente generico non può identificare i dati esatti su cui è stato addestrato un modello di intelligenza artificiale. Quindi, è difficile notare la differenza tra i modelli di intelligenza artificiale.

L’esperienza finale dipende anche da come viene implementato un modello di intelligenza artificiale e dalle limitazioni imposte per ottimizzare il consumo di risorse.

Ad esempio, la versione gratuita di ChatGPT è basata su GPT-3.5 mentre la versione a pagamento funziona sul modello avanzato GPT-4. Sebbene sia difficile distinguere tra i modelli sulla base delle specifiche, la differenza nella qualità delle risposte è enorme tra i due modelli. La versione GPT-4 ha meno restrizioni e ha accesso a set di dati superiori, offrendogli un enorme vantaggio rispetto alla versione basata su GPT-3.5 dello stesso chatbot, ChatGPT.