Connect with us

Notizie

Apple rilascia 4 nuovi modelli di intelligenza artificiale open source che vengono eseguiti sul dispositivo

Apple rilascia 4 nuovi modelli di intelligenza artificiale open source che vengono eseguiti sul dispositivo

Apple non condivide molto sui suoi piani di intelligenza artificiale generativa. Ora, con il rilascio di una famiglia di modelli linguistici di grandi dimensioni open source, sembra che il gigante tecnologico di Cupertino voglia far funzionare l’intelligenza artificiale localmente sui dispositivi Apple. Gli LLM di Apple, che l’azienda chiama OpenELM (Open-source Efficient Language Models), sono progettati per essere eseguiti sul dispositivo anziché su server cloud. Questi LLM sono disponibili su Hub per il viso abbracciatouna piattaforma centrale per la condivisione di codice e set di dati AI.

Durante i test, Apple osserva che OpenELM offre prestazioni simili a quelle degli altri modelli di linguaggio aperto, ma il primo ha meno dati di addestramento.

Per gentile concessione dell’immagine: viso abbracciato

Come mostrato nel carta bianca, ci sono otto modelli OpenELM in totale. Quattro modelli sono stati pre-addestrati utilizzando la libreria CoreNet, mentre gli altri quattro sono modelli ottimizzati per le istruzioni. Per migliorare la precisione e l’efficienza complessive, Apple utilizza una strategia di ridimensionamento a livello in questi LLM open source.

“A tal fine, rilasciamo OpenELM, un modello di linguaggio aperto all’avanguardia. OpenELM utilizza una strategia di ridimensionamento a livello per allocare in modo efficiente i parametri all’interno di ciascun livello del modello del trasformatore, garantendo una maggiore precisione. Ad esempio, con un budget di parametri di circa un miliardo di parametri, OpenELM mostra un miglioramento della precisione del 2,36% rispetto a OLMo richiedendo al tempo stesso il doppio dei token di pre-addestramento.“- Mela

Apple non si è limitata a fornire il modello addestrato finale. Piuttosto, ha anche fornito codice, registri di addestramento e molteplici iterazioni del modello. I ricercatori del progetto sono ottimisti sul fatto che accelererà i progressi e fornirà “risultati affidabili” nel campo dell’intelligenza artificiale con linguaggio naturale.

“Diversamente dalle pratiche precedenti che fornivano solo pesi del modello e codice di inferenza e pre-addestramento su set di dati privati, la nostra versione include il quadro completo per la formazione e la valutazione del modello linguistico su set di dati disponibili pubblicamente, inclusi registri di addestramento, checkpoint multipli e pre -configurazioni di allenamento. Rilasciamo anche il codice per convertire i modelli nella libreria MLX per l’inferenza e la messa a punto sui dispositivi Apple. Questa versione completa mira a potenziare e rafforzare la comunità di ricerca aperta, aprendo la strada a futuri sforzi di ricerca aperta”.– Mela

Apple ha inoltre aggiunto che il rilascio dei modelli OpenELM “potenzia e arricchisce la comunità di ricerca aperta” con modelli linguistici all’avanguardia. I modelli open source consentono ai ricercatori di esplorare potenziali rischi, dati e pregiudizi inerenti ai modelli. I modelli sono pronti per l’uso da parte degli sviluppatori. Possono utilizzare questi LLM open source così come sono o apportare le modifiche richieste.

Già a febbraio, il CEO di Apple, Tim Cook, aveva anticipato che le funzionalità di intelligenza artificiale generativa sarebbero arrivate sui dispositivi Apple entro la fine dell’anno. Qualche tempo dopo, ha ribadito che l’azienda sta lavorando duramente per offrire esperienze di intelligenza artificiale rivoluzionarie.

Bene, Apple ha già rilasciato diversi altri modelli di intelligenza artificiale in precedenza. Sfortunatamente, non ha ancora portato le funzionalità di intelligenza artificiale sui suoi dispositivi. Detto questo, si prevede che il prossimo iOS 18 includa una suite di nuove funzionalità AI e la versione OpenELM potrebbe essere l’ultima parte della preparazione dietro le quinte di Apple.

Di recente, Mark Gurman ha anche riferito che le funzionalità AI di iOS 18 saranno in gran parte alimentate da un modello linguistico di grandi dimensioni sul dispositivo per vantaggi in termini di privacy e velocità. Bene, sapremo tutto quando Apple annuncerà iOS 18 e altri aggiornamenti software al WWDC del 10 giugno.