Il 14 aprile OpenAI ha annunciato il lancio di una nuova famiglia di modelli di intelligenza artificiale ottimizzati per eccellere nella programmazione, in una fase in cui la società sta intensificando gli sforzi per contrastare la concorrenza sempre più agguerrita da parte di aziende come Google e Anthropic.
OpenAI ha introdotto modelli di tre dimensioni diversi, a cui gli sviluppatori potranno accedere attraverso la sua interfaccia di programmazione delle applicazioni (Api) : GPT 4.1, GPT 4.1 Mini e GPT 4.1 Nano. Kevin Weil, responsabile del prodotto dell’azienda, ha dichiarato in un livestream che i nuovi sistemi superano GPT-4o, il modello più popolare di OpenAI, e per certi versi anche GPT-4.5, il più grande e potente prodotto fin qui dalla startup.
GPT-4.1 ha ottenuto un punteggio del 55% su Swe-Bench, un benchmark molto utilizzato per valutare le capacità dei modelli in grado di programmare. Il risultato supera di diversi punti percentuali superiore quello ottenuto da altri modelli OpenAI. Le nuove AI sono “bravissime a programmare, a seguire istruzioni complesse e a costruire agenti”, ha dichiarato Weil.
Negli ultimi mesi la capacità dei modelli di intelligenza artificiale di scrivere e modificare codice è progredita in modo significativo, un passo avanti che ha permesso di automatizzare in parte la creazione di prototipi software e ha migliorato le capacità dei cosiddetti agenti AI. Sia Anthropic chee Google hanno già svelato a loro volta modelli particolarmente bravi a scrivere codice.
Cosa può fare OpenAI GPT-4.1
L’arrivo di OpenAI GPT-4.1 era al centro di voci da settimane. Sembra che la società abbia testato il modello usando lo pseudonimo Alpha quasar, che ha colpito molto positivamente diversi utenti. “Quasar ha risolto tutti i problemi aperti che avevo con altri codici generati tramite llm, che erano incompleti“, ha scritto una persona su Reddit.
Tutti i nuovi modelli sono in grado di analizzare una quantità di codice otto volte superiore rispetto al passato, migliorando la propria capacità di apportare miglioramenti e correggere i bug. Ma i nuovi sistemi sono si attengono anche in maniera più accurata alle istruzioni degli utenti, riducendo la necessità di riformulare i comandi per ottenere il risultato desiderato. OpenAI ha mostrato una demo in cui GPT-4.1 costruisce diverse applicazioni, tra cui una dedicata all’apprendimento delle lingue. “Gli sviluppatori tengono molto alla programmazione e quindi abbiamo migliorato la capacità del nostro modello di scrivere codice funzionale – ha dichiarato Michelle Pokrass, che si occupa di post-formazione presso OpenAI, durante il livestream del 14 aprile –. Abbiamo fatto in modo che possa seguire diversi formati ed esplorare meglio i repository, eseguire collaudi unitari e scrivere codice“.
Fonte : Wired