OpenAI Operator: l'agente che gestisce le attività web

Commenti · 34 Visualizzazioni

OpenAI afferma che il suo nuovo agente di intelligenza artificiale, in grado di svolgere attività online, è addestrato a confrontarsi con gli utenti quando incontra puzzle CAPTCHA pensati per distinguere le persone dal software.

OpenAI ha presentato un programma di intelligenza artificiale chiamato "Operator" in grado di svolgere attività online come ordinare articoli o compilare moduli. Secondo OpenAI, l'operatore può consultare le pagine web e interagire con esse digitando, cliccando o scorrendo come farebbe una persona.

"All'operatore può essere chiesto di gestire un'ampia gamma di attività ripetitive del browser, come la compilazione di moduli, l'ordinazione di generi alimentari e persino la creazione di meme", ha affermato OpenAI in un post online.

"La possibilità di utilizzare le stesse interfacce e gli stessi strumenti con cui gli esseri umani interagiscono quotidianamente amplia l'utilità dell'intelligenza artificiale, aiutando le persone a risparmiare tempo nelle attività quotidiane e aprendo al contempo nuove opportunità di coinvolgimento per le aziende".

Un "agente" di intelligenza artificiale, l'ultima tendenza della Silicon Valley, è un aiutante digitale che dovrebbe percepire l'ambiente circostante, prendere decisioni e agire per raggiungere obiettivi specifici.

A dicembre Google ha annunciato le funzionalità degli agenti con il lancio di Gemini 2.0, il suo modello di intelligenza artificiale più avanzato fino ad oggi.

Due mesi prima, il rivale nella corsa all'intelligenza artificiale Anthropic aveva aggiunto una funzionalità di "utilizzo del computer" al suo modello di intelligenza artificiale di frontiera Claude in una fase beta pubblica sperimentale.

"Gli sviluppatori possono chiedere a Claude di usare i computer come fanno le persone, ovvero guardando uno schermo, muovendo un cursore, cliccando sui pulsanti e digitando del testo", ha affermato Anthropic in un post dell'epoca, avvisando che si trattava di un lavoro in corso.

OpenAI ha descritto Operator come uno dei suoi primi agenti di intelligenza artificiale in grado di lavorare per le persone in modo indipendente, progettato per portare a termine i compiti che gli vengono assegnati.

L'operatore è disponibile solo per gli utenti statunitensi che pagano l'abbonamento Pro al servizio OpenAI "per garantire un'implementazione sicura e iterativa", ha affermato OpenAI.

"Se incontra difficoltà o commette errori, Operator può sfruttare le sue capacità di ragionamento per autocorreggersi", ha affermato OpenAI. "Quando si blocca e ha bisogno di assistenza, il controllo viene semplicemente restituito all'utente."

Secondo OpenAI, l'operatore è addestrato a chiedere all'utente di sostituirlo in attività che richiedono l'accesso, i dati di pagamento o la risoluzione di problemi di sicurezza "CAPTCHA" volti a distinguere tra persone e software online.

"Gli utenti possono far sì che Operator esegua più attività contemporaneamente creando nuove conversazioni, ad esempio ordinando una tazza smaltata personalizzata su Etsy mentre si prenota un campeggio su Hipcamp", ha affermato OpenAI.
fonte

Commenti