Due ricercatori di PeopleTec, un'azienda tecnologica con sede in Alabama, hanno sviluppato un modello computazionale in grado di creare ricette complesse contenenti ingredienti che gli utenti hanno a disposizione, dopo aver analizzato le immagini di ciò che si trova all'interno del loro frigorifero. Il loro approccio, presentato in un documento pre-pubblicato su arXiv, si basa su modelli in grado di identificare oggetti nelle immagini e GPT-4, il rinomato modello di linguaggio di grandi dimensioni (LLM) sviluppato da OpenAI.
I modelli di intelligenza artificiale (IA) si sono già fatti strada in una vasta gamma di contesti del mondo reale, aiutando le persone ad affrontare i problemi quotidiani in modo più rapido ed efficiente. Ora, per la prima volta, uno chef o un cuoco IA sembra non solo possibile, ma offre alcune funzionalità avanzate per aumentare le librerie di ricette umane in modi pragmatici, dicono i ricercatori.
Nel loro esperimento hanno generato un ricettario di 100 pagine con i trenta migliori ingredienti utilizzando oltre 2000 immagini del frigorifero come elenchi di inizializzazione, tempo di preparazione, restrizioni dietetiche, dimensioni delle porzioni e programmi di pasti multipli.
L'idea di base del loro lavoro era combinare cibi crudi e ingredienti della ricetta utilizzando l'analisi delle immagini, quindi chiedere a un potente modello linguistico di costruire una ricetta di cucina plausibile, inclusi il titolo, la proporzione e i passaggi previsti. Per ottenere la generazione di ricette dalle immagini, hanno utilizzato in modo specifico interfacce di programmazione delle applicazioni (API) di modelli per l'analisi delle immagini, nonché il generatore di testo alla base di ChatGPT.
"Uno degli interessanti colpi di scena di questo approccio linguaggio-immagine è quello di vincolare il generatore di stili di ricetta in modi diversi e spesso complessi basati, ad esempio, sulla riduzione al minimo del costo del pasto, sulla modifica delle dimensioni delle porzioni o sull'adattamento a restrizioni dietetiche. Le parti difficili di questo ricadono davvero su quanto sia buono il modello linguistico, che ovviamente ha fatto passi da gigante solo negli ultimi mesi", spiega uno dei ricercatori.
In futuro, l'approccio computazionale introdotto da team potrebbe essere integrato in un'applicazione per smartphone o in altri strumenti software progettati per ispirare cuochi umani sia dilettanti che esperti. Allo stesso tempo, potrebbe anche ispirare altri team in tutto il mondo ad applicare LLM e altri modelli di intelligenza artificiale per attività di generazione di ricette o altri problemi creativi.