Talk

Pythia: framework per la gestione centralizzata e validazione automatica dei prompt per applicazioni

Thursday, May 28

12:25 - 12:55
RoomTagliatelle
LanguageItalian
Audience levelIntermediate
Elevator pitch

Le applicazioni LLM hanno rivoluzionato lo sviluppo software, ma i prompt sono ancora un punto cieco: sparsi nel codice, senza versioning né test, rendono rischiosa ogni migrazione di modello. Pythia, il framework GenAI del team Advanced Analytics di Generali, standardizza l’intero ciclo di vita dei prompt: li gestisce in un repo Git dedicato con test automatici in CI/CD e li pubblica in un prompt registry centralizzato, single source of truth. Così i team possono cambiare modello LLM modificando solo la configurazione, rieseguire i test e monitorare i costi per team, progetto e business unit senza toccare il codice applicativo.

Abstract

Le applicazioni basate su Large Language Model hanno trasformato il modo in cui sviluppiamo software, ma hanno introdotto una nuova categoria di artefatti spesso trascurata: i prompt. Oggi i prompt sono tipicamente dispersi nel codice sorgente, privi di versioning strutturato, testati manualmente — o non testati affatto — e senza alcuna governance sul ciclo di vita. Questo approccio genera regressioni silenziose e rende rischiosa ogni migrazione tra versioni di modelli LLM, deprecate mediamente ogni anno. Pythia è il framework sviluppato dal team Advanced Analytics di Generali per standardizzare l’intero ciclo di vita dei prompt in applicazioni GenAI. Il framework genera un repository Git dedicato in cui i team definiscono prompt e test in modo dichiarativo. La pipeline CI/CD esegue automaticamente i test tramite Promptfoo e, solo in caso di successo, pubblica i prompt su un prompt registry centralizzato, che diventa la single source of truth sia per la gestione dei prompt che per le applicazioni che li consumano. Questo approccio rende la migrazione tra versioni di modelli LLM un’operazione a basso rischio: basta modificare la configurazione e rieseguire i test. Il framework include inoltre meccanismi nativi di cost tracking, che permettono di attribuire i costi LLM per team, progetto e business unit senza modifiche al codice applicativo.Pythia è il framework sviluppato dal team Advanced Analytics di Generali per standardizzare l’intero ciclo di vita dei prompt in applicazioni GenAI. Il framework genera un repository Git dedicato in cui i team definiscono prompt e test in modo dichiarativo. La pipeline CI/CD esegue automaticamente i test tramite Promptfoo e, solo in caso di successo, pubblica i prompt su un prompt registry centralizzato, che diventa la single source of truth sia per la gestione dei prompt che per le applicazioni che li consumano. Questo approccio rende la migrazione tra versioni di modelli LLM un’operazione a basso rischio: basta modificare la configurazione e rieseguire i test. Il framework include inoltre meccanismi nativi di cost tracking, che permettono di attribuire i costi LLM per team, progetto e business unit senza modifiche al codice applicativo.

TagsML and AI
Participant

Alessandro Riboni

Participant

Diego Paladini