La ricerca non è più solo una questione di keyword, precisione e trasparenza delle fonti. Perché ci vengono mostrati certi risultati e non altri? Esploriamo insieme il funzionamento della ricerca, implementandola in pratica su una KB personale, sperimentando diversi pattern in un server MCP.
Oggi deleghiamo la ricerca e l’organizzazione dei nostri dati al cloud, spesso sacrificando la privacy in favore dell’utilità. Questo compromesso non riguarda solo la riservatezza: i sistemi proprietari tendono a essere opachi. Come lavorano gli algoritmi che decidono cosa è “rilevante” per noi? Quali logiche seguono e perché? Quali informazioni hanno a disposizione e quali no?
In questo workshop metteremo “le mani in pasta” nella ricerca moderna per riappropriarci dei nostri dati. Partendo da una Knowledge Base locale in Markdown, costruiremo un sistema di ricerca trasparente, modulare e local-first, creando tool MCP con Python.
Cosa faremo Esploreremo diversi approcci alla ricerca (keyword, BM25, embeddings) valutando pro e contro di ciascuno in base al caso d’uso. Implementeremo un endpoint MCP, scelto per la sua capacità di interfacciarsi in modo standardizzato con qualsiasi sistema (LLM locali, agenti o client personalizzati), raffinando via via l’intelligenza del recupero informazioni.
Programma dettagliato (120 minuti)
Requisiti per i partecipanti Per trarre il massimo dal workshop, è richiesta una buona conoscenza di Python e familiarità con Git e Docker.
Tool necessari:
I work on changing the way people find and organize suppliers at soource.com. I bridge the gap between ‘old school’ Data Science techniques and the new world of Retrieval and LLMs.
Beyond the screen, I’m a reader and outdoor enthusiast, though these days most of my steps are earned chasing after my two toddlers.