L’Intelligenza Artificiale (IA) e il Machine Learning (ML) stanno diventando strumenti sempre più centrali nella ricerca scientifica, ma la loro adozione solleva sfide significative in termini di trasparenza, documentazione e riutilizzo
Sebbene i principi FAIR (Findable, Accessible, Interoperable, Reusable) siano ormai ampiamente riconosciuti per i dati della ricerca e, più recentemente, anche per il software scientifico, la loro applicazione ai modelli di IA è ancora in fase iniziale e priva di linee guida consolidate.
L’Istituto Italiano di Tecnologia (IIT), in qualità di ente affiliato del progetto europeo Skills4EOSC coordinato dal GARR, ha recentemente completato uno studio Delphi con l’obiettivo di costruire un consenso tra esperti su un insieme di pratiche FAIR specificamente pensate per i modelli di ML/AI.
Uno studio collaborativo e strutturato
Lo studio Delphi, un metodo strutturato ideato per raggiungere consenso attraverso un confronto iterativo tra esperti, condotto nell’ambito del progetto insieme a TU Delft e KIT, ha coinvolto un ampio numero di esperti internazionali. Sono stati identificati e raggiunti oltre 200 esperti in IA e ML provenienti da università, centri di ricerca e reti internazionali. Di questi, 67 hanno partecipato allo studio, tra cui anche esperti del nostro istituto.
Lo studio è stato condotto in collaborazione con i ricercatori delle istituzioni coinvolte e con il gruppo FAIR4ML IG della Research Data Alliance (RDA), i cui membri hanno contribuito alla definizione e al perfezionamento della lista di pratiche, nonché alla partecipazione durante lo studio.
Il lavoro ha incluso due cicli di consultazione tramite questionari online e si è concluso con un incontro online a gennaio 2025, durante il quale sono stati discussi i risultati e le prospettive future con alcuni partecipanti allo studio.
Il risultato: le 10 buone pratiche FAIR per i modelli di IA e ML
Il risultato finale è una lista condivisa di dieci buone pratiche, fondamentali per rendere i modelli di IA e ML facilmente trovabili, più accessibili e riutilizzabili, in linea con i principi FAIR. Le pratiche coprono l’intero ciclo di vita del modello, dalla documentazione, alla condivisione e riutilizzo.
I risultati sono stati presentati in un Lightning Talk alla 19esima edizione della International Digital Curation Conference (IDCC25) il 18 febbraio 2025.
Tutti i dettagli dello studio sono stati descritti all’interno del deliverable ufficiale e resi più fruibili per i ricercatori in forma di Booklet.
Un contributo al Research Data Management e alla Scienza Aperta
“Questo contributo si inserisce pienamente nella missione di Skills4EOSC, che mira a costruire un ecosistema formativo per la Scienza Aperta in Europa, e rafforza il ruolo di IIT come promotore di innovazione e buone pratiche nella gestione dei dati scientifici.” – Valentina Pasquale, Data Steward Coordinator in IIT.
Il lavoro svolto rappresenta un passo concreto verso l’adozione dei principi FAIR anche in ambiti tecnologicamente avanzati come IA e ML, contribuendo alla costruzione di una ricerca più aperta, collaborativa e responsabile.
Un elemento distintivo del lavoro è stato il forte coinvolgimento della comunità scientifica sia esterna che interna all’IIT, che ha partecipato già nelle fasi preparatorie dello studio.
“Essere coinvolta in questo studio fin dalle fasi iniziali, mi ha permesso di entrare in contatto con esperti internazionali per determinare in modo collaborativo le migliori pratiche per rendere più FAIR i modelli di IA e ML. Questo processo è stato anche un’opportunità preziosa per coinvolgere i ricercatori di IIT e per capire come trasferire i risultati del progetto all’interno dell’Istituto. La fase successiva prevede un lavoro congiunto con i ricercatori per trasformare i risultati in linee guida concrete per l’implementazione delle pratiche FAIR nel nostro contesto.” — Elda Osmenaj, Data Steward in IIT.
Crediti immagine: © Khanchit Khirisutchalual/iStock, ID immagine: 1515913422.