La rapida evoluzione dei modelli di intelligenza artificiale generativa, come ChatGPT di OpenAI, segna un’era promettente per la ricerca medica. Un articolo pubblicato recentemente su The Lancet Digital Health esplora l’integrazione e le sfide dei large language models (LLM) nella patologia digitale, un campo in rapida evoluzione che richiede una comprensione contestuale complessa.
Il rapporto tra LLM e la patologia digitale
Le capacità dei LLM sono notevoli, ma la loro adattabilità viene spesso messa in discussione quando applicati a discipline specialistiche. Questi campi di nicchia richiedono un livello di precisione e comprensione senza precedenti. Un LLM generico, nonostante i suoi vasti dati di formazione, potrebbe non cogliere i dettagli specifici su cui si basano gli specialisti. Al contrario, tende a fornire risposte generiche e di alto livello, che potrebbero mancare della profondità necessaria.
La patologia digitale, un sottocampo relativamente nuovo della patologia che prevede l’acquisizione e l’analisi di immagini istopatologiche generate da vetrini con l’ausilio di scanner, sottolinea ulteriormente queste sfide. In questo campo in rapida evoluzione, si producono continuamente nuovi dati, algoritmi e applicazioni innovative.
Tenere il passo con questo rapido afflusso di conoscenze è una sfida per i professionisti, che devono vagliare un corpus di letteratura in continua crescita.
Le risposte univoche dei LLM non sono all’altezza, mancando della specificità necessaria per supportare il processo decisionale complesso richiesto.
BioBERT: un caso emblematico
Le soluzioni di IA su misura sfruttano le ampie capacità computazionali dell’IA, allineandole ai requisiti specifici di domini specializzati. Un esempio è BioBERT, un derivato del LLM BERT. Sebbene BERT sia stato inizialmente addestrato su insiemi di dati generali, BioBERT ha ricevuto un addestramento aggiuntivo utilizzando la letteratura biomedica, migliorando sostanzialmente le sue prestazioni nei compiti di ricerca biomedica.
Un database completo dedicato alla patologia digitale: GPT4DFCI-RAG
Riconoscendo il potenziale dell’IA generativa specifica per il dominio, il team ha curato un database completo di letteratura patologica digitale. Hanno avviato una ricerca mirata su Google Scholar utilizzando parole chiave specifiche per estrarre manoscritti, sia peer-reviewed che preprints, datati da gennaio 2022 in poi. Questa ricerca ha restituito 650 pubblicazioni, catturando gli ultimi sviluppi degli algoritmi di apprendimento automatico e delle applicazioni della patologia digitale.
Questo approccio combina GPT4DFCI, uno strumento di IA generativa privato e sicuro basato su GPT-4 Turbo, con un’architettura RAG per creare GPT4DFCI-RAG.
RAG funge da interfaccia tra l’utente e il database curato, migliorando la specificità e la pertinenza delle informazioni fornite.
Vantaggi degli Strumenti di IA Specifici per Dominio
Questi strumenti di intelligenza artificiale non sono ancora agenti di trasformazione della ricerca biomedica e della sanità pubblica, ma possono aumentare sostanzialmente la produttività. Facilitano l’accesso alle conoscenze e automatizzano le attività manuali o ripetitive.
Non solo facilitano l’accesso alla ricerca scientifica, ma ne democratizzano anche quello alle tecniche di patologia computazionale per gli scienziati con poca esperienza di programmazione. Nell’editoria accademica, strumenti come l’Artificial Intelligence Review Assistant, sviluppato da Frontiers, automatizzano la valutazione della qualità dei manoscritti e delle revisioni paritarie. Inoltre, semplificano il processo di conduzione delle revisioni sistematiche, fondamentali nella generazione di prove ad alta affidabilità in medicina.
L’adozione di strumenti di intelligenza artificiale generativa specifici per dominio negli ambienti accademici può facilitare l’apprendimento continuo e l’adattamento al panorama dinamico della ricerca medica.