Artificial intelligence tools predict DNA’s regulatory role and 3D structure

Jian Zhou, Ph.D.

Dallas - 08 agosto 2022 - Di recente sviluppoIl software di intelligenza artificiale (AI) ha previsto accuratamente il ruolo degli elementi regolatori del DNA e della struttura tridimensionale (3D) basandosi solo sulla loro sequenza iniziale, secondo due recenti studi in Genetica naturale. Questi strumenti potrebbero infine gettare nuova luce su come le mutazioni genetiche portano alla malattia e potrebbero portare a una nuova comprensione di come il sequenziamento genetico influenzi l'organizzazione spaziale e la funzione del DNA cromosomico nel nucleo, ha affermato l'autore dello studio Jian Zhou, PhD, assistente professore. Nel dipartimento di bioinformatica di Lyda Hill nell'UTSW.

ha detto il dottor Zhou, un membro dell'Harold C. Simmons Comprehensive Cancer CenterE il Lupe Murchison Research Scholar in Medical Research, Texas (CPRIT) Scienziato per la prevenzione e la ricerca sul cancro.

Struttura 3D prevista di una porzione di DNA genomico umano

Solo l'1% circa del DNA umano codifica le istruzioni per la produzione di proteine. La ricerca negli ultimi decenni ha dimostrato che gran parte del materiale genetico non codificante rimanente contiene elementi regolatori - come induttori, potenziatori, silenziatori e isolanti - che controllano il modo in cui viene espresso il DNA codificante. Il dottor Zhou ha spiegato che il modo in cui la sequenza controlla le funzioni della maggior parte di questi elementi regolatori non è ben compreso.

Per comprendere meglio questi componenti regolatori, lui e i colleghi della Princeton University e del Flatiron Institute hanno sviluppato un modello di apprendimento profondo che chiamano Sei, che ordina con precisione questi estratti di DNA non codificante in 40 "classi di sequenza" o funzioni, ad esempio, come potenziatore dell'attività cellulare cellule staminali o cerebrali. Queste 40 classi sequenziate, sviluppate utilizzando quasi 22.000 set di dati da studi precedenti che hanno esaminato l'organizzazione del genoma, coprono oltre il 97% del genoma umano. Inoltre, Sei può valutare qualsiasi sequenza in base alla sua attività prevista in ciascuna delle 40 classi di sequenza e prevedere come le mutazioni influenzeranno tali attività.

Applicando Sei ai dati genetici umani, i ricercatori sono stati in grado di caratterizzare la struttura regolatoria di 47 tratti e malattie registrati nel database della biobanca britannica e spiegare come le mutazioni negli elementi regolatori causino malattie specifiche. Queste capacità possono aiutare a ottenere una comprensione più sistematica di come i cambiamenti della sequenza genetica siano correlati a malattie e altri tratti. I risultati sono stati pubblicati questo mese.

A maggio, il dottor Chu ha segnalato lo sviluppo di uno strumento diverso chiamato Orca, che prevede la struttura 3D del DNA nei cromosomi in base alla sua sequenza. Utilizzando i set di dati esistenti sul sequenziamento del DNA e i dati strutturali di studi precedenti che hanno rivelato curve, torsioni e svolte delle molecole, il dott. Zhou ha addestrato il modello a creare connessioni e valutato la capacità del modello di prevedere la struttura a varie scale di lunghezza.

I risultati hanno mostrato che Orca ha predetto strutture del DNA sia piccole che grandi in base al loro sequenziamento con elevata precisione, comprese le sequenze che portano mutazioni associate a varie condizioni di salute tra cui una forma di leucemia e anomalie degli arti. Orca ha anche consentito ai ricercatori di creare nuove ipotesi su come le sequenze di DNA governino la sua struttura tridimensionale locale e su larga scala.

Il dottor Zhou ha affermato che lui e i suoi colleghi hanno in programma di utilizzare Sei e Orca, entrambi disponibili pubblicamente su server Web e come codice open source, per esplorare ulteriormente il ruolo delle mutazioni genetiche nel causare le manifestazioni molecolari e fisiche delle malattie — ricerca che alla fine potrebbe portare a nuovi modi per trattare queste condizioni.

Lo studio Orca è stato sostenuto da sovvenzioni da CPRIT (RR190071), National Institutes of Health (DP2GM146336) e UT Southwestern Endowed Scholars Program in Medical Sciences.

Informazioni sull'UT Southwestern Medical Center

UT Southwestern, uno dei principali centri medici accademici della nazione, combina una ricerca biomedica rivoluzionaria con cure cliniche e istruzione eccezionali. La facoltà dell'istituto ha ricevuto sei premi Nobel e comprende 26 membri della National Academy of Sciences, 17 membri della National Academy of Medicine e 14 ricercatori dell'Howard Hughes Medical Institute. I nostri 2.900 docenti a tempo pieno sono responsabili di sviluppi medici pionieristici e si impegnano a tradurre rapidamente la ricerca scientifica in nuovi trattamenti clinici. I medici dell'UT Southwestern forniscono assistenza in oltre 80 specialità per oltre 100.000 pazienti ospedalizzati, oltre 360.000 emergenze e supervisionano quasi 4 milioni di visite ambulatoriali all'anno.

#Artificial #intelligence #tools #predict #DNAs #regulatory #role #structure

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.