Amici, settembre sta per finire e anche una tappa.

È arrivato il momento di raccogliere i frutti di questo enorme sforzo collettivo che abbiamo compiuto tutti insieme.

Nel corso degli ultimi 3 mesi (luglio-settembre) l’applicazione GENIGMA è rimasta aperta con nuovi dati del genoma del cancro al seno. L’obbiettivo era convalidare l’uso del gioco come strumento di ricerca e verificare a quale risoluzione si possono ottenere i migliori risultati per la scienza.

La sfida che abbiamo lanciato in estate è stata quella di risolvere 250 nuovi set di 15 e 12 pezzi a diverse risoluzioni.  Se durante la #GenigmaChallenge ogni pezzo che si muoveva nel puzzle aveva le dimensioni di 100.000 coppie di basi di DNA, i nuovi giochi sono stati caricati con una risoluzione di 10K (cioè ogni pezzo ha le dimensioni di 10.000 coppie di basi) o 1Mb (ogni pezzo ha le dimensioni di 1.000,000 coppie di basi).

Per darvi un’idea, è come se invece di guardare ai Paesi volessimo guardare ai continenti o alle città.

In questi 3 mesi, più di 5400 persone (di cui 2300 nuovi giocatori) hanno collaborato a questo nuovo test giocando nel loro tempo libero. È incredibile!

Le ultime soluzioni ricevute hanno fornito nuova luce sulla ricerca. Sebbene nel caso della maggior parte dei giochi a risoluzione 1Mb siano stati trovati risultati simili a quelli trovati da un algoritmo di base, nelle regioni del cromosoma 9 giocate alla stessa risoluzione i giocatori hanno trovato nuove regioni Eureka! Questo confermerebbe che le persone sono in grado di identificare le regioni di interesse dove gli algoritmi non riescono, il che apre la possibilità di utilizzare GENIGMA a risoluzioni diverse in futuro per ottenere risultati migliori.

Nel caso dei set di regioni Eureka! precedentemente identificate durante la #GenigmaChallenge offerta a una risoluzione di 10Kb, i giocatori non hanno identificato riarrangiamenti aggiuntivi, indicando che non ci sarebbero ulteriori cambiamenti strutturali nel genoma in queste regioni analizzate rispetto a quelle precedentemente trovate.

Dopo questi test finali e quasi 700.000 dati raccolti, si conclude oggi il primo #GenigmaChallenge dedicato al cancro al seno. Ora è il momento che i team scientifici analizzino a fondo i risultati di GENIGMA, prima di lanciare una nuova sfida al pubblico.

Il CNAG e il CRG desiderano ringraziare tutte le persone che hanno collaborato a questa sfida scientifica per il loro tempo e il loro entusiasmo.

Il 3 ottobre chiuderemo momentaneamente l’app. Vi terremo informati su tutte le novità sui nostri social network.

A presto Genigmers!

Grazie allo sforzo collettivo di tutte le persone che hanno partecipato alla #GenigmaChallenge, in sole 20 settimane sono state identificate 181 regioni del genoma con anomalie cromosomiche nella linea cellulare di cancro al seno T47D. Abbiamo chiamato queste regioni Eureka!

I giochi forniti durante la #GenigmaChallenge sono stati preparati con una risoluzione di 100k, il che significa che ogni tassello del gioco (quelli da spostare e posizionare per aumentare il punteggio) corrisponde a frammenti di 100.000 coppie di basi di DNA. Questo ci ha permesso di ottenere una prima istantanea della mappa genomica di queste cellule e ora, invece di andare “alla cieca” o di analizzare l’intero genoma, il team di ricerca si sta concentrando su queste regioni per cercare i geni di interesse per far progredire la ricerca.

In questa fase, chiediamo ancora una collaborazione al pubblico per analizzare in modo più dettagliato la riorganizzazione cromosomica di queste aree di grande interesse.

A tal fine, abbiamo introdotto nell’applicazione set di regioni Eureka trovate a una risoluzione di 10K, il che significa che ogni tassello che si muove, d’ora in poi, ha le dimensioni di 10.000 coppie di basi di DNA. È come se, invece di guardare ai continenti, guardassimo ai Paesi. Ci avviciniamo per osservare da una distanza più ravvicinata.

Durante la fase #GenigmaEureka, i giocatori analizzeranno alcune di queste regioni con puzzle da 15 pezzi, più difficili ma in grado di fornire molte informazioni al team scientifico.

Il 16 giugno si è conclusa la #GenigmaChallenge, il primo esperimento partecipativo di analisi del genoma umano attraverso un’applicazione per cellulari, GENIGMA, a cui hanno partecipato più di 39.000 persone da 154 Paesi.

–> In 20 settimane sono state raccolte 600.287 soluzioni e sono state identificate 181 regioni Eureka!, aree del genoma di interesse per la ricerca sul cancro al seno.
–> La comunità dei giocatori ha dedicato 19.485 ore alla scansione dei 23 cromosomi caricati nell’app dal team scientifico.
–> A partire da ora, sarà possibile giocare con i frammenti del genoma delle zone Eureka! identificate durante le settimane di svolgimento della #GenigmaChallenge. In questo modo, il team scientifico cercherà di verificare se è possibile progredire nell’analisi della disposizione di questi frammenti a un livello di risoluzione più elevato.

Nel corso di 139 giorni, il videogioco GENIGMA per iOS e Android ha lanciato il guanto di sfida della #GenigmaChallenge ai giocatori di tutto il mondo affinché risolvessero i rompicapo per contribuire al progresso della ricerca sul cancro. L’obiettivo era quello di collaborare per identificare le regioni cromosomiche interessate da anomalie nella coltura di cellule di cancro al seno T-47D. Si tratta delle cellule più comunemente utilizzate dalla comunità scientifica mondiale nella ricerca su questo tipo di cancro.
Le colture cellulari sono una pietra miliare della biologia moderna e sono state utilizzate per scoprire vaccini, chemioterapia per il cancro o fecondazione in vitro. Tuttavia, non abbiamo ancora una conoscenza dettagliata di come è organizzato il genoma di ciascuna di queste colture e questo continua a limitare il progresso scientifico. Questo esperimento è stato progettato per verificare se è possibile identificare aree di interesse nel genoma di queste cellule in modo rapido e collaborativo.

20 settimane con la #GenigmaChallenge
Sulla base dei dati reali ottenuti in laboratorio con la coltura cellulare del tumore al seno T-47D, il team scientifico ha suddiviso tutto il DNA in piccoli frammenti e ha creato 5.442 rompicapi da far analizzare alla comunità di giocatori. Ogni settimana, puzzle di 8, 10, 12 e fino a 15 pezzi sono stati caricati su GENIGMA per essere analizzati con la logica umana e con l’aiuto di strumenti virtuali integrati nel gioco.
Genigma ha più di 5.000 puzzle, che contengono parti del genoma di 100.000 coppie di basi delle 3.000.000.000 che compongono il nostro genoma. La sfida di metterli in ordine poteva essere portata a termine solo dividendo il “grande puzzle” in piccole parti che ogni giocatore poteva risolvere.

In 20 settimane, più di 44.000 persone da 154 Paesi hanno scaricato il gioco e fornito più di 600.000 soluzioni. Con l’aiuto dei social media e dei media tradizionali, il team ha gradualmente riunito un’enorme squadra di volontari da tutto il mondo che hanno contribuito a questa ricerca nel loro tempo libero. Per tutta la durata dell’esperimento, inoltre, ha tenuto la comunità aggiornata sui risultati ottenuti su base settimanale attraverso questo sito web, il sistema di messaggistica interna dell’app, Twitter, Facebook e Instagram. Il team ha anche interagito con la comunità, modificando alcune funzioni dell’app e preparando contenuti extra per gestire le domande e mantenere l’interesse per il progetto. L’esperimento è durato infatti quattro mesi e mezzo, nel corso dei quali l’app è stata aggiornata in 5 occasioni, apportando i miglioramenti suggeriti dai cittadini (nel tutorial, nel sistema di punteggio, nella visualizzazione dei risultati individuali e inserendo anche nuove schede di divulgazione scientifica).

Quando la CNAG-CRG ha lanciato il gioco, ai giocatori è stato chiesto di giocare un minimo di 50 partite per partecipare all’esperimento. Tuttavia, questo minimo è stato più che superato in molti casi. Inoltre, alcune persone hanno giocato e sostenuto il progetto fino alla fine e hanno anche partecipato alla diffusione e alla condivisione delle loro strategie di gioco per far sì che il maggior numero possibile di persone aderisse a questo sforzo collettivo. Anche il loro coinvolgimento è stato decisivo per il successo del progetto.

Regioni cromosomiche di grande interesse per la ricerca
Nei 139 giorni in cui è durata la #GenigmaChallenge, i puzzle in cui almeno 40 giocatori diversi sono riusciti a battere il punteggio record indicato nel gioco sono stati etichettati come regioni Eureka! Complessivamente, nell’intero genoma di queste cellule, sono state identificate 181 regioni considerate di alto interesse scientifico, poiché mostrano che la sequenza del genoma potrebbe essere influenzata da riarrangiamenti cromosomici se la confrontiamo con le sequenze delle cellule non cancerose. Le regioni in cui il record proposto non è stato battuto, anch’esse risolte per consenso, sono probabilmente regioni con una disposizione simile a quella delle loro regioni omologhe nelle cellule sane, il che implica che non sarebbero interessate da alcuna alterazione cromosomica.

Ora che l’analisi dell’intero genoma è stata completata, le regioni Eureka! identificate saranno analizzate in dettaglio dal nostro team scientifico. Una volta analizzati questi risultati, valuteremo la possibilità di utilizzare GENIGMA per analizzare altri tipi di cancro.

Alcuni dati
20 settimane di gioco, 139 giorni
Persone provenienti da 154 paesi diversi hanno preso parte all’esperimento
Più di 44.000 download (Android e iOS)
39.543 giocatori attivi, di cui 1.900 sono “super” giocatori (hanno giocato più di 50 partite)
Un totale di 19.485 ore registrate da tutti i giocatori
600.287 soluzioni raccolte
181 regioni di alto interesse scientifico (Eureka!) identificate
5.472 puzzle analizzati dalla comunità, che rappresentano più di 300.000 pezzi complessivi (equivalenti a 3.000.000.000 di coppie di basi di DNA)
1 h 46 min – tempo medio di interazione per giocatore
6 – numero medio di giochi inviati per sessione e per giocatore
Tempo medio di risoluzione per gioco: puzzle da 10 pezzi: 18 min; puzzle da 12 pezzi: 25 min; puzzle da 15 pezzi: 33 min; puzzle da 20 pezzi: 1 h
I 5 giocatori che hanno giocato di più: Giocatore 1: 6.139 soluzioni inviate. 240 ore di gioco; Giocatore 2: 5.342 soluzioni inviate. 180 ore di gioco; Giocatore 3: 4.518 soluzioni inviate. 220 ore di gioco; Giocatore 4: 4.502 soluzioni inviate. 320 ore di gioco; Giocatore 5: 3.920 soluzioni inviate. 299 ore di gioco
I 5 principali Paesi contributori: 60% Spagna (>23.000 persone); 7,6% Stati Uniti (>2.800 persone); 4,7% Regno Unito (>1.700 persone); 3,2% Russia (>1.200 persone); 3% Italia (>1.000 persone).

Cosa riserva il futuro di GENIGMA
In questo periodo di analisi dei dati da parte dell’équipe scientifica, l’app GENIGMA continuerà a funzionare, in modo che chiunque lo desideri possa continuare a giocare e ad affinare le proprie capacità.
A partire da ora, sarà possibile giocare con i frammenti del genoma delle zone Eureka! identificate durante le settimane di svolgimento della #GenigmaChallenge. In questo modo, il team scientifico cercherà di verificare se è possibile progredire nell’analisi della disposizione di questi frammenti a un livello di risoluzione più elevato.

Anche se abbiamo raggiunto il 100% dei giochi nella linea cellulare del cancro al seno, continueremo a far funzionare GENIGMA per esplorare ulteriormente le regioni “Eureka!” trovate dai giocatori. In questo modo, quando le analizzeremo, avremo informazioni più dettagliate sulle possibili alterazioni di queste zone.

I risultati dell’analisi dei dati forniti dai giocatori di GENIGMA saranno resi pubblici nei prossimi mesi.

di Juan Rodríguez e Marco di Stefano (dell’equip scientifico di GENIGMA)

Vi siete mai chiesti come fanno gli scienziati a studiare i tumori in laboratorio? Come è possibile riprodurre un sistema biologico in miniatura per capire come funziona il corpo umano? Come si verifica l’efficacia dei nuovi farmaci?

Nei laboratori di tutto il mondo la ricerca si svolge utilizzando linee cellulari, dette anche colture cellulari. Queste ultime sono utilizzate da diverso tempo e hanno permesso parecchie scoperte che sarebbero state impossibili in altro modo. Grazie alle linee cellulari i ricercatori hanno fatto importanti passi avanti nello sviluppo del vaccino anti polio, testato nuovi farmaci chemioterapici, stabilito importanti linee guida per la clonazione cellulare, e svolto un ruolo chiave nello sviluppo della fecondazione in vitro. Alcuni di questi studi sono stati premiati con un Nobel. I 19 vaccini anti-covid che usiamo oggi sono stati inizialmente sviluppati e provati su colture cellulari disponibili in quel momento, permettendo ai ricercatori di riprodurre l’infezione da coronavirus in modo sicuro e in un ambiente realistico.

Le colture cellulari sono uno strumento unico in biologia, che ha fatto passi da gigante dall’inizio del XX secolo. Ma potreste chiedervi..che cosa ha a che fare un videogioco come Genigma con tutto questo? Per rispondere a questa domanda dovremo fare un viaggio indietro nel tempo.

Definizione e origine delle colture cellulari

Per coltura cellulare si intende il processo attraverso il quale è possibile far crescere delle cellule in un ambiente artificiale adatto. Le cellule vengono isolate da un tessuto fresco e vengono mantenute in condizioni strettamente controllate. L’uso di linee cellulari ha molti vantaggi:

  • permette di ricreare a costi ragionevoli un modello adatto per la ricerca
  • costituisce un’alternativa alla sperimentazione su animali da laboratorio
  • permette di conservare le cellule per anni (anche congelate!)
  • fornisce informazioni su come le cellule del corpo reagiscono ai farmaci

I principi alla base delle colture cellulari animali e vegetali in vitro furono sviluppati all’inizio del XX secolo. Alla fine del XIX secolo la teoria cellulare fornì i presupposti teorici della ricerca biologica basandosi su tre ipotesi:

1. tutti gli organismi sono composti da una o più cellule

2. la cellula costituisce l’unità strutturale e organizzativa degli organismi

3. le cellule si formano a partire da un’altra cellula preesistente

Nel 1885 l’embriologo tedesco Wilhelm Roux dimostrò che è possibile mantenere in vita per alcuni giorni delle cellule al di fuori dell’organismo d’origine conservandole in una soluzione salina. Roux osservò che cellule nervose di embrioni di pollo erano in grado di svolgere le loro funzioni al di fuori dell’organismo.

Da allora il processo di creazione di nuove linee cellulari è in continuo sviluppo. La prima linea cellulare, L929, creata da Earle nel 1948 è in uso ancora oggi! Si tratta di una linea cellulare di cellule di tessuto dermico di topo e mostra una morfologia abbastanza diversa rispetto al tessuto originario.

Come si coltiva una linea cellulare in laboratorio

Per generare un nuova linea cellulare i ricercatori per prima cosa ottengono una coltura primaria a partire da un tessuto o un organo. Le cellule crescono fino ad occupare l’intera piastra di coltura, poi si fermano. A questo punto le cellule devono essere separate e distribuite in nuove piastre creando colture secondarie. In questo modo la loro crescita può riprendere e il processo si ripete ogni volta che le piastre sono completamente ricoperte di cellule. Dal secondo passaggio in poi possono essere considerate una coltura cellulare o linea cellulare.

La tecnica delle colture secondarie ha permesso ai ricercatori di ottenere linee cellulari a partire da colture primarie nello stesso modo in cui otteniamo lievito madre per il pane da una piccola quantità di impasto o i fermenti lattici da una piccola quantità di yogurt. Le colture primarie vengono avviate con tessuti normali o tumorali adulti e/o embrionali. Per esempio è possibile creare una linea cellulare a partire da cellule tumorali di un paziente prelevate con una biopsia e messe a crescere in una piastra cellulare.

Le linee cellulari create a partire da tessuti sani crescono solo fino ad un certo punto, poi si fermano. Invece le linee cellulari che vengono create a partire da cellule tumorali possono crescere indefinitamente; questa, infatti, è la caratteristica distintiva dei tumori. E’ possibile, però, rendere immortali, cioè in grado di riprodursi indefinitamente, anche cellule normali attraverso particolari tecniche di laboratorio.  

I limiti delle linee cellulari

Sebbene diverse linee cellulari siano comunemente usate in studi di tipo diverso, esse hanno anche limiti e svantaggi.

Uno degli svantaggi è che il numero di mutazioni genetiche nelle linee cellulari aumenta nel tempo. Inoltre la risposta ad un farmaco può non essere del tutto identica a quella di un paziente; infatti l’ambiente di una piastra cellulare è diverso da quello del tumore originario nell’organismo. Nelle condizioni di coltura, i tumori o i tessuti possono perdere le loro proprietà naturali alterando la loro potenziale risposta ai trattamenti.

Un altro grave problema che può verificarsi in un laboratorio che utilizza diverse linee cellulari è la contaminazione incrociata di una linea cellulare con un altra. In questo caso l’osservazione di un certo fenomeno può essere attribuito alla linea cellulare sbagliata.

Anche un’infezione batterica può modificare le proprietà di una coltura cellulare danneggiandola. Infine non tutti i tipi di tumore possono dare origine ad una linea cellulare e questo influenza la ricerca sul cancro a favore delle linee cellulari di facile coltivazione.

Sfortunatamente non è possibile risolvere tutti questi problemi ma i vantaggi sono comunque superiori agli svantaggi.

L’importanza della sfida di Genigma

Le caratteristiche genetiche determinano il comportamento e la risposta cellulare alle terapie e agli stimoli. Tutte le informazioni genetiche sono contenute nel DNA cellulare che determina quando la cellula si replicherà, quando morirà, quando verrà attivato un certo programma genetico per reagire ad uno stimolo esterno.

Ogni cellula deriva da un’altra cellula. Quando le cellule sono immortalizzate in una coltura devono copiare il loro materiale genetico ogni volta che si dividono. Questo processo si ripete così tante volte che è molto probabile che si generino degli errori di copiatura.

Immaginate di dover copiare la stessa pagina di un libro ogni giorno, per anni ed anni. Inevitabilmente col tempo farete piccoli errori di battitura, di cui non vi accorgerete e che si diffondono e si amplificheranno. In pochi anni la vostra pagina scritta potrebbe non assomigliare affatto all’originale.

E’ facile immaginare che cosa possa succedere al materiale genetico di una cellula dopo decenni in coltura cellulare. Sappi che questi errori si trovano ovunque nelle linee cellulari! In alcuni casi risultano duplicati interi cromosomi (figura). Per le linee tumorali questo problema è particolarmente grave, perché questo tipo di malattia è caratterizzata dalla perdita di controllo da parte delle cellule che hanno un genoma modificato, con parti duplicate o eliminate, sia a causa della malattia che come conseguenza del suo decorso.

Figura 1. A sinistra: cariotipo (cioè l’insieme dei cromosomi di una cellula) umano normale A destra: cariotipo di una linea cellulare. Si può osservare che il cariotipo normale mostra le classiche 23 coppie di cromosomi, mentre la linea cellulare mostra cromosomi duplicati o persi ed è molto diversa dalla normalità.

Quando i ricercatori lavorano con le linee cellulari tumorali, interpretano i dati sulla base di mappe genomiche che permettono loro, fra le altre cose, di individuare la posizione dei geni che hanno studiato nel DNA cellulare. Questa mappa si chiama sequenza genomica di riferimento.

Per la maggior parte degli studi i ricercatori utilizzano una normale sequenza genomica di riferimento per orientarsi nel genoma della cellula e interpretare i loro risultati. In teoria queste mappe dovrebbero essere prive di errori ma usarle sarebbe come cercare le strade di una città usando una mappa di 150 anni fa. Per esempio a Barcellona potremmo riconoscere il mare e le montagne ai margini della città ma molte zone o strade potrebbero essere state aggiunte, ampliate o anche eliminate del tutto in quel lasso di tempo. La mappa non è più utilizzabile.

Questo è esattamente il problema che vogliamo affrontare con Genigma. Come è possibile costruire una mappa genomica precisa e aggiornata delle linee cellulari tumorali più utilizzate che rifletta tutti questi cambiamenti nel genoma delle linee cellulari?

 

E come pensiamo di farlo, esattamente? Vogliamo utilizzare la genomica tridimensionale (puoi trovare più informazioni qui) e il potente aiuto della citizen science che utilizzerà le capacità di calcolo del nostro cervello per risolvere uno dei problemi più complessi ed emozionanti della biologia!

Figura 2: come è cambiata la mappa di Barcellona negli ultimi 150 anni circa. Immagini del Museo di Storia di Barcellona (MUHBA).

Il confronto uomo-macchina: l’intelligenza di gruppo contro l’intelligenza artificiale

Le macchine e gli algoritmi informatici possono essere molto utili per risolvere problemi biologici simili a quello che affrontiamo con Genigma. Ciononostante hanno dei limiti che non permettono di raggiungere tutta l’accuratezza richiesta da un compito così arduo.

Per esempio dai un’occhiata all’immagine qui sotto. Quanto ci metti a trovare i cani?

Figura 3: alcune immagini possono confondere le macchine, ma non i cervelli… 

La maggior parte delle persone è in grado di individuarli immediatamente! Ma quali schemi specifici utilizza il tuo cervello per riconoscere il muso di un cane? Esprimerlo a parole non è facile. Per esempio i muffin hanno mirtilli o pezzetti di cioccolato che possono essere scambiati per occhi e naso di una cane ma il tuo cervello è in grado di riconoscere che questi elementi non sono in una posizione anatomicamente corretta. Allo stesso modo il colore del muso dei cani è simile a quello dell’impasto dei muffin.

Se dovessi programmare un computer per questo compito dovresti inserire nell’algoritmo il concetto di cane. Insegnare questo concetto in modo accurato ad un programma è estremamente costoso. Infatti per raggiungere una risposta il nostro cervello prende in considerazione un numero estremamente elevato di concetti concreti e astratti, sia consciamente che inconsciamente.

Quindi come possiamo descrivere un insieme di concetti ad un computer in modo che possa dare la risposta giusta nel contesto giusto? Questa è una delle sfide nell’uso di moderni algoritmi per generare sequenze genomiche di riferimento. Possono dare risultati buoni e rapidi e accurati in un primo momento ma ad un livello più specifico possono confondersi facilmente portando a risultati imprecisi. Al contrario il nostro cervello può analizzare una quantità limitata di informazioni per unità di tempo, mentre i computer lavorano molti più velocemente, ma fornisce risultati migliori nei problemi più specifici.

Per Genigma ci siamo chiesti come dividere un problema di dimensioni enormi in migliaia di piccoli pezzi per utilizzare la capacità di calcolo di migliaia di di cervelli per ottenere la soluzione ciascun pezzo.

Anche i cervelli possono sbagliare ma collettivamente sono un mezzo potente. Mentre gli algoritmi continueranno sempre a fare gli stessi errori in modo sistematico di fronte allo stesso compito, diversi cervelli umani tenderanno a fare errori diversi. Questa intelligenza di gruppo è esattamente ciò che vogliamo sfruttare con Genigma per ricostruire queste preziose sequenze di genomi tumorali per aiutare i ricercatori a sviluppare le loro strategie terapeutiche con una mappa genomica più precisa.

Il gioco utilizza i dati degli esperimenti condotti sulle cellule del cancro al seno nel laboratorio del CRG.
Gli esperimenti hanno prodotto mappe di interazione tra tutte le regioni genomiche delle cellule di cancro al seno analizzate. Ogni elemento di una mappa di interazione è una misura sperimentale del numero di interazioni che due regioni cromosomiche fanno all’interno del nucleo.

Yasmina Cuartero e François Le Dily sono stati responsabili al CRG di eseguire gli esperimenti in laboratorio utilizzando la tecnica Hi-C con la linea cellulare del cancro al seno T47D.

François, che lavora sulla risposta delle cellule del seno agli steroidi ed è un esperto della conformazione della cromatina, spiega i vantaggi di questa tecnica: “La tecnica Hi-C ci permette di ottenere una “fotografia” in 3D di come la cromatina (DNA e proteine associate) è disposta nelle cellule. Questo metodo quantifica il numero di interazioni tra regioni di sequenza di DNA in un cromosoma, che sono vicine nello spazio 3D, ma possono essere separate da molti nucleotidi nel genoma lineare.

Gli scienziati hanno scoperto qualche anno fa che per capire come funziona una cellula non basta sapere qual è la struttura lineare dei geni (cioè come sono distribuiti uno dietro l’altro). Questa prima approssimazione fornisce solo una parte delle informazioni, poiché il DNA è impacchettato in modo tale che alcuni geni possono essere molto distanti linearmente, ma in realtà sono molto vicini l’uno all’altro, e da questa posizione, interagiscono. Si tratta di circa 2 metri di DNA che si ripiega per entrare in un nucleo di pochi micrometri!

Le cellule tumorali sono caratterizzate da alterazioni del genoma (l’insieme dei geni) che influenzano il loro funzionamento: questo perché il loro DNA può contenere molte copie dello stesso gene (a causa di un errore nella fase di copiatura del DNA), geni che non sono più nella loro posizione originale (rispetto alla struttura di una cellula sana), geni che sono stati “girati a 180⁰” (quindi non vengono letti correttamente e non svolgono la loro funzione) o anche cromosomi che si sono fusi fra loro. In tutti questi casi, le conseguenze sul buon funzionamento della cellula sono evidenti e possono essere gravi”. La tecnica Hi-C permette di trovare questi errori e può essere utilizzata per ricostruire la mappa del genoma delle cellule anormali.

Yasmina, esperta in tecniche di studio della struttura del genoma, ci dà alcuni dettagli su come viene applicata in laboratorio. “Con la tecnica Hi-C, quantifichiamo le possibili interazioni tra tutte le coppie di frammenti di DNA simultaneamente. Questo viene fatto con molte cellule allo stesso tempo, perché in ogni cellula, a seconda del suo ciclo di vita, il DNA può trovarsi in una posizione diversa. Il primo passo è fissare la cromatina con un reagente. Poi, pezzi di 400 paia di basi sono tagliati con enzimi in posizioni definite (in base alla conoscenza del genoma di riferimento delle cellule sane) e infine, i pezzi rimanenti sono legati con un altro enzima a livello 3D. Una volta completato questo processo, questo DNA viene estratto e si ottiene una serie di frammenti chimerici (che non esistono nella realtà in forma lineare, ma sono il risultato dell’immagine 3D che abbiamo fatto in laboratorio), che verranno sequenziati”.

Una volta fuori dal laboratorio, i risultati del sequenziamento vengono passati a un programma informatico. Questo genera una matrice di contatto, che contiene le informazioni che vengono date ai giocatori, sotto forma di gioco, da analizzare.

Questi esperimenti sono stati realizzati grazie all’aiuto di ARIMA Genomics, che ha fornito a Genigma i kit per queste analisi.

Cosa devo fare?
Riorganizzare i pezzi del gioco e cercare di ottenere il punteggio più alto possibile.

Ci sono delle guide per migliorare l’ordine dei pezzi?
Sì, puoi usare gli assistenti che si trovano nella casella in fondo al puzzle.

Perché gli assistenti non sono attivi?
Bisogna assumere il meccanico per essere in grado di usare gli assistenti .

Qual è lo scopo di ogni assistente?
Puoi consultare il pulsante di informazione a destra della casella degli assistenti .

Qual è la differenza tra zone e aree sulla mappa e cosa dice il colore?
Ogni zona ha 3 aree con 3 livelli diversi (0, 1, 2). Le zone sono usate per contare il numero di mosse. Il colore dell’area appartiene al gruppo che ha ottenuto il maggior numero di stelle giocando in essa finora. Alla fine della settimana, la sfida in corso viene chiusa, vengono proclamati i clan vincitori e vengono aperti nuovi abbinamenti di clan e nuove mappe da esplorare.

Quali sono i costi per muoversi sulla mappa?
Il costo per raggiungere una zona è di 5 monete per ogni zona in cui devi entrare per arrivare a destinazione e c’è un costo “extra” di monete per il livello della zona (segnato sulla mappa con 0, 1 o 2).

Se non ho monete, posso continuare ad esplorare la mappa?
Se finisci le monete puoi continuare a giocare nell’area di livello 0 della zona in cui ti trovi.
Se vuoi scommettere di guadagnare più monete puoi sempre spostarti in aree più distanti e di livello superiore.

Come funziona il sistema di ricompensa?
La ricompensa è il risultato dell’aggiunta di 1 all’area in cui si gioca e della moltiplicazione per le stelle guadagnate. Le aree danno ricompense più alte a seconda del livello (contrassegnato da un numero sulla mappa).
Se al momento di scegliere dove muoversi avevamo un esploratrice nel team, il risultato viene moltiplicato per 2.

Posso vedere quante aree ho conquistato?
Non è possibile sapere quante aree sono state conquistate a livello individuale. Le zone e le aree non vengono conquistate individualmente, è il risultato dello sforzo collettivo del clan. Cambiano di mano durante la settimana e il conteggio finale dà il vincitore della battaglia settimanale.

C’è una risposta corretta?
No, è quello che stiamo cercando. Quando molte persone avranno raggiunto lo stesso record, saremo vicini alla risposta corretta.

A cosa serve il punteggio?
Non conosciamo la risposta corretta di ogni insieme di pezzi: determinaremo la soluzione utilizzando i dati fornitit dai giocatori. Quando almeno 40 giocatori avranno fornito la stessa soluzione con il punteggio più alto, questa sarà considerata la migliore possibile. Il risultato sará quello ottenuto grazie a una soluzione collettiva che riflette il consenso tra i giocatori.

Perché le persone possono essere migliori dei computer?
L’algoritmo non dà risposte del tutto corrette. Le persone possono fare meglio perché l’occhio umano é capace di riconosce certi pattern meglio dei computer.

Perché è importante giocare molto?
Se molte persone diverse giocano e risolvono gli stessi puzzle, saremo capaci di esplorare lí dove l’algoritmo non può arrivare. Questo si traduce in più informazioni scientifiche, il che ci permette di far progredire la ricerca molto più rapidamente.

Come cambia il punteggio?
Ogni pezzo ha un punteggio relativo agli altri pezzi. Quando muovi un pezzo, il punteggio totale cambia perché cambia l’ordine tra tutti loro.

Cosa dice la barra superiore?
Dice quanti punti hai in questo momento, qual é il tuo record e quello raggiunto da altri giocatori.

Cosa significano i simboli all’interno di ogni pezzo?
I simboli hanno solo la funzione di aiutarti a identificare i pezzi.

Cosa significano i colori dei pezzi?
I colori dei pezzi vanno dal rosso al verde. Più i pezzi sono verdi, migliore é il tuo punteggio.

Cosa significano i numeri di ogni pezzo?
Mostrano il valore della relazione che un pezzo ha con gli altri pezzi. Se ottieni numeri alti significa che stai ottenendo un buon punteggio.

Perché é utile assumere professionisti?
Ti permette di ottenere più monete, più carte scientifiche o di poter utilizzare gli attrezzi virtuali. Capirai cosa fa ognuno di loro cliccando sulla loro immagine.

A cosa servono gli attrezzi virtuali?
Ti permettono di ottenere informazioni sui diversi pezzi, spostarli o tornare al tuo miglior punteggio.

Cosa sono le tre stelle in basso?
Man mano che salirai di punteggio in una partita, vedrai quante stelle hai ottenuto. Il tuo obbiettivo? Ottenerne tre!

Cosa indica il livello?
Man mano che ottieni punti il tuo livello aumenta. Anche i giochi aumentano la difficoltá con el tempo.

Come posso rifare il tutorial?
Nella rotellina della pagina principale troverai un pulsante per rifarlo.

I genomi di riferimento hanno grandi benefici per la medicina: ci permettono di scoprire i meccanismi molecolari responsabili di molte malattie e facilitano la diagnosi e lo sviluppo di terapie più mirate. Conoscere la mappa genomica delle cellule tumorali può fornirci informazioni utili per capire come funzionano. In alcuni tipi di cancro, non sappiamo se le mutazioni nella sequenza rispetto al genoma normale siano la causa o l’effetto del cancro stesso.

Attraverso il gioco, analizzeremo il genoma delle cellule tumorali pezzo a pezzo ed in modo collaborativo: prima faremo un’analisi cromosoma per cromosoma e poi confronteremo coppie di cromosomi con coppie di cromosomi. Sempre tenendo conto del genoma noto delle cellule non tumorali, cercheremo nel genoma delle cellule di cancro la presenza di frammenti modificati, trasladati o l’assenza di sequenze note.

Nell’analisi del cancro al seno, faremo molta attenzione a cercare informazioni su certi geni che la scienza sa essere particolarmente rilevanti in questo tipo di cancro.

Cromosoma 17. (Lanciato il 27 gennaio) Questo cromosoma contiene un gran numero di geni legati al cancro al seno. Alcuni di essi sono geni soppressori del tumore come TP53 o BRCA1. I geni soppressori dei tumori sono geni che regolano la crescita e la divisione cellulare. Pertanto, se sono mutati, possono portare allo sviluppo del cancro. Per esempio, una funzione ridotta di BRCA1 è stata associata a circa il 40% dei tumori al seno ereditari. Altri geni associati includono oncogeni come MAP2K4 o BCAS3. Gli oncogeni sono geni che, se mutati o sovraespressi, possono far sì che le cellule sopravvivano e proliferino, piuttosto che subire la morte cellulare programmata (apoptosi). ERBB2 è un importante oncogene, poiché la sua sovraespressione è associata al 20% dei carcinomi mammari invasivi. Infine, un gene interessante situato in questo cromosoma è RAD51C. Si trova in una regione in cui l’amplificazione si verifica frequentemente nei tumori al seno, suggerendo un ruolo nella progressione del tumore.

Cromosoma 10. (Lanciato l’1 febbraio) Questo cromosoma contiene interessanti riarrangiamenti interni, come traslocazioni (porzione di un cromosoma che si stacca e salta in una posizione diversa) o duplicazioni (produzione di una o più copie di un gene o regione di un cromosoma). Inoltre, contiene geni legati al cancro al seno. Alcuni di loro (PTEN o FGFR2) sono legati a un importante percorso che regola il ciclo cellulare, intervenendo in funzioni come il metabolismo, la crescita, la proliferazione o la sopravvivenza cellulare (il percorso PI3K/AKT). Pertanto, l’attivazione aberrante di questa via porterà alla sopravvivenza/proliferazione delle cellule tumorali. PTEN è un gene che funziona come un soppressore tumorale, agendo come regolatore negativo della via PI3K/AKT. Le mutazioni in questo gene porteranno alla sovraespressione del percorso, aumentando il rischio di cancro. FGFR2 può attivare il percorso PI3K/AKT ed è coinvolto nella maturazione cellulare o nel mantenimento delle ossa. Un aumento errato del numero di copie di questo gene è stato osservato nel cancro al seno. Altri geni interessanti situati sul cromosoma 10 sono KIF5B o SUFU. Il primo funziona come una proteina motrice, ed è stato trovato altamente espresso nel cancro al seno. SUFU gioca un ruolo in un percorso di segnalazione coinvolto nello sviluppo umano, che è in gran parte inattivo nell’organismo adulto. Così, la segnalazione aberrante di questo gene è stata collegata a diversi tipi di cancro.

Cromosoma 7. (Lanciato il 4 febbraio) Questo cromosoma contiene alcuni riarrangiamenti interni, compresa un’interessante traslocazione. Contiene geni legati al cancro al seno. Possiamo trovare BRAF o KMT2C, due dei geni più comunemente mutati in questo tipo di cancro. BRAF è un oncogene coinvolto nella divisione e differenziazione cellulare. KMT2C è coinvolto nella modifica degli istoni (proteine che proteggono il DNA). Questo gene ha una frequenza di mutazione dell’8% nel cancro al seno. Possiamo trovare altri geni importanti come EGFR, un recettore del fattore di crescita epidermico, che porta alla proliferazione cellulare. Amplificazioni e mutazioni di questo gene hanno dimostrato di essere fattori scatenanti in molti tipi di cancro.

Cromosoma 16. (Lanciato il 4 febbraio) Questo cromosoma contiene piccoli riarrangiamenti e alcuni geni legati al cancro al seno. Possiamo trovare geni soppressori del tumore come PALB2, BRD7 o CTCF. PALB2 aiuta a riparare le rotture del DNA, e BRD7 gioca un ruolo importante interagendo con l’oncogene p53 e prevenendo la crescita tumorale. CTCF regola l’espressione genica ed è coinvolto nella struttura tridimensionale del genoma. È spesso mutato nelle linee cellulari del cancro al seno e nei tumori al seno. Inoltre, il cromosoma 16 contiene CDH1, che è un gene che codifica una proteina coinvolta nel legame delle proteine. Le mutazioni in questo gene sono legate a vari tipi di cancro, poiché si pensa che la sua perdita di funzione contribuisca alla progressione del cancro.

Cromosoma 1. (Lanciatol’11 febbraio) Questo cromosoma è il più grande cromosoma umano. Contiene alcuni importanti geni legati al cancro al seno, come MTOR, coinvolto nel percorso PI3K/AKT, che svolge un ruolo essenziale nella crescita cellulare, nella proliferazione, nell’apoptosi e nell’angiogenesi. La disregolazione di MTOR è stata osservata in molti tipi di cancro. BCAS2, anch’esso sul cromosoma 1, è stato associato al cancro al seno, poiché aumenta l’attività del recettore degli estrogeni (ER), e potrebbe promuovere processi cancerogeni nelle cellule del cancro al seno. Inoltre, i geni soppressori del tumore, come SPEN, si trovano su questo cromosoma.

Cromosoma 13. (Lanciato l’11 febbraio) Questo cromosoma contiene un importante gene del cancro al seno, BRCA2. Questo gene è coinvolto nella riparazione delle rotture a doppio filamento del DNA. Le mutazioni in questo gene sono diventate un segno distintivo dei tumori ereditari del seno e delle ovaie. Contiene anche RB1, un gene che regola negativamente il ciclo cellulare ed è stato il primo gene soppressore di tumori trovato.

Cromosoma 2. (Lanciato il 18 febbraio) Questo cromosoma contiene alcuni geni legati al cancro al seno come BARD1, DNMT3A o SF3B1. Il primo gene, BARD1, codifica una proteina che interagisce con un altro gene del cancro al seno, BRCA1 (sul cromosoma 17). La loro interazione promuove funzioni di soppressione del tumore, poiché sono coinvolti nella riparazione della rottura del doppio filamento e nell’apoptosi. DNMT3A è coinvolto nei processi di metilazione, e la sua down-regolazione è stata collegata al cancro al seno. D’altra parte, SF3B1 è coinvolto nello splicing dell’RNA. Mutazioni in questo gene sono state descritte nel cancro al seno.

Cromosoma 3. (Lanciato il 18 febbraio) Questo cromosoma contiene un importante oncogene, PIK3CA. Questo gene ha la più alta frequenza di mutazione nel cancro al seno ed è stato uno dei principali obiettivi della ricerca sul cancro nell’ultimo decennio. Gioca un ruolo in diverse funzioni cellulari, tra cui la proliferazione e la sopravvivenza. Un altro gene situato su questo cromosoma è SETD2, che è coinvolto nelle modifiche degli istoni. Le sue mutazioni sono state comunemente trovate nei tumori, e ha un tasso di mutazione ad alta frequenza nel tumore al seno fillopodiale (PT). Questo tipo di tumore può essere molto aggressivo.

Cromosoma 4. (Rilasciato il 25 febbraio) Questo cromosoma contiene alcuni geni legati al cancro al seno come REST, FGF2 o FBXW7. REST agisce come repressore trascrizionale di geni neuronali in tessuti non neuronali. È interessante notare che può agire come un oncogene o un soppressore tumorale a seconda del contesto. FGF2 è un membro della famiglia dei fattori di crescita dei fibroblasti (FGF). È coinvolto nella guarigione delle ferite o nella crescita dei tumori, tra le altre funzioni. FBXW7 è coinvolto nell’ubiquitinazione delle proteine. Si tratta di un gene soppressore tumorale critico e mutazioni in questo gene sono state rilevate in linee cellulari ovariche e tumorali.

Cromosoma 5. (Lanciato il 25 febbraio) Questo cromosoma contiene geni soppressori del tumore come APC o IRF1. APC codifica una proteina soppressiva del tumore che agisce come antagonista delle vie di segnalazione della superficie cellulare. È coinvolto nella migrazione cellulare o nell’apoptosi, tra le altre funzioni. IRF1 agisce come regolatore trascrizionale e soppressore di tumori. Attiva la trascrizione dei geni coinvolti nella risposta immunitaria. Difetti in questo gene sono stati associati ad alcuni tipi di cancro. Un altro gene interessante situato sul cromosoma 5 è TERT, che codifica una proteina che mantiene le estremità dei telomeri sui cromosomi. La disregolazione di questa proteina può essere coinvolta nell’oncogenesi.

Cromosoma 21. (Lanciato il 4 marzo) Questo cromosoma contiene un gene interessante legato al cancro al seno, RUNX1. Questo gene controlla l’espressione di geni essenziali per lo sviluppo cellulare. La cattiva regolazione di questo gene è associata a molti tumori, compreso il cancro al seno.

Cromosoma 22. (Lanciato il 4 marzo) Questo cromosoma è uno dei più piccoli e contiene tre geni legati al cancro al seno. Uno di questi è PRODH, che codifica una proteina mitocondriale che è coinvolta nei processi che producono ATP o specie reattive dell’ossigeno, giocando un ruolo nella sopravvivenza o morte cellulare. CHEK2 è un altro gene coinvolto nei punti di controllo del ciclo cellulare ed è un soppressore tumorale. Stabilizza la proteina soppressore del tumore p53, portando all’arresto del ciclo cellulare. Inoltre, interagisce con BRCA1 (situato sul cromosoma 17) ed è quindi coinvolto nella sopravvivenza cellulare dopo un danno al DNA. Le mutazioni in CHEK2 conferiscono una predisposizione al cancro al seno, ai sarcomi e ai tumori al cervello, tra altri. Infine, APOBEC3A è un gene che codifica una proteina coinvolta nell’immunità. Le mutazioni in questo gene sono una delle principali fonti di cancro al seno.

Cromosoma 6. (Lanciato l’11 marzo) Questo cromosoma contiene un’enorme varietà di geni legati al cancro al seno. Come TRIM27, un repressore trascrizionale coinvolto nella senescenza cellulare. Ha un ruolo nello sviluppo del cancro, poiché è altamente espresso nelle cellule tumorali, portando alla disregolazione cellulare, alla proliferazione delle cellule tumorali e alla migrazione. Ha il potenziale per servire come biomarcatore per i pazienti affetti da cancro. MAPK14 è un membro della famiglia delle MAP chinasi. Agiscono come un punto di integrazione per molteplici segnali biochimici e sono coinvolti in un’ampia varietà di processi cellulari. Questo gene gioca un ruolo essenziale nella migrazione cellulare nelle cellule del cancro al seno. HSP90AB1 codifica una proteina che appartiene alla famiglia HSP (heat shock protein), che è coinvolta nella sopravvivenza cellulare, nella trasduzione del segnale e nel ripiegamento delle proteine. Sono stati collegati alla formazione dei tumori e alla proliferazione delle cellule tumorali, e vengono studiati come nuovi approcci terapeutici nel trattamento del cancro. Infine, FOXO3 funziona come un trigger per l’apoptosi attraverso l’espressione di geni richiesti per la morte cellulare. È un importante gene soppressore di tumori in una varietà di tumori umani.

Cromosoma 20. (Lanciato l’11 marzo) Questo cromosoma contiene BCAS4 e BCAS1, due geni situati nella regione 20q13.2, una regione che subisce amplificazione, sovraespressione e fusione nel cancro al seno. L’amplificazione di questa regione è associata a fenotipi tumorali più aggressivi. Un altro gene legato al cancro al seno situato su questo cromosoma è CD40. Questo gene è un recettore delle cellule presentanti l’antigene del sistema immunitario, che media un’ampia varietà di risposte immunitarie infiammatorie. È un membro della famiglia dei recettori del fattore di necrosi tumorale (TNR), che sono proteine che sviluppano risposte antitumorali contro le cellule tumorali. CD40 è ampiamente espresso sulla superficie delle cellule immunitarie e in vari tipi di cancro, compreso il cancro al seno.

Cromosoma 19 (Lanciato il 25 marzo). Questo cromosoma contiene un gene soppressore del tumore, STK1, che è alterato in quasi il 3% dei tumori dell’adenocarcinoma polmonare o del carcinoma duttale invasivo del seno. Contiene anche altri geni come CCNE1 o KCNN4. La sovraespressione di CCNE1 è stata osservata in molti tumori, il che causa instabilità cromosomica e può contribuire alla tumorigenesi. KCNN4 codifica una proteina coinvolta nella formazione di canali di potassio nella membrana cellulare. Questo gene ha dimostrato di essere un modulatore della progressione e della resistenza ai farmaci nel cancro al seno. Prendere di mira questo gene potrebbe servire come strategia terapeutica.

Cromosoma 8 (lanciato il 25 marzo). Questo cromosoma racchiude alcuni geni legati al cancro come LOXL2, MYC o NDRG1. LOXL2 codifica una proteina essenziale per la biogenesi del tessuto connettivo. Permette anche il cross-linking del collagene e dell’elastina nella matrice extracellulare dei tumori, facilitando il processo di metastasi. È di particolare interesse nella biologia del cancro in quanto è altamente espresso in alcuni tumori e influenza la proliferazione delle cellule del cancro al seno. L’amplificazione di MYC si osserva in numerosi tumori umani. Inoltre, è altamente espresso nel cancro al seno triplo-negativo, il sottotipo di cancro al seno più aggressivo. Infine, NDRG1 codifica una proteina citoplasmatica coinvolta nelle risposte allo stress, nella crescita e nella differenziazione cellulare. Guida la progressione del tumore e le metastasi cerebrali nei tumori al seno aggressivi e può quindi servire come bersaglio terapeutico e biomarcatore prognostico.

Cromosoma 9. (lanciato il 1º di aprile) Questo cromosoma contiene il gene NOTCH1, un gene importante in quanto fa parte di una via di segnalazione coinvolta nei processi relativi alla specificazione del destino cellulare, differenziazione e proliferazione. L’aumento dei recettori Notch è stato osservato in diversi tipi di cancro, compreso il cancro al seno. Inoltre, il cromosoma 9 contiene il gene SMC5, che è coinvolto nella ricombinazione del DNA, nella senescenza cellulare e nelle rotture del doppio filamento del DNA. Cambiamenti nell’espressione di questo gene sono stati osservati in pazienti con cancro al seno.

Cromosoma 11. (lanciatol’8 aprile). Questo cromosoma contiene il gene ATM che codifica una proteina che è un importante checkpoint del ciclo cellulare. Regola una varietà di proteine, tra cui p53 o BRCA1, due importanti soppressori di tumori. Le mutazioni nel gene ATM sono associate a un aumento del rischio di sviluppare il cancro al seno e a una prognosi peggiore.

Cromosoma 12. (lanciato l’8 aprile). Questo cromosoma contiene tre interessanti geni del cancro al seno. CD9 codifica una glicoproteina di superficie cellulare. È coinvolto nel differenziamento, nell’adesione e nella trasduzione del segnale. L’espressione di questo gene gioca un ruolo chiave nella soppressione della motilità e della metastasi delle cellule tumorali. Il gene ETV6 è coinvolto nelle interazioni proteina-proteina. Riarrangiamenti di questo gene sono stati osservati in pazienti con carcinoma mammario secretorio, che è un raro tipo di cancro al seno che di solito ha un esito favorevole. Un altro gene è MDM2. Questo gene codifica un’ubiquitina ligasi. Può promuovere la formazione del tumore prendendo di mira le proteine soppressorie del tumore come la p53. Così, la sovraespressione di questo gene viene rilevata in una varietà di tumori diversi.

Cromosoma 14: (lanciato il 22 aprile). Questo cromosoma contiene il gene DICER1, che codifica una proteina di elaborazione del miRNA che regola l’espressione genica. L’elaborazione dei miRNA è stata collegata a una vasta gamma di tipi di cancro, quindi le mutazioni in DICER1 sono state collegate allo sviluppo del cancro. È anche conosciuto come un forte agente antivirale con attività contro i virus RNA come il SARS-CoV-2. Un altro gene che contiene è TEP1. Codifica una proteina che catalizza l’aggiunta di nuovi telomeri alle estremità del cromosoma. Poiché la lunghezza dei telomeri è stata collegata al cancro al seno, è un gene davvero interessante da studiare. Anche il gene AKT1 è presente su questo cromosoma: è un noto oncogene che gioca un ruolo nella sopravvivenza cellulare, nell’angiogenesi e nella formazione dei tumori.

Cromosoma 15: (lanciato il 22 aprile). Questo cromosoma racchiude alcuni geni legati al cancro, come SMAD3, un gene soppressore di tumori. Trasmette segnali dalla superficie cellulare al nucleo, regolando l’attività genica e la proliferazione cellulare. NTRK3 codifica una proteina che agisce come un recettore legato alla membrana. Le mutazioni in questo gene sono state associate a medulloblastomi, carcinomi mammari secretori e altri tumori. Questo cromosoma contiene anche il gene IGF1R, che lega il fattore di crescita insulino-simile. Ii è altamente sovraespresso nei tessuti maligni migliorando la sopravvivenza delle cellule.

Cromosoma 18: (lanciato il 22 aprile). Questo cromosoma contiene il gene SMAD4, che codifica una proteina di trasduzione del segnale. Una bassa espressione di questo gene è stata collegata allo sviluppo del cancro al seno. Questo perché SMAD4 è attivato dal fattore di crescita TFG-beta, che è spesso alterato in diversi tipi di tumore. Un altro gene presente su questo cromosoma è BCL2. Questo gene codifica una proteina integrale della membrana mitocondriale esterna che blocca la morte apoptotica di alcune cellule, come i linfociti. Si pensa che l’espressione costitutiva di BCL2 sia la causa del linfoma follicolare, un tipo di cancro che colpisce i globuli bianchi, i linfociti.

Cromosoma X: (lanciato il 22 aprile). Questo cromosoma contiene il gene KDM6A, che codifica UTX, una demetilasi dell’istone coinvolta nello sviluppo embrionale. Mutazioni in questo gene sono state descritte in una vasta gamma di tumori, compreso il cancro al seno. Un altro gene aggiunto è XIST, che è coinvolto nel processo di silenziamento del cromosoma X nei mammiferi femmina, per fornire l’equivalenza di dose tra maschi e femmine, dato che i maschi hanno solo un cromosoma X. XIST è espresso esclusivamente sul cromosoma X inattivo. L’espressione di questo gene è stata trovata deregolata in una varietà di tumori umani rispetto alle cellule normali.