O primeiro esboço do genoma humano foi publicado há exatamente 20 anos. Demorou quase três anos para ser concluído, a um custo de quase um bilhão de dólares. O Projeto Genoma humano permitiu aos cientistas ler, quase de uma ponta à outra, os 3 bilhões de pares de bases de DNA (ou "letras") que definem biologicamente um ser humano.
Foi um empreendimento memorável. Esse projeto permitiu que uma nova geração de pesquisadores identificasse novos alvos para tratamentos de câncer, projetado ratos com sistema imunológico humano e até mesmo construir um site onde você pode navegar por todo o genoma humano como se fosse o Google Maps.
O primeiro genoma humano completo foi gerado a partir de um punhado de doadores anônimos. O objetivo era produzir um genoma de referência que representasse mais de um único indivíduo. Como esperado, não foi suficiente entender a grande diversidade de populações humanas em todo o mundo. Não há duas pessoas iguais e não há dois genomas iguais. Se os pesquisadores quisessem entender a humanidade em toda a sua diversidade com maior precisão, um único genoma humano não seria suficiente.
Milhares ou milhões deles teriam que ser sequenciados: e esse é exatamente o propósito de um projeto em andamento.
Compreendendo a diversidade genética

A riqueza da diversidade genética entre as pessoas é o que torna cada pessoa única. Mas as mudanças genéticas também causam muitas doenças e tornam alguns grupos de pessoas mais suscetíveis a certas doenças do que outros.
Na época do projeto do genoma humano, os pesquisadores também estavam sequenciando os genomas completos de organismos mais simples, como camundongos , moscas da fruta , levedura e algumas plantas . O enorme esforço feito para gerar esses primeiros genomas levou a uma revolução na tecnologia necessária para ler genomas. Uma tecnologia que avançou tanto que hoje não leva anos e milhões de euros para sequenciar um genoma humano completo. Agora é preciso alguns dias e custa menos de mil euros.
Milhares de genomas
Os avanços na tecnologia permitiram aos cientistas sequenciar os genomas completos de milhares de indivíduos de todo o mundo. Iniciativas como a Consórcios de agregação de genoma eles estão fazendo grandes esforços para coletar e organizar esses dados dispersos. Até agora, esse grupo conseguiu coletar quase 150.000 genomas. Dentro desse conjunto de dados, os pesquisadores encontraram mais de 241 milhões de diferenças nos genomas das pessoas, com uma média de uma variante a cada oito pares de bases .
A maioria dessas variações é muito rara e não terá efeito sobre uma pessoa. No entanto, escondidas entre eles estão variantes com importantes consequências fisiológicas e médicas. Por exemplo, algumas variantes do gene BRCA1 predispõem certos grupos de mulheres, como os judeus Ashkenazi, para o câncer para ovários e seios. Outras variantes nesse gene carregam alguns Mulheres nigerianas apresentam mortalidade maior do que o normal para câncer de mama.
Como identificar essas variantes do genoma humano?
A melhor maneira de os pesquisadores identificarem esses tipos de variantes no nível populacional é por meio de estudos comparando os genomas de grandes grupos de pessoas com um grupo de controle. Mas as doenças são complicadas. O estilo de vida, os sintomas e o tempo de início de um indivíduo podem variar muito, e o efeito da genética em muitas doenças é difícil de distinguir. O poder preditivo da pesquisa genômica atual é muito baixo para descartar muitos desses efeitos porque não há dados genômicos suficientes .
Compreender a genética de doenças complexas, particularmente aquelas relacionadas às diferenças genéticas entre grupos étnicos, é essencialmente um problema de big data. E os pesquisadores precisam de mais dados. Muito mais dados.
1.000.000 de genomas

Para atender à necessidade de mais dados, o National Institutes of Health iniciou um programa chamado Todos nós . O projeto visa coletar informações genéticas, registros médicos e hábitos de saúde a partir de pesquisas e dispositivos vestíveis de mais de um milhão de pessoas nos Estados Unidos ao longo de 10 anos. Foi aberto ao público em 2018, e mais de 270.000 pessoas contribuíram com amostras desde então.
O grande potencial deste projeto está na possibilidade de fazer pesquisas cruzando os dados mais díspares. Um neurocientista poderia procurar variações genéticas associadas à depressão, considerando, por exemplo, os níveis de exercício. Um oncologista pode procurar variantes relacionadas ao risco de câncer de pele com base em diferenças étnicas.
Com um milhão de genomas humanos, teremos uma riqueza extraordinária de dados para descobrir os efeitos da variação genética nas doenças, não apenas para indivíduos, mas também dentro de diferentes grupos de pessoas.
A floresta escura do genoma humano

Outra vantagem deste projeto é que permitirá aos cientistas aprender sobre partes do genoma humano que atualmente são muito difíceis de estudar. A maior parte da pesquisa genética foi feita nas partes do genoma que codificam as proteínas. No entanto, estes representam apenas o1,5% do genoma humano.
Uma pesquisa promissora se concentra no RNA, uma molécula que transforma as mensagens codificadas no DNA de uma pessoa em proteínas. No entanto, os RNAs provenientes de 98,5% do genoma humano não produtor de proteínas têm uma série de outras funções. Algumas dessas RNAs estão envolvidas em processos como o maneira in qual câncer se espalha , desenvolvimento embrionário ou controle do cromossomo X em mulheres. Uma vez que o projeto All of Us inclui todas as partes codificantes e não codificantes do genoma, será de longe o maior conjunto de dados disponível para lançar luz sobre esses misteriosos RNAs.