A análise do conjunto de dados genômicos ‘Todos nós’ começa a abordar as desigualdades na pesquisa genética.
Um enorme programa dos EUA que visa melhorar os cuidados de saúde, centrando-se nos genomas e nos perfis de saúde de grupos historicamente sub-representados, começou a produzir resultados. Análises de até 245 mil genomas recolhidos pelo programa All of Us, gerido pelos Institutos Nacionais de Saúde dos EUA em Bethesda, Maryland, revelaram mais de 275 milhões de novos marcadores genéticos, quase 150 dos quais podem contribuir para a diabetes tipo 2.
O trabalho também identificou lacunas na pesquisa genética em populações não brancas. As descobertas foram publicadas em 19 de fevereiro em um pacote de artigos na Nature 1 , 2 , Communications Biology 3 e Nature Medicine 4 .São uma “boa destilação do recurso All of Us – o que é e o que pode fazer”, diz Michael Inouye, genomicista computacional da Universidade de Cambridge, no Reino Unido. “Este será o conjunto de dados de referência” para os investigadores genéticos que querem saber se as suas descobertas são generalizáveis a uma população ampla ou se se aplicam apenas a uma população limitada, acrescenta.
Preenchendo a lacuna
Os investigadores há muito que reconhecem a falta de diversidade nos genomas disponíveis para estudo, diz Jibril Hirbo, geneticista do Centro Médico da Universidade Vanderbilt, em Nashville, Tennessee, que estuda a genética das disparidades na saúde. Um estudo 5 que analisou dados recolhidos até Janeiro de 2019 concluiu que 78% das pessoas na maioria dos estudos genómicos de doenças em grande escala eram de ascendência europeia. Isto exacerbou as disparidades de saúde existentes, especialmente entre os indivíduos não-brancos, diz Hirbo. Quando os investigadores escolhem alvos genéticos ou moleculares para novos medicamentos ou criam modelos para prever quem está em risco de desenvolver uma doença, tendem a tomar decisões com base em dados não diversificados porque é tudo o que está disponível.
Enfrentando a injustiça na ciência do genoma
O programa All of Us, que recebeu mais de 3,1 mil milhões de dólares até à data e planeia montar perfis de saúde detalhados para um milhão de pessoas nos Estados Unidos até ao final de 2026, pretende colmatar essa lacuna, diz Andrea Ramirez, chefe de dados do programa. Policial. Começou a inscrever pessoas em 2018 e divulgou a sua primeira parcela de dados – cerca de 100.000 genomas inteiros – em 2022. Em abril de 2023, tinha inscrito 413.000 participantes anónimos, 46% dos quais pertencem a um grupo racial ou étnico minoritário, e tinham partilhado quase 250.000 genomas. Em comparação, o maior conjunto de dados do genoma completo do mundo , o UK Biobank, divulgou até agora cerca de meio milhão de genomas, cerca de 88% dos quais são de pessoas brancas.
O conjunto de dados All of Us é “um enorme recurso, particularmente de genomas afro-americanos, hispânicos e latino-americanos, que está enormemente ausente da grande maioria dos recursos de biobancos e consórcios genómicos em grande escala”, diz Alicia Martin, geneticista populacional em Massachusetts. Hospital Geral de Boston.
Além dos genomas, a base de dados inclui respostas de inquéritos de alguns participantes, registos eletrónicos de saúde e dados de dispositivos vestíveis, como Fitbits, que relatam a atividade das pessoas, “tornando este um dos recursos mais poderosos de dados genómicos”, diz Martin.
Uma necessidade urgente
Um estudo publicado na Nature sobre diabetes tipo 2 é um exemplo do poder de usar um banco de dados que inclui diversos genomas, diz Ramirez. A condição, que afecta cerca de uma em cada dez pessoas nos Estados Unidos, pode ser causada por muitos mecanismos biológicos distintos que envolvem vários genes. Os pesquisadores analisaram informações genéticas de vários bancos de dados, incluindo All of Us, de um total de mais de 2,5 milhões de pessoas; quase 40% dos dados vieram de indivíduos que não têm ascendência europeia. A equipe encontrou 611 marcadores genéticos que podem impulsionar o desenvolvimento e a progressão da doença, 145 dos quais nunca haviam sido relatados antes. Estas descobertas podem ser utilizadas para desenvolver “cuidados geneticamente informados para a diabetes”, escrevem os autores.
O maior conjunto de sequências do genoma humano do mundo é aberto aos cientistas
Num outro estudo 3 , os investigadores utilizaram dados da All of Us para examinar variantes patogénicas — isto é, diferenças genéticas que aumentam o risco de uma pessoa desenvolver uma doença específica. Descobriram que, entre os genomas de pessoas com ascendência europeia, 2,3% tinham uma variante patogénica. Entre os genomas de pessoas com ascendência africana, no entanto, este número caiu para 1,6%.
O coautor do estudo, Eric Venner, geneticista computacional do Baylor College of Medicine em Houston, Texas, adverte que não deve haver nenhuma razão biológica para as diferenças. Ele diz que a disparidade é provavelmente o resultado de mais pesquisas terem sido realizadas em pessoas de ascendência europeia; simplesmente sabemos mais sobre quais mutações nesta população levam à doença. Na verdade, os investigadores encontraram mais variantes de risco desconhecido nos genomas de pessoas com ascendência não europeia do que naquelas com ascendência europeia, acrescenta. Isto sublinha a necessidade urgente de estudar mais detalhadamente os genomas não europeus, diz Venner.
Atualizando modelos
A recolha e utilização de mais dados genómicos e de saúde de diversas populações será especialmente importante para gerar “pontuações de risco poligénico” mais precisas. Eles fornecem uma imagem do risco de uma pessoa desenvolver uma doença como resultado de sua genética.
Projeto de medicina personalizada dos EUA visa equilíbrio étnico
Para calcular uma pontuação para uma doença específica, os pesquisadores desenvolvem um algoritmo que é treinado em milhares de genomas de pessoas que têm ou não a doença. A pontuação da própria pessoa pode então ser calculada inserindo seus dados genéticos no algoritmo.
Pesquisas anteriores 6 demonstraram que as pontuações, que poderão em breve ser utilizadas na clínica para cuidados de saúde personalizados, tendem a ser menos precisas para populações minoritárias do que para populações maioritárias. Num dos artigos atuais 4 , os investigadores utilizaram os dados mais inclusivos de All of Us para melhorar o panorama: calibraram e validaram pontuações para 23 condições e recomendaram que 10 fossem priorizadas para utilização na clínica, para condições incluindo doença coronária e diabetes. Martin aplaude estes esforços, mas espera que estudos futuros abordem a forma como os médicos e outros profissionais da clínica interpretam estas pontuações e se as pontuações podem melhorar a saúde de uma pessoa a longo prazo devido às decisões de tratamento que provocam.
O programa All of Us planeja divulgar uma parcela de dados todos os anos, representando novos inscritos e genomas, incluindo um no final de 2024, diz Ramirez. É excelente que dados diversos estejam chegando, diz Hirbo, acrescentando que gostaria de ver os algoritmos existentes que foram treinados principalmente nos genomas de pessoas de ascendência europeia atualizados em breve. “Os modelos ainda estão muito atrasados”, diz ele.