A imputação é uma técnica estatística que permite “adivinhar” pedaços do seu código genético que não foram lidos num exame comum (como os de ancestralidade). Em vez de sequenciar todas as 3 mil milhões de letras do seu genoma, o que seria caríssimo, o computador usa painéis de referência para preencher as lacunas.
- A Biblioteca de Referência (O Gabarito)
Para o sistema saber o que completar, ela precisa de “mapas” de humanos reais que já tiveram o genoma todo mapeado.
- O Projeto 1000 Genomes (2.504 pessoas) foi o pioneiro.
- O HRC (Haplotype Reference Consortium) subiu o nível para cerca de 32.000 pessoas.
- O TOPMed é um dos mais robustos hoje, ultrapassando 97.000 sequências completas.
Quanto maior o painel, maior a diversidade genética disponível. Isso torna muito mais fácil encontrar alguém no mundo que tenha “blocos” de DNA parecidos com os seus, aumentando a precisão da previsão.
- Como o processo funciona na prática?
Imagine que o seu exame leu apenas alguns pontos (chamados de rsIDs). O sistema olha para esses pontos e procura combinações idênticas nos painéis de referência:
- Bloco A: Se nos seus marcadores rs123, rs1234 e rs12345 você segue uma sequência idêntica à do Humano nº 1.233 do painel, o sistema assume que você também herdou as letras que estão entre esses pontos. Ela usa esse humano como “molde” para essa região.
- Bloco B: Logo adiante, nos marcadores rs345, rs3456 e rs34567, o seu padrão muda e passa a ser similar ao do Humano nº 3. A IA troca de referência e completa o que falta com a sequência dele.
- O Resultado
O seu genoma imputado acaba por ser uma colcha de retalhos digital. O sistema identifica em qual “vizinho” do painel de referência você se encaixa em cada trecho do cromossoma. O resultado é uma estimativa altamente assertiva (muitas vezes acima de 99% de precisão) do seu genoma completo, permitindo identificar riscos de doenças ou características que o exame original simplesmente não tinha visto.

