Dados do Trabalho
Título
Sarcoma de Ewing - Aprendizagem de Máquina para Classificação e Seleção de Genes Relevantes
Resumo
A seleção de biomarcadores genéticos pode beneficiar o gerenciamento clínico de pacientes e auxiliar na compreensão dos mecanismos envolvidos na tumorigênese. Entretanto, a análise de dados de expressão utilizando Inteligência Artificial ainda é um desafio, devido à alta dimensionalidade, pequena quantidade de amostras por dataset, relações complexas não lineares e alto ruído de fundo. O sarcoma de Ewing (SE) é caracterizado pela presença da proteína de fusão EWSR1-FLI1 e o seu diagnóstico é um grande desafio. Ele é composto por células indiferenciadas, exibindo um fenótipo de pequenas células redondas o qual é compartilhado por outras entidades tumorais, como rabdomiossarcoma e neuroblastoma. O objetivo deste trabalho foi analisar diferentes métodos de Aprendizagem de Máquina (AM) para classificação e seleção de genes relevantes de tumores utilizando dados de expressão gênica e posteriormente utilizar essa metodologia para Sarcoma de Ewing (SE). Avaliamos 21 métodos de AM (16 Rasa e 5 Profunda), usando 11 datasets de diferentes tumores disponibilizados no Gene Expression Omnibus (GEO). O GSE2553 foi utilizado para classificar e diferenciar SE de outros 12 tumores (que compartilham fenótipo histológico com SE). O SVM com kernel Linear L2 ficou entre os melhores classificadores (acurácia média de 91.67% nos 11 datasets e 99.46% no SE). Para a seleção de genes relevantes no SE, realizamos uma combinação dos resultados de 20 modelos de SVM (ordenados pela média de posição de importância entre os modelos). Através dessa metodologia identificamos 5 genes, ATP1A1, DYRK3, KDSR, GLG1 e FCGRT, capazes de diferenciar SE de outros tumores com fenótipo histológico semelhante. Recentemente foi demonstrado que ATP1A1 e GLG1 são marcadores de alta especificidade para SE e podem oferecer um diagnóstico rápido e eficiente por imuno-histoquímica (IHQ). O SE é caracterizado pela presença da fusão EWSR1-FLI e os genes KDSR e FCGRT, identificados neste trabalho, são regulados por essa quimera. Essa metodologia se mostrou eficiente para detectar genes potenciais para o diagnóstico de IHQ no SE, e contribui para o desenvolvimento de um diagnóstico mais preciso e de menor custo.
Área
Tumores sólidos
Autores
Gisele Moraes Simas, Marialva Sinigaglia, André Tesainer Brunetto, Ricardo Matsumura de Araújo