Previsão de risco de demência em indivíduos com comprometimento cognitivo leve: uma comparação entre regressão de Cox e modelos de aprendizado de máquina
BMC Medical Research Methodology volume 22, Número do artigo: 284 (2022) Citar este artigo
1911 Acessos
2 Citações
7 Altmétrica
Detalhes das métricas
Os modelos de regressão de riscos proporcionais de Cox e os modelos de aprendizado de máquina são amplamente usados para prever o risco de demência. As comparações existentes desses modelos foram baseadas principalmente em conjuntos de dados empíricos e produziram resultados mistos. Este estudo examina a precisão de vários modelos de aprendizado de máquina e de regressão de Cox para prever resultados de tempo até o evento usando a simulação de Monte Carlo em pessoas com comprometimento cognitivo leve (MCI).
A precisão preditiva de nove modelos de regressão de tempo até o evento e aprendizado de máquina foi investigada. Esses modelos incluem regressão de Cox, regressão de Cox penalizada (com Ridge, LASSO e penalidades de rede elástica), árvores de sobrevivência, florestas de sobrevivência aleatórias, máquinas vetoriais de suporte à sobrevivência, redes neurais artificiais e aumento de gradiente extremo. Os dados de simulação foram gerados usando o desenho do estudo e as características dos dados de um registro clínico e um grande registro baseado na comunidade de pacientes com CCL. O desempenho preditivo desses modelos foi avaliado com base na validação cruzada tripla por meio do índice de concordância de Harrell (c-index), índice de calibração integrado (ICI) e escore de brier integrado (IBS).
A regressão de Cox e o modelo de aprendizado de máquina tiveram precisão preditiva comparável em três métricas de desempenho diferentes e condições analíticas de dados. Os valores estimados do índice c para regressão de Cox, florestas de sobrevivência aleatória e aumento de gradiente extremo foram 0,70, 0,69 e 0,70, respectivamente, quando os dados foram gerados a partir de um modelo de regressão de Cox em condições de tamanho de amostra grande. Em contraste, os valores estimados do índice c para esses modelos foram 0,64, 0,64 e 0,65 quando os dados foram gerados a partir de uma floresta de sobrevivência aleatória em condições de tamanho de amostra grande. Tanto a regressão de Cox quanto a floresta de sobrevivência aleatória tiveram os menores valores de ICI (0,12 para um tamanho de amostra grande e 0,18 para um tamanho de amostra pequeno) entre todos os modelos investigados, independentemente do tamanho da amostra e do modelo de geração de dados.
Os modelos de regressão de Cox têm desempenho preditivo comparável e, às vezes, melhor do que os modelos de aprendizado de máquina mais complexos. Recomendamos que a escolha entre esses modelos seja guiada por considerações importantes para hipóteses de pesquisa, interpretabilidade do modelo e tipo de dados.
Relatórios de revisão por pares
A demência é uma condição de saúde complexa que influencia a memória, o pensamento, o comportamento e a qualidade de vida. Em 2015, os custos mundiais da demência foram estimados em $ 818 bilhões de dólares e 86% dos custos foram incorridos em países de alta renda [1]. A demência é geralmente precedida por comprometimento cognitivo leve (MCI), definido como preocupações cognitivas com escores de testes cognitivos ruins, apesar das atividades da vida diária preservadas. Indivíduos com MCI têm um risco substancialmente maior de desenvolver demência em comparação com pessoas com cognição normal. Em média, 5-10% das pessoas com DCL progridem para demência por ano [2]; no entanto, nem todos os indivíduos com CCL evoluem para demência [3]. Na ausência de tratamentos modificadores da doença para a demência, há uma demanda crescente por auxiliares de decisão clínica para apoiar a identificação precoce de indivíduos com alto risco de desenvolver demência e que podem se beneficiar de intervenções direcionadas para fatores de risco modificáveis. Essas ferramentas também podem ser usadas para fins de vigilância: quando os indivíduos com MCI evoluem para demência, eles podem receber cuidados de suporte para viver com segurança na comunidade [4]. Além disso, essas ferramentas podem ajudar os profissionais de saúde a responder perguntas para pacientes com MCI e suas famílias sobre o risco de desenvolver demência e planejamento de vida futura [5].
Os modelos de previsão de risco prognóstico [6], que estimam a probabilidade de desenvolver demência com base em um conjunto de fatores de risco dos pacientes, constituem uma classe de modelos sobre os quais essas ferramentas de decisão podem ser desenvolvidas. Os escores prognósticos de risco para demência foram desenvolvidos com base em análises de regressão e modelos de aprendizado de máquina, sendo este último usado com frequência nos últimos anos. Por exemplo, uma revisão sistemática recentemente publicada de escores de risco de demência mostrou que cerca de 40% dos modelos publicados adotaram um algoritmo de aprendizado de máquina [7]. No entanto, a revisão concluiu que a maioria dos escores de risco identificados tem limitações metodológicas inerentes, que incluem a falta de validações internas e externas dos modelos, escolha de métodos estatísticos para desenvolver os escores de risco e o longo intervalo decorrido entre as avaliações dos indivíduos em risco [7]. Até o momento, nenhum escore de risco de demência adequado foi adotado como auxílio à decisão clínica para uso na prática clínica de rotina [7, 8].
3.0.CO;2-5" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291097-0258%2819990915%2F30%2918%3A17%2F18%3C2529%3A%3AAID-SIM274%3E3.0.CO%3B2-5" aria-label="Article reference 35" data-doi="10.1002/(SICI)1097-0258(19990915/30)18:17/183.0.CO;2-5"Article CAS PubMed Google Scholar /p>