top of page

Compreensão e preparação de dados aplicados na estratificação de risco em ansiedade

por Evaldo de Oliveira da Silva, Marcello Peixoto Bax, Auxiliatrice Caneschi Badaró, Raissa Barros Dominato, Carla Maria Guimarães de Assis, Manuela Mayworm Jens, Eduarda Novais Falcão, Rubens Amorim Souto Neto, João Vitor Carvalho, João Gabriel Garcia Paiva e Samuel Henrique Reis do Nascimento A pesquisa busca compreender dados estruturados identificados a partir estratificação de risco em ansiedade, juntamente com dados textuais (não estruturados) de tratamentos psicoterápicos a fim de prepará-los para análise qualitativa e quantitativa.

Transtornos mentais estão entre as principais causas de incapacidade no mundo. Estudos do Global Burden Disease (GBD ) apresentam que milhões de pessoas no mundo sofrem de depressão, ansiedade e cometem suicídios (WHITEFORD; FERRARI; DEGENHARDT, 2016). De acordo com a Mayo Foundation for Medical Education and Research (MAYO CLINIC, 2022) algumas das causas da ansiedade são: trauma, estresse devido a uma doença, acúmulo de estresse, personalidade, outros transtornos de saúde mental, parentes próximos com transtorno de ansiedade, drogas ou álcool.


De acordo com os números publicados pelo GDB, aproximadamente 300 milhões de pessoas possuem algum tipo de transtorno de ansiedade (DATTANI; RITCHIE; ROSER, 2018). A melhoria da qualidade de dados para estudos na área da saúde mental tem sido um desafio. Porém, o objetivo de enriquecer estudos que visam melhorar a assistência à saúde mental se faz relevante. Dados sobre parâmetros epidemiológicos, psicopatologias, faixas etárias, estimativas globais e nacionais são frequentemente usados em estudos em saúde mental (DATTANI; RITCHIE; ROSER, 2018). Dados utilizados para análise da condição mental dos pacientes envolvem tanto dados estruturados, tais como instrumentos de avaliação e questionários para estratificação de risco, quanto dados não-estruturados (evolução dos tratamentos com base em técnicas da psicologia) (MELLO; 2015, PAULA, 2019). O governo brasileiro por meio do Ministério da Saúde orienta a utilização de instrumentos que visam direcionar a assistência à saúde (incluindo saúde mental), a fim de revisar metas e resultados esperados em diferentes intervenções, conforme as necessidades dos pacientes (BRASIL, 2014).


Técnicas são utilizadas por profissionais em saúde mental para descrever os casos e tratamentos psicoterápicos. A Terapia Cognitivo-Comportamental (TCC) tem sido acolhida em diferentes campos que envolvam trabalhos terapêuticos, isso por apresentar um conjunto vasto de estudos e bases científicas, definindo-a como uma prática baseada em evidências em psicologia. Entre suas particularidades, considera-se o uso de protocolos de atendimentos e manuais que guiam a atuação prática a partir do desenho do caso clínico e possíveis diagnósticos. Ademais, tendo em vista que os transtornos de ansiedade se mostram cada vez mais presentes na vida da população, torna-se notória a necessidade crescente de estudo e tratamento destes no campo da Psicologia e de grande relevância para a pesquisa desse transtorno (MELO; LOURENÇO, 2020).


Os tipos de dados mencionados, tanto da estratificação de riscos, quanto dos tratamentos psicoterápicos, podem servir para impulsionar estudos científicos na área da psicologia, onde o conhecimento sobre eles pode ser reutilizado e compartilhado em diferentes pesquisas na melhoria da aplicação dos tratamentos. Assim, entende-se a importância de compreender e preparar os diferentes dados produzidos. A estratificação de riscos em saúde mental pode ser utilizada como instrumento para orientar os tratamentos psicoterápicos na avaliação dos sinais e sintomas do paciente. No entanto, os dados na forma que estão estruturados, podem dificultar as análises da eficácia dos tratamentos, se os riscos foram mitigados ou quais fatores que influenciam no tratamento. Dados quantitativos, oriundos de instrumentos de avaliação do paciente (estratificação de riscos) e qualitativos (casos clínicos e evolução dos tratamentos) necessitam estar compreendidos e preparados para permitir as análises.


A e-Science refere-se à aplicação de métodos de obtenção de resultados científicos por meio da utilização de computação, e grande volume de dados (BERTHOLD et al., 2010; SCHRÖER; KRUSE; GÓMEZ, 2021). Possui um processo suportado pelas fases iniciais de compreensão e preparação de dados. A compreensão de dados visa entender se existem dados suficientes para responder a diferentes questões de pesquisa (BERTHOLD et al., 2010). Deve-se estabelecer o entendimento entre dados existentes, em relação aos dados necessários para desenvolvimento da pesquisa. Por meio desta fase que o cientista de dados obtém insights sobre os dados que podem ser utilizados em etapas posteriores (BERTHOLD et al., 2010; SCHRÖER; KRUSE; GÓMEZ, 2021). Inicia-se a compreensão com a coleta inicial de dados e que prossegue com atividades para se familiarizar com os dados, identificar problemas de qualidade e detectar subconjuntos de interesse para pesquisa científica a fim de formar hipóteses (DANUBIANU; PENTIUC; TOBOLCEA, 2010). De acordo com Berthold et al. (2010) algumas questões norteiam a compreensão de dados:

  • Que tipo de atributos temos e como são seus domínios?

  • O domínio de um atributo é estável ao longo do tempo ou muda?

  • É possível navegar pelas diferentes colunas de dados a fim de visualizá-los?

  • Os dados podem ser correlacionados para extrair métricas?

  • Existem valores discrepantes(outliers) que diferem dos outros dados?

  • Os valores ausentes impactam no entendimento do conjunto de dados?

As questões acima podem ser respondidas a partir da execução dos seguintes métodos: compreensão de dados; qualidade de dados; visualização de dados e identificação de valores discrepantes. O uso de ontologias tem sido apresentado como mecanismo para auxiliar na compreensão de dados.


Ontologias são estruturas usadas para representar o conhecimento de um determinado domínio de aplicação (GRUBER; 1993, GUARINO, 1998). Alguns trabalhos utilizam ontologias como mecanismos para compreensão de dados, atribuindo-lhes significados (semântica). Com base em uma discussão sobre a hierarquia de compreensão de dados, Zhou et al. (2010) analisam a integração de informações sob uma perspectiva semântica. A gestão de dados suportada por ontologias oferece um caminho promissor para resolver problemas de compreensão, localização, reutilização e integração de dados e a qualidade das informações geradas (FUJIMOTO; CANEDO, 2018). Na fase de compreensão de dados, uma forma de tornar explícito o conhecimento da ontologia, é o mapeamento de dados para ontologia (SVÁTEK; RAUCH; RALBOVSKÝ, 2005). Em Brisson e Collard (2008) os autores modelam o conhecimento de domínio durante as etapas de compreensão de domínio e compreensão de dados para construir um sistema de informação orientado a ontologia (ODIS, An Ontology Driven Information System). De acordo com os autores, a compreensão dos dados significa a seleção e descrição dos dados de origem para capturar sua semântica e confiabilidade por meio de ontologias.


De acordo com Paton (2019) os cientistas de dados gastam tempos excessivos preparando dados. A partir da compreensão dos dados, a preparação de dados abrange a seleção, limpeza, mapeamento e integração de conjuntos de dados existentes para uma organização de dados adequada para modelagem e análise (BERTHOLD et al., 2010; PATON, 2019). Dados devem estar preparados adequadamente para suportar as técnicas de modelagem evitando análises enviesadas (PYLE, 1999).


Diferentes informações podem ser extraídas da estratificação e das evoluções dos tratamentos, com o objetivo de fundamentar as decisões sobre como avaliar os sinais e sintomas do paciente e quais dados são usados para atribuir o nível de risco. A ausência da definição e organização conceitual dos diferentes dados pode gerar interpretações ambíguas sobre a estratificação de risco e, como consequência, a elaboração equivocada da assistência à saúde do paciente.


Os dados coletados pela aplicação de questionários podem ser usados para apoiar as equipes multiprofissionais a responder questionamentos com base em diferentes tipos de estudos, a fim de propor tratamentos que possam melhorar a saúde mental do paciente. No entanto, a estrutura dos dados gerados no formato tabular carece de modelagem conceitual que explicite suas propriedades e relações, e não favorece a integração de diferentes conjuntos de dados que podem ser formados a partir não somente da própria estratificação, mas também de conjuntos de dados externos.


A partir do risco estratificado, são estabelecidas intervenções por meio de sessões de com o uso da TCC. Entende-se que o rastreio do transtorno mental de ansiedade não deve utilizar somente instrumentos, tal como a estratificação de risco, para geração de dados quantitativos e métricas do nível de risco da saúde do paciente. Uma estratégia importante para rastreio na atenção primária, é considerar os dados das evoluções (anotações). As evoluções podem constituir um conjunto de dados que servem como base para rastrear se os tratamentos estão sendo efetivos com objetivo de orientar a melhoria do estado de saúde dos pacientes, e, consequentemente, mitigar o risco estratificado. Os dados produzidos na estratificação são considerados como dados quantitativos, pois geram uma nota (final score) para o paciente com base em um conjunto de perguntas e a pontuação atribuída a cada uma. A análise qualitativa do caso clínico pode ser realizada usando os textos das evoluções, a fim de gerar dados qualitativos. Ambos os tipos de dados sendo compreendidos, preparados e integrados em uma mesma base de dados abrem caminho para analisar diferentes variáveis para estudos científicos ou até mesmo suportar a descoberta de novos padrões de tratamentos psicoterápicos que obtiveram sucesso na mitigação dos riscos em ansiedade para diferentes grupos de pacientes.


Este texto refere-se ao projeto de pesquisa de Doutorado intitulado “Processo sistemático fundamentado em modelagem ontológica aplicado à estratificação de risco em saúde mental”, realizado no Programa de Pós-Graduação em Gestão e Organização do Conhecimento da Universidade Federal de Minas Gerais (PPGGOC). O projeto tem como objetivo compreender dados estruturados identificados a partir estratificação de risco em ansiedade, juntamente com dados textuais (não estruturados) de tratamentos psicoterápicos a fim de prepará-los para análise qualitativa e quantitativa. A pesquisa aborda o uso de ontologias para anotar semanticamente os dados, e de tecnologias que permitam gerar grafos de conhecimento. Como resultado, espera-se que especialistas de domínio possam navegar pelos grafos para realizar análise quali-quanti e inferir novos conhecimentos sobre a eficiência dos tratamentos na mitigação dos riscos em ansiedade.


Este projeto é realizado em parceria com o Centro Universitário UniAcademia situado em Juiz de Fora, Minas Gerais. O UniAcademia dispõe de infraestrutura física e pode fornecer apoio técnico administrativo para execução do projeto. Desde 1972, o UniAcademia possui uma Clínica Escola de Psicologia com estrutura física e suporte de professores do curso de graduação em Psicologia que coordenam atividades de atendimento gratuito a dezenas de pacientes de Juiz de Fora e região. Alunos dos cursos de graduação em Psicologia e Engenharia de Software participam da pesquisa em estágio avançado.


Referências


BRISSON, Laurent; COLLARD, Martine. An ontology driven data mining process. International Conference on Enterprise Information Systems, Barcelona, jun. 2008. p. 54-61. Disponível em: https://hal.archives-ouvertes.fr/ird-00842979. Acesso em: 25 nov. 2022.


BERTHOLD, M. R.;BORGELT, C.; H¨OPPNER, F.; KLAWONN, F. Guide to intelligent data analysis: how to intelligently make sense of real data. London: Springer, 2010. Disponível em: