Universidade Federal de Santa Maria
Ci. e nat., Santa Maria, v. 42
Commemorative Edition: Statistic, e49, 2020
DOI: http://dx.doi.org/10.5902/2179460X40510
Received: 11/10/2019 Accepted: 17/12/2019
Bacharelado
Previsão da taxa de incidência dos casos de AIDS no município de Santa Maria – RS
Prediction of the incidence rate of AIDS cases in the municipality of Santa Maria - RS
Camila Malu da Rosa I
Fernando de Jesus Moreira Junior II
Cleber Bisognin III
I Universidade Federal de Santa Maria, Santa Maria, Brasil. E-mail: camilamaludarosa@gmail.com.
II Universidade Federal de Santa Maria, Santa Maria, Brasil. E-mail: fmjunior777@yahoo.com.br.
III Universidade Federal de Santa Maria, Santa Maria, Brasil. E-mail: cleber.bisognin@ufsm.br.
RESUMO
A disseminação da AIDS foi um fato social marcante no final do século XX, devido principalmente à falta de conhecimento das pessoas sexualmente ativas e usuários de drogas, alastrando-se rapidamente pelos cinco continentes. Inicialmente, estava associada ao grupo de homossexuais masculinos. Com o passar dos anos, outros segmentos populacionais infectaram-se com o Vírus da Imunodeficiência Humana (HIV). Assim, este artigo tem como objetivo comparar metodologias de previsão, para prever a taxa de incidência de AIDS a cada 100 mil habitantes, em homens e mulheres em Santa Maria, entre 2017 a 2022. Para isto, foram ajustados dois modelos de previsões para cada série (modelo de tendência polinomial mais um modelo ARIMA(p,d,q), e um modelo de Suavização Exponencial). Como as séries apresentam quebras estruturais devido à vários acontecimentos históricos no Brasil e no mundo, foram utilizadas metodologias de combinações de previsão através de regressões robustas, pelos métodos dos Mínimos Quadrados Ponderados, MM e Regressão Quantílica. Verificamos através das medidas de acurácia que, para os homens as melhores metodologias para previsão foi o Modelo 1 e as combinações de previsão por regressão, pelos métodos de MM e RQ. Já para as mulheres as melhores metodologias foram o Modelo 1 e as combinações de previsão por regressão, pelo método de RQ.
Palavras-chave: Aids; Combinação de Previsão; Regressão Robusta.
ABSTRACT
The spread of AIDS was a striking social fact in the late twentieth century, mainly due to the lack of knowledge of sexually active people and drug users, spreading rapidly across five continents. Initially, it was associated with the group of male homosexuals. Over the years, other population segments became infected with the Human Immunodeficiency Virus (HIV). Thus, this article aims to compare forecasting methodologies to predict the incidence rate of AIDS per 100,000 inhabitants in Santa Maria between 2017 and 2022. For this purpose, two forecasting models were adjusted for each series (polynomial trend model plus an ARIMA model (p, d, q), and an exponential smoothing model). As the series show structural breakdowns due to various historical events in Brazil and around the world, prediction combinations methodologies were used through robust regressions, using the Weighted Least Squares, MM and Quantile Regression methods. We verified through the accuracy measures that, for men, the best forecasting methodologies were Model 1 and the regression forecast combinations, using the MM and RQ methods. For women, the best methodologies were Model 1 and regression prediction combinations by the RQ method.
Keywords: Aids; Forecast combination; Robust Regression.
A identificação, em 1981, da Síndrome da Imunodeficiência Adquirida (AIDS) tornou-se um marco na história da humanidade. A epidemia da infecção pelo vírus da imunodeficiência humana (HIV) tornou-se um fenômeno abrangente em todo o mundo. Segundo Brito et al. (2001), a AIDS destaca-se entre as enfermidades infecciosas emergentes pela grande magnitude e extensão dos danos causados às populações e, desde a sua origem, tem-se discutido exaustivamente pela comunidade científica e pela sociedade em geral.
Conforme Schaurich et al. (2006), a disseminação da AIDS foi um evento sociocultural marcante no final do século XX, alastrando-se rapidamente pelos cinco continentes. Inicialmente, estava associada, principalmente, ao grupo dos homossexuais masculinos. Porém, com o passar dos anos, outros segmentos populacionais infectaram-se com o Vírus da Imunodeficiência Humana (HIV).
Como resultado das excessivas desigualdades da população brasileira, a propagação da infecção pelo HIV no país revela uma epidemia, que vem sofrendo transformações significativas em seu perfil epidemiológico ao longo do tempo. Assim,
De epidemia inicialmente restrita a alguns círculos cosmopolitas das denominadas metrópoles nacionais — São Paulo e Rio de Janeiro — e marcadamente masculina, que atingia prioritariamente homens com prática sexual homossexual e indivíduos hemofílicos, depara-se, hoje, com quadro marcado pelos processos da heterossexualização, da feminização, da interiorização e da pauperização. O aumento da transmissão por contato heterossexual resulta em crescimento substancial de casos em mulheres, o que vem sendo apontado como o mais importante fenômeno para o atual momento da epidemia. (BRITO et al. 2001, p.208)
Contudo, ao se buscar compreender o norteamento entre a saúde e a doença, percebe-se que além das condições de cada indivíduo, tem-se também uma rede complexa de crenças, hábitos, valores, ações, conhecimentos e significados pessoais e coletivos.
Em 13 de novembro de 1996, o então Presidente do Brasil, Fernando Henrique Cardoso, sancionou a LEI 9.313, que garante aos portadores do vírus HIV e AIDS o direito de receber gratuitamente toda a medicação necessária para seu tratamento, pelo Sistema Único de Saúde (SUS). O acesso universal à terapia antirretroviral, tem possibilitado a redução das internações hospitalares e dos óbitos por AIDS no Brasil, onde uma das estratégias para combater a epidemia é a política de distribuição dos medicamentos antirretrovirais.
A ascensão do conhecimento e os avanços na utilização de recursos diagnósticos e terapêuticos tem se mostrado decisivos no aumento da sobrevivência de indivíduos com infecção pelo HIV. Conforme Saldanha et al. (2009), “vários indicadores evidenciam o efeito positivo dessa política adotada no país, como uma redução da mortalidade (50%), diminuição das internações hospitalares (80%), redução da incidência de infecções oportunistas, e da transmissão vertical”.
Segundo a Associação Brasileira Interdisciplinar de AIDS (ABIA, 2011), a taxa de incidência de AIDS no Brasil, entre 1991 a 2011, era de 19,7 casos a cada 100 mil habitantes. No Rio Grande do Sul, durante o mesmo período, a taxa era de 40,2 casos a cada 100 mil habitantes. Isso gera um cenário preocupante, pois a incidência de casos no RS é muito maior, por exemplo, do que as taxas em São Paulo e Rio de Janeiro, com 20,6 e 31,5 casos a cada 100 mil habitantes, respectivamente.
Diante dos apontamentos anteriores, observa-se que os estudos realizados retratam apenas o que vem acontecendo com as taxas de incidência até o momento. Assim, este trabalho tem como objetivo prever a taxa de incidência, de AIDS a cada 100 mil habitantes, em homens e mulheres em Santa Maria – RS, entre 2017 a 2022. Desta forma, realizar previsões acuradas da taxa de incidência de AIDS torna-se fundamental para que os órgãos competentes possam lançar e fortificar campanhas de prevenção.
O presente artigo é composto por cinco seções. Além desta introdução serão apresentadas as técnicas e combinações de previsões dos modelos, na sequência a metodologia utilizada, após os resultados e discussões e para finalizar, as considerações finais.
2 TÉCNICAS DE PREVISÃO
Nesta seção são apresentados os modelos utilizados para analisar as séries temporais das taxas de incidência dos casos de AIDS a cada 100 mil habitantes para homens e mulheres, no município de Santa Maria, a citar, modelos ARIMA(p,d,q) e Suavização Exponencial com efeitos sazonais aditivos. Para melhorar as medidas de acurácia (CLEMEN, 1989) e dado que as séries temporais em estudo apresentam quebras estruturais (ver Figura 3), serão utilizados também três métodos de combinações de previsão por regressão linear robusta, a citar, métodos dos Mínimos Quadrados Ponderados, MM e Regressão Quantílica.
A seguir são definidos os processos ARIMA (p,d,q), proposto por Box e Jenkins (1976).
Definição 1: Seja um processo estocástico satisfazendo a equação (1).
|
(1) |
onde m é a média do processo, é o processo ruído branco, B é o operador defasagem ou de retardo, isto é, , para , e são os polinômios de ordem p e q, respectivamente, definidos pela equação (2).
|
(2) |
com , , , , são constantes reais e . Então é um processo auto regressivo integrado de média móvel de ordem (p,d,q), denotado por ARIMA(p,d,q), onde é o grau de diferenciação.
Outro método de previsão de séries temporais é através dos métodos de suavização exponencial, onde “a grande popularidade atribuída aos métodos é devida à simplicidade, à eficiência computacional e à sua razoável previsão” (MORETTIM E TOLOI, 1981).
Assim, conforme Makridakis et al. (1998), o modelo de Holt-Winters é entendido como um método de suavização exponencial, incluindo-se uma equação extra, a qual é utilizada para ajustar a previsão da sazonalidade. De acordo com Morettin e Toloi (1981), esse modelo possui procedimentos baseados em três equações com constantes de alisamento diferentes, sendo associados a cada uma das componentes do padrão da série: nível, tendência e sazonalidade.
Definição 2: Para os Modelos de Holt-Winters para efeitos sazonais aditivos, considera-se que tal série é formada pela soma do nível, tendência, um fator sazonal e um erro aleatório, como apresentado pela equação (3).
, para |
(3) |
As estimativas do nível da série no tempo t, denotado por , da tendência, denotada por e do fator sazonal, denotado por , são dadas, respectivamente pelas equações de (4) a (6).
|
(4) |
|
(5) |
|
(6) |
onde: α é o coeficiente de ponderação exponencial do nível , b é o coeficiente de ponderação exponencial da tendência e g é o coeficiente de ponderação exponencial do fator sazonal .
Segundo Jacobs (2014), uma forma de melhorar as previsões de séries temporais é por meio de combinação das previsões de modelos, onde vários estudos demonstraram que a combinação das previsões obtém um desempenho superior em comparação à utilização individual de cada modelo.
O método de combinação por regressão é baseado na equação
, para |
(7) |
Onde é uma constante, , para k = 2, 3 , são os pesos das previsões e para k = 2, 3 , são as previsões individuais de cada modelo que serão combinadas.
As séries temporais ajustadas neste trabalho, pelos modelos ARIMA e Holt-Winters, apresentam quebras estruturais (quebras de regime), no entanto, os modelos podem apresentar problemas para prever os futuros valores das séries. Um método para suprir este problema, seria a combinação de previsão por meio de regressão robusta, assim, a influência das quebras estruturais seria minimizada na previsão. Segundo Fontoura (2015), modelos de regressão linear são muito utilizados em diversas áreas de estudo, porém podem apresentar alguns problemas em determinadas condições. Então, uma das possíveis soluções, é a utilização de métodos robustos de estimação de regressão linear, capazes de amenizar esses problemas. Uma das principais causas que geram esses problemas nos modelos de regressão linear estimados por certos métodos, são os outliers e/ou quebras estruturais.
Então, para ajustar uma equação que conceba boas estimativas dos coeficientes de regressão baseados em observações que possuem outliers, ou quando a variável resposta não segue uma distribuição normal, utiliza-se o método de regressão linear robusta, cujo objetivo é reduzir a influência de pontos discrepantes que afetam a qualidade da estimação dos parâmetros do modelo de regressão (FONTOURA, 2015).
Um procedimento de estimação robusta é o dos Mínimos Quadrados Ponderados (MQP) proposto por Rousseeuw (1984). Os estimadores baseados na regressão linear múltipla, obtidos através do procedimento MQP, são os valores que minimizam a função perda
|
(8) |
Onde ≤ ... ≤ são os resíduos, ao quadrado ordenados e é o número de pontos usados no procedimento de otimização.
Outro procedimento de estimação robusta foi proposto por Yohai (1987), denotado por MM. Os estimadores baseados na regressão linear múltipla e obtidos através do procedimento MM são definidos como a solução a qual minimiza a função perda
|
(9) |
sujeita a restrição
|
onde e são funções simétricas, e não decrescentes em [0, ∞), com . , para υ = 1,2, é um parâmetro de escala, b é definido por , onde ø denota a função de distribuição acumulada padrão e são os resíduos, para todo . Os estimadores baseados no procedimento MM são consistentes e assintoticamente normais.
Outro procedimento de estimação robusta foi realizado por Koenker e Basset (1978), denotado por Regressão Quantílica (RQ). Segundo os autores, o método de RQ seria uma extensão do modelo de regressão linear clássico. O estimador de βθ é obtido resolvendo o problema:
|
(10) |
onde é a função perda definida como:
|
Maiores detalhes sobre os estimadores de regressão robusta podem ser encontrados em Bisognin (2007) e Oliveira (2011).
Para selecionar o modelo mais acurado para prever os dados, faz-se necessário analisar suas medidas de acurácia (qualidade do ajuste). Segundo Mancuso (2013), “em problemas de previsão de séries temporais, uma importante tarefa é a de quantificar a qualidade da predição obtida”. Para que se possa estimar o quanto uma técnica de previsão é acurada, é necessário aferir o quanto se está errando, assim, pode-se contrapor diversas estruturas de modelos.
As principais medidas de acurácia são a MAPE (Mean Absolute Percentage Error), a MAE (Mean Absolute Error), RMSE (Root Mean Square Error) e o coeficiente U de Theil, expressas na Tabela 1. De acordo com Kim e kim (2016), a medida de acurácia MAPE é uma das medidas de precisão da previsão mais amplamente utilizadas, devido às suas vantagens de independência de escala e interpretabilidade. Entretanto, segundo Mancuso (2013), a medida RMSE, onde penaliza os erros maiores, permite avaliar a qualidade de um previsor em relação aos dados. Já o coeficiente U de Theil analisa a qualidade das previsões, sendo que, quanto mais próximo de zero significa que o erro de previsão, gerada por determinado modelo ou combinação, é menor que da previsão ingênua, ou seja, que uma previsão é melhor que a previsão trivial (MAKRIDAKIS et al., 1998).
Tabela 1– Medidas de Acurácia
Sigla |
Fórmula |
MAPE |
|
MAE |
|
RMSE |
|
U de Theil |
|
Legenda: é o valor real do período t, é a previsão para o período t, tal que
Fonte: Os Autores.
3 METODOLOGIA
Esta pesquisa é de caráter quantitativo aplicada, com um objetivo de prever a taxa de incidência dos casos de AIDS a cada 100 mil habitantes, no município de Santa Maria levando em consideração possíveis quebras estruturais nas variáveis, através da combinação de previsões por regressão robusta. Esse estudo caracteriza-se como um estudo de caso, onde segundo Gil (2002), é uma investigação de um fenômeno contemporâneo dentro de seu contexto real, de maneira que permita seu amplo e detalhado conhecimento.
Os dados utilizados neste estudo são os casos de AIDS notificados anualmente em homens e mulheres, na cidade Santa Maria - RS, durante o período de 1989 a 2016, obtidos no Departamento de Informática do Sistema Único de Saúde (DATASUS). O DATASUS já desenvolveu mais de 200 sistemas que auxiliam o Ministério da Saúde no processo de construção e fortalecimento do SUS. Este departamento surgiu em 1991 com a criação da Fundação Nacional de Saúde (Funasa). Atualmente, o Departamento é um grande provedor de soluções de software para as secretarias estaduais e municipais de saúde.
Inicialmente as séries temporais serão analisadas graficamente, onde poderão ser identificados padrões e comportamentos das mesmas. A fim de determinar a existência de tendência nos dados, foi aplicado o teste de Wald-Wolfowitz, para testar se as séries temporais possuem tendência determinística e os testes de Philips-Perron e Dickey-Fuller para raiz unitária, verificando a estacionariedade das séries. Também será analisada a presença ou não de quebras estruturais, através do teste de Chow (CHOW, 1960).
Após a análise inicial, a modelagem das séries será executada. Irá ser ajustado dois modelos para ambas as séries, o primeiro será um modelo de tendência polinomial mais um modelo ARIMA(p,d,q) e o segundo será um modelo de Suavização Exponencial de Holt-Winters (Aditivo).
Realizado o ajuste dos modelos e seus parâmetros estimados será aplicado técnicas de combinação através da regressão linear robusta, pelos métodos dos Mínimos Quadrados Ponderados, MM e Regressão Quantílica, implementadas no software R Core Team (2018).
A verificação dos ajustes das previsões dos modelos e das combinações de previsão se dará pelas medidas de acurácias RMSE (Raiz Quadrada da Média dos Erros Quadráticos), MAPE (Média dos Erros Percentuais Absolutos), MAE (Erro Médio Absoluto) e coeficiente U de Theil. Para calcular tais medidas será utilizada a rotina accuracy do pacote forecast, com a finalidade de estabelecer o modelo mais acurado para fazer a previsão da taxa de incidência dos casos de AIDS entre 2017 a 2022, tanto para homens como para mulheres.
4 RESULTADOS E DISCUSSÃO
Uma vez que se busca uma técnica adequada prever a taxa de incidência dos casos de AIDS em Santa Maria entre 2017 a 2022, tanto para homens como para mulheres, obtivemos as previsões utilizando um modelo de tendência polinomial mais um modelo ARIMA(p,d,q), um modelo de Suavização Exponencial de Holt-Winters (Aditivo) e suas respectivas combinações utilizando metodologias de regressão robustas. Durante a apresentação das análises e discussões dos resultados será levado em consideração o contexto social e histórico. Na subseção 4.1 uma análise preliminar das séries temporais será abordada, verificando a presença, ou não, de tendências, estacionariedade e quebras estruturais. Já nas subseções 4.2 e 4.3 serão apresentadas as estimativas dos parâmetros nos modelos ajustados, para os homens e para as mulheres, respectivamente. Na subseção 4.4 serão realizadas as combinações de previsão através da regressão robusta, verificando qual o modelo ou técnica de combinação é mais acurado para as previsões dos casos de AIDS em homens e mulheres.
4.1 Análise Preliminar
Para uma análise inicial, foi construído um gráfico temporal. A Figura 1 apresenta a taxa de incidência a cada 100 mil habitantes, dos casos de AIDS em homens e mulheres em Santa Maria, no período de 1989 a 2016, onde pode-se observar que ambas as séries não apresentam sazonalidade, mas apresentam tendência.
Figura 1 – Séries Temporais da Taxa de Incidência a cada 100 mil habitantes dos Casos de AIDS em Santa Maria, em Homens 1(a) e Mulheres 1(b), entre 1989 a 2016
|
|
(a) |
(b) |
Fonte: Os Autores
Prosseguindo a análise, é preciso verificar se séries são estacionárias ou não-estacionárias. Para isso, foram realizados os testes de Philips-Perron e Dickey-Fuller, sob as hipóteses: H0: série temporal é não estacionária versus H1: série temporal é estacionária. Utilizou-se a rotina pp.test e adf.test, do pacote tseries do R Core Team (2018). Já para verificar se existe alguma tendência, foi aplicado o teste de Wald-Wolfowitz, sob as hipóteses: H0: Não existe tendência determinística versus H1: Existe tendência determinística. Para isso, utilizou-se a rotina runs.test, do pacote randtests do R Core Team (2018).
Na Tabela 2 abaixo, pode-se verificar que ambos os testes para estacionariedade obtiveram um p-valor > 0,05, logo não rejeita-se H0, com nível de significância de 5%, ou seja, as séries são não estacionárias. Já o teste de tendência obteve um p-valor = 2,267e-05 para ambas as séries, rejeitando-se H0, com nível de significância de 5%, ou seja, existe uma tendência determinística nas séries.
Tabela 2 – P-valores para os Testes de Estacionariedade e de Tendência
Testes |
Homens |
Mulheres |
Phillips-Perron |
0,6759 |
0,6986 |
Dickey-Fuller |
0,9224 |
0,9440 |
Wald-Wolfowitz |
2,267e-05 |
2,267e-05 |
Fonte: Os Autores.
A Figura 2 apresenta as funções de autocorrelação (FAC) amostral das séries temporais dos casos de AIDS em Santa Maria entre 1989 a 2016, onde percebe-se que as séries têm um decaimento lento nas ACFs, o que confirma que elas são não estacionárias, e também que não apresentam sazonalidade.
Figura 2 – Funções de Autocorrelação Amostral das Séries Temporais da Taxa de Incidência dos Casos de AIDS em Santa Maria, em Homens 2(a) e Mulheres 2(b), entre 1989 a 2016
|
|
(a) |
(b) |
Fonte: Os Autores.
Para testar possíveis quebras estruturais nas séries, foi aplicado o teste de Chow, sob as hipóteses: H0: as estimativas para os coeficientes são estáveis versus H1: as estimativas para os coeficientes não são estáveis. Para tal, foi utilizada a rotina Fstats, do pacote strucchange do R Core Team (2018). Obteve-se um p-valor igual a 5.037e-13 para os homens e 5.155e-16 para as mulheres. Assim, H0 foi rejeitado, ou seja, as séries apresentam quebras estruturais. As quebras podem ser verificadas na Figura 3 abaixo.
Figura 3 – Quebras estruturais das Séries Temporais da Taxa de Incidência dos Casos de AIDS em Santa Maria, em Homens 3(a) e Mulheres 3(b), entre 1989 a 2016
|
|
(a) |
(b) |
Fonte: Os Autores.
Para os homens pode-se perceber três quebras estruturais. A primeira quebra no ano de 1994 pode estar associada ao fato do acordo entre o Ministério da Saúde e Banco Mundial, onde foram impulsionadas as ações de controle e prevenção da AIDS no Brasil, segundo o Instituto Osvaldo Cruz (2007). Assim, este fato pode ter incentivado os homens a buscar ajuda médica, assim havendo um aumento no registro de casos.
Já a quebra estrutural em 2001, presentes em ambas as séries, pode ser justificada, segundo o Instituto Osvaldo Cruz (2007), pela ameaça do Brasil em quebrar patente, assim conseguindo reduzir o preço dos medicamentos. Também no mesmo ano, foi aprovada a Lei 10.25, que regulamenta a coleta, processamento, estocagem, distribuição e aplicação do sangue, seus componentes e derivados. A partir de 2005, a mídia começou uma maior divulgação sobre doenças transmissíveis, podendo justificar a quebra estrutural em 2008.
Nas mulheres observou-se quatro quebras estruturais. Onde em 1995, segundo o Instituto Osvaldo Cruz (2007), os Estados Unidos aprovam nova classe de medicamentos antirretrovirais, os inibidores de protease. Assim, novos medicamentos são lançados, aumentando as opções de tratamento. Também houve a criação do Simpósio Brasileiro de Pesquisa em HIV/AIDS (Simpaids). Esses acontecimentos podem justificar a quebra neste ano, incentivando as mulheres a buscarem novos tratamentos, aumentando assim, o registro de casos.
Já em 2005, segundo o Instituto Osvaldo Cruz (2007), o tema do Dia Mundial de Luta Contra a AIDS no Brasil aborda o racismo como fator de vulnerabilidade para a população negra. O Brasil abriga a 3ª Conferência Internacional em Patogênese e Tratamento da AIDS, realizada pela International Aids Society (IAS). Estas conferências trouxeram uma maior visibilidade aos grupos de risco, fazendo assim com que as mulheres buscassem ajuda médica e consequentemente, o número do aumento de casos.
Em 2012, segundo o Instituto Osvaldo Cruz (2007), foram realizadas capacitações regionais para os médicos e equipes multiprofissionais sobre hepatites virais, podendo indiciar a quebra estrutural no ano.
Como as séries apresentam tendência determinística e são não estacionárias, irão ser ajustados dois modelos para ambas, onde o primeiro será modelo de tendência polinomial mais um modelo ARIMA(p,d,q) e o segundo será um modelo de Suavização Exponencial.
4.2 Modelos de Previsões para a Série Temporal da Taxa de Incidência dos Casos de AIDS em Homens
Modelo 1 – Considerando tendência determinística, foi ajustado o modelo linear , onde t =1,...,n, que obteve um . As estimativas dos coeficientes e suas respectivas estatísticas são apresentadas na Tabela 3.
Tabela 3 – Estimativa dos coeficientes do ajuste do modelo considerando tendência determinística
Parâmetros |
Estimativa |
Erro Padrão |
Estat. Z |
P(>|z|) |
|
-6,71232 |
3,15287 |
-2,129 |
0,0433 |
|
3,48351 |
0,50111 |
6,952 |
2,75e-07 |
|
-0,09057 |
0,01677 |
-5,401 |
1,33e-05 |
Fonte: Os Autores.
A Figura 4 apresenta a série temporal sem a tendência determinística e sua respectiva função de autocorrelação amostral. Foi aplicado o teste de Box-Pierce (p-valor = 0,04758), ou seja, a série temporal não é um ruído branco.
Figura 4 – Função de Autocorrelação Amostral da Série Temporal da Taxa de Incidência de Homens infectados em Santa Maria- RS, no Estado do Rio Grande do Sul, entre de 1989 a 2016, após retirada da tendência determinística
(a) |
(b) |
Fonte: Os Autores.
Após a retirada da tendência linear, ajustou-se um modelo ARIMA(0,0,1), cujos coeficientes encontram-se na Tabela 4. Pelo Teste de Box-Pierce (p-valor = 0,8506), os resíduos do modelo são não correlacionados, sendo assim, o modelo proposto é adequado aos dados.
Tabela 4 – Resultado do ajuste do Modelo ARIMA(0,0,1)
Parâmetros |
Estimativa |
Erro Padrão |
Estat. Z |
P(>|z|) |
|
0,4868 |
0,1906 |
2,5533 |
0,01067 |
Log Verossimilhança: -81,37; AIC = 166,74, BIC = 169,4, AICc = 167,22 Teste Resíduos (Box-Pierce): df=15 - p-valor = 0,8506 |
Fonte: Os Autores.
Modelo 2 – Ajustou-se um modelo de Suavização Exponencial de Holt-Winters, onde as estimativas para os parâmetros do modelo encontram-se na Tabela 5.
Tabela 5 – Resultado do ajuste do Modelo de Suavização Exponencial Holt-Winters
Parâmetro |
|
|
|
Estimativa |
0,8026 |
0,0001 |
0,0000 |
AIC = 198,030, BIC = 204,691, AICc = 200,757 Teste Resíduos (Box-Pierce): df =15 - p-valor = 0,9223 |
Fonte: Os Autores.
Para a análise de resíduos foi utilizado o teste de Box-Pierce, onde o p-valor encontrado foi de 0,9223. Assim, conclui-se que os resíduos do modelo são não correlacionados, indicando um bom modelo para previsão.
4.3 Modelos de Previsões para a Série Temporal da Taxa de Incidência dos Casos de AIDS em Mulheres
Modelo 1 – Considerando tendência determinística, foi ajustado o modelo linear , onde t =1,...,n, que obteve um . As estimativas dos coeficientes e suas respectivas estatísticas são apresentadas na Tabela 6.
Tabela 6 – Estimativa dos coeficientes do ajuste do modelo considerando tendência determinística
Parâmetros |
Estimativa |
Erro Padrão |
Estat. Z |
P(>|z|) |
|
-8,08392 |
2,94942 |
-2,741 |
0,011149 |
|
2,61003 |
0,46877 |
5,568 |
8,64e-06 |
|
-0,06549 |
0,01569 |
-4,175 |
0,000316 |
Fonte: Os Autores.
A Figura 5 apresenta a série temporal sem a tendência determinística e sua respectiva função de autocorrelação amostral. Foi aplicado o teste de Box-Pierce (p-valor = 0,00237), ou seja, a série temporal não é um ruído branco.
Figura 5 – Função de Autocorrelação Amostral da Série Temporal da Taxa de Incidência de Mulheres infectadas em Santa Maria- RS, no Estado do Rio Grande do Sul, entre de 1989 a 2016, após retirada da tendência determinística
(a) |
(b) |
Fonte: Os Autores.
Após a retirada da tendência linear, foi ajustado um modelo ARIMA(0,0,2), cujos coeficientes encontram-se na Tabela 7. Pelo Teste de Box-Pierce (p-valor = 0,9264), os resíduos do modelo são não correlacionados, sendo assim, o modelo proposto é adequado aos dados.
Tabela 7 – Resultado do ajuste do Modelo ARIMA(0,0,2)
Parâmetros |
Estimativa |
Erro Padrão |
Estat. Z |
P(>|z|) |
|
0,97277 |
0,19162 |
5,0767 |
3,841e-07 |
|
0,34858 |
0,18006 |
1,9360 |
0,05287 |
Log Verossimilhança: -73,00; AIC = 152, BIC = 155,90, AICc = 153 Teste Resíduos (Box-Pierce): df =15 - p-valor = 0,9264 |
Fonte: Os Autores.
Modelo 2 – Ajustou-se um modelo de Suavização Exponencial de Holt-Winters, onde as estimativas para os parâmetros do modelo encontram-se na Tabela 8.
Tabela 8 – Resultado do ajuste do Modelo de Suavização Exponencial Holt-Winters
Parâmetro |
|
|
|
Estimativa |
0,9999 |
0,0001 |
0,0000 |
AIC = 182,659, BIC = 189,320, AICc = 185,386 Teste Resíduos (Box-Pierce): df =15 - p-valor = 0,3680 |
Fonte: Os Autores.
Para a análise de resíduos utilizamos o teste de Box-Pierce, onde o p-valor encontrado foi de 0,3680. Assim, conclui-se que os resíduos do modelo são não correlacionados, indicando um bom modelo para previsão.
4.4 Combinação de Previsões
Como as séries apresentam quebras estruturais devido a vários acontecimentos históricos no Brasil e no mundo, será feito combinações das previsões dos modelos através de regressões robustas, a citar, pelos métodos dos Mínimos Quadrados Ponderados, MM e Regressão Quantílica.
Nas Tabelas 9 e 10, estão dispostas as estimativas dos coeficientes das combinações de previsões por regressão robusta para os homens e mulheres, respectivamente, através dos diferentes métodos aplicados. Onde é o intercepto da equação de combinação de previsões por regressão, é o coeficiente do Modelo 1 ajustado e oé o coeficiente do Modelo 2.
Tabela 9 – Estimativa dos coeficientes das Combinações de Previsão por Regressão para a Série Temporal da Taxa de Incidência dos Casos de AIDS em Homens
Combinação |
|
|
|
MM[1] |
0,779 |
0,400 |
0,504 |
RQ[2] |
-0,993 |
0,790 |
0,221 |
MQP[3] |
1,009 |
0,289 |
0,612 |
Fonte: Os Autores.
Tabela 10 – Estimativa dos coeficientes das Combinações de Previsão por Regressão para a Série Temporal da Taxa de Incidência dos Casos de AIDS em Mulheres
Combinação |
|
|
|
MM |
-1,112 |
0,917 |
0,111 |
RQ |
-1,795 |
1,075 |
0,025 |
MQP |
0,078 |
0,495 |
0,392 |
Fonte: Os Autores.
Após o cálculo das predições utilizando os Modelos 1 e 2 e suas combinações de previsão por três métodos de regressão robustas, faz-se necessário selecionar a metodologia mais acurada para as séries temporais em estudo. As Tabelas 11 e 12 apresentam as medidas de acurácia das predições para ambas as séries temporais calculadas, utilizando-se os modelos e as combinações de previsão, onde os menos valores das medidas estão destacados em negrito.
Tabela 11 – Medidas de acurácia das predições para a Série Temporal da Taxa de Incidência dos Casos de AIDS em Homens
Modelos |
RMSE[4] |
MAE[5] |
MAPE[6] |
U de Theil[7] |
1 |
4,495 |
3,320 |
17,148 |
0,103 |
2 |
5,428 |
3,591 |
32,747 |
0,126 |
MM |
4,921 |
3,220 |
17,704 |
0,115 |
RQ |
4,584 |
3,149 |
15,041 |
0,106 |
MQP |
5,001 |
3,253 |
17,986 |
0,116 |
Fonte: Os Autores.
Tabela 12 – Medidas de acurácia das predições para a Série Temporal da Taxa de Incidência dos Casos de AIDS em Mulheres
Modelos |
RMSE |
MAE |
MAPE |
U de Theil |
|
1 |
3,259 |
2,405 |
46,505 |
0,111 |
|
2 |
4,125 |
2,810 |
30,375 |
0,143 |
|
MM |
3,336 |
2,272 |
35,009 |
0,116 |
|
RQ |
3,279 |
2,251 |
31,378 |
0,112 |
|
MQP |
3,762 |
2,356 |
28,033 |
0,134 |
|
Fonte: Os Autores.
Pode-se perceber pelas medidas de acurácia (Tabela 11) que, para a Série Temporal da Taxa de Incidência dos Casos de AIDS em Homens, o Modelo 1 apresentou menor RMSE e U de Theil, enquanto a combinação de previsões por regressão RQ apresentou menor MAE e MAPE. No caso da Série Temporal da Taxa de Incidência dos Casos de AIDS em Mulheres (Tabela 12), o Modelo 1 apresentou menor RMSE e U de Theil, a combinação por regressão RQ apresentou menor MAE e a combinação por regressão MQP apresentou menor MAPE. Cabe ressaltar ainda que, ambos os modelos e todas as combinações de previsão apresentaram baixo coeficiente U de Theil, indicando que todas as predições apresentam boa qualidade, quando comparadas com as predições ingênuas, ou seja, comparadas com a predição utilizando apenas a média das séries temporais.
Tabela 13 – Previsões da Taxa de Incidência dos Casos de AIDS, a cada 100 mil habitantes para os Homens
Ano |
Modelo 1 |
Modelo 2 |
MM |
RQ |
MQP |
2017 |
18,279891 |
22,10214 |
19,22895 |
18,33423 |
19,83162 |
2018 |
16,283082 |
22,9161 |
18,84137 |
16,93764 |
19,7522 |
2019 |
14,242031 |
23,73005 |
18,43612 |
15,50612 |
19,65998 |
2020 |
12,019846 |
24,544 |
17,95847 |
13,93157 |
19,51534 |
2021 |
9,616528 |
25,35795 |
17,40844 |
12,21399 |
19,3183 |
2022 |
7,032077 |
26,1719 |
16,78603 |
10,35338 |
19,06884 |
Fonte: Os Autores.
Tabela 14 – Previsões da Taxa de Incidência dos Casos de AIDS, a cada 100 mil habitantes para as Mulheres
Ano |
Modelo 1 |
Modelo 2 |
MM |
RQ |
MQP |
2017 |
14,014 |
13,887 |
13,275 |
13,609 |
12,457 |
2018 |
11,996 |
14,435 |
11,486 |
11,452 |
11,673 |
2019 |
9,896 |
14,982 |
9,622 |
9,209 |
10,850 |
2020 |
8,380 |
15,530 |
8,293 |
7,594 |
10,315 |
2021 |
6,734 |
16,077 |
6,845 |
5,837 |
9,716 |
2022 |
4,956 |
16,625 |
5,276 |
3,940 |
9,051 |
Fonte: Os Autores.
Nas Tabelas 13 e 14, estão dispostas as previsões da taxa de incidência dos casos de AIDS, em homens e mulheres, a cada 100 mil habitantes em Santa Maria, que podem ser observadas graficamente nas Figuras 6 e 7 abaixo. Pode-se observar que as previsões calculadas através do Modelo 1 e das combinações de previsão por regressão robusta, pelos métodos de MM, RQ e MQP, demonstram um declínio na taxa de incidência em ambas as séries. Apenas o Modelo 2 apresenta um aumento na taxa de incidência.
Figura 6 – Previsão da Taxa de Incidência nos Casos de AIDS a cada 100 mil habitantes em Santa Maria, em Homens
Fonte: Os Autores.
Figura 7 – Previsão da Taxa de Incidência nos Casos de AIDS a cada 100 mil habitantes em Santa Maria, em Mulheres
Fonte: Os Autores.
5 CONSIDERAÇÕES FINAIS
Neste estudo, pode-se constatar que a tendência das taxas de incidências de AIDS ao longo dos anos em Santa Maria-RS vem sofrendo um aumento significativo, ocasionando uma preocupação constante aos órgãos públicos. Contudo, realizou-se a previsão das taxas de incidências de AIDS para homens e mulheres para 2017 a 2022. Onde ajustou-se dois modelos de previsão, o primeiro modelo de tendência polinomial mais um modelo ARIMA(p,d,q) e o segundo um modelo de Suavização Exponencial. Devido à presença de quebras estruturais a ambas as séries, foram aplicadas técnicas de combinação de previsões, utilizando regressões robustas, para gerar previsões mais acuradas às séries temporais.
Assim, verificou-se através das medidas de acurácia que, para os homens as melhores metodologias para previsão foi o Modelo 1 e as combinações de previsão por regressão robusta, pelos métodos de MM e RQ. Já para as mulheres as melhores metodologias foram o Modelo 1 e a combinação de previsão por regressão robusta, pelo método de RQ.
Observou-se que o Modelo 1 e as combinações de previsão pelos métodos MM, RQ e MQP, demonstram um declínio na taxa de incidência em ambas as séries. Apenas as previsões geradas pelo Modelo 2 apresenta um aumento na taxa de incidência.
Tais resultados, segundo o Boletim Epidemiológico HIV/AIDS 2017 (2018), são frutos das campanhas de Educação Permanente da Coordenação Estadual de IST/AIDS, bem como as diferentes tecnologias de prevenção desenvolvidas nos últimos anos, oferecendo uma série de novas alternativas para a prevenção. Entre elas, destacam-se a PrEP (Profilaxia Pré-Exposição) e a PEP (Profilaxia Pós-Exposição) ao HIV, que consistem no uso diário de antirretrovirais por pessoas não infectadas ao HIV, com o intuito de reduzir o risco de infecção pelo vírus antes ou após as relações sexuais. Além da expansão de municípios que implementaram o teste rápido para HIV e sífilis nas redes de serviços.
Todavia, não é em apenas um segmento da população que a epidemia da AIDS está presente. É de extrema importância que os órgãos competentes discutam a dinâmica dos relacionamentos e o significado do sexo seguro nos diversos contextos afetivos, e também, que fortaleçam a divulgação e a conscientização sobre os programas de prevenção que o Sistema de Saúde Único (SUS) oferece junto à população.
REFERÊNCIAS
abiaids.org [Internet]. Rio de Janeiro: Observatório Nacional de Políticas de AIDS; 2011 [cited 2019 Aug 19]. Available from: http://abiaids.org.br/aids-no-brasil.
BISOGNIN C. Estimação e Previsão em Processos SARFIMA (p,d,q) x (P,D,Q)s na presença de Outliers [Internet]. Santa Maria/RS [thesis]. Porto Alegre: Universidade Federal do Rio Grande do Sul/RS; 2007 [cited 2019 Sep 30]. Available from: https://lume.ufrgs.br/bitstream/handle/10183/137796/000622449.pdf?sequence=1&isAllowed=y.
BOX GE, JENKINS GM. Time series analysis: forecasting and control. San Francisco: Holden - Day; 1976.
BRITO AM, CASTILHO EA, SZWARCWALD CL. AIDS e infecção pelo HIV no Brasil: uma epidemia multifacetada. Rev. Soc. Bras. Med. Trop. [Internet]. 2001 [cited 2019 Aug 19];34(2):207-217. Available from: http://www.scielo.br/scielo.php?pid=S0037-86822001000200010&script=sci_abstract&tlng=pt.
CHOW GC. Tests of equality between sets of coefficients in two linear regressions. Econometrica. 1960;28(3): 591–605.
CLEMEN RT. Combining Forecasts: A Review and Annotated Bibliography. International Journal of Forecasting. 1989(5):559-583.
DATASUS [Internet]. Brasília: Ministério da Saúde (BR), 2019 [cited 2017 Oct 10]. Departamento de Informática do SUS–DATASUS. Available from: http://www2.datasus.gov.br/DATASUS/index.php?area=0203&id=6930.
FONTOURA GF. Regressão Linear Robusta: O Método de TELBS e uma Aplicação a dados de E-Commerce [Internet]. Porto Alegre/RS [monography]. Porto Alegre: Universidade Federal do Rio Grande do Sul/RS; 2015 [cited 2019 Sep 30]. Available from: https://www.lume.ufrgs.br/bitstream/handle/10183/133722/000986118.pdf?sequence=1.
GIL AC. Como elaborar projetos de pesquisa. São Paulo: Atlas; 2002. [cited 2019 Sep 02]. Available from: http://www.urca.br/itec/images/pdfs/modulo%20v%20-%20como_elaborar_projeto_de_pesquisa_-_antonio_carlos_gil.pdf.
ioc.fiocruz.br [Internet]. Rio de Janeiro: Instituto Osvaldo Cruz; 2007 [cited 2019 Sep 02]. Available from: http://www.ioc.fiocruz.br/aids20anos/linhadotempo.html.
JACOBS W. Combinação Das Previsões Dos Modelos De Box-Jenkins E Mlp/Rna Para A Previsão de demanda no Planejamento da Produção [Internet]. Santa Maria/RS [dissertation]. Santa Maria: Universidade Federal de Santa Maria/RS; 2014 [cited 2019 Sep 30]. Available from: https://repositorio.ufsm.br/bitstream/handle/1/8327/JACOBS%2c%20WILLIAM.pdf?sequence=1&isAllowed=y.
KIM S, KIM H. A new metric of absolute percentage error for intermittent demand forecasts. International Journal of Forecasting. 2016;35(3):669-679.
KOENKER R, BASSET G. Regression quantiles. Econometrica: journal of the Econometric Society. 1978:33-50.
LEI N 9.313 DE 13 DE NOVEMBRO DE 1996. Dispõe sobre a distribuição gratuita de medicamentos aos portadores do HIV e doentes de AIDS. Diário Oficial da União (Brasília). 1996 Nov 13.
MAKRIDAKIS S, WHEELWRIGHT SC, HYNDMAN RJ. Forecasting: methods and applications. Wiley, 1998.
MANCUSO ACB. Uma Investigação do Desempenho de Métodos de Combinação de Previsões: Simulada e Aplicada [Internet]. Porto Alegre/RS [dissertation]. Porto Alegre: Universidade Federal do Rio Grande do Sul/RS; 2013 [cited 2019 Sep 02]. Available from: https://www.lume.ufrgs.br/bitstream/handle/10183/75918/000891325.pdf?sequence=1.
MORETTIN PA, TOLOI CMC. Modelos para previsão de séries temporais. Rio de Janeiro: Instituto de Matemática Pura e Aplicada, 1981.
OLIVEIRA GR. Determinantes da Estrutura de Capital das Empresas brasileiras: Uma Abordagem em Regressão Quantílica [Internet]. Brasília/DF [dissertation]. Brasília: Universidade de Brasília/DF; 2011 [cited 2019 Sep 30]. Available from: http://repositorio.unb.br/handle/10482/8615.
RIO GRANDE DO SUL, SECRETARIA DE ESTADO DA SAÚDE, DEPARTAMENTO DE AÇÕES EM SAÚDE, SEÇÃO ESTADUAL DE CONTROLE DAS DST\AIDS. Boletim Epidemiológico: HIV\AIDS 2017 [Internet]. Porto Alegre: Secretaria do Estado do Rio Grande do Sul, 2018 [cited 2019 dec 03]. Available from: https://saude.rs.gov.br/upload/arquivos/carga20180508/11140851-boletim-2017.pdf.
ROUSSEEUW PJ. Least Median of Square Regression. Journal of the American Statistical Association. 1984(79):871-880.
R-project.org [Internet]. Viena: R Core Team: A language and environment for statistical computing; 2018 [cited Oct 10]. Available from: https://www.r-project.org/.
SALDANHA JS, ANDRADE CS, BECK ST. Grau de adesão ao tratamento com anti-retrovirais entre indivíduos HIV positivos atendidos no hospital universitário de Santa Maria. Revista Saúde [Internet]. 2009 [cited 2019 Aug 18];35(1):4-9. Available from: https://periodicos.ufsm.br/index.php/revistasaude/article/viewFile/10226/pdf.
SCHAURICH D, COELHO DF, MOTTA MGC. A Cronicidade no processo saúde-doença: repensando a epidemia da AIDS após os anti-retrovirais. R. Enferm UERJ [Internet]. 2006 [cited 2019 Aug 18];14(3):455-462. Available from: https://lume.ufrgs.br/handle/10183/107165.
YOHAI V J. High breakdown point and high efficiency ro-bust estimates for regression. Annals of Statistics. 1987;15(2):642-656.
[1] Estimação robusta por MM.
[2] Estimação robusta por RQ (Regressão Quantílica).
[3] Estimação robusta por MQP (Mínimos Quadrados Ponderados).
[4] RMSE (Raiz Quadrada da Média dos Erros Quadráticos).
[5] MAE (Erro Médio Absoluto).
[6] MAPE (Média dos Erros Percentuais Absolutos).
[7] Coeficiente U de Theil.