Logotipo

Descrição gerada automaticamente

Desenho de personagem de desenhos animados com texto preto sobre fundo branco

Descrição gerada automaticamente com confiança média

 

Universidade Federal de Santa Maria

Ci. e Nat., Santa Maria, v. 44, e9, 2022

DOI: 10.5902/2179460X63466

ISSN 2179-460X

Submissão: 08/12/2020 • Aprovação: 20/01/2022 • Publicação: 03/09/2022

1 INTRODUCTION   4

2 MATERIAL AND METHODS. 8

3 RESULTS AND DISCUSSION.. 11

4 CONCLUSIONS. 26

ACKNOWLEDGEMENTS. 27

REFERENCES. 27

 

Estatística

Aplicação do modelo SARIMAX para modelar e prever a concentração de material particulado inalável, no Espírito Santo, Brasil

Application of SARIMAX model to model and forecast the concentration of inhalable particulate matter, in Espírito Santo, Brazil

Jaqueline Knaak IÍcone

Descrição gerada automaticamente

Wanderson de Paula Pinto IIÍcone

Descrição gerada automaticamente

I Universidade Federal do Espírito Santo, Vitória, ES, Brasil

II Faculdade da Região Serrana, Santa Maria de Jetibá, ES, Brasil

Resumo

Este trabalho teve como objetivo modelar e prever a concentração média diária de material particulado inalável (PM10) utilizando o modelo SARIMAX, na Região da Grande Vitória (RGV), ES, Brasil, para o período de 01/01/2008 a 31/12/2018. Para isso, utilizaram-se séries temporais de concentrações de PM10 e de variáveis meteorológicas velocidade do vento (V), umidade relativa (U), precipitação pluviométrica (PP), temperatura (T), radiação solar (I) e pressão atmosférica (P) obtidas junto ao Instituto Estadual de Meio Ambiente e Recursos Hídricos (IEMA), sendo escolhidas as estações Laranjeiras, Carapina, Jardim Camburi, Enseada do Suá, Vitória (Centro), Ibes e Vila Capixaba, para fazer o estudo de predição e previsão. Conforme os indicadores de desempenho, os modelos SARIMAX para a maioria das estações, apresentaram como bons modelos para realizar predições e previsões da qualidade do ar nas localidades. Em relação à predição de eventos de qualidade do ar regular, de forma geral, os modelos SARIMAX se sobressaíram quando comparados com os modelos SARIMA e ARMA. Entre as variáveis meteorológicas avaliadas, a V, U, PP e T destacam-se como variáveis preditoras das concentrações de PM10 e assumiram papel determinante na melhoria do desempenho dos modelos de previsão.

Palavras-chave: PM10; SARIMAX; Variáveis meteorológicas; Poluição do ar

ABSTRACT

This work aimed to model and forecast the average daily concentration of inhalable particulate matter (PM10) using the SARIMAX model, in the Greater Vitória Region (RGV), ES, Brazil, for the period from January 1st, 2008 to December 31th, 2018. For this, time series of PM10 concentration and meteorological parameters wind speed (V), relative humidity (U), precipitation (PP), temperature (T), solar radiation (I) and atmospheric pressure (P) were considered. These parameters were obtained from the State Environmental Institute (IEMA), being chosen the Laranjeiras, Carapina, Jardim Camburi, Enseada do Suá, Vitória (Centro), Ibes and Vila Capixaba stations to the study of prediction and forecasting. According to performance indicators, SARIMAX models, for most seasons, have been presented as good models for making predictions and forecasts of air quality in the localities. Regarding the prediction of regular air quality events, in general, the SARIMAX models stood out when compared to the SARIMA and ARMA models. Among the meteorological variables evaluated, V, U, PP and T stand out as predictor variables of PM10 concentrations and assumed a decisive role in improving the performance of the prediction models.

Keywords: PM10; SARIMAX; Meteorological variables; Air pollution

1 INTRODUção

O ar, necessário para a sobrevivência de todos os seres vivos da Terra, tem sido um dos elementos mais agredidos pelo homem. O crescimento populacional, o aumento da frota motorizada e a expansão das atividades industriais são os principais fatores que conduziram à multiplicação das fontes de emissão de poluentes comprometendo a salubridade do ar (LIRA, 2009).

Entre os poluentes atmosféricos, o material particulado (PM) se destaca devido à sua complexidade em termos de composição química e propriedades físicas, visto que é uma classe de poluentes constituído de poeira, fumaça e todo tipo de partículas sólidas e líquidas suspensas no ar originadas de diferentes fontes, como combustão de combustíveis fósseis e reações químicas de gases na atmosfera (ARAUJO e NEL, 2009; SANTIAGO et al., 2015). Além disso, possui associação intrínseca com a saúde em razão do tamanho das partículas, principalmente as partículas com diâmetro igual ou inferior a 10 mícrons (PM10), pois são capazes de penetrar profundamente no sistema respiratório chegando no pulmão, onde se depositam nas regiões alveolares durante a respiração e podem ser absorvidas pela corrente sanguínea através dos capilares alveolares, afetando a função de vários outros órgãos, além do sistema respiratório (FIORDELISI et al.,2017).

Em vista disso, vários estudos epidemiológicos associam o PM10 com os diferentes danos à saúde, como o aumento de hospitalização devido morbidades respiratórias e cardiovasculares, principalmente de crianças e idosos (GOUVEIA et al., 2003; NASCIMENTO et al., 2007, FREITAS et al., 2016), maiores chances de uma criança ter Transtorno do Espectro do Autismo (RAZ et al., 2015), risco aumentado de incidência de diabetes mellitus (BOWE et al., 2018), alterações no desempenho cognitivo humano (ZHANG, CHEN e ZHANG, 2018), mortalidade cardiovascular, especialmente em idosos (YAP et al., 2019), entre outros efeitos que destacam a emergência em adotar medidas de controle da poluição do ar.

Diante esse cenário, o conhecimento prévio dos níveis de poluentes na atmosfera de uma região pode ser utilizado para alertar concentrações que possam representar risco à saúde pública e permitir a tomada de ações de emergência. Os modelos de previsão de poluentes atmosféricos têm sido propostos como uma ferramenta de ajuda para a gestão da qualidade do ar em diversas cidades em todo mundo, com intuito de prever possíveis picos de concentrações e índices de qualidade do ar indesejáveis (PEREZ e REYS, 2006; GOMES, 2009).

De acordo com Leite et al. (2011) os efeitos causados pela emissão dos poluentes atmosféricos, ao meio ambiente e à saúde da população, podem não ser apenas locais, pois dependem do relevo do entorno do ponto de emissão, das condições meteorológicas e da natureza dos poluentes. Em consonância, Lira (2009) descreve que a concentração de um poluente no ar depende de vários fatores, não apenas das emissões das fontes, mas também de suas interações físicas (diluição) e químicas (reações) na atmosfera. Desta maneira, as condições meteorológicas possuem fundamental importância em relação a acumulação e dispersão de poluentes, visto que essas condições atuam por meio da ação de dois fenômenos fundamentais: o transporte e a difusão (MOREIRA, TIRABASSI e MORAES, 2008). Geralmente, a poluição do ar está associada a fatores como temperatura, umidade relativa, velocidade e direção do vento (LIU e JOHNSON, 2002).

Assim, variáveis meteorológicas têm sido incorporadas nos modelos de séries temporais com objetivo de melhorar o desempenho da modelagem e previsão da qualidade do ar. Como exemplo, Agirre-Basurko, Ibarra-Berastegui e Madariaga (2006), Reisen et al. (2014) e Pinto, Reisen e Monte (2018) desenvolveram modelos estatísticos de previsão da qualidade do ar, para a cidade de Bilbao (Espanha) e os municípios de Cariacica, Vitória, Vila Velha e Serra (Espírito Santo, Brasil), respectivamente. De forma geral, estas pesquisas demonstraram que os modelos que consideraram, além da série do poluente estudado, outras séries temporais como variáveis explicativas, apresentaram melhor desempenho em relação à previsão das concentrações desses poluentes.

Além deles, Gripa et al. (2012) compararam dois modelos, a saber: um modelo de séries temporais e um modelo de regressão linear múltipla, para previsão das concentrações médias de PM10 monitorados na cidade da Serra, Região da Grande Vitória (RGV), com incorporação de variáveis meteorológicas. Os resultados demonstraram que a atribuição da variável explicativa (velocidade do vento) no modelo de regressão permitiu melhorar sua capacidade preditiva, apresentando melhores previsões quando comparado à análise exclusiva das séries temporais da variável sob estudo. De forma semelhante, Memarianfard e Hatami (2017) utilizaram a técnica de rede neural artificial para modelar a dispersão de partículas inaláveis com diâmetro menor ou igual a 2,5 µm (PM2,5) usando dados meteorológicos na cidade de Teerã, Iran. As variáveis exógenas consideradas foram os poluentes: dióxido de enxofre (SO2), monóxido de carbono (CO), dióxido de nitrogênio (NO2) e os fatores climáticos: velocidade do vento, umidade relativa e temperatura. De acordo com os resultados obtidos, houve um melhor desempenho quando considerados no modelo as variáveis exógenas, comprovando que os padrões meteorológicos são determinantes na precisão da previsão da qualidade atmosférica local.

Nesse contexto, este trabalho teve como objetivo modelar e prever a concentração média diária de PM10 utilizando o Modelo Autorregressivo Integrado e de Médias Móveis Sazonal Multiplicativo com variáveis exógenas (SARIMAX), na Região da Grande Vitória (RGV), ES, Brasil, para o período de 01/01/2008 a 31/12/2018, sob justificativa de que com a atribuição de variáveis explicativas nos modelos de séries temporais é possível melhorar seu desempenho para fazer predições e previsões da qualidade do ar da Região da Grande Vitória e, assim, este pode ser utilizado como uma ferramenta eficiente de alerta sobre a concentração de PM10 na atmosfera dos municípios da localidade, proporcionando fornecer dados para ativar ações de emergência durante períodos de estagnação atmosférica, quando os níveis de poluentes possam representar risco à saúde da população. Além disso, pode ser utilizado como informação para os gestores corroborando a preparação de planos para redução de emissões e gerenciamento da qualidade do ar da região.

Vale ressaltar que o trabalho se trata de uma extensão do estudo desenvolvido por Pinto, Reisen e Monte (2018), no qual foi avaliado um maior número de estações e observações referentes ao PM10 e as variáveis meteorológicas, permitindo considerar uma variação climática de tempo maior, que pode afetar a qualidade do ar em uma determinada região. Sob essas considerações, os resultados obtidos nesse trabalho tendem proporcionar informações mais reais de qualidade do ar para a RGV.

2 METODOLOGIA

2.1 Caracterização da área de estudo

A RGV, localiza-se na costa sul do estado do Espírito Santo sendo composta pelos municípios de Vitória, Vila Velha, Cariacica, Serra e Viana. Segundo o Instituto Brasileiro de Geografia e Estatística (IBGE, 2019), a RGV possui uma área de cerca de 1.456 km² com uma população estimada de aproximadamente 1.832.969 habitantes o que representa 45,61% da população total do estado.

Além disso, apresenta clima Aw (tropical quente) de acordo com a classificação de Köppen (KÖPPEN, 1900), com estações de estiagem bem definida no inverno e estação chuvosa de verão, com chuvas convectivas. Segundo IEMA (2018), as temperaturas não variam muito, concentrando-se entre 24º a 30ºC. Em média, a precipitação pluvial anual total é de 1.318,6 mm, cujo período chuvoso inicia-se em outubro e se estende até a metade do mês de abril. Em relação ao regime de vento, as localidades da RGV são influenciadas por brisas marinhas e terrestres - em função da proximidade com o oceano e brisas de vale montanha – em razão da topografia acidentada.

A região é caracterizada por ser uma das principais áreas de desenvolvimento urbano e industrial do estado. Devido a isso, a qualidade do ar tem sido diretamente influenciada pelas emissões de poluentes atmosféricos provenientes, principalmente, da atividade industrial, da frota veicular e da ressuspensão do solo causado pelo vento e tráfego veicular. Além desses fatores, as condições meteorológicas e da topografia dos municípios são determinantes para a salubridade do ar na região, pois atuam na acumulação e dispersão desses poluentes na atmosfera (IEMA, 2018).

Diante dessas características, em junho do ano de 2000, foi inaugurada na RGV a Rede Automática de Monitoramento da Qualidade do Ar (RAMQAr) de propriedade do Instituto Estadual de Meio Ambiente e Recursos Hídricos (IEMA). A RAMQAr é composta por nove estações distribuídas por quatro munícipios da RGV, são elas: Estação Laranjeiras (E1), Estação Carapina (E2), Estação Jardim Camburi (E3), Estação Enseada do Suá (E4), Estação Vitória (Centro) (E5), Estação Ibes (E6), Estação Vila Velha (Centro) (E7), Estação Vila Capixaba (E8) e Estação Cidade Continental (E9). A Figura 1, apresenta a localização espacial das estações de monitoramento da RAMQAr.

A RAMQAr monitora os seguintes poluentes atmosféricos: PM2,5; PM10; partículas totais em suspensão (PTS); SO2; monóxido de nitrogênio (NO); NO2; óxidos de nitrogênio (NOx); CO; ozônio (O3); metano (CH4); hidrocarbonetos não-Metano (HCnM) e hidrocarbonetos totais (HCT). E, ainda realiza, o monitoramento dos seguintes parâmetros meteorológicos: direção dos ventos (DV); velocidade dos ventos (V); umidade relativa (U); precipitação pluviométrica (PP); temperatura (T); pressão atmosférica (P); e a radiação solar (I). As variáveis monitoradas por cada estação da RAMQAr estão apresentados na Tabela 1.

Figura 1 – Localização das estações da RAMQAr na RGV, Espírito Santo

Fonte: Autores (2020)

Tabela 1 – Estações e variáveis atmosféricas monitoradas pela RAMQAr

Estações

Poluentes Monitorados

Variáveis Meteorológicas

E1

PM10, PTS, SO2, NO, NO2, NOX, O3

 

E2

PM10, PTS

DV, V, U, PP, P, T, I

E3

PM10, PTS, SO2, NO, NO2, NOX

 

E4

PM10, PM2.5, PTS, SO2, NO, NO2, NOX, CO, O3, CH4, HCnM, HCT

DV, V

E5

PM10, PTS, SO2, NO, NO2, NOX, CO, CH4, HCnM, HCT

 

E6

PM10, PM2.5, PTS, SO2, NO, NO2, NOX, CO, O3, CH4, HCnM, HCT

DV, V

E7

PM10, SO2

 

E8

PM10, PTS, SO2, NO, NO2, NOX, CO, O3

DV, V, T

E9

PM10, PTS, SO2, NO2

DV, V

Fonte: Adaptado de IEMA (2018)

2.2 Dados

Para a realização do estudo foram utilizadas séries temporais referentes à concentração de PM10 e as variáveis V, U, PP, P, T e I, fornecidos em médias horárias de 24 horas e coletados através do banco de dados do IEMA (2018), para o período de 01/01/2008 a 31/12/2018.

De acordo com a Companhia Ambiental do Estado de São Paulo (CETESB, 2019) é necessário adotar critérios de representatividade temporal nos dados de monitoramento da qualidade do ar para que não seja comprometida a interpretação do resultado obtido. A CETESB determina que os dados médios diários da estação devem conter 2/3 das medidas horárias válidas no dia. Seguindo as orientações do órgão e considerando que algumas estações da RAMQAr possuem uma porcentagem alta de dados faltantes, para determinar as estações representativas do estudo foi realizado uma análise dos dados brutos de todas as estações da RAMQAr, sendo considerada apenas as estações que apresentaram porcentagem de dados faltantes de sua série igual ou inferior a 34%, como disposto na Tabela 2. Assim, foram definidas as seguintes estações a serem utilizadas, considerando a série do poluente PM10: E1, E2, E3, E4, E5, E6 e E8.

Tabela 2 – Porcentagem de observações faltantes referente as medições médias horárias das estações da RAMQAr

Estação

Porcentagem de dados faltantes (%)

E1

13

E2

15

E3

13

E4

11

E5

10

E6

13

E7

62

E8

29

E9

66

Fonte: Autores (2020)

Com relação à determinação das variáveis meteorológicas utilizadas neste trabalho, foi seguida a mesma metodologia descrita anteriormente para escolha das estações. Sendo assim, foram empregadas as séries de dados referentes a V, U, PP, T, I e P conforme a descrição da Tabela 3.

Tabela 3 – Descrição das variáveis meteorológicas

Variáveis

Unidades

Descrição

V

Dado que a estação de Cidade Continental apresentou muitos dados faltantes, adotou-se uma média aritmética entre as estações de Carapina, Enseada do Suá, IBES e de Cariacica.

U

%

Média aritmética entre as estações de Carapina e Cariacica, as únicas que medem tal variável.

PP

Valores medidos na estação de Carapina, pois é a única que possui medição para tal variável.

P

Valores medidos na estação de Carapina, pois é a única que possui dados para tal variável.

T

Média aritmética entre as estações de Carapina e Cariacica.

I

Valores medidos na estação de Carapina, única que realiza tal medição.

Fonte: Adaptado de Pinto, Reisen e Monte (2018)

Em razão da presença de dados faltantes nas séries temporais foi adotada a metodologia de imputação via algoritmo EM (expectation-maximisation), por meio da plataforma mstdi (multivariate time-series data imputation) proposta por Junger e Leon (2015) e implementada na biblioteca do software R (JUNGER e LEON, 2018). Após a imputação dos dados faltantes, calculou-se as médias diárias das concentrações do poluente PM10 e as médias diárias das variáveis meteorológicas adotadas, sendo considerados, assim, para o período analisado, 4.015 observações tanto na série de PM10 quanto das variáveis explicativas.

2.3 Métodos

Para a predição e previsão das concentrações de PM10 para cada estação da RGV, utilizou-se a metodologia proposta por Box e Jenkins (1970), que consiste na ideia de que a série temporal em estudo seja gerada por um processo estocástico, cuja natureza pode ser representada a partir de um modelo matemático (MORETTIN e TOLOI, 2006).

Os chamados modelos Autorregressivos Integrados e de Médias Móveis Sazonal Multiplicativo (SARIMA) destacam-se por serem uma ampliação dos modelos Autorregressivos Integrados e de Médias Móveis (ARIMA), por incluírem a característica de autocorrelação sazonal. O modelo SARIMA é geralmente descrito como SARIMA , em que  e  são inteiros não negativos que se referem a ordem polinomial autorregressiva (AR), integrada (I), e média móvel (MA) de partes não sazonais e sazonais do modelo, respectivamente. Logo, este modelo pode ser representado pela seguinte expressão (Equação 1):

(1)

em que  é a variável de previsão; é o polinômio de AR regular de ordem ;  é o polinômio de MA regular de ordem ;  é o polinômio de AR sazonal de ordem ;  é o polinômio de MA sazonal de ordem  e  é ruído branco, definido como uma sequência de variáveis aleatórias não correlacionadas com média zero e variância constante ao longo do tempo (WEI, 2006; VANGROPOULOS et al., 2016).

O operador de diferenciação  e o operador de diferenciação sazonal  eliminam a não-sazonalidade e a não-estacionariedade sazonal, respectivamente. Tem-se que  é o operador de defasagem definido como . Os polinômios e os operadores são definidos, matematicamente como .

Neste estudo foi aplicado o modelo SARIMAX, que é uma extensão do modelo SARIMA, com capacidade de integrar variáveis explicativas, processo no qual possibilita aumentar o desempenho da previsão. De acordo Vagropoulos et al. (2016), esse modelo pode ser representado pela Equação 2:

(2)

em que  é o vetor que inclui as variáveis de entrada exógenas  no tempo  e  refere-se ao valor do coeficiente da variável de entrada exógena .

Segundo Wei (2006), antes de se proceder a modelagem, o primeiro passo na análise de séries temporais é identificar se elas são estacionárias, ou seja, se possuem média, variância e covariância constantes ao longo do tempo. Para isso, foi aplicado aos dados o teste de raiz unitária de Dickey-Fuller Aumentado (Argumented Dickey-Fuller ou ADF) (DICKEY e FULLER, 1981). A avaliação da existência de periodicidade, também denominada sazonalidade, nas séries de concentração de PM10 foi realizada pela análise espectral com a construção do periodograma e, além disso, aplicou-se o teste G de Fisher aos dados transformados (WEI, 2006). A transformação dos dados da série temporal foi utilizada para estabilizar a variância e aproximar de uma distribuição normal. Para isso, foi considerada a transformação sugerida por Box e Cox (1964), no qual se estima o  e baseada nessa estimativa, define-se o tipo de transformação. Assim, a série transformada é dada por:

(3)

Em que  é o parâmetro de transformação e escolhido no intervalo  e os valores mais correntes correspondem às transformações propostas por Box e Cox (1964). Por fim, o estabelecimento do modelo de previsão apropriado que descreva o fenômeno gerador de cada série estudada foi definido através das quatro etapas contidas na metodologia de Box e Jenkins (1970), as quais são descritas como: () identificação; () estimação; () diagnóstico; e () previsão.

2.4 Indicadores estatísticos

Na Tabela 4 estão apresentadas as equações referentes aos indicadores estatísticos utilizados para realizar a identificação e avaliação da qualidade de ajuste e desempenho do modelo de previsão das concentrações de PM10, a saber: os critérios de seleção Akaike Information Criteria (AIC) (AKAIKE, 1973) e Bayesian Information Criterion (BIC) (SCHAWAZ; AKAIKE, 1978), raiz do erro quadrático médio (REQM), erro absoluto médio (EAM) e as estatísticas de avaliação propostas por Ryan (1995) e Liu e Johnson (2003) - probabilidade de detecção (POD), razão de alarme falso (FAR), escore de ameaças (EA) e taxa de perda (MISS), respectivamente. O melhor modelo para representar a série é aquele que obtêm os menores valores para os critérios de informação e para as medidas de qualidade.

Tabela 4 – Fórmulas dos indicadores estatísticos de qualidade de ajuste e desempenho do modelo

Indicador Estatístico

Fórmula

AIC

BIC

REQM

EAM

POD

FAR

EA

MISS

Legenda: Legenda: 𝑙(𝜉̂) é a função de log-verossimilhança maximizada; 𝐾 refere-se ao número de parâmetros do modelo; 𝑛 é o número de observações da amostra; 𝑌𝑖 𝑒 𝑌̂ 𝑖 são os valores observados e previsto no instante i; 𝑁 é o número período de tempos; 𝐴 é o número de eventos observados e preditos; 𝐵 é o número de eventos observados, mas não preditos; e 𝐶 é o número de eventos estimados, mas não observados.

3 RESULTADOS E DISCUSSÃO

Para um entendimento preliminar das variáveis em estudo, estão apresentadas na Tabela 5 medidas descritivas básicas. Observa-se que a maior concentração média de PM10 foi registrada na E8 (38,84 ) seguida pela E1 (32,82 ), e o menor valor médio foi encontrado na E2 (20,35 ). Em média, as concentrações não ultrapassaram a diretriz estabelecida pela Organização Mundial da Saúde (OMS) (WHO, 2006) (50 ), o Padrão Intermediário 1 (PI1) estabelecido pela Resolução CONAMA 491/2018 (CONAMA, 2018) (120 ) e a Meta Intermediária 1 (MI1) determinada pelo Decreto Estadual nº 3463 – R/2013 (ESPÍRITO SANTO, 2013) (120 ). Porém, nota-se que todas as estações apresentam alto desvio-padrão e coeficiente de variação, sugerindo que a média dos dados é pouco representativa e que existe uma grande variabilidade deles. Os valores dos coeficientes de assimetria e curtose encontrados indicam que as séries em estudo não são normalmente distribuídas.

Com relação à análise das medidas descritivas das variáveis meteorológicas (Tabela 5) é possível notar que os dados meteorológicos também apresentam grande variabilidade, com exceção da variável temperatura que, de acordo com o IEMA (2018), apresenta pouca variabilidade climatológica na região.

Tabela 5 – Medidas descritivas das variáveis em estudo

Estações e Variáveis

Medidas Descritivas

µ

M

σ

CV

Máx.

Mín.

Assimetria

Curtose

PM10

E1

31,82

30,25

13,38

42,03

118,8

5,93

0,96

E2

20,41

19,23

7,26

35,55

88,25

4,41

1,79

E3

22,59

21,83

7,58

33,56

66,86

3,54

0,94

E4

27,17

26,33

8,94

32,92

83,58

8,33

0,91

E5

24,96

23,83

8,07

32,35

83,12

6,06

1,03

E6

26,21

25,16

9,56

36,47

88,12

5

0,97

E8

38,84

36,88

15,27

39,31

120,83

5,5

1,20

Variáveis meteorológicas

V

2,01

1,92

0,40

31,62

9,42

0,75

2,22

U

76,01

75,72

6,59

8,67

98,3

55,25

0,24

PP

0,14

0,01

0,45

313,26

12,83

0

9,99

T

24,73

24,77

2,50

10,12

30,69

17,81

-0,09

I

209,24

205,8

72,6

34,7

396,54

22,57

-0,04

P

1010,8

1010,7

5,07

0,5

1026,52

994,3

0,01

Legenda: Unidade de Medida: µ, M, σ, Máx (máxima)., Mín.(mínima) = , CV (coeficiente de variação) = %.

Fonte: Autores (2020)

Para complementar a avaliação comportamental do poluente e dos elementos climatológicos, as Figuras 2 e 3 apresentam as séries temporais das concentrações de PM10 e das variáveis meteorológicas, respectivamente, no período de estudo.

Do total de observações, sem exceção, todas estações apresentaram valores diários que ultrapassaram a diretriz estabelecida pela OMS (WHO, 2006) para o PM10, sendo que as concentrações monitoradas nas estações E1 e E8 foram as que mais superaram o valor de , correspondente a 401 ultrapassagens na primeira e 716 ultrapassagens na estação de Cariacica. A diretriz da OMS é baseada em extensas evidências científicas sobre a poluição do ar referente ao PM10 e suas consequências para a saúde. Conforme os achados, o valor de  é o valor mínimo de exposição diária ao poluente encontrado, que apresenta mais segurança aos expostos, porém não garante uma proteção completa contra os efeitos adversos do material particulado à saúde, uma vez que os limites não foram identificados devido a existência de pouca evidência para sugerir um limite abaixo do qual nenhum efeito adverso à saúde seria previsto. De acordo com o Guia de Qualidade do Ar da OMS, a diretriz de  proporciona a redução de cerca de 1,2%, 2,5% e 5% na mortalidade de curto prazo em relação aos limites de 75, 100 e 150 , respectivamente, com base nos coeficientes de risco publicados em estudos multicêntricos e metanálises (WHO, 2006).

Figura 2 – Evolução temporal das séries de PM10 em cada estação da RGV

Fonte: Autores (2020)

Em comparação com a legislação brasileira, a estação E8 foi a única que excedeu o padrão PI1 da Resolução do CONAMA nº 491/2018 (CONAMA, 2018) e a meta MI1 do Decreto Estadual nº 3463 – R/2013 (ESPÍRITO SANTO, 2013), contudo, esses resultados são preocupantes, pois mesmo em níveis abaixo do estabelecido pela legislação são observados efeitos adversos à saúde da população e ao meio ambiente em geral, como demonstrado na pesquisa de Freitas et al. (2016) em que mesmo as concentrações anuais do poluente estudado (PM10) terem permanecido em torno de 27 , valor bem abaixo do estabelecido pela Resolução do CONAMA n° 491/2018 (40 ), houve associação consistente entre as concentrações de PM10 e problemas respiratórios na cidade de Vitória.

Figura 3 – Evolução temporal das séries das variáveis meteorológicas

Fonte: Autores (2020)

A Tabela 6 contém a quantidade de vezes que as concentrações de PM10 ultrapassaram a diretriz estabelecida pela OMS (WHO, 2005), o padrão PI1 estabelecido pela Resolução do CONAMA nº 491/2018 e a meta MI1 do Decreto Estadual nº 3463 – R/2013 em cada ano do período estudado. A estação E8, no ano de 2011, foi a que registrou maior número de concentrações acima de 50 .

Tabela 6 – Quantidade de vezes que as concentrações de PM10 ultrapassaram o padrão estadual, o padrão nacional e a diretriz da OMS

Estações

Legislação

Anos

Total

2008

2009

2010

2011

2012

2013

2014

2015

2016

2017

2018

 

 

E1

OMS

10

5

18

38

54

24

50

69

39

31

18

356

 

CONAMA e Decreto

0

0

0

0

0

0

0

0

0

0

0

-

 

E2

OMS

10

0

6

3

0

0

0

0

0

0

2

21

 

CONAMA e Decreto

0

0

0

0

0

0

0

0

0

0

0

-

 

E3

OMS

16

0

0

0

0

0

0

0

0

0

0

16

 

CONAMA e Decreto

0

0

0

0

0

0

0

0

0

0

0

-

 

E4

OMS

10

5

18

7

4

2

4

10

4

1

0

65

 

CONAMA e Decreto

0

0

0

0

0

0

0

0

0

0

0

-

 

E5

OMS

2

4

5

11

1

0

0

9

0

0

1

33

 

CONAMA e Decreto

0

0

0

0

0

0

0

0

0

0

0

-

 

E6

OMS

15

2

17

24

5

4

2

2

1

0

0

72

 

CONAMA e Decreto

0

0

0

0

0

0

0

0

0

0

0

-

 

E8

OMS

120

94

111

131

118

18

24

38

46

10

4

714

 

CONAMA e Decreto

0

0

0

0

1

0

0

0

0

0

0

1

 

Fonte: Autores (2020)

Na Tabela 7 estão apresentadas as matrizes de correlação entre as variáveis meteorológicas e o poluente PM10, correspondente, às estações E1, E2, E3, E4, E5, E6 e E8, contendo os seus respectivos coeficientes de correlação de Pearson. Os coeficientes de correlação que não apresentaram significância estatística estão em negrito, sendo considerado o nível de significância de 5%. De forma geral, observa-se que as variáveis meteorológicas apresentam relação linear com as concentrações de material particulado inalável.

Tabela 7 – Matriz de correlação entre PM10 e as variáveis meteorológicas

 

PM10

V

U

PP

T

I

P

E1

PM10

1

 

 

 

 

 

 

V

0,3742

1

 

 

 

 

 

U

-0,3898

-0,4421

1

 

 

 

 

PP

-0,2059

-0,0882

0,3675

1

 

 

 

T

0,3520

0,3865

-0,3994

-0,1435

1

 

 

I

0,2587

0,4013

-0,4874

-0,2521

0,6185

1

 

P

-0,2664

-0,2425

0,0308

-0,0728

-0,4702

-0,2033

1

E2

PM10

1

 

 

 

 

 

 

V

-0,1851

1

 

 

 

 

 

U

-0,0255

-0,4421

1

 

 

 

 

PP

-0,1545

-0,0882

0,3675

1

 

 

 

T

-0,1019

0,3865

-0,3994

-0,1435

1

 

 

I

-0,1227

0,4013

-0,4874

-0,2521

0,6185

1

 

P

-0,0484

-0,2425

0,0308

-0,0728

-0,4702

-0,2033

1

E3

PM10

1

 

 

 

 

 

 

V

-0,0737

1

 

 

 

 

 

U

-0,1041

-0,4421

1

 

 

 

 

PP

-0,08

-0,0882

0,3675

1

 

 

 

T

-0,0392

0,3865

-0,3994

-0,1435

1

 

 

I

-0,0712

0,4013

-0,4874

-0,2521

0,6185

1

 

P

-0,0697

-0,2425

0,0308

-0,0728

-0,4702

-0,2033

1

E4

PM10

1

 

 

 

 

 

 

V

0,1325

1

 

 

 

 

 

U

-0,2583

-0,4421

1

 

 

 

 

PP

-0,1734

-0,0882

0,3675

1

 

 

 

T

0,0847

0,3865

-0,3994

-0,1435

1

 

 

I

0,0585

0,4013

-0,4874

-0,2521

0,6185

1

 

P

-0,16

-0,2425

0,0308

-0,0728

-0,4702

-0,2033

1

E5

PM10

1

 

 

 

 

 

 

V

-0,0872

1

 

 

 

 

 

U

-0,1128

-0,4421

1

 

 

 

 

PP

-0,1623

-0,0882

0,3675

1

 

 

 

T

0,01

0,3865

-0,3994

-0,1435

1

 

 

I

0,0107

0,4013

-0,4874

-0,2521

0,6185

1

 

P

-0,1399

-0,2425

0,0308

-0,0728

-0,4702

-0,2033

1

E6

PM10

1

 

 

 

 

 

 

V

0,0485

1

 

 

 

 

 

U

-0,2482

-0,4421

1

 

 

 

 

PP

-0,2189

-0,0882

0,3675

1

 

 

 

T

0,003

0,3865

-0,3994

-0,1435

1

 

 

I

0,0385

0,4013

-0,4874

-0,2521

0,6185

1

 

P

-0,1889

-0,2425

0,0308

-0,0728

-0,4702

-0,2033

1

E8

PM10

1

 

 

 

 

 

 

V

-0,1446

1

 

 

 

 

 

U

-0,0921

-0,4421

1

 

 

 

 

PP

-0,1732

-0,0882

0,3675

1

 

 

 

T

-0,1382

0,3865

-0,3994

-0,1435

1

 

 

I

-0,1035

0,4013

-0,4874

-0,2521

0,6185

1

 

P

-0,0576

-0,2425

0,0308

-0,0728

-0,4702

-0,2033

1

Fonte: Autores (2020)

Assim, como esperado, as concentrações de PM10 na RGV estão associadas às mudanças dessas variáveis, ou seja, constata-se a partir dos resultados (Tabela 7) que o aumento da V acarreta aumento nas concentrações de PM10 nas estações E1, E4 e a redução dos níveis do poluente monitorado nas estações E2 e E8; já o aumento da U e PP contribui para diminuição nas concentrações de PM10 nas estações E1, E3, E4, E5, E6 e E8. Em contrapartida, o aumento de T acarreta tanto o aumento dos níveis de material particulado inalável monitorados na estação E1, quanto a sua redução nas estações E2 e E8; da mesma forma, a I apresenta correlação positiva com o poluente estudado na estação E1 e correlação negativa nas estações E2 e E8; e, por fim, o aumento da P leva a diminuição dos níveis de PM10 nas estações E1, E4, E5 e E6. É importante ressaltar que algumas combinações não foram estatisticamente significativas, pois os dados não foram validados, seja na análise da estatística do teste de significância ou na análise dos valores dos coeficientes de correlação, o que pode ser explicado visto a quantidade de dados faltantes das séries temporais, pelos dados meteorológicos utilizados serem uma média para todas as estações ou até mesmo pela inexistência de relação entre as variáveis estudadas.

As disparidades encontradas nos resultados da correlação entre as variáveis meteorológicas e o material particulado inalável monitorado nas estações da RGV deve as características específicas de cada localidade estudada e, também, foi encontrada por Santos, Reboita e Carvalho (2018), os quais relataram que a influência dos fatores meteorológicos nos níveis de poluentes na atmosfera está relacionada com as características locais e específicas da região. A exemplo, citam que a velocidade do vento pode promover a ressuspensão de partículas e, consequentemente, levar o aumento da concentração de PM10, ou sua dispersão, como também, de acordo com a direção deste em relação à fonte emissora e a estação, pode dispersar as partículas para outra direção ou contribuir para seu aumento na estação de monitoramento.

A análise das séries temporais é realizada por meio de várias etapas com objetivo de identificar as principais dependências existentes temporalmente nos dados e com base nelas descrever o seu comportamento (WEI, 2006). Desse modo, o primeiro passo na análise dessas séries consiste em identificar se elas são estacionárias. Por meio da aplicação do teste de Dickey-Fuller aumentado (DICKEY e FULLER,1981), os resultados obtidos revelaram que as séries em estudo não são estacionárias na média e, por isso, foi aplicada uma diferença estacionária de ordem 1 para eliminar a componente tendência de cada série temporal e torná-las estacionárias na média. Em seguida, observou-se que a série não é estacionária na variância. Dessa maneira, para estabilizar o aumento da variância das observações e melhorar na aproximação da distribuição dos dados para a distribuição normal, foi aplicado o logaritmo natural na série temporal.

A análise das funções de autocorrelação indica a presença de sazonalidade nos dados com periodicidade de sete dias. Assim, para a confirmação da presença dessa característica e verificação da necessidade de aplicação de diferenças sazonais foi realizada a decomposição espectral das séries de PM10 de acordo com a Figura 4. Os periodogramas das estações E1, E2, E4, E5, E6 e E8 demonstraram que o maior pico está associado à frequência de 0,1429, e da estação E3, à frequência de 0,1432, o que implica em  e , ou seja, todas estações apresentam componente sazonal com periodicidade de sete dias. E, conforme os resultados do teste de Fisher, para todas as estações o valor de G foi superior ao de Z, deste modo, aceita-se a hipótese H1 da existência de sazonalidade, confirmando a existência da componente sazonalidade para períodos de sete dias, ao nível de significância de 5%. Por fim, a aplicação do teste de Kruskal-Wallis também corrobora com a existência de sazonalidade na série (MORETTIN e TOLOI, 2006), considerando que o valor de p é menor do que 0,05, rejeita-se a hipótese nula de que não existe sazonalidade, conforme Tabela 8.

Tabela 8 – Teste de Kruskal-Wallis aplicado aos dados da série de PM10

Estação

Estatística

Valor p

E1

679,08

< 0,0001

E2

86,294

< 0,0001

E3

64,983

0,0002

E4

165,64

< 0,0001

E5

153,1

< 0,0001

E6

251,45

< 0,0001

E8

168

< 0,0001

 

 

 

 

 

 

 

 

 

 

 

Fonte: Autores (2020)

Tal comportamento é esperado em séries de PM10, pois conforme o Inventário de Emissões Atmosféricas na Região da Grande Vitória (ECOSOFT, 2019), dispõe o processo de emissão dominante para partículas é a ressuspensão nas vias primárias e secundárias da região provocada, principalmente, pelo deslocamento de veículos automotores. Em razão disso, a variação sazonal apresentada pode ser explicada pelo ritmo de movimentação dos transportes, ou seja, as maiores concentrações de PM10 ocorrem durante os dias úteis, quando o fluxo de veículos é maior, e o oposto ocorre nos finais de semana, devido à redução da circulação veicular nas ruas. Logo, foi aplicada uma diferença sazonal de ordem  para eliminar a sazonalidade presente nas séries das estações.

Figura 4 – Periodograma das séries temporais de material particulado inalável

Fonte: Autores (2020)

O próximo passo consiste em realizar os procedimentos de identificação e estimação dos parâmetros do modelo SARIMAX para cada estação de monitoramento do poluente PM10. A identificação preliminar das ordens autorregressivas e de médias móveis não sazonal e sazonal  dos modelos deram-se por meio da análise do comportamento das funções de autocorrelação (FAC) e das funções de autocorrelação parcial (FACP) e o melhor modelo para representar os dados, baseou-se nos critérios de informação AIC, BIC, nos valores de REQM e EAM e na qualidade de ajuste à série original. Como foi realizada uma diferença estacionária nas séries e se fez necessária a aplicação de uma diferença sazonal, tem-se  e . Assim, entre todos os modelos testados e estimados, os modelos com melhores ajustes para as estações E1, E2, E3, E4, E5, E6 e E8 foram, respectivamente, SARIMAX (1,1,2) (0,1,1)7; SARIMAX (1,1,1) (0,1,1)7; SARIMAX (1,1,1) (0,1,1)7; SARIMAX (3,1,1) (0,1,1)7; SARIMAX (1,1,1) (0,1,0)7; SARIMAX (1,1,2) (0,1,1)7 e SARIMAX (1,1,3) (0,1,1)7.

Na Tabela 9 são apresentados os resultados das estatísticas dos testes Shapiro e Wilk, Jarque e Bera, Ljung e Box e Box e Pierce, para verificar a adequação do modelo por meio da normalidade e a não autocorrelação dos resíduos. Conforme os dois primeiros testes, os resíduos das séries temporais de todas as estações não são normalmente distribuídos, por se tratar uma variável ambiental. Entretanto, conforme Monte, Albuquerque e Reisen (2015), assumiu-se, pela teoria assintótica sobre as médias das distribuições de probabilidade a suposição de que os resíduos são normais. Na Figura 5 são apresentados os gráficos da FAC e FACP dos resíduos dos modelos SARIMAX ajustados para cada estação. Não se rejeita a hipótese nula de erros não correlacionados, considerando os valores p superiores ao nível de significância de 5%. Por conseguinte, conclui-se que os modelos ajustados são adequados para fazer previsões.

Tabela 9 – Testes estatísticos de normalidade e correlação dos resíduos dos modelos escolhidos

MODELOS

Testes de normalidade

Testes de correlação

Shapiro-Wilk

Jarque-Bera

Box-Ljung

Box-Pierce

E1 SARIMAX (1,1,2) (0,1,1)7

<0,0001

<0,0001

0,6514

0,6521

E2 SARIMAX (1,1,1) (0,1,1)7

<0,0001

<0,0001

0,0573

0,0583

E3 SARIMAX (1,1,1) (0,1,1)7

<0,0001

<0,0001

0,0943

0,0956

E4 SARIMAX (3,1,1) (0,1,1)7

<0,0001

<0,0001

0,4931

0,4959

E5 SARIMAX (1,1,1) (0,1,0)7

<0,0001

<0,0001

0,3244

0,3254

E6 SARIMAX (1,1,2) (0,1,1)7

<0,0001

<0,0001

0,1003

0,1018

E8 SARIMAX (1,1,3) (0,1,1)7

<0,0001

<0,0001

0,6767

0,6793

Fonte: Autores (2020)

As estimativas dos parâmetros dos modelos selecionados, calculados por máxima verossimilhança e seus respectivos erros padrão, valores de  e , são apresentados na Tabela 10. De acordo com os resultados obtidos para o teste , todos os coeficientes dos modelos são significativos. As variáveis I e P não foram estatisticamente significativas, por isso não foram incorporadas no ajuste final dos modelos das estações de monitoramento. Nos modelos ajustados para as estações E2, E4, E5 foram consideradas como variáveis explicativas V e PP. Já no modelo estimado para a estação E3 foi incorporada apenas a variável PP. Na estação E6, além da variável V, foi considerada também a U como variável preditora. Por fim, para as estações E1 e E8, o melhor modelo ajustado considerou como variáveis explicativas a V, PP e T.

Tabela 10 – Estimativa dos parâmetros dos modelos ajustados para as estações de PM10 sob estudo

Estações

Parâmetro

Estimativa

Erro padrão

Valor de z

Valor de p

 

E1

V

0,09028

0,0105

8,6209

<0,0001

 

PP

-0,0501

0,0098

-5,0629

<0,0001

 

T

0,1355

0,004

33,8699

<0,0001

 

0,3447

0,0388

8,8783

<0,0001

 

-0,7884

0,0405

-19,4320

<0,0001

 

-0,1198

0,0343

-3,4903

0,0004

 

-0,9718

0,0045

-215,0002

<0,0001

 

E2

V

-0,1139

0,0086

-13,264

<0,0001

 

PP

-0,1189

0,009

-13,090

<0,0001

 

0,3706

0,017

21,763

<0,0001

 

-0,9608

0,0058

-164,593

<0,0001

 

-0,9764

0,0038

-256,479

<0,0001

 

E3

PP

-0,0328

0,0083

-3,986

<0,0001

 

0,4071

0,0173

23,486

<0,0001

 

-0,9582

0,007

-136,446

<0,0001

 

-0,9603

0,0056

-193,008

<0,0001

 

E4

V

0,0468

0,0084

5,5387

<0,0001

 

PP

-0,1055

0,0088

-11,8881

<0,0001

 

0,4353

0,0169

25,6156

<0,0001

 

-0,044

0,0175

-2,5106

0,012

 

0,0655

0,0167

3,9199

<0,0001

 

-0,9812

0,0057

-172,4301

<0,0001

 

-0,9716

0,0042

-232,1971

<0,0001

 

E5

V

-0,1024

0,0083

-12,222

<0,0001

 

PP

-0,1243

0,0086

-14,385

<0,0001

 

0,3421

0,0152

22,5

<0,0001

 

-0,9999

0,0008

-132,981

<0,0001

 

E6

U

-0,0202

0,0101

-22,1889

<0,0001

 

PP

-0,0893

0,0101

-8,8211

<0,0001

 

0,2706

0,0525

5,1531

<0,0001

 

-0,8105

0,0547

-14,8305

<0,0001

 

-0,1025

0,0471

-2,1774

0,0294

 

-0,9750

0,0038

-257,2294

<0,0001

E8

V

-0,114

0,0095

-11,9930

<0,0001

PP

-0,1275

0,0095

-13,3938

<0,0001

T

0,0514

0,0036

14,2817

<0,0001

0,6752

0,0831

8,1162

<0,0001

0,2458

0,0861

-14,4608

<0,0001

0,1558

0,0516

3,0177

0,002

0,1178

0,0355

3,3218

0,0008

-0,8887

0,01

-88,8394

<0,0001

Fonte: Autores (2020)

Zhang et al. (2018) produziram um modelo Land-use Regression (LUR) para estimar a média mensal de PM2,5, PM10 e NO2 de 2014 a 2016 na China. Os autores observaram que a umidade relativa, temperatura da atmosfera e a velocidade do vento são os principais fatores meteorológicos que explicam a variação dos três poluentes estudados sendo utilizados como preditores no modelo desenvolvido. Em consonância, Lyra, Oda - Souza e Viola (2011) observaram que a precipitação pluviométrica e a umidade relativa foram as variáveis mais significativas para explicar a variabilidade do material particulado inalável na cidade do Rio de Janeiro, Brasil. Ambos os estudos corroboram aos resultados apresentados no presente trabalho, confirmando a dependência entre as concentrações de PM10 e fatores climáticos e a importância de se avaliar em conjunto essas duas variáveis.

Gocheva-Ilieva, Ivanov e Iliev (2019) afirmam que para uma previsão realista dos valores de PM10, é necessário ter conhecimento das variáveis precursoras do poluente como as variáveis meteorológicas, dos quais dependem suas concentrações. Portanto, para efeitos de comparação e mostrar a significância de incorporar nos modelos de predição e previsão de concentração de material particulado através de variáveis meteorológicas, realizou-se estimativas para os modelos ARMA e SARIMA e verificou-se qual o melhor modelo para fazer previsões de PM10 nos municípios da RGV. Para isso, foram determinados dois horizontes de previsão (), sendo um para calcular as estimações do período de 01/01/2008 a 31/12/2018 () e outro para realizar a previsão referente ao período de 01/01/2019 a 07/01/2019 ().

Na Tabela 11 são apresentados os resultados estimados de REQM e EAM para os modelos ajustados. Observa-se que, de forma geral, os modelos SARIMAX apresentaram um aumento da precisão das previsões nos horizontes. Para todas as estações, exceto a estação E3 e E5, os resultados da comparação das medidas de qualidade mostraram que, para  e , o modelo SARIMAX foi o que obteve melhores resultados, sendo o mais adequado para realizar previsões nessas estações, assemelhando aos resultados obtidos por Pinto, Reisen e Monte (2018) quando avaliaram a predição e previsão do modelo SARIMAX com as variáveis meteorológicas V e PP, utilizando séries temporais de concentração de PM10 monitorados na estação de Enseada do Suá.

Tabela 11 – Medidas de avaliação da qualidade de previsão obtidas a partir de modelos ajustados

Estação

Medida

Modelos

ARMA

SARIMA

SARIMAX

ARMA

SARIMA

SARIMAX

E1

REQM

10,5767

10,3209

8,7479

10,4844

10,2621

8,8210

EAM

7,6940

7,4901

6,4345

7,7472

7,5358

6,6049

E2

REQM

6,1094

5,7240

5,4650

5,8309

5,7391

5,5388

EAM

4,2084

3,9936

3,8348

4,1203

4,0601

3,9465

E3

REQM

5,3037

5,2005

5,2020

13,0584

12,6985

12,7093

EAM

3,9091

3,8127

3,8162

9,6820

13,0584

9,4483

E4

REQM

7,1396

6,9244

6,7975

14,8237

14,5869

14,4608

EAM

5,2327

5,0874

5,0024

10,9828

10,8003

10,6762

E5

REQM

6,9397

8,5116

8,1937

12,6696

13,1578

12,9338

EAM

5,0944

6,3038

6,0890

9,2360

9,7276

9,5843

E6

REQM

7,6890

7,4215

7,0537

14,4268

14,0942

13,5385

EAM

5,7233

5,5103

5,2464

10,8609

10,6130

10,0512

E8

REQM

12,1396

10,5950

9,9978

29,368

26,7762

26,4073

EAM

8,8232

7,5867

7,2022

22,214

20,6618

20,3882

Fonte: Autores (2020)

Além disso, os autores supracitados ajustaram o modelo SARIMAX (1,0,2) (0,1,1)7 para a estação E4 avaliando o período de 01/01/2012 a 30/04/2015. Quando comparado o modelo obtido para a estação nesse trabalho com a referência, verifica-se que as estimativas de  foram quase duas vezes melhores (Pinto, Reisen e Monte (2018): REQM = 12,85 e EAM = 9,34) e a qualidade de previsão de sete dias ficou próxima ao obtido no estudo de referência, que foi igual a 12,92 para o REQM e 9,35 para o EAM. Outra consideração que pode ser feita é que a pesquisa se apresenta como uma extensão de Pinto, Reisen e Monte (2018) e os resultados obtidos no trabalho em função do maior número de estações avaliadas e observações, proporcionam informações mais reais de qualidade do ar para a RGV.

Para estação E3, o modelo SARIMA apresentou as menores medidas de avaliação para ambos os horizontes de previsão, que se deve ao fato de que apesar do modelo SARIMAX ajustado ter considerado como variável preditiva a PP, esse não foi capaz de contribuir nas predições e previsões do modelo, pois como disposto na Tabela 9, as concentrações medidas nessa estação apresentam relações baixas com as variáveis meteorológicas, uma vez que não existe medição dessas variáveis nessa estação. Além disso, a estação está localizada em um bairro residencial, onde o predomínio de prédios atua como uma barreira na circulação dos ventos. No que se refere aos resultados obtidos para estação E5, o modelo ARMA foi o melhor modelo para predição e previsão das concentrações de PM10 monitoradas, tal efeito pode ser atribuído a característica de estacionariedade desse modelo que tende a produzir previsões que oscilam em torno do valor médio de longo prazo (MORETTIN e TOLOI, 2006).

Figura 5 – Funções amostrais de autocorrelação (FAC) e autocorrelação parcial (FACP) dos resíduos dos modelos SARIMAX ajustados para cada estação

 

 

Fonte: Autores (2020)

É desejável que o modelo de previsão seja capaz de captar concentrações as quais possam ser prejudiciais à saúde pública. Assim, a fim de avaliar a eficiência e comparar os três modelos em predizer eventos iguais ou superiores a 46  (qualidade do ar regular), foram calculadas as estatísticas de avaliação POD, FAR, EA e MISS, cujos resultados encontram-se descritos na Tabela 12. É possível observar que o modelo SARIMAX apresentou como o melhor modelo para realizar predições de eventos com níveis iguais ou superiores a 46 , dentre eles destacam-se os modelos determinados para as estações E1 e E8 os quais, das vezes que foram observados eventos de qualidade do ar regular, estimaram corretamente, 50,09% (E1) e 64,46% (E8) desses eventos. Tais resultados vão de encontro com os trabalhos de Monte, Alburquerque e Reisen (2015) e Pinto, Reisen e Monte (2018) em que os modelos adotados pelos autores considerando as variáveis velocidade do vento, temperatura, umidade relativa e precipitação pluviométrica se sobressaíram na predição de concentrações de ozônio acima de 80  e de concentrações de material particulado inalável superiores a 46 , respectivamente.

Tabela 12 – Resultados das estatísticas de avaliação da eficiência do modelo em predizer eventos classificados como regular

Estatística

Modelos

Estações

E1

E2

E3

E4

E5

E6

E8

POD

SARIMAX

0,5009

0

0,3571

0,0347

0,1798

0,1429

0,6446

SARIMA

0,2555

0

0,3571

0,0347

0,1685

0,1039

0,585

ARMA

0,1908

0

0,2857

0,0139

0

0,026

0,4179

FAR

SARIMAX

0,3836

1

0,0625

0,2857

0,8

0,4762

0,2944

SARIMA

0,3902

1

0,0625

0,4444

0,8193

0,3333

0,3056

ARMA

0,3412

0

0,0769

0

0

0,3333

0,3409

EA

SARIMAX

0,3818

0

0,3488

0,0342

0,1046

0,1264

0,5079

SARIMA

0,2196

0

0,3488

0,0338

0,0955

0,0988

0,4652

ARMA

0,1736

0

0,2791

0,0139

0

0,0256

0,3436

MISS

SARIMAX

0,4991

1

0,6429

0,9653

0,8202

0,8571

0,3554

SARIMA

0,7445

1

0,6429

0,9653

0,8315

0,8961

0,415

ARMA

0,8092

1

0,7143

0,9861

1

0,974

0,5821

Fonte: Autores (2020)

Ng e Awang (2018) também avaliaram modelos de previsão de concentrações médias diárias de PM10 monitoradas em cinco estações localizadas em diferentes ambientes da Malásia, com base em variáveis preditivas, incluindo parâmetros meteorológicos e poluentes gasosos. Os resultados obtidos demonstram que os três modelos de regressão linear múltipla (MLR) apresentaram melhor desempenho conforme a variação das concentrações medidas em cada estação. Assim, o modelo de regressão linear múltipla com variáveis preditivas e concentrações de PM10 defasadas (MLR1) atuou bem em cenários em que as concentrações de material particulado apresentam grande variação. Em contrapartida, o modelo de regressão com erro de série temporal (RTSE) apresentou um bom desempenho nos casos em que as concentrações de PM10 variam com pequenas alterações.

Tal análise explica as diferenças encontradas na qualidade de predição e previsão dos modelos para cada estação da RGV. Para aquelas estações que apresentaram maior variação temporal (E1, E4, E6 e E8), o modelo SARIMAX mostrou-se mais eficaz comparado aos modelos ARMA e SARIMA. Logo, o modelo SARIMA com atribuição de variáveis exógenas pode ser considerado como um bom modelo de previsão de concentrações de PM10 mais elevadas, que possam representar risco a saúde da população.

Os resultados obtidos com a modelagem das séries temporais de concentração de PM10 com o modelo SARIMAX, tanto na previsão quanto na predição de eventos de qualidade do ar, demonstram que estes são considerados bons, posto que os modelos ajustados apresentaram resultados satisfatórios em relação à termos estatísticos, portanto, podem ser utilizados como ferramenta de previsão da qualidade do ar nos municípios da RGV para alertar previamente níveis prejudiciais à saúde pública e permitir adaptação de comportamentos adequados pela população e, principalmente, grupos de risco como crianças, idosos e pessoas com problemas respiratórios.

Tal análise explica as diferenças encontradas na qualidade de predição e previsão dos modelos para cada estação da RGV. Para aquelas estações que apresentaram maior variação temporal (E1, E4, E6 e E8), o modelo SARIMAX mostrou-se mais eficaz comparado aos modelos ARMA e SARIMA. Logo, o modelo SARIMA com atribuição de variáveis exógenas pode ser considerado como um bom modelo de previsão de concentrações de PM10 mais elevadas, que possam representar risco a saúde da população.

Os resultados obtidos com a modelagem das séries temporais de concentração de PM10 com o modelo SARIMAX, tanto na previsão quanto na predição de eventos de qualidade do ar, demonstram que estes são considerados bons, posto que os modelos ajustados apresentaram resultados satisfatórios em relação à termos estatísticos, portanto, podem ser utilizados como ferramenta de previsão da qualidade do ar nos municípios da RGV para alertar previamente níveis prejudiciais à saúde pública e permitir adaptação de comportamentos adequados pela população e, principalmente, grupos de risco como crianças, idosos e pessoas com problemas respiratórios.

4 CONCLUSÕES

Este trabalho objetivou modelar e prever a concentração média diária de material particulado inalável utilizando o modelo SARIMAX, na Região da Grande Vitória (RGV), ES, Brasil, para o período de 01/01/2008 a 31/12/2018.  Os resultados obtidos para os indicadores de desempenho demostraram que os modelos SARIMAX ajustados para as estações E1, E2, E4, E6 e E8 são os mais minuciosos entre os estudados, para realizar predições e previsões da qualidade do ar na RGV. Para as estações E3 e E5 os modelos SARIMA e ARMA, respectivamente, superaram o desempenho do modelo SARIMAX devido a nula ou baixa correlação com as variáveis meteorológicas e pelas concentrações de PM10 variarem próximos a média.

Com relação à predição de eventos de qualidade do ar regular para todas estações, com exceção da estação E2 e E3, o desempenho estatístico dos modelos SARIMAX foram superiores quando comparado aos demais. Dentre as variáveis meteorológicas avaliadas, foram significativas e melhoraram o ajuste dos modelos as variáveis V, U, PP e T. Além disso, é importante destacar que a influência dos fatores meteorológicos sob os níveis de PM10 está relacionada com as características locais e específicas de cada região.

Ressalta-se que estudos dessa natureza são importantes visto que, ao analisar o comportamento do poluente (PM10) juntamente com as variáveis meteorológicas, permitem traçar um perfil mais preciso e eficaz na previsão dos índices de qualidade do ar com a capacidade de prever os picos de concentração, podendo auxiliar na tomada de decisões dos agentes públicos em relação ao planejamento e controle da qualidade do ar com vistas em minimizar os efeitos adversos provocados, especialmente, por episódios críticos de poluição atmosférica.

Referências

AGIRRE-BASURKO, E.; IBARRA-BERASTEGUI, G.; MADARIAGA, I. Regression and multilayer perceptron-based models to forecast hourly O3 and NO2 leves in the Bilbao area. Environmental Modelling and Software, v. 21, p. 430-446, 2006.

AKAIKE, H. A Bayesian analysis of the minimum AIC procedure. Annals of the Institute of Statistical Mathematics, v. 30, n. 1, p. 9-14, 1978.

AKAIKE, H. Information theory and an extension of the maximum likelihood principle. In: PETROV. B.N.; CSAKI, F. (Eds.). Proceedings of the Second International Symposium on Information Theory. Budapeste: Akademiai Kiado. 1973, p. 267-281.

ARAUJO, J. A.; NEL, A. E. Particulate matter and atherosclerosis: role of particle size, composition and oxidative stress. Particle and Fibre Toxicology, v. 6, n. 24, 2009.

BERA, A.K.; JARQUE, C.M. Efficient tests for normality, homoscedasticity and serial independence of regression residuals: Monte Carlo evidence. Economics Letters, v. 7, n. 4, p. 313-318, 1981.

BOX, G.; JENKINS, G. M. Time Series Analysis: Forecasting and Control. San Francisco, CA: Holden - Day, 1970, 500 p.

BOX, G.; PIERCE, D.A. Distribution of residual autocorrelations in autorregressive integrated moving average time series models. Journal of the American Statistical Association, v. 65, n. 332, p. 1509 1526, 1970.

BOX, G., COX, D. An analysis of transformations. Journal of the Royal Statistical Society, v. 26, p. 211–252, 1964.

BOWE, B.; XIE, Y.; LI, T.; YAN, Y.; XIAN, H.; AL-ALY, Z. The 2016 global and national burden of diabetes mellitus attributable to PM2,5 air pollution. The Lancet Planetary Health, v. 2, n. 7, p. e301-e312, 2018.

CETESB - Companhia Ambiental do Estado de São Paulo. Relatório de qualidade do ar no Estado de São Paulo 2018. São Paulo: CETESB, 2019. Disponível em: https://cetesb.sp.gov.br/ar/publicacoes-relatorios/. Acesso em: 07 jul. 2021.

CONAMA – Conselho Nacional de Meio Ambiente. Resolução nº 491, de 19 de novembro de 2018. Dispõe sobre padrões de qualidade do ar. Diário Oficial da União: seção 1, Brasília, DF, p. 155. Disponível em: http://www2.mma.gov.br/port/conama/legiabre.cfm?codlegi=740. Acesso em: 13 ago. 2019.

DICKEY, D. A.; FULLER, W. A. Likelihood ratio statistics for autoregressive time series with a unit root. Econometrica, Chicago, v. 49, p. 1057-1072, 1981.

ECOSOFT – Ecosoft Consultoria e Softwares Ambientais. Inventário de emissões atmosféricas da Região da Grande Vitória: ano base – 2015. Vitória, 2019. Disponível em: https://iema.es.gov.br/qualidadedoar/inventariodefontes/2015. Acesso em: 24 ago. 2019.

ESPÍRITO SANTO (Estado). Decreto nº 3463-R, de 16 de dezembro de 2013. Estabelece novos padrões de qualidade do ar e dá providências correlatas. Diário Oficial do Estado do Espírito Santo, Vitória, ES, p. 9-11, 17 dez. 2013. Disponível em: https://iema.es.gov.br/Media/iema/CQAI/Documentos/DECRETO_N%C2%BA_3463_2013.pdf. Acesso em: 13 ago. 2019.

FIORDELISI, A.; PISCITELLI, P.; TRIMARCO, B.; COSCIONI, E.; IACCARINO, G.; SORRIENTO, D. The mechanisms of air pollution and particulate matter in cardiovascular diseases. Heart Failure Reviews, v. 22, p. 337–347, 2017. 

FREITAS, C. U.; LEON, A. P.; JUNGER, W. GOUVEIA, N. Air pollution and its impacts on health in Vitoria, Espirito Santo, Brazil. Revista de Saúde Pública, v. 50, n. 4, p. 1-9, 2016.

GOMES, K.S. Modelagem INAR(p) para a previsão de índices de qualidade do ar. 71 f. Dissertação (Mestrado em Engenharia Ambiental) – Programa de Pós-Graduação em Engenharia Ambiental, Centro Tecnológico, Universidade Federal do Espírito Santo, Vitória, 2009.

GOUVEIA, N.; MENDONÇA, G. A. e S.; LEON, A. P.; CORREIA, J. E. M.; JUNGER, W. L.; FREITAS, C. U.; DAUMAS, R. P.; MARTINS, L. C.; GIUSSEPE, L.; CONCEIÇÃO, G. M.S.; MANERICH, A.; CUNHA-CRUZ, J. Poluição do ar e efeitos na saúde nas populações de duas grandes metrópoles brasileiras. Epidemiologia e Serviços de Saúde, v. 12, p. 29-40, 2003.

GOCHEVA-ILIEVA, S.; IVANOV, A.; ILIEV, I. Exploring key air pollutants and forecasting particulate matter PM10 by a two-step SARIMA approach. In: Aip Conference Proceedings. AIP Publishing, 2019, p. 1-10.

GRIPA, W.R.; REISEN, V.A.; FAJARDO, F.A.; REIS JUNIOR, N.C. Análise de predição e previsão das concentrações de material particulado inalável (PM10) na cidade de Cariacica, ES. Revista Brasileira de Estatística, v. 73, n. 237, p. 37-57, 2012.

IBGE – Instituto Brasileiro de Geografia e Estatística. Estimativa da população. 2019. Disponível em: https://www.ibge.gov.br/estatisticas/sociais/populacao/9103-estimativas-de-populacao.html. Acesso em: 15 out. 2019.

IEMA – Instituto Estadual de Meio Ambiente e Recursos Hídricos do Estado do Espírito Santo, Relatório da qualidade do ar da Região da Grande Vitória – 2016. Vitória. 2018. Disponível em: https://iema.es.gov.br/Media/iema/CQAI/Relatorios_anuais/Relat%C3%B3rio_Anual_de_Qualidade_do_Ar_2016.pdf. Acesso em: 03 mar. 2019.

JUNGER, W.L.; LEON, A.P. Imputation of missing data in time series for air pollutants. Atmospheric Environment, v. 102, p. 96-104, 2015.

JUNGER, W.L.; LEON, A.P. mstdi: Multivariate Time Series Data Imputation. R package version 0.3.5, 2018. Disponível em: https://CRAN.R-project.org/package=mtsdi. Acesso em: 01 maio 2020.

KÖPPEN, W. Versuch einer klassifikation der klimate, vorzugsweise nach ihren beziehungen zur pflanzenweltl. Geogr Zeitschr, v. 6, p. 596–611, 1900.

LEITE, R. C. M.; GUIMARÃES, E. C.; LIMA, E. A. P.; BARROZO, M. A. S.; TAVARES, M. Utilização de regressão logística simples na verificação da qualidade do ar atmosférico de Uberlândia. Engenharia Sanitária e Ambiental, v. 16, n.1, p. 175-180, 2011.

LIRA, T. S. Modelagem e previsão da qualidade do ar na cidade de Urbelândia – MG. 180 f. Tese (Doutorado em Engenharia Química) - Programa de Pós-graduação em Engenharia Química, Universidade Federal de Uberlândia, Uberlândia, 2009.

LIU, P. W.G.; JOHNSON, R. Forecasting peak daily ozone levels: part 2. A regression with time series errors model having a principal component trigger to forecast 1999 and 2002 ozone levels. Journal of the Air & Waste Management Association, v. 52, n. 9, p.1064-1074, 2002.

LIU, P.W.G.; JOHNSON, R. Forecasting peak daily ozone levels: part 2. A regression with time series errors model having a principal component trigger to forecast 1999 and 2002 ozone levels. Journal of the Air & Waste Management Association, v. 53, n. 12, p.1472-1489, 2003.

LJUNG, G.M.; BOX, G.E.P. On a measure of lack of fit in time series models. Biometrika, v. 65, n. 2, p. 297-303, 1978.

LYRA, G.B.; ODA-SOUZA, M.; VIOLA, D.N. Modelos lineares aplicados à estimativa da concentração do material particulado (PM10) na cidade do Rio de Janeiro, RJ. Revista Brasileira de Meteorologia, v. 26, n. 3, p. 392-400, 2011.

MEMARIANFARD, M.; HATAMI, A. M. Artificial neural network forecast application for fine particulate matter concentration using meteorological data. Global Journal of Environmental Science and Management, v. 3, n. 11, p. 333-340, 2017.

MONTE, E. Z.; ALBUQUERQUE, T. T. A.; REISEN, V. A. Previsão da concentração de ozônio na Região da Grande Vitória, ES, Brasil, utilizando o modelo ARMAX-GARCH. Revista Brasileira de Meteorologia, v. 30, n. 3, p. 285-294, 2015.

MOREIRA, D. M.; TIRABASSI, T.; MORAES, M. R. Meteorologia e poluição atmosférica. Ambiente e Sociedade, v. 11, n. 1, p. 1-13, 2008.

MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. 2 ed. São Paulo: Edgard Blücher, 2006.

NASCIMENTO, L. F. C.; PEREIRA, L. A. P.; BRAGA, A. L. F.; MÓDOLO, M. C. C.; CARVALHO JUNIOR, J. A. Efeitos da poluição atmosférica na saúde infantil em São José dos Campos, SP. Revista de Saúde Pública, v. 40, p. 77- 82, 2006.

NG, K. Y.; AWANG, N. Multiple linear regression and regression with time series error models in forecasting PM10 concentrations in Peninsular Malaysia. Environmental Monitoring and Assessment, v. 190, n. 2, p. 1-11, 2018.

PEREZ, P.; REYES, J. An integrated neural network model for PM10 forecasting. Atmospheric Environment, v. 40, p. 2845–2851, 2006.

PINTO, W. P.; REISEN, V. A.; MONTE, E. Z. Previsão da concentração de material particulado inalável, na Região da Grande Vitória, ES, Brasil, utilizando o modelo SARIMAX. Engenharia Sanitária e Ambiental, v. 23, n. 2, p. 307-318, 2018.

R CORE TEAM (2019). R: A language and environment for statistical computing, R Foundation for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria, 2019. Disponível em: https://www.R-project.org/.

RAZ, R.; ROBERTS, A. L.; LYALL, K.; HART, J. E.; JUST, A. C.; LADEN, F.; WEISSKOPF, M. G. Autism spectrum disorder and particulate matter air pollution before, during, and after pregnancy: a nested case-control analysis within the Nurses’ Health Study II cohort. Environmental Health Perspectives, v.123, p. 264-270, 2015.

REISEN, V.A.; SARNAGLIA, A.J.Q.; REIS JR, N.C.; LÉVY-LEDUC, C. SANTOS, J.M. Modeling and forecasting daily average PM10 concentrations by a seasonal long-memory model with volatility. Environmental Modelling & Software, v. 51, p. 286-295, 2014.

RYAN, W. F. Forecasting severe ozone episodes in the Baltimore metropolitan area. Atmospheric Environment, v. 29, n. 17, p. 2387-2398, 1995.

SANTIAGO, A.; PRADO, R. J.; FILHO, P. M.; ALONSO, R. V. Caracterização do material particulado suspenso no ar de Cuiabá-MT no período de queimadas. Revista Matéria, v. 20, p. 273-283, 2015.

SANTOS, T. C.; REBOITA, M. S.; CARVALHO, V. S. B. Investigação da Relação entre Variáveis Atmosféricas e a Concentração de MP10 E O3 no Estado de São Paulo. Revista Brasileira de Meteorologia, v. 33, p. 631-645, 2018.

SCHWARZ, G. Estimating the dimension of a model. Ann. Stat., Haward, v.6, p.461-464, 1978.

SHAPIRO, S.S.; WILK, M.B. An analysis of variance test for normality (complete samples). Biometrika, v. 52, n. 3-4, p. 591-611, 1965.

SNEDECOR, W.; COCHRAN, W. G. Statistical Methods. 8 ed., Ames: Iowa State University Press, 1989.

SOUZA, J. B.D.; REISEN, V. A.; SANTOS, J.M.; FRANCO, G.C. Componentes principais e modelagem linear generalizada na associação entre atendimento hospitalar e poluição do ar. Revista de Saúde Pública, v. 48, n. 3, p. 451-458, 2014.

VAGROPOULOS, S. I.; VAGROPOULOS, S. I.; CHOULIARAS, G. I.; KARDAKOS, E. G.; SIMOGLOU, C. K. BAKIRTZIS, A. G. Comparison of SARIMAX, SARIMA, modified SARIMA and ANN-based models for short-term PV generation forecasting. In: 2016 Ieee International Energy Conference (Energycon). IEEE, Bélgica, 2016.

WEI, W. Time Series Analysis: Univariate and Multivariate Methods. Nova York: Addison Wesley, 2006.

WHO – World Health Organization. WHO air quality guidelines global update 2005. 2005. Disponível em: http://www.euro.who.int/__data/assets/pdf_file/0008/147851/E87950.pdf. Acesso em: 13 ago. 2019.

WUERTZ, D.; SETZ, T.; CHALABI, Y. fBasics: Rmetrics - Markets and Basic Statistics. R package version 3042.89.1, 2020. Disponível em: https://CRAN.R-project.org/package=fBasics. Acesso em: 01 maio 2020.

YAP, J.; NG, Y.; YEO, K. K.; SAHLÉN, A.; LAM, C. S. P.; LEE, V.; MA, S. Particulate air pollution on cardiovascular mortality in the tropics: impact on the elderly. Environmental Health, v. 18, p. 34, 2019.

ZHANG, X.; CHEN, X.; ZHANG, X. The impact of exposure to air pollution on cognitive performance. Proceedings of the National Academy of Sciences, v. 115, p. 9193-9197, 2018.

ZHANG, Z.; WANG, J.; HART, J. E.; LADEN, F.; ZHAO, C.; LI, T.; ZHEN, P.; LI, D.; YE, Z.; CHEN, K. National scale spatiotemporal land-use regression model for PM2, 5, PM10 and NO2 concentration in China. Atmospheric Environment, v. 192, p. 48-54, 2018.

Contribuição de autoria

1 – Jaqueline Knaak (Autor correspondente)

Engenheira Sanitarista e Ambiental, Mestranda em Engenharia Ambiental,

https://orcid.org/0000-0001-8980-7289 - jaquelineknaak@gmail.com

Contribuição: Curadoria de dados, investigação, análise formal, metodologia, software, visualização de dados, escrita – primeira redação, escrita – revisão e edição.

2 – Wanderson de Paula Pinto

Matemático, Mestre e Doutor em Engenharia Ambiental, Professor do Curso de Engenharia Ambiental e Sanitária da FARESE

https://orcid.org/0000-0001-5267-227X - wandersondpp@gmail.com

Contribuição: investigação, administração do projeto, escrita – revisão e edição, metodologia.

Como citar este artigo

KNAAK, J.; PINTO, W. de P. Aplicação do Modelo SARIMAX para Modelar e Prever a Concentração de Material Particulado Inalável, no Espírito Santo, Brasil. Ciência e Natura, Santa Maria, v. 44, e9, 2022. DOI 10.5902/2179460X63466. Disponível em: https://doi.org/10.5902/2179460X63466.