Comparação de métodos para avaliar a acurácia da incorporação de dados químicos censurados na análise estatística descritiva de águas subterrâneas contaminadas

Publicado
2023-01-29
Palavras-chave: Censored data, Hydrochemistry, Detection limit, Descriptive statistics. Dados censurados, Hidroquímica, Limite de detecção, Estatística descritiva.

    Autores

  • Vinicius Rodrigues dos Santos Universidade Federal de Ouro Preto (UFOP), Ouro Preto, MG, Brasil.
  • Luis de Almeida Prado Bacellar Universidade Federal de Ouro Preto (UFOP), Ouro Preto, MG, Brasil. https://orcid.org/0000-0003-1670-9471
  • Cícero Antônio Antunes Catapreta Universidade Federal de Ouro Preto (UFOP), Ouro Preto, MG, Brasil.

Resumo

Análises químicas da água subterrânea frequentemente apresentam conjuntos de dados com valores censurados, ou seja, abaixo do limite de detecção (LD). Quando a proporção de valores censurados é significativa, a análise geoquímica descritiva (média, mediana e desvio padrão) ou a exploratória podem ser prejudicadas e ignorar tais dados ou substituí-los por algum valor pré-determinado nem sempre é a alternativa recomendável. Assim, neste trabalho objetiva-se investigar a aplicabilidade de quatro métodos na estimativa de dados químicos censurados de uma área com águas subterrâneas contaminadas. Foram empregados três métodos estatísticos: paramétrico (Estimativa de Máxima Verossimilhança, MLE), não paramétrico (Kaplan-Meier, KM) e robusto (Métodos de Regressão na Ordem, ROS), além do método tradicional de substituição direta de dados censurados, utilizando o LD/2. O MLE, admitindo uma distribuição gaussiana dos dados (MLE-no), rendeu fatores de substituição admissíveis, próximos a 0,5, à semelhança do método tradicional de substituição (LD/2). A validação com conjuntos de dados completos com os mesmos métodos de estimativa e considerando três LD artificiais atestou os bons resultados de MLE-no e ROS com 25% e 50% de dados censurados, respectivamente, bem como de LD/2. Acredita-se que os dois primeiros métodos sejam preferíveis ao LD/2, por serem estatisticamente baseados. Recomenda-se em estudos futuros que tais métodos de estimativa sejam combinados com outros tratamentos geoestatísticos para melhorar a análise espacial de conjuntos de dados hidroquímicos.

Referências

ANTWEILER, R.C., TAYLOR, H.E. Evaluation of statistical treatments of left-censored environmental data using coin-cident uncensored data sets: I. Summary statistics. Envi-ronmental Science & Technology, v. 42, p. 3732–3738, 2008. https://doi.org/10.1021/es071301c

ANTWEILER, R.C., 2015. Evaluation of Statistical Treatments of Left-Censored Environmental Data Using Coincident Un-censored Data Sets. II. Group Comparisons. Environmental Science & Technology, v. 49, p. 13439-13446, 2015 https://doi.org/10.1021/acs.est.5b02385

BACELLAR L.A.P., OLIVEIRA FILHO W.L. Caracterização defini-tiva da pluma de contaminação das águas subterrâneas da área do aterro sanitário da CTRS-BR040. Unplubished report, Belo Horizonte, 2009.

BARELLA, C.F., BACELLAR, L.A.P., NALINI, H.A. Influence of the natural oxidation of the leachate organic fraction from a landfill on groundwater quality, Belo Horizonte: Minas Ge-rais, south-eastern Brazil. Environ Earth Sci, v. 70, p. 2283–2292, 2013. https://doi.org/10.1007/s12665-013-2284-4

BACCARELLI, A. et al. Handling of dioxin measurement data in the presence of non-detectable values: overview of availa-ble methods and their application in the Seveso chloracne study. Chemosphere, v. 60, n. 7, p. 898-906, 2005.

https://doi.org/10.1016/j.chemosphere.2005.01.055

CARRANZA, E.J.M. Analysis and mapping of geochemical anomalies using logratio-transformed stream sediment data with censored values. J. Geochem. Explor. v. 110, n. 2, p. 167-185, 2011. https://doi.org/10.1016/j.gexplo.2011.05.007

CLARKE, J. U. Evaluation of Censored Data Methods To Allow Statistical Comparisons among Very Small Samples with Below Detection Limit Observations. Environmental Science & Technology v. 32, p. 177-183, 1998.

https://doi.org/10.1021/es970521v

COHEN, A.C. Tables for maximum likelihood estimates: sin-gly truncated and singly censored samples. Technometrics, v. 3, p. 535–541, 1961. https://doi.org/10.1080/00401706.1961.10489973

CROGHAN, C. W., EGEGHY, P. P. Methods of dealing with values below the limit of detection using SAS. Southeastern SAS User Group September, p. 22-24, 2003.

FIÉVET, B., VEDOVA, D.C. Dealing with non-detect values in time series measurements of radionuclide concentration in the marine environment. Journal Environmental Radioactive v. 101, n. 1, p. 1-7, 2010. https://doi.org/10.1016/j.jenvrad.2009.07.007

FISHER, R.A. Theory of statistical estimation. In: MATHEMAT-ICAL PROCEEDINGS OF THE CAMBRIDGE PHILOSOPHICAL SOCIETY. Cambridge University Press, p. 700–725, 1925. https://doi.org/10.1017/S0305004100009580

GIBBONS, R.D. Statistical methods for detection and quanti-fication of environmental contamination. United States: John Wiley & Sons, 2001.

GILLIOM, R.J., HELSEL, D.R. Estimation of distributional parameters for censored trace level water quality data: 1. Estimation techniques. Water Resources Research, v. 22, p. 135–146, 1986. https://doi.org/10.1029/WR022i002p00135

HELSEL, D.R. Insider censoring: distortion of data with non-detects. Human and Ecological Risk Assessment, v. 11, p. 1127–1137, 2005. https://doi.org/10.1080/10807030500278586

HELSEL, D.R. Fabricating data: how substituting values for nondetects can ruin results, and what can be done about it. Chemosphere, v. 65, p. 2434–2439. https://doi.org/10.1016/j.chemosphere.2006.04.051

HELSEL, D.R. Statistics for censored environmental data using Minitab and R. Second Edition. United States: John Wiley & Sons, 2011. https://doi.org/10.1002/9781118162729

HEWETT, P., GANSER, G.H. A comparison of several methods for analyzing censored data. Annals of Occupational Hygiene v. 51, p. 611-632, 2007.

HORNUNG, R.W., REED, L.D. Estimation of average concen-tration in the presence of nondetectable values. Applied occupational and environmental hygiene, v. 5, p. 46–51, 1990. https://doi.org/10.1080/1047322X.1990.10389587

KAPLAN, E.L., MEIER, P. Nonparametric estimation from incomplete observations. Journal of the American Statistical association, v. 53, p. 457–481, 1958. https://doi.org/10.1080/01621459.1958.10501452

KROLL, C.N., STEDINGER, J.R. Estimation of moments and quantiles using censored data. Water Resources Research, v. 32, p. 1005–1012, 1996. https://doi.org/10.1029/95WR03294

LEE, L. NADA: Nondetecs and Data Analysis for Environmen-tal Data. R Package, 2010.

LEE, L., HELSEL, D. Baseline models of trace elements in major aquifers of the United States. Applied Geochemistry, v. 20, n. 8, p. 1560-1570, 2005. https://doi.org/10.1016/j.apgeochem.2005.03.008

LEITH, K.F. et. al. A comparison of techniques for assessing central tendency in left-censored data using PCB and pp'DDE contaminant concentrations from Michigan's Bald Eagle Biosentinel Program. Chemosphere, v. 80, p. 7-12, 2010. https://doi.org/10.1016/j.chemosphere.2010.03.056

LEVITAN, D.M., SCHREIBER, M.E., SEAL, R.R., BODNAR, R.J., AYLOR J.G. Developing protocols for geochemicalbaeline studies: An exemple from the Cole Hill uranium deposit, Virginia, USA. Applied Cheochemistry, v. 43, p. 88-100, 2014. https://doi.org/10.1016/j.apgeochem.2014.02.007

LIU, S., LU, J.C., KOPLIN, D. W., MEEKER, W. Q. Analysis of environmental data with censored observations. Environ-mental Science & Technology, v. 31, p. 3358-3362, 1997. https://doi.org/10.1021/es960695x

REIMANN, C. Statistical data analysis explained: applied environmental statistics with R. United States: John Wiley & Sons, 2008. https://doi.org/10.1002/9780470987605

SANFORD, R.F., PIERSON, C.T., CROVELLI, R.A.. An objective replacement method for censored geochemical data. Math-ematical Geology, v. 25, p. 59–80, 1993. https://doi.org/10.1007/BF00890676

SINGH, A., NOCERINO, J. Robust estimation of mean and variance using environmental data sets with below detection limit observations. Chemometrics and Intelligent Laboratory Systems, v. 60, p. 69-86, 2002. https://doi.org/10.1016/S0169-7439(01)00186-1

TEMPL, M., FILZMOSER, P., REIMANN, C. Cluster analysis applied to regional geochemical data: problems and possibil-ities. Applied Geochemistry, v. 23, p. 2198–2213, 2008. https://doi.org/10.1016/j.apgeochem.2008.03.004

THODE, H.C. Testing for normality. First Edition. United States: CRC press, 2002. https://doi.org/10.1201/9780203910894

YOUNG, K.D., MENEGAZZI, J.J., LEWIS, R.J. Statistical meth-od: IX. Survival analysis. Academic emergency medicine, v. 6, p. 244–249, 1999. https://doi.org/10.1111/j.1553-2712.1999.tb00165.x

Como Citar
Santos, V. R. dos . ., Bacellar, L. de A. P., & Catapreta, C. A. A. . (2023). Comparação de métodos para avaliar a acurácia da incorporação de dados químicos censurados na análise estatística descritiva de águas subterrâneas contaminadas. Águas Subterrâneas, 37(1), e–30104. https://doi.org/10.14295/ras.v37i1.30104