Resumo Classificação Quimiométrica de Vinagres
Transcrição
Resumo Classificação Quimiométrica de Vinagres
1º Congresso Químico do Brasil João Pessoa – PB – 2010 Classificação quimiométrica de vinagres usando espectros UV-Vis Hebertty Vieira Dantas1; Marcelo Batista de Lima 1 Universidade Federal da Paraíba – Departamento de Química – CCEN [email protected] Resumo Neste trabalho foi realizada a classificação de amostras de vinagres quanto ao seu tipo por meio de métodos quimiométricos de reconhecimento de padrão. Foram ao todo utilizadas 91 amostras de vinagre comercial dos tipos álcool, maçã, vinho branco e tinto, seus espectros foram obtidos por absorção molecular no UV-Vis. Para tal tratamento foram empregados os programas computacionais The Unscrambler, MatLab e Statistica. Os métodos utilizados foram o HCA, PCA, SIMCA, KNN e SPA-LDA. Os resultados obtidos permitiram uma satisfatória classificação dos vinagres. Palavras-chave: quimiometria, classificação quimiométrica, vinagres. 1. Introdução A utilização de numerosos e variados equipamentos de análise instrumental possibilitam uma elevada produção de informação analítica. Desta forma a manipulação e interpretação de tais informações tornaram-se fundamentais para a Química Analítica. Para conseguir processar o maior e melhor número de dados instrumentais os químicos se utilizam de vários procedimentos quimiométricos. A quimiometria compreende uma ampla série de procedimentos matemáticos e estatísticos utilizados para o tratamento de dados analíticos. Existe difundida na literatura grande número de métodos e técnicas quimiométricas como planejamento e otimização de experimentos, classificação e calibração multivariada. As técnicas de reconhecimento de padrão têm por objetivo encontrar similaridades e diferenças entre conjunto de amostras submetidas a certo tipo de análise. Os métodos não supervisionados, denominados também de métodos de análise exploratória, são aqueles usados apenas para examinar similaridades ou diferenças entre amostras, bem como para identificar a formação de padrões no espaço multidimensional. Os métodos de análise exploratórios mais utilizados são: HCA (Hierarchical Cluster Analysis)e PCA (Principal Component Analysis). Os métodos supervisionados são aqueles 1º CQB – 29 de Março a 01 de Abril – IFPB 1º Congresso Químico do Brasil João Pessoa – PB – 2010 usados para prever se uma amostra futura pertence a uma classe; por meio da formação de conjuntos de dados para calibração, validação e predição, são eles: o método do k vizinho mais próximo (do inglês: K-Nearest Neighbor-KNN) e o método de modelagem independente e flexível por analogia de classes (do inglês: Soft Independent Modelling of Class Analogy-SIMCA). O LDA (Linear Discriminant Analysis) é outra ferramenta de classificação. Suas singularidades são decorrentes dos cálculos usados e como cada ferramenta associa as amostra. No LDA, existem algumas desvantagens em relação a outras ferramentas, como problemas sérios com colinearidades entre os dados; trabalhar com pequenas dimensões de variáveis, etc. Contudo estas desvantagens foram superadas com algoritmos para seleção de variáveis, como o APS (Successive Projections Algorithm) que elimina as variáveis não informativas e retém aquelas que resultam numa máxima exatidão. Por isso geralmente estas duas ferramentas são associadas (APS-LDA). A produção de vinagre ocorre por dois processos de fermentação, diversos métodos de produção e uma variedade de matérias-primas (como, vinho tinto e branco, cidra, malte de cevada, mel, álcool da cana, etc.). Suas características químicas e propriedades organolépticas são determinadas pela matéria-prima utilizada como substrato, tipo de acetificação e em alguns casos, pelo período de envelhecido. Tão importante como a obtenção de uma qualidade específica do vinagre é a necessidade de determinar os parâmetros adequados que nos permitem caracterizar e diferenciá-los uns dos outros. Vários estudos têm sido realizados para caracterizar este produto utilizando diferentes parâmetros analíticos e vários técnicas quimiométricas. O objetivo deste trabalho foi o desenvolvimento de várias abordagens de reconhecimento de padrões, que permitem a classificação de amostras de vinagre de acordo com a matéria-prima (vinho tinto, vinho branco, maçã e álcool), a partir de espectros de absorção molecular. 2. Metodologia Foram utilizadas 91 amostras de vinagre comercial de marcas e lotes distintos, sendo 35 de álcool, 23 de maçã, 19 de vinho tinto e 14 de vinho branco. Seus espectros foram obtidos por um espectrofotômetro Hewlett Packard 8453 HP. Para as medidas instrumentais foram realizadas diluições de todas as amostras, soluções de 10% v/v em água destilada, sendo estas análises realizadas em triplicata. O tratamento quimiométrico para reconhecimento de padrão não supervisionado (PCA, Principal Component Analysis e HCA, Hierarchical Cluster Analysis) e supervisionado (SIMCA, Soft Independent Modeling of Class Analogies, KNN K-Nearest 1º CQB – 29 de Março a 01 de Abril – IFPB 1º Congresso Químico do Brasil João Pessoa – PB – 2010 Neighbor e SPA-LDA, Successive Projections Algorithm - Linear Discriminant Analysis) foram realizados por meio dos softwares The Unscrambler, MatLab e Statistica. 3. Resultados e Discussão Um exame preliminar dos dados permitiu a seleção da região de trabalho, que compreende um intervalo espectral de perfil satisfatoriamente informativo, com a presença das bandas espectrais e livre de ruídos significativos. A Figura 1 mostra em detalhe esta região de trabalho selecionada, com 151 comprimentos de onda, de 250 a 400nm. O pré-tratamento empregado não se mostrou necessário devido à ausência expressiva de variações sistemáticas e/ou aleatórias como ruído instrumental e desvio da linha de base para a região selecionada. Figura 1 – Medidas de absorção molecular de todas as amostras, em destaque região de trabalho. O modelo HCA realizado, representado por um dendrograma, obteve melhores resultados utilizando a distância Euclidiana e o agrupamento pelo processo single-linkage. A Figura 2a apresenta os agrupamentos (clusters) melhor delimitados pelo modelo. Observa-se no dendrograma a presença de um possível outlier (amostra anômala), pois se liga ao grupo numa distância maior que 2,5. O modelo PCA estimado também comprovou a existência de um outlier por meio das suas ferramentas de diagnóstico usado na validação dos modelos. O gráfico dos loadings ou influência no modelo (resíduo × influência) é satisfatório para comprovar a presença da 1º CQB – 29 de Março a 01 de Abril – IFPB 1º Congresso Químico do Brasil João Pessoa – PB – 2010 amostra anômala. A figura 2b mostra o gráfico dos scores (PC1 × PC2) sem a presença do outlier, a PC1 já consegue explicar cerca de 99,83% da variância das amostras. (a) (b) Figura 2 – (a) Dendrograma; (b) Gráfico dos Scores Para o reconhecimento de padrão supervisionado foi utilizado, inicialmente, o KNN, com acerto de todas as amostras de predição até o décimo primeiro vizinho mais próximo (K=11). No modelo SIMCA ao nível de 95% de confiança estatística foram encontrados apenas um erro em uma das amostras de vinagre de álcool estudada. O modelo SPA-LDA não apresentou nenhum erro no conjunto de predição, o que pode reafirmar o uso da seleção de variáveis para a construção de modelos quimiométricos. Erros SPA-LDA SIMCA 1% SIMCA 5% SIMCA 10% SIMCA 25% Tipo I 0 0 1 5 9 Tipo II 0 0 0 0 0 Total 0 0 0 0 0 Figura 3 – Resumo dos erros de classificação 4. Conclusões Os resultados obtidos foram bastante satisfatórios. O comportamento espectral das amostras permitiu uma classificação quanto ao tipo de vinagre totalmente adequada para os modelos de classificação SIMCA, KNN e SPA-LDA. 1º CQB – 29 de Março a 01 de Abril – IFPB 1º Congresso Químico do Brasil João Pessoa – PB – 2010 5. Referências Beebe, K. R., Pell, R. J., Seasholtz, M. B., Chemometrics - A Practical Guide. John Wiley & Sons: New York, 1998. Bruns, R. E.; Faigle, J. F. G., Quimiometria. Quím. Nova, 8: 84, 1985. Camo A/S, The Unscrambler User’s Guide, Trondhein, 2002. Ferreira, M. M. C., et al., Quimiometria I: calibração multivariada, um tutorial, Quím. Nova, 22 (5): 724, 1999. MathWorks, MatLab, versão 6.5, 2002. Natera, Ramón; Remedios, Castro; Garcia-Moreno, Maria De Valme; Hernandez, Maria Jesús; Garcia-Barroso, Carmelo. Chemometric Studies Of Vinegars From Different Raw Materials And Processes Of Production. J. Agric. Food Chem. 2003, 51, 3345-3351p. R. A. Fisher. The use of multiple measurement in taxonomic problems. Annals of Eugenic 7 (1936) 179-188 R.W. Kennard, L. A. Stone, Technometrics 11 (1969) 137-148 Stasoft, Manual do usuário, STATÍSTICA, versão 6.0, São Caetano do Sul-Brasil, 2001. 1º CQB – 29 de Março a 01 de Abril – IFPB