Resumo Classificação Quimiométrica de Vinagres

Transcrição

Resumo Classificação Quimiométrica de Vinagres
1º Congresso Químico do Brasil
João Pessoa – PB – 2010
Classificação quimiométrica de vinagres usando espectros UV-Vis
Hebertty Vieira Dantas1; Marcelo Batista de Lima
1
Universidade Federal da Paraíba – Departamento de Química – CCEN
[email protected]
Resumo
Neste trabalho foi realizada a classificação de amostras de vinagres quanto ao seu tipo por
meio de métodos quimiométricos de reconhecimento de padrão. Foram ao todo utilizadas 91
amostras de vinagre comercial dos tipos álcool, maçã, vinho branco e tinto, seus espectros
foram obtidos por absorção molecular no UV-Vis. Para tal tratamento foram empregados os
programas computacionais The Unscrambler, MatLab e Statistica. Os métodos utilizados
foram o HCA, PCA, SIMCA, KNN e SPA-LDA. Os resultados obtidos permitiram uma
satisfatória classificação dos vinagres.
Palavras-chave: quimiometria, classificação quimiométrica, vinagres.
1. Introdução
A utilização de numerosos e variados equipamentos de análise instrumental
possibilitam uma elevada produção de informação analítica. Desta forma a manipulação e
interpretação de tais informações tornaram-se fundamentais para a Química Analítica. Para
conseguir processar o maior e melhor número de dados instrumentais os químicos se utilizam
de vários procedimentos quimiométricos.
A quimiometria compreende uma ampla série de procedimentos matemáticos e
estatísticos utilizados para o tratamento de dados analíticos. Existe difundida na literatura
grande número de métodos e técnicas quimiométricas como planejamento e otimização de
experimentos, classificação e calibração multivariada.
As técnicas de reconhecimento de padrão têm por objetivo encontrar similaridades e
diferenças entre conjunto de amostras submetidas a certo tipo de análise. Os métodos não
supervisionados, denominados também de métodos de análise exploratória, são aqueles usados
apenas para examinar similaridades ou diferenças entre amostras, bem como para identificar a
formação de padrões no espaço multidimensional.
Os métodos de análise exploratórios mais utilizados são: HCA (Hierarchical Cluster
Analysis)e PCA (Principal Component Analysis). Os métodos supervisionados são aqueles
1º CQB – 29 de Março a 01 de Abril – IFPB
1º Congresso Químico do Brasil
João Pessoa – PB – 2010
usados para prever se uma amostra futura pertence a uma classe; por meio da formação de
conjuntos de dados para calibração, validação e predição, são eles: o método do k vizinho mais
próximo (do inglês: K-Nearest Neighbor-KNN) e o método de modelagem independente e flexível
por analogia de classes (do inglês: Soft Independent Modelling of Class Analogy-SIMCA).
O LDA (Linear Discriminant Analysis) é outra ferramenta de classificação. Suas
singularidades são decorrentes dos cálculos usados e como cada ferramenta associa as amostra. No
LDA, existem algumas desvantagens em relação a outras ferramentas, como problemas sérios com
colinearidades entre os dados; trabalhar com pequenas dimensões de variáveis, etc. Contudo estas
desvantagens foram superadas com algoritmos para seleção de variáveis, como o APS (Successive
Projections Algorithm) que elimina as variáveis não informativas e retém aquelas que resultam numa
máxima exatidão. Por isso geralmente estas duas ferramentas são associadas (APS-LDA).
A produção de vinagre ocorre por dois processos de fermentação, diversos métodos de
produção e uma variedade de matérias-primas (como, vinho tinto e branco, cidra, malte de
cevada, mel, álcool da cana, etc.). Suas características químicas e propriedades organolépticas
são determinadas pela matéria-prima utilizada como substrato, tipo de acetificação e em
alguns casos, pelo período de envelhecido.
Tão importante como a obtenção de uma qualidade específica do vinagre é a
necessidade de determinar os parâmetros adequados que nos permitem caracterizar e
diferenciá-los uns dos outros. Vários estudos têm sido realizados para caracterizar este
produto utilizando diferentes parâmetros analíticos e vários técnicas quimiométricas. O
objetivo deste trabalho foi o desenvolvimento de várias abordagens de reconhecimento de
padrões, que permitem a classificação de amostras de vinagre de acordo com a matéria-prima
(vinho tinto, vinho branco, maçã e álcool), a partir de espectros de absorção molecular.
2. Metodologia
Foram utilizadas 91 amostras de vinagre comercial de marcas e lotes distintos, sendo
35 de álcool, 23 de maçã, 19 de vinho tinto e 14 de vinho branco. Seus espectros foram
obtidos por um espectrofotômetro Hewlett Packard 8453 HP. Para as medidas instrumentais
foram realizadas diluições de todas as amostras, soluções de 10% v/v em água destilada,
sendo estas análises realizadas em triplicata.
O tratamento quimiométrico para reconhecimento de padrão não supervisionado
(PCA, Principal Component Analysis e HCA, Hierarchical Cluster Analysis) e
supervisionado (SIMCA, Soft Independent Modeling of Class Analogies, KNN K-Nearest
1º CQB – 29 de Março a 01 de Abril – IFPB
1º Congresso Químico do Brasil
João Pessoa – PB – 2010
Neighbor e SPA-LDA, Successive Projections Algorithm - Linear Discriminant Analysis)
foram realizados por meio dos softwares The Unscrambler, MatLab e Statistica.
3. Resultados e Discussão
Um exame preliminar dos dados permitiu a seleção da região de trabalho, que
compreende um intervalo espectral de perfil satisfatoriamente informativo, com a presença
das bandas espectrais e livre de ruídos significativos. A Figura 1 mostra em detalhe esta
região de trabalho selecionada, com 151 comprimentos de onda, de 250 a 400nm.
O pré-tratamento empregado não se mostrou necessário devido à ausência expressiva
de variações sistemáticas e/ou aleatórias como ruído instrumental e desvio da linha de base
para a região selecionada.
Figura 1 – Medidas de absorção molecular de todas as amostras, em destaque região de trabalho.
O modelo HCA realizado, representado por um dendrograma, obteve melhores
resultados utilizando a distância Euclidiana e o agrupamento pelo processo single-linkage. A
Figura 2a apresenta os agrupamentos (clusters) melhor delimitados pelo modelo. Observa-se
no dendrograma a presença de um possível outlier (amostra anômala), pois se liga ao grupo
numa distância maior que 2,5.
O modelo PCA estimado também comprovou a existência de um outlier por meio das
suas ferramentas de diagnóstico usado na validação dos modelos. O gráfico dos loadings ou
influência no modelo (resíduo × influência) é satisfatório para comprovar a presença da
1º CQB – 29 de Março a 01 de Abril – IFPB
1º Congresso Químico do Brasil
João Pessoa – PB – 2010
amostra anômala. A figura 2b mostra o gráfico dos scores (PC1 × PC2) sem a presença do
outlier, a PC1 já consegue explicar cerca de 99,83% da variância das amostras.
(a)
(b)
Figura 2 – (a) Dendrograma; (b) Gráfico dos Scores
Para o reconhecimento de padrão supervisionado foi utilizado, inicialmente, o KNN,
com acerto de todas as amostras de predição até o décimo primeiro vizinho mais próximo
(K=11). No modelo SIMCA ao nível de 95% de confiança estatística foram encontrados
apenas um erro em uma das amostras de vinagre de álcool estudada. O modelo SPA-LDA não
apresentou nenhum erro no conjunto de predição, o que pode reafirmar o uso da seleção de
variáveis para a construção de modelos quimiométricos.
Erros
SPA-LDA
SIMCA 1%
SIMCA 5%
SIMCA 10%
SIMCA 25%
Tipo I
0
0
1
5
9
Tipo II
0
0
0
0
0
Total
0
0
0
0
0
Figura 3 – Resumo dos erros de classificação
4. Conclusões
Os resultados obtidos foram bastante satisfatórios. O comportamento espectral das
amostras permitiu uma classificação quanto ao tipo de vinagre totalmente adequada para os
modelos de classificação SIMCA, KNN e SPA-LDA.
1º CQB – 29 de Março a 01 de Abril – IFPB
1º Congresso Químico do Brasil
João Pessoa – PB – 2010
5. Referências
Beebe, K. R., Pell, R. J., Seasholtz, M. B., Chemometrics - A Practical Guide. John Wiley &
Sons: New York, 1998.
Bruns, R. E.; Faigle, J. F. G., Quimiometria. Quím. Nova, 8: 84, 1985.
Camo A/S, The Unscrambler User’s Guide, Trondhein, 2002.
Ferreira, M. M. C., et al., Quimiometria I: calibração multivariada, um tutorial, Quím. Nova,
22 (5): 724, 1999.
MathWorks, MatLab, versão 6.5, 2002.
Natera, Ramón; Remedios, Castro; Garcia-Moreno, Maria De Valme; Hernandez, Maria
Jesús; Garcia-Barroso, Carmelo. Chemometric Studies Of Vinegars From Different Raw
Materials And Processes Of Production. J. Agric. Food Chem. 2003, 51, 3345-3351p.
R. A. Fisher. The use of multiple measurement in taxonomic problems. Annals of Eugenic 7
(1936) 179-188
R.W. Kennard, L. A. Stone, Technometrics 11 (1969) 137-148
Stasoft, Manual do usuário, STATÍSTICA, versão 6.0, São Caetano do Sul-Brasil, 2001.
1º CQB – 29 de Março a 01 de Abril – IFPB