Espectroscopia do infravermelho próximo para a discriminação das espécies de café cru

dc.contributor.advisorNixdorf, Suzana Lucy
dc.contributor.authorSilva, Fabrício Bruneli
dc.contributor.bancaGalvan, Diego
dc.contributor.bancaKillner, Mário Henrique Montazzolli
dc.coverage.extent58 p.
dc.coverage.spatialLondrina
dc.date.accessioned2026-06-22T19:29:34Z
dc.date.available2026-06-22T19:29:34Z
dc.date.issued2026-03-13
dc.description.abstractO café possui grande importância na economia do Brasil, sendo responsável por cerca de 30% da produção mundial. Em 2024, foram exportados aproximadamente 50,6 milhões de sacas de 60 kg. As espécies Coffea arabica e Coffea canephora são as mais comercializadas, sendo o arábica mais valorizado devido às suas características sensoriais, como sabor mais suave e adocicado, além das maiores exigências relacionadas ao seu cultivo. Em função dessas diferenças, o café arábica pode atingir valores de mercado significativamente superiores aos do canéfora, o que favorece a ocorrência de fraudes. Assim, o desenvolvimento de uma metodologia rápida, de baixo custo e robusta para a identificação da espécie apresenta grande relevância econômica. Nesse contexto, este trabalho teve como objetivo desenvolver uma metodologia baseada na espectroscopia no infravermelho próximo (NIRS) para discriminar as espécies arábica e canéfora, tanto em grão quanto moídas. No total, foram utilizadas 207 amostras provenientes das seis principais regiões produtoras de café do Brasil (MG, SP, BA, PR, ES e RO), referentes às safras de 2020 e 2022. As amostras da safra de 2022 foram utilizadas para a calibração dos modelos, enquanto as da safra de 2020 foram empregadas para a validação externa. Os espectros NIR foram obtidos a partir de 50 g de café em grão e 2,0 g de café moído, sendo este último passado em peneira de 32 mesh, na faixa de 400 a 2498 nm, por meio da média de 32 scans. Os espectros foram submetidos aos pré-processamentos de correção multiplicativa de espalhamento (MSC), variável padrão normal (SNV) e primeira derivada. A análise por componentes principais (PCA) indicou que as componentes principais 1 e 2 (PC1 e PC2), obtidas a partir dos espectros tratados com MSC, explicaram juntas 95,75% da variância para o café moído e 97,51% para o café em grão. A Análise Discriminante por Mínimos Quadrados Parciais (PLS-DA) foi empregada para a discriminação das duas espécies e para avaliar a eficiência da seleção de variáveis associadas a compostos presentes em diferentes concentrações nas duas espécies. Para isso, os modelos foram construídos utilizando o espectro NIR completo (1000 a 2498nm) e com regiões selecionadas. Para o café cru moído, o modelo apresentou exatidão de 99,34% na calibração e 100% na validação. Para o café em grão, observou-se alta eficiência na calibração (100%), porém baixo desempenho no conjunto de validação (18,87%). Os modelos com seleção de variáveis apresentaram desempenho semelhante ao obtido com o espectro completo. A partir das regiões selecionadas, foi utilizado um algoritmo iterativo com o objetivo de encontrar a melhor razão entre somas de comprimentos de onda capaz de discriminar as duas espécies, considerando como critérios a maximização da distância entre os grupos e a minimização da variabilidade dentro dos grupos. A equação obtida foi posteriormente ajustada visando maior explicabilidade química, por meio da inclusão de novos comprimentos de onda. Com a equação final, tornou-se possível discriminar as duas espécies de café provenientes de diferentes safras
dc.description.abstractother1Coffee plays an important role in the Brazilian economy, accounting for approximately 30% of global production. In 2024, around 50.6 million 60-kg bags were exported. The species Coffea arabica and Coffea canephora are the most commercialized, with arabica being more highly valued due to its sensory characteristics, such as a smoother and sweeter flavor, as well as the greater agronomic requirements associated with its cultivation. As a result of these differences, arabica coffee can reach significantly higher market values than canephora, which favors the occurrence of fraud. Thus, the development of a fast, low-cost, and robust methodology for species identification is of great economic relevance. In this context, this study aimed to develop a methodology based on near-infrared spectroscopy (NIRS) to discriminate between arabica and canephora species, both in whole bean and ground forms. A total of 207 samples from the six main coffee-producing regions of Brazil (MG, SP, BA, PR, ES, and RO), corresponding to the 2020 and 2022 harvests, were analyzed. Samples from the 2022 harvest were used for model calibration, while those from 2020 were used for external validation. NIR spectra were obtained from 50 g of whole beans and 2.0 g of ground coffee, the latter sieved through a 32-mesh screen, in the spectral range from 400 to 2498 nm, using the average of 32 scans. The spectra were subjected to three preprocessing methods: multiplicative scatter correction (MSC), standard normal variate (SNV), and first derivative. Principal component analysis (PCA) showed that the first two principal components (PC1 and PC2), obtained from MSC-treated spectra, jointly explained 95.75% of the variance for ground coffee and 97.51% for whole beans. Partial Least Squares Discriminant Analysis (PLS-DA) was employed to discriminate between the two species and to evaluate the effectiveness of variable selection associated with compounds present at different concentrations in the two species. For this purpose, the models were built using the full NIR spectrum (1000–2498 nm) and selected spectral regions. For ground raw coffee, the model showed an accuracy of 99.34% in calibration and 100% in validation. For whole beans, high efficiency was observed in calibration (100%), but low performance was obtained in the validation set (18.87%). The models with variable selection showed similar performance to those obtained with the full spectrum. Based on the selected regions, an iterative algorithm was applied to find the best ratio between sums of wavelengths capable of discriminating the two species, considering as criteria the maximization of intergroup distance and the minimization of intragroup variability. The resulting equation was subsequently adjusted to improve chemical interpretability by including additional wavelengths. With the final equation, it became possible to discriminate between the two coffee species from different harvests
dc.identifier.urihttps://repositorio.uel.br/handle/123456789/19295
dc.language.isopor
dc.relation.departamentCCE - Departamento de Química
dc.relation.institutionnameUniversidade Estadual de Londrina - UEL
dc.relation.ppgnamePrograma de Pós-Graduação em Química
dc.subjectNIRS
dc.subjectQuimiometria
dc.subjectDiscriminação de espécie
dc.subjectCafé cru
dc.subjectMétodo rápido
dc.subjectCafé
dc.subjectCoffea arabica
dc.subjectCoffea canephora
dc.subjectControle de qualidade
dc.subject.capesCiências Exatas e da Terra - Química
dc.subject.cnpqCiências Exatas e da Terra - Química
dc.subject.keywordsNIRS
dc.subject.keywordsChemometrics
dc.subject.keywordsSpecies discrimination
dc.subject.keywordsRaw coffee
dc.subject.keywordsRapid method
dc.subject.keywordsCoffea arabica
dc.subject.keywordsCoffee
dc.subject.keywordsCoffea canephora
dc.subject.keywordsQuality control
dc.titleEspectroscopia do infravermelho próximo para a discriminação das espécies de café cru
dc.title.alternativeNear-infrared spectroscopy for the discrimination of raw coffee species
dc.typeDissertação
dcterms.educationLevelMestrado Acadêmico
dcterms.provenanceCentro de Ciências Exatas

Arquivos

Pacote Original
Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
CE_QUI_Me_2026_Silva_Fabrício_B.pdf
Tamanho:
1.85 MB
Formato:
Adobe Portable Document Format
Descrição:
Texto completo ID. 194741
Nenhuma Miniatura disponível
Nome:
CE_QUI_Me_2026_Silva_Fabrício_B_Termo.pdf
Tamanho:
196.58 KB
Formato:
Adobe Portable Document Format
Descrição:
Termo de autorização
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
555 B
Formato:
Item-specific license agreed to upon submission
Descrição: