Prediction of technological properties of wheat flour by combination of UV-VIS-NIR spectroscopy and multivariate analysis methods
- Authors: Platova R.А.1, Zhirkova E.V.1, Metlenkin D.А.1, Lysenkova A.А.1, Platov Y.T.1, Rassulov V.A.2
-
Affiliations:
- Plekhanov Russian University of Economics
- All-Russian Scientific-Research Institute of Mineral Resources named after N. M. Fedorovsky
- Issue: Vol 7, No 1 (2024)
- Pages: 22-30
- Section: Статьи
- URL: https://journals.rcsi.science/2618-9771/article/view/295810
- DOI: https://doi.org/10.21323/2618-9771-2024-7-1-22-30
- ID: 295810
Cite item
Full Text
Abstract
Over the last decades, optical spectroscopy methods that do not require complex sample preparation have been widely used to identify and control the composition of food products. In the present study, the possibility of using UV-VIS-NIR spectroscopy combined with multivariate analysis for grading wheat flour into groups differing in technological properties was analyzed. UV-VIS-NIR spectra contain information on the combination and intensity of absorption bands assigned to functional groups of the composition components and determining the technological properties of wheat flour. The database of UV-VIS-NIR spectra of wheat flour samples differing by technological properties was formed into three groups: the first group — wheat flour samples with good baking properties, the second group — with reduced baking properties, the third group — with low baking properties. The visible range of UV-VIS-NIR diffuse reflectance spectrum was used to calculate the color coordinates in the CIE colorimetric system L*a*b*. The greatest difference among the groups in the color coordinates of the samples was found for the coordinate b*, which is associated with the different content of coloring pigments. The spectra database was used to build a classification model for grading wheat flour into quality groups using a combination of principal component analysis and linear discriminant analysis (PCA-LDA) methods. The achieved results indicate that the classification model built on the training sample is able to distinguish wheat flour spectra by quality groups with an accuracy of 96.49%. The effectiveness of the model is verified using a test set of spectra of wheat flour samples. The present study confirms that the combination of UV-VIS-NIR spectroscopy in conjunction with the PCA-LDA method has significant potential for determining a quality group of wheat flour based on technological properties.
Full Text
1. Введение
В настоящее время растет спрос на высококачественную сельскохозяйственную продукцию, что требует проведения инспекционных процессов в цепочках поставок производителей и дистрибьюторов с целью обеспечения высокого качества продукции для потребителей [1]. Пшеничная мука широко используется для производства различных видов хлебобулочных, кондитерских и макаронных изделий.
Изучение хлебопекарных свойств пшеничной муки позволяет оперативно выявлять ее целевое назначение и в определенной степени прогнозировать качество хлебобулочных изделий. Хлебопекарные свойства пшеничной муки определяются следующими показателями: количество и свойства клейковины, число падения и «сила» муки. «Сила» муки — это способность муки образовывать тесто, обладающее после замеса и в ходе брожения и расстойки определенными структурно-механическими свойствами [2].
Существует ряд методов и приборов, с помощью которых изучают свойства пшеничной муки, в том числе и «силу» муки. Среди таких приборов выделяют Фаринограф (Brabender, Германия) и Альвеограф (Chopin, Франция). Для контроля показателей технологических свойств зерна и продуктов его переработки данными методами требуется много времени и большое количество химических реактивов; кроме того, возможность выявления этих показателей в режиме реального времени отсутствует [3].
В современных условиях на предприятиях необходимо устанавливать показатели технологических свойств, отвечающие за определение дальнейшего назначения пшеничной муки, на месте (in situ) и в режиме реального времени. Для реализации этой задачи применяют бесконтактные и неразрушающие методы контроля. Технологические характеристики объектов возможно изучать и анализировать без разрушающего воздействия с помощью таких технологий, как электронный глаз или компьютерное зрение [4]. Среди неразрушающих способов исследования сельскохозяйственной продукции все более актуальными становятся спектроскопические методы, включая UV-VIS-NIR спектроскопию [5].
Использование портативного UV-VIS-NIR спектрометра для анализа технологических характеристик и оценки качества сельскохозяйственной продукции ранее было рассмотрено в работах [6–8]. В настоящее время ближняя инфракрасная спектроскопия широко применяется для определения содержания белка, клейковины, влаги в составе зерна [9]. При этом данные зарегистрированных UV-VIS-NIR спектров возможно задействовать для расчета колориметрических показателей пищевых продуктов. Использование данных UV-VIS-NIR спектров для расчета координат цвета в колориметрических системах проанализировано в работе [10]. В исследованиях [10, 11] применен колориметрический анализ для оценки возможности использования данного метода при контроле качества муки из маниоки и пшеничной муки соответственно. В данной работе изучены цветовые характеристики образцов пшеничной муки, различающихся по технологическим свойствам, для градации образцов на группы качества.
UV-VIS-NIR спектры множества образцов пшеничной муки считаются многомерными данными, поэтому для их анализа используют многомерные методы. Основное назначение этих методов — построение классификационных и градуировочных моделей [12]. В работе [13] применяли методы многомерного анализа в сочетании с данными NIR-спектров для прогнозирования значений показателей свойств, полученных с помощью фаринографа и параметров экстенсиграфа. В настоящем исследовании предлагается другой методический подход — не прогнозирование отдельных показателей технологических свойств сочетанием методов спектроскопии и многомерного анализа, а градация образцов пшеничной муки на группы по технологическим свойствам сочетанием методов спектроскопии и многомерного анализа. Эта гипотеза обусловлена тем, что в UV-VIS-NIR спектрах образцов пшеничной муки имеются полосы поглощения, соответствующие функциональным группам компонентов химического состава и различающиеся по интенсивности полос поглощения, что определяет, на наш взгляд, градацию образцов на группы по технологическим свойствам.
Применение портативных UV-VIS-NIR спектрометров и построение на их основе классификационных моделей методами многомерного анализа позволит существенно сократить время прогнозирования технологических свойств и определения группы качества. При непрерывном контроле на производстве выявление группы пшеничной муки по технологическим свойствам возможно в режиме реального времени, что является преимуществом в условиях непрерывного цикла производства продукта.
Целью работы является разработка методического подхода к градации образцов пшеничной муки на группы качества, различающиеся по технологическим свойствам, сочетанием методов UV-VIS-NIR спектроскопии и многомерного анализа.
2. Объекты и методы
В качестве объектов исследования выбраны 68 UV-VIS-NIR спектров пшеничной хлебопекарной муки высшего сорта, различающиеся по технологическим свойствам. В соответствии с методологией построения классификационной модели формируются две выборки: обучающая, необходимая для построения калибровочной модели, и тестовая — для верификации модели [14]. В нашем исследовании в обучающую выборку из 68 спектров включены 62 спектра, а в тестовую — 6 спектров.
Значения показателей технологических свойств образцов пшеничной муки, представленные в Таблице 1, были получены в Центре реологии пищевых сред ФГАНУ НИИ хлебопекарной промышленности. Количество и качество клейковины определяли по ГОСТ 27839–20131 на приборе ИДК-3М, а число падения — по ГОСТ 27676–882 на приборе ПЧП-5. Значения показателей реологических свойств образцов пшеничной муки выявлялись в соответствии с ГОСТ ISO 5530–1–20133 на фаринографе Farinograph (фирма Brabender, Германия). Методика и технология определения технологических свойств будет представлена в отдельном исследовании.
Таблица 1. Средние значения технологических показателей пшеничной муки по трем группам качества с учетом стандартной ошибки выборки средств
Table 1. Mean values of technological indicators of wheat flour by three quality groups with account for the standard error
группа 1 | группа 2 | группа 3 | |
Номера спектров образцов пшеничной муки | 37–42, 49, 50, 53–56, 65, 66 | 35, 36, 45–48, 51, 52, 59–62, 67, 68 | 1–34, 43, 44, 57, 58, 63, 64 |
Показатели | Средние значения по группам | ||
«Число падения» (ЧП), с | 365 ± 13,89 | 300 ± 15,61 | 355 ± 11,37 |
Количество клейковины (Gкл), % | 28,7 ± 0,18 | 28,0 ± 0,42 | 26 ± 0,39 |
Качество клейковины, ед. ИДК | 62 ± 3,10 | 62 ± 3,61 | 51 ± 2,61 |
Водопоглощение муки (V) на 500 ЕФ, % | 58 ± 0,20 | 61 ± 1,24 | 59 ± 0,51 |
Время образования теста (a), мин | 7,2 ± 2,15 | 5,1 ± 0,99 | 2 ± 0,21 |
Устойчивость теста (b), мин | 17,9 ± 0,43 | 11,6 ± 0,94 | 9 ± 1,24 |
Разжижение теста через 10 минут после начала тестирования (d1) | 8 ± 4,61 | 49 ± 3,92 | 51 ± 3,92 |
Разжижение теста через 12 минут после времени развития (d2) | 8 ± 2,67 | 24 ± 3,37 | 43 ± 3,73 |
Число качества, ЧК | 194 ± 3,31 | 106 ± 6,60 | 53 ± 1,32 |
Методами многомерного анализа [8] проведена процедура градации образцов пшеничной хлебопекарной муки, а также формирования групп качества по показателям технологических свойств. В результате выделены три группы: первая группа — образцы пшеничной муки с хорошими хлебопекарными свойствами, вторая группа — с пониженными хлебопекарными свойствами, третья группа — с низкими хлебопекарными свойствами. Средние значения технологических показателей образцов исследования представлены в Таблице 1.
Измерение UV-VIS-NIR спектров диффузного отражения проведено на портативном спектрометре ASD TerraSpec® 4 Hi-Res в диапазоне 350–2500 нм. Этот портативный прибор имеет массу 5,44 кг. Спектральное разрешение прибора в диапазоне до 1000 нм составляет 3 нм и 6 нм — в диапазоне от 1000 до 2500 нм. Апертура исследуемого участка — 12 мм. В качестве источника света используется галогенная лампа (# 8106–002, Welch Allyn, США). Управление спектрометром проводится с помощью программы RS3 (ASD Inc., США), установленной на портативном компьютере — ноутбуке ThinkPad X201 (Lenovo, Китай). Использование портативного спектрометра имеет ряд преимуществ: измерение диффузного отражения можно проводить in situ, без пробоподготовки; при измерении спектров применяется проба большого объема и массы, что повышает достоверность и репрезентативность результатов; сочетание видимого (VIS) и ближнего инфракрасного (NIR) диапазонов позволяет, с одной стороны, определить по VIS-диапазону цветовые характеристики и центры окраски природных пигментов, с другой — идентифицировать по NIR-диапазону функциональные группы компонентов химического состава пшеничной муки.
По видимому диапазону UV-VIS-NIR спектра диффузного отражения произведен расчет (при соблюдении следующих стандартных условий: измерение/наблюдение d/8° при источнике света D65 и колориметрическом наблюдателе 10°) координат цвета в колориметрической системе МКО L*a*b*: L* — светлота; +a* — красный, -a* — зеленый; +b* — желтый, -b* — синий. C — насыщенность цвета, Н — цветовой тон [15].
Для применения многомерных методов проводили предварительную обработку UV-VIS-NIR спектров диффузного отражения в программном пакете Unscrambler (ver. 10.0.4, Camo Software, Норвегия). Предварительная обработка включала следующие этапы: коррекция мультипликативного рассеяния (MSC), процедура сглаживания спектров методом сглаженной скользящей средней (Moving Average) и преобразование коэффициентов диффузного отражения (R) в коэффициенты поглощения длин волн спектра по функции A = log(1/R). Профили UV-VIS-NIR спектров поглощения образцов пшеничной муки после предварительной обработки представлены на Рисунке 1.
Рисунок 1. Профили UV-VIS-NIR спектров образцов пшеничной муки после предварительной обработки. Положение полос поглощения спектра, приписываемых функциональным группам компонент состава пшеничной муки. Подробнее — см. Таблицу 3
Figure 1. Profiles of UV-VIS-NIR spectra of the wheat flour samples after the preliminary treatment. The location of the absorption bands of the spectrum assigned to the functional groups of the composition components of wheat flour. See Table 3 for further details
Для разработки классификационной модели градации образцов пшеничной муки на группы качества использованы следующие методы классификации в программном пакете Unscrambler (ver. 10.0.4, Camo Software, Норвегия):
- метод главных компонент (МГК): алгоритм — NIPALS (нелинейное итерационное проектирование при помощи чередующих наименьших квадратов), метод проверки — полная перекрестная кросс-валидация;
- сочетание метода главных компонент и линейного дискриминантного анализа (PCA-LDA).
3. Результаты и обсуждение
Анализ UV-VIS-NIR спектров образцов пшеничной муки выполнен в несколько этапов:
- по видимому диапазону (380–750 нм) спектра произведен расчет координат цвета в колориметрической системе МКО L*a*b* для образцов пшеничной муки из трех групп, различающихся по технологическим свойствам;
- по UV-VIS-NIR спектру выявлен перечень полос поглощения, приписываемых функциональным группам компонентов состава пшеничной муки, и методом главных компонент определены полосы поглощения, вносящие наибольший вклад в градацию образцов на группы;
- методом дискриминантного анализа построены классификационные модели градации образцов пшеничной муки на группы, различающиеся по технологическим свойствам, и проведена верификация одной из моделей по тестовой выборке образцов.
3.1. Цветовые характеристики пшеничной муки
Содержание и структура белка (качество клейковины), а также цвет пшеничной муки — наиболее ценные показатели свойств для пищевой промышленности и для гарантии качества конечных продуктов [16]. Матрица значений координат цвета L*a*b* образцов пшеничной муки обработана методом главных компонент. Две главные компоненты объясняют 99,9% по общей дисперсии (71% и 29% соответственно). По 1 ГК максимальное значение факторной нагрузки, равное 0,96, имеет координата светлоты L*, а наибольший показатель по 2 ГК, равный 0,96, присущ координате желтизны b*. Координата красноты а* имеет самые низкие значения факторных нагрузок по 1 и 2 ГК. Известно [17], что значение светлоты пшеничной муки определяется твердостью зерен и размером частиц пшеничной муки, а желтизна — содержанием природных пигментов.
Таблица 2. Координаты цвета образцов пшеничной муки по группам
Table 2. Coordinates of the color of the wheat flour samples by groups
Номер группы | Значение показателя | Координаты цвета | ||||
L* | a* | b* | C | H | ||
Группа 1 | Максимум | 96,1 | 0,77 | 12,78 | 12,8 | 87,8 |
Минимум | 92,4 | 0,41 | 9,39 | 9,4 | 86,3 | |
Среднее | 94,5 | 0,52 | 11,07 | 11,1 | 87,3 | |
Группа 2 | Максимум | 95,8 | 0,83 | 10,75 | 10,7 | 88,2 |
Минимум | 91,98 | 0,32 | 9,32 | 9,3 | 85,5 | |
Среднее | 94,8 | 0,47 | 10,06 | 10,1 | 87,3 | |
Группа 3 | Максимум | 96,2 | 0,53 | 11,06 | 11,1 | 88,1 |
Минимум | 90,5 | 0,33 | 8,48 | 8,5 | 86,6 | |
Среднее | 94,6 | 0,45 | 9,66 | 9,7 | 87,3 |
В Таблице 2 представлены координаты цвета образцов из трех групп в колориметрической системе МКО L*a*b*. По окраске образцы из трех групп, разделенные по технологическим свойствам, различаются следующим образом: по значению светлоты L* и цветового тона Н практически не различаются, по красноте а* — очень слабо, а по желтизне b* и насыщенности цвета С — слабо различимы.
Флавоноиды и красноватые флабовены, в основном присутствующие во внешнем слое зерна, как и каротиноиды, которые отвечают за цвет зерна, находятся в эндосперме [18]. Накопление каротиноидов в эндосперме, обладающих антиоксидантными свойствами, определяет желтый цвет зерна [19]. Согласно исследованиям взаимосвязи природных пигментов и окраски злаков и их продуктов, координата желтизны b* взаимосвязана с содержанием природных пигментов — лютеина и бета-каротина [20]. Среди каротиноидов именно лютеин и бета-каротин являются основными компонентами, формирующими желтый оттенок зерна пшеницы. Если сравнить средние значения трех групп образцов по желтизне, то образцы первой группы желтее по сравнению с образцами второй и третьей групп (11,07 против 9,66–10,06). Можно предположить, что образцы из первой группы, обладающие среди трех групп лучшими хлебопекарными свойствами и имеющие незначительное превосходство по значениям координат желтизны b*, следовательно, имеют в своем составе большее содержание красящих пигментов — лютеина и бета-каротина.
3.2. Построение классификационной модели образцов пшеничной муки по данным UV-VIS-NIR спектров методом главных компонент
По результатам измерения UV-VIS-NIR спектров пшеничной муки, различающейся по технологическим свойствам на три группы, построены две матрицы данных на обучающей (X1) и тестовой (X2) выборках: X1 размерностью 62 × 2151 (62 — количество UV-VIS-NIR спектров, 2151 — отсчеты на длинах волн) и X2 размерностью 6 × 2151 (6 — количество UV-VIS-NIR спектров, 2151 — отсчеты на длинах волн).
Методом главных компонент матрица Х1 преобразована в произведение двух матриц: Т — матрицу счетов (scores) координат спектров образцов и Р — матрицу факторных нагрузок (loadings) длин волн спектра. Число столбцов в матрицах Т и Р, равное А, называют числом главных компонент (ГК). Из матрицы Х1 выделены четыре главные компоненты (А = 4), вклад которых в объяснимую дисперсию составляет 97,49% (69,58; 16,53; 8,98 и 2,40% соответственно).
Одной из задач исследовательского анализа данных является обнаружение выбросов и их удаление из обучающей выборки. На Рисунке 2 представлен график, на котором по оси абсцисс указаны значения статистики Hotelling’s T2, а по оси ординат — значение F-Residuals. Для всех спектров образцов, полученных при анализе методом главных компонент, статистика Hotelling’s T2 описывает расстояние до модели, охватываемое главными компонентами, а также показывает критический предел, связанный со статистическим доверительным интервалом. Из данного Рисунка видно, что пять спектров образцов находятся за пределами критических значений статистики Hotelling’s T2. Это означает, что данные спектры образцов относятся к выбросам, в связи с чем они были удалены из обучающей выборки матрицы Х1. Для дальнейшего анализа при исключении пяти спектров из матрицы Х1 использована матрица Х11.
Рисунок 2. Расположение точек, соответствующее спектрам образцов, в координатах двух осей: значения статистики Hotelling’s T2 и F-Residuals
Figure 2. Location of points corresponding to the spectra of the samples in coordinates of two axes: values of Hotelling’s T2 and F-Residuals statistics
На Рисунках 3а и 3б представлено расположение точек, соответствующих спектрам образцов из разных групп, в координатах 1–2 ГК и 2–3 ГК соответственно. На Рисунках 4а-4г приведены значения факторных нагрузок длин волн спектра поглощения образцов для 1, 2, 3 и 4 ГК.
Рисунок 3. График расположения точек, соответствующих спектрам образцов пшеничной муки в координатах: а) первой и второй главных компонент; б) второй и третьей главных компонент. Группа 1 — желтый цвет ▲; группа 2 — зеленый цвет ■; группа 3 — красный цвет ●
Figure 3. Graph of location of points corresponding to the spectra of the wheat flour samples in coordinates: a) the first and second principal components; б) the second and third principal components. Group 1 — yellow ▲; group 2 — green ■; group 3 — red ●
Рисунок 4. Факторные нагрузки длин волн спектра по четырем главным компонентам: а) по 1 ГК; б) по 2 ГК; в) по 3 ГК; г) по 4 ГК
Figure 4. Factor loadings of wavelengths of the spectrum by four principal components: a) by 1 PC; б) by 2 PC; в) by 3 PC; г) by 4 PC
Таблица 3. Положение полос поглощения спектра, приписываемых функциональным группам компонентов состава пшеничной муки
Table 3. Location of absorption bands of the spectrum assigned to the functional groups of the composition components of wheat flour
Положение полосы, нм | Функциональная группа | Компонент | Источник |
396 | Валентные колебания О–Н | Каротиноиды | |
482 | Валентные колебания О–Н | Каротиноиды | |
910 | Изгиб связи О–Н | Крахмал | [25] |
998 | Изгиб связи О–Н | Крахмал | |
1197 | Второй обертон CH2 связи | Липиды | |
1363 | Второй обертон и растяжение C–H связей | Липиды | [15] |
1454 | Первый обертон валентных колебаний О–Н | Крахмал | |
1576 | N–H и N–O связи | Белок | [29] |
1702 | Первый обертон C–H растягивающих колебаний метильной (–CH3), метиленовой (–CH2) и этениловой (–CH–CH-) групп | Липиды | |
1778 | Первый обертон деформационных колебаний C–H в жирных кислотах | Липиды | [30] |
1932 | Изгиб связи O–H | Вода | |
2097 | Комбинация деформационных колебаний О–Н и валентных колебаний С–O | Крахмал | |
2286 | Валентные колебания С=О | Липиды | [31] |
2318 | Второй обертон деформационных колебаний С–Н, деформационные колебания СН2 | Липиды |
Интерпретация 1, 2, 3 и 4 ГК проведена по знаку (+/-) и по максимальному значению факторных нагрузок длин волн спектра, соответствующих функциональным группам компонентов состава пшеничной муки (Таблица 3).
По 1 ГК со знаком (+/-) факторные нагрузки спектра разделяются на два диапазона: со знаком (+) — видимая область, а со знаком (–) — ближняя инфракрасная область.
По 2 ГК со знаком (+) и по значению факторных нагрузок длин волн спектра выделяют функциональные группы, которые приписывают липидам (2286, 1702 нм), а также комбинации деформационных колебаний О–Н и валентных колебаний С–O, что соответствует крахмалу (2097 нм). Относительно ГК со знаком (–), выделяются функциональные группы при значениях 1932, 1454 и 482 нм, которые соответствуют молекулярной воде, первому обертону валентных колебаний О–Н и каротиноидам соответственно.
По 3 ГК со знаком (+) и по значению факторных нагрузок длин волн спектра выделяются функциональные группы при 1932, 910 и 998 нм, приписываемые молекулярной воде и изгибам ОН-связей групп крахмала, а со знаком (–) — при 482, 1576 и 1778 нм, приписываемые каротиноидам, первому обертону растяжения N–H связей и липидам соответственно.
По 4 ГК со знаком (+) выделяются функциональные группы при 1702, 1778 и 1363 нм, которые приписывают липидам, а со знаком (–) — группы при значениях 482 и 2097 нм, которые относятся к каротиноидам и крахмалу соответственно.
Многомерная градация образцов проведена по координатам образцов главных компонент. Образцы по 1 ГК разделяются на темные со знаком (+) и на более светлые со знаком (–). Действительно, если сравнить значения координат цвета образцов, имеющих знак (+) по 1 ГК (Таблица 4), со средними значениями координат цвета пшеничной муки трех групп (Таблица 1), то видно, что они имеют или более низкие значения светлоты (L* < 94,7), или более низкие значения желтизны (b* < 10,7).
Таблица 4. Цветовые характеристики образцов пшеничной муки, имеющие значения со знаком (+) по 1 ГК
Table 4. Color characteristics of the wheat flour samples having values with the plus sign (+) by 1 PC
Номер спектра образца | Номер группы | Координаты цвета | ||||
L* | a* | b* | C | H | ||
51 | 2 | 91,9 | 0,83 | 10,50 | 10,5 | 85,5 |
52 | 2 | 92,7 | 0,83 | 10,64 | 10,7 | 85,5 |
11 | 3 | 93,9 | 0,53 | 9,18 | 9,2 | 86,7 |
12 | 3 | 93,6 | 0,53 | 9,23 | 9,2 | 86,7 |
5 | 3 | 91,2 | 0,48 | 8,48 | 8,5 | 86,8 |
6 | 3 | 91,5 | 0,51 | 8,80 | 8,8 | 86,6 |
7 | 3 | 90,5 | 0,45 | 9,95 | 9,9 | 87,4 |
10 | 3 | 92,8 | 0,43 | 9,25 | 9,3 | 87,3 |
Следовательно, 1 ГК вносит наибольший вклад в градацию образцов на группы (вклад, равный 69,58% от общей дисперсии), но при этом не вносит различие между группами по технологическим показателям. Согласно ее интерпретации по факторным нагрузкам коэффициента спектра поглощения, она необходима для градации образцов на светлые и более темные.
При рассмотрении расположения спектров образцов в координатах 2 и 3 ГК и при сравнении их расположения с интерпретацией ГК по максимальным значениям факторных нагрузок, можно выявить следующее:
- спектры образцов из третьей группы имеют значения координат со знаком (–) по 2 ГК, которая имеет максимальные значения факторных нагрузок полос при 1932, 1454 и 482 нм, приписываемых функциональным группам ОН молекулярной воды, первому обертону валентных колебаний ОН-крахмала и каротиноидам;
- спектры образцов из второй группы имеют координаты со знаком (+) по 2 ГК, которая имеет максимальные значения факторных нагрузок полос при 2286 и 2097 нм, приписываемых липидам, а также комбинации деформационных колебаний О–Н и валентных колебаний С–О, которые относятся к крахмалу;
- спектры образцов из первой группы расположены вдоль линии (Рисунок 3б), соединяющей спектры образцов со знаком (+) по 2 ГК и со знаком (–) по 3 ГК. Они, в свою очередь, имеют максимальные значения факторных нагрузок полос при 2286, 2097, 482 нм, приписываемых функциональным группам липидов, крахмала и каротиноидов.
Следовательно, ГК взаимосвязаны со значением функциональных групп компонентов состава пшеничной муки и хорошо разделяют образцы, предварительно классифицированные по технологическим свойствам на группы. Поэтому ГК использованы для построения классификационной модели градации образцов на группы методом PCA-LDA.
3.3. Построение классификационной модели градации образцов пшеничной муки на три группы, различающиеся по технологическим свойствам, по данным UV-VIS-NIR спектроскопии методом PCA-LDA
PCA — метод анализа данных без обучения, который используется для уменьшения размеров матрицы X2 с целью получения четырех ГК, объясняющих 97,49% от общей дисперсии. В качестве входных данных для алгоритма LDA использована матрица данных главных компонент (PCA). LDA — это метод анализа с обучением, поэтому для каждой строки матрицы РСА присвоен код — номер соответствующей группы качества. При построении классификационной модели методом PCA-LDA мы варьировали сочетанием меры расстояния между группами — линейного (евклидово), квадраты евклидового расстояния и расстояние Махаланобиса — и количеством используемых ГК.
Линейный метод используется в случае, когда разница между двумя группами может быть представлена линейной функцией. Когда группы разделяются между собой кривой линией, эффективна мера расстояния — квадраты евклидового расстояния. Эта мера может работать лучше в ситуациях, когда различные классифицируемые группы имеют основную изменчивость в разных направлениях. Расстояние Махаланобиса является способом измерения расстояния наблюдения до центров групп, этот метод задействует эллипсы для определения расстояний [35].
Результаты моделирования представлены в Таблице 5, а визуальное представление расположения спектров образцов из трех групп в координатах двух дискриминантных функций LD1 и LD2 — на Рисунке 5.
Таблица 5. Точность классификационной модели (%) от использования при построении меры расстояния между группами и количество главных компонент
Table 5. Accuracy of the classification model (%) on using in building the measure of distance between groups and the number of principal components
Мера расстояния | Количество главных компонент | Точность, % |
Линейное (евклидово) | 3 | 78,95 |
Линейное (евклидово) | 4 | 85,96 |
Квадраты евклидового расстояния | 3 | 92,98 |
Квадраты евклидового расстояния | 4 | 96,49* |
Махаланобис | 3 | 92,98 |
Махаланобис | 4 | 92,98 |
* Выделена модель с наибольшей точностью.
Рисунок 5. Результаты PCA-LDA. Расположение спектров образцов из трех групп в координатах двух дискриминантных функций LD1 и LD2: синие точки обозначают спектры образцов из 1 группы; красные — из 2 группы; зеленые — из 3 группы
Figure 5. Results of PCA-LDA. Location of the spectra of the samples from three groups in the coordinates of two discriminant functions LD1 и LD2: blue points denote spectra of the samples from the 1st group; red points — from the 2nd group; green points — from the 3rd group
В Таблице 6 представлена классификационная матрица данных по принадлежности образцов из обучающей выборки к одной из предполагаемых групп, полученных по классификационной модели методом PCA-LDA при соблюдении следующих условий моделирования: мера расстояния между группами — квадраты евклидового расстояния; число ГК — 4. Наилучшие результаты показывает классификационная модель, построенная с использованием четырех главных компонент и мерой расстояния между группами — квадраты расстояний (Таблица 5). Точность предсказания в этом случае — 96,49%. Неточность классификационной модели объясняется слабым различием между первой и второй группами образцов пшеничной муки по технологическим свойствам: образцы из первой группы — с хорошими хлебопекарными свойствами, образцы из второй группы — с пониженными хлебопекарными свойствами.
Таблица 6. Классификационная матрица определения принадлежности спектров образцов из обучающей выборки к одной из трех групп образцов пшеничной муки
Table 6. Classification matrix of determination of assignment of the spectrum samples from the training sample to one of three groups of the wheat flour samples
Исходная группа | Предполагаемая группа | ||
1 | 2 | 3 | |
1 | 14 | 2 | 0 |
2 | 0 | 13 | 0 |
3 | 0 | 0 | 28 |
Примечание: по диагонали Таблицы показано число правильно классифицированных образцов для каждой группы.
Для валидации классификационной модели использована исходная матрица Х2, в которой представлены данные из тестовой выборки.
Таблица 7. Прогнозирование по классификационной модели принадлежности спектров образцов из тестовой выборки к одной из групп качества пшеничной муки, различающихся по технологическим свойствам
Table 7. Prediction by the classification model of the assignment of the samples from the test sample to one of the quality groups of wheat flour differed by technological properties
Номер спектра образца | Номер группы согласно технологическим свойствам | Номер группы, предсказанный моделью |
2 | 3 | 3 |
9 | 3 | 3 |
22 | 3 | 3 |
46 | 2 | 2 |
59 | 2 | 2 |
66 | 1 | 1 |
В Таблице 7 показаны результаты прогнозирования по классификационной модели принадлежности спектров образцов из тестовой выборки к одной из групп качества пшеничной муки, различающихся по технологическим свойствам. Из Таблицы видно, что для всех образцов из тестовой выборки номер группы согласно технологическим свойствам совпадает с номером группы, предсказанным моделью. Таким образом, предполагаемый метод позволяет достичь точности градации образцов на группы, превышающей 90%. Точность градации образцов на группы качества методом РСА-LDA, вероятно, улучшится, когда в существующую базу данных будет включен большой набор обучающих данных. В связи с этим предлагаемый способ определения спектров образцов к одной из групп качества пшеничной муки, различающихся по технологическим свойствам, может быть высокоэффективным для практического применения в пищевой промышленности.
4. Выводы
Показан потенциал и преимущество использования UV-VIS-NIR спектроскопии для градации образцов пшеничной муки высшего сорта, различающейся по технологическим свойствам, по группам качества: первая группа — образцы пшеничной муки с хорошими хлебопекарными свойствами, вторая группа — с пониженными хлебопекарными свойствами, третья группа — с низкими хлебопекарными свойствами.
Применение портативного спектрометра позволяет проводить измерения UV-VIS-NIR спектров в диапазоне 350–2500 нм на месте и принимать решения о качестве пшеничной муки в режиме реального времени. Для анализа UV-VIS-NIR спектров и построения классификационной модели использованы методы многомерного анализа данных: метод главных компонент и линейный дискриминантный анализ (PCA-LDA).
По видимому диапазону (380–750 нм) спектра произведен расчет координат цвета пшеничной муки высшего сорта в колориметрической системе МКО L*a*b*. Показано, что координаты L* и b* вносят наибольший вклад в различение образцов по цвету. При этом координата светлоты L* не вносит вклад в различение образцов на группы качества по технологическим свойствам, а координата желтизны b* значимо различает и, по-видимому, связана с большим содержанием каротиноидов.
Методом PCA-LDA построена классификационная модель градации образцов пшеничной муки на группы, различающиеся по технологическим свойствам, с точностью 96,49%, и проведена верификация модели по тестовой выборке спектров.
1 ГОСТ 27839–2013 «Мука пшеничная. Методы определения количества и качества клейковины». — Москва.: Стандартинформ, 2023. — 22 с.
2 ГОСТ 27676–88 «Зерно и продукты его переработки. Метод определения числа падения». — Москва.: Стандартинформ, 2023. — 5 с.
3 ГОСТ ISO 5530–1–2013 «Мука пшеничная. Физические характеристики теста. Часть 1. Определение водопоглощения и реологических свойств с применением фаринографа». — Минск.: Стандартинформ, 2016. — 16 с.
About the authors
R. А. Platova
Plekhanov Russian University of Economics
Email: Platova.RA@rea.ru
ORCID iD: 0000-0001-9583-8188
Candidate of Technical Sciences, Docent, Department of Commodity Science
Russian Federation, MoscowE. V. Zhirkova
Plekhanov Russian University of Economics
Email: Zhirkova.EV@rea.ru
ORCID iD: 0000-0002-8934-4162
Candidate of Technical Sciences, Docent, Department of Commodity Science
Russian Federation, MoscowD. А. Metlenkin
Plekhanov Russian University of Economics
Author for correspondence.
Email: Metlenkin.DA@rea.ru
ORCID iD: 0000-0002-7006-2253
Engineer, Engineering Center
Russian Federation, MoscowA. А. Lysenkova
Plekhanov Russian University of Economics
Email: ann.terra@mail.ru
ORCID iD: 0009-0002-8302-7542
Graduate student, Department of Commodity Science
Russian Federation, MoscowYu. T. Platov
Plekhanov Russian University of Economics
Email: Platov.YT@rea.ru
ORCID iD: 0000-0001-6157-572X
Doctor of Technical Sciences, Professor, Department of Commodity Science
Russian Federation, MoscowV. A. Rassulov
All-Russian Scientific-Research Institute of Mineral Resources named after N. M. Fedorovsky
Email: rassulov@mail.ru
ORCID iD: 0000-0001-6235-0936
Candidate of Geological and Mineralogical Sciences
Russian Federation, MoscowReferences
- Cortés, V., Blasco, J., Aleixos, N., Cubero, S., Talens, P. (2019). Monitoring strategies for quality control of agricultural products using visible and near-infrared spectroscopy: A review. Trends in Food Science and Technology, 85, 138–148. https://doi.org/10.1016/j.tifs.2019.01.015
- Сибирина, Т. Ф., Мельникова, Е. В., Мордвинова, Н. М., Полубояринов, Н. А., Беляков, А. А. (2020). Прогнозирование силы муки яровой пшеницы, возделываемой в условиях лесостепи. Эпоха науки, 21, 49–60. https://doi.org/10.24411/2409-3203-2020-11007
- Porep, J. U., Kammerer, D. R., Carle, R. (2015). On-line application of near infrared (NIR) spectroscopy in food production. Trends in Food Science and Technology, 46(2(A)), 211–230. https://doi.org/10.1016/j.tifs.2015.10.002
- Galata, D. L., Meszaros, L. A., Ficzere, M., Vass, P., Nagy, B., Szabo, E. et al. (2021). Continuous blending monitored and feedback controlled by machine vision-based PAT tool. Journal of Pharmaceutical and Biomedical Analysis, 196, Article 113902. https://doi.org/10.1016/j.jpba.2021.113902
- Radman, M., Jurina, T., Benković, M., Tušek, A.J., Valinger, D., Kljusurić, J. G. (2018). Application of NIR spectroscopy in gluten detection as a cross-contaminant in food. Hrvatski Casopis za Prehrambenu Tehnologiju, Biotehnologiju i Nutricionizam, 13(3–4), 120–127. https://doi.org/10.31895/hcptbn.13.3-4.4
- Platov, Y. T., Metlenkin, D. A., Platova, R. A., Rassulov, V. A., Vereshchagin, A. I., Marin, V. A. (2021). Buckwheat identification by combined UV-VIS-NIR spectroscopy and multivariate analysis. Journal of Applied Spectroscopy, 88, 723–730. https://doi.org/10.1007/s10812-022-01315-7
- de Brito, A. A., Campos, F., dos Reis Nascimento, A., Damiani, C., da Silva, F. A., de Almeida Teixeira, G. H. et al. (2022). Non-destructive determination of color, titratable acidity, and dry matter in intact tomatoes using a portable Vis-NIR spectrometer. Journal of Food Composition and Analysis, 107, Article 104288. https://doi.org/10.1016/j.jfca.2021.104288
- Pourdarbani, R., Sabzi, S., Kalantari, D., Karimzadeh, R., Ilbeygi, E., Arribas, J. I. (2020). Automatic non-destructive video estimation of maturation levels in Fuji apple (Malus Malus pumila) fruit in orchard based on colour (Vis) and spectral (NIR) data. Biosystems Engineering, 195, 136–151. https://doi.org/10.1016/j.biosystemseng.2020.04.015
- Menezes, C. M., da Costa, A. B., Renner, R. R., Bastos, L. F., Ferrão, M. F., Dressler, V. L. (2014). Direct determination of tannins in Acacia mearnsii bark using near-infrared spectroscopy. Analytical Methods, 6(20), 8299–8305. https://doi.org/10.1039/C4AY01558D
- de Matos, M. F. R., Bezerra, P. Q. M., Correia, L. C. A., Viola, D. N., de Oliveira Rios, A., Druzian, J. I. et al. (2021). Innovative methodological approach using CIELab and dye screening for chemometric classification and HPLC for the confirmation of dyes in cassava flour: A contribution to product quality control. Food Chemistry, 365, Article 130446. https://doi.org/10.1016/j.foodchem.2021.130446
- Jeber, J. N., Hassan, R. F., Hammood, M. K., Al-Jeilawi, O. H. R. (2021). Sensitive and simple colorimetric methods for visual detection and quantitative determination of semicarbazide in flour products using colorimetric reagents. Sensors and Actuators B: Chemical, 341, Article 130009. https://doi.org/10.1016/j.snb.2021.130009
- Rodionova, O. Ye., Pomerantsev, A. L. (2006). Chemometrics: Achievements and prospects. Russian Chemical Reviews, 75(4), 271–287. https://doi.org/10.1070/RC2006v075n04ABEH003599
- Prasadi, V. P. N., Joye, I. J. (2023). Effect of soluble dietary fibre from barley on the rheology, water mobility and baking quality of wheat flour dough. Journal of Cereal Science, 112, Article 103715. https://doi.org/10.1016/j.jcs.2023.103715
- Парасич, А. В., Парасич, В. А., Парасич, И. В. (2021). Формирование обучающей выборки в задачах машинного обучения. Обзор. Информационно-управляющие системы, 4(113), 61–70. https://doi.org/10.31799/1684-8853-2021-4-61-70
- Aw, W. C., Ballard, J. W. O. (2019). Near-infrared spectroscopy for metabolite quantification and species identification. Ecology and Evolution, 9(3), 1336–1343. https://doi.org/10.1002/ece3.4847
- Шибаева, А. А., Мясникова, Е. Н. (2020). Факторы и стандарты, формирующие качество пшеничной муки. Технологии пищевой и перерабатывающей промышленности АПК-продукты здорового питания, 3, 72–77. https://doi.org/10.24411/2311-6447-2020-10064
- Horváth, Z. H., Véha, A. (2015). Colour characteristics of winter wheat grits of different grain size. Acta Universitatis Sapientiae, Alimentaria, 8(1), 70–77. https://doi.org/10.1515/ausal-2015-0006
- Мальчиков П. Н., Мясникова М. Г. (2020). Содержание желтых пигментов в зерне твердой пшеницы (Triticum durum Desf.): биосинтез, генетический контроль, маркерная селекция. Вавиловский журнал генетики и селекции. 24(5), 501–511. https://doi.org/10.18699/VJ20.642
- Lachman, J., Martinek, P., Kotikova, Z, Orsáka, M., Šulcaet, M. (2017). Genetics and chemistry of pigments in wheat grain — A review. Journal of Cereal Science, 74, 145–154. https://doi.org/10.1016/j.jcs.2017.02.007
- Fratianni, A., Irano, M., Panfili, G., Acquistucci, R. (2005). Estimation of Color of Durum Wheat. Comparison of WSB, HPLC, and Reflectance Colorimeter Measurements. Journal of Agricultural and Food Chemistry, 53(7), 2373–2378. https://doi.org/10.1021/jf040351n
- Steinberg, T. S., Meleshkina, E. P., Shvedova, O. G., Morozova, O. V., Zhiltsova, N. S. (2020). Changes of the optical properties of top-grade flour (semolina) from durum wheat during its ripening. Food Systems, 3(2), 24–28. https://doi.org/10.21323/2618-9771-2020-3-2-24-28
- Kolašinac, S. M., Dajić-Stevanović, Z. P., Kilibarda, S. N., Kostić, A. Ž. (2021). Carotenoids: New applications of “old” pigments. Phyton-International Journal of Experimental Botany, 90(4), 1041–1062. https://doi.org/10.32604/phyton.2021.015996
- Шлыкова, А. Н., Балабаев, А. А., Трухина, Е. В., Базарнова, Ю. Г. (2020). Получение каротиноидных пигментов из микроводорослей Chlorella. Вестник ПНИПУ. Химическая технология и биотехнология, 3, 20–37. https://doi.org/10.15593/2224-9400/2020.3.02
- Britton, G. (2020). Carotenoid research: History and new perspectives for chemistry in biological systems. Biochimica et Biophysica Acta (BBA)-Molecular and Cell Biology of Lipids, 1865(11), Article 158699. https://doi.org/10.1016/j.bbalip.2020.158699
- Dowell, F. E., Maghirang, E. B., Graybosch, R. A., Berzonsky, W. A., Delwiche, S. R. (2009). Selecting and sorting waxy wheat kernels using near-infrared spectroscopy. Cereal Chemistry, 86(3), 251–255. https://doi.org/10.1094/CCHEM-86-3-0251
- Joe, A. A. F., Gopal, A. (April 20–21, 2017). Identification of spectral regions of the key components in the near infrared spectrum of wheat grain. International Conference on Circuit, Power and Computing Technologies (ICCPCT). IEEE, Kollam. https://doi.org/10.1109/ICCPCT.2017.8074207
- Hoffman, L. C., Ni, D., Dayananda, B., Abdul Ghafar, N., Cozzolino, D. (2022). Unscrambling the provenance of eggs by combining chemometrics and near-infrared reflectance spectroscopy. Sensors, 22(13), Article 4988. https://doi.org/10.3390/s22134988
- Wang, P., Ma, T., Slipchenko, M. N., Liang, S., Hui, J., Shung, K. K. et al. (2014). High-speed intravascular photoacoustic imaging of lipid-laden atherosclerotic plaque enabled by a 2-kHz barium nitrite Raman laser. Scientific Reports, 4(1), Article 6889. https://doi.org/10.1038/srep06889
- Puertas, G., Cazón, P., Vázquez, M. (2023). Application of UV-VIS-NIR spectroscopy in membrane separation processes for fast quantitative compositional analysis: A case study of egg products. LWT, 174, Article 114429. https://doi.org/10.1016/j.lwt.2023.114429
- Monago-Maraña, O., Eskildsen, C. E., Galeano-Díaz, T., de la Peña, A. M., Wold, J. P. (2021). Untargeted classification for paprika powder authentication using visible–Near infrared spectroscopy (VIS-NIRS). Food Control, 121, Article 107564. https://doi.org/10.1016/j.foodcont.2020.107564
- Núñez-Sánchez, N., Martínez-Marín, A. L., Polvillo, O., Fernández-Cabanás, V. M., Carrizosa, J., Urrutia, B. et al. (2016). Near Infrared Spectroscopy (NIRS) for the determination of the milk fat fatty acid profile of goats. Food Chemistry, 190, 244–252. https://doi.org/10.1016/j.foodchem.2015.05.083
- Uysal, R. S., Acar-Soykut, E., Boyaci, I. H. (2020). Determination of yolk: White ratio of egg using SDS-PAGE. Food Science and Biotechnology, 29, 179–186. https://doi.org/10.1007/s10068-019-00650-4
- Wilson, R. N., Nadeau, K. P., Jaworski, F. B., Tromberg, B. J., Durkina, A. J. (2015). Review of short-wave infrared spectroscopy and imaging methods for biological tissue characterization. Journal of Biomedical Optics, 20(3), Article 03090. https://doi.org/10.1117/1.JBO.20.3.030901
- Taira, E. (2021). Information and Communication Technology in Agriculture. Chapter in a book: Near-infrared spectroscopy: Theory, spectral analysis, instrumentation, and applications. Singapore: Springer, 2021. https://doi.org/10.1007/978-981-15-8648-4
- Næs, T., Isaksson, T., Fearn, T., Davies, T. (2002). A user-friendly guide to multivariate calibration and classification. NIR Publications, Chichester, UK. 2002.
Supplementary files
