Группа компаний "Униконс"

Продвижение и реализация пищевых добавок, антисептиков и другой продукции НПО Альтернатива.

Перейти на сайт

"Бесплатные образцы"

Комплексные пищевые добавки "Униконс".

Для всех отраслей пищевой промышленности!

Перейти на сайт

"Петритест"

Микробиологические экспресс-тесты. Первые результаты уже через 4 часа.

Перейти на сайт
 

1

Важным аспектом оценки модели является корректность преобразования данных. Многие графическое методы, регрессионный анализ и другие способы определения эффективности модели построены на предположениях, что данные характеризуются нормальным распределением и дисперсия не зависит от среднего значения [56]. Различные варианты преобразования данных, обеспечивающие стабилизацию дисперсии, представлены в ряде публикации [2, 46, 61, 79]. Многие численные значения при количественной оценке микробиологических реакций не подчиняются гауссовскому распределению и обычно требуют преобразования к распределению, близкому к нормальному. Для хронологических данных, например, для времени задержки роста (длительность лаг-фазы) или времени достижения заданной численности микроорганизмов, обычно применяют логарифмическое преобразование (log10 или 1n) [17]. Для скорости роста или скорости гибели микроорганизмов зачастую применяют обратную величину («1/время») [60] или корень квадратный от времени [28]. Если перед оценкой модели не рассматривалась необходимость преобразования данных, то результаты и рассчитанные погрешности могутоказаться ошибочными. Важно помнить о том, что если при создании модели пли ее валидизации использовались преобразованные данные, то прогнозируемые значения необходимо подвергнуть обратному преобразованию. Например, если прогнозируемое значение Iog10 от длительности лаг-фазы составляет 1,8 ч. то в целях практического использования прогнозных оценок его следует преобразовать обратно к длительности лаг-фазы, которое составит 63 ч. Доверительные интервалы, полученные для преобразованных данных, после обратного преобразования будут несимметричными.

 

10.3.1. Графический анализ экспериментальных данных

Графики экспериментальных и прогнозируемых значений

Простейшим способом оценки адекватности модели является визуальное сравнение экспериментальных и прогностических данных [10, 15]. Прогнозируемые и наблюдаемые значения наносят на график относительно соответствующих осей, и чем ближе располагаются точки вдоль прямой линии, тем лучше согласованность экспериментальных и прогнозируемых значений. Такой графический метод можно применять на любой стадии оценки модели. Достоинство этого метода заключается в том, что с его помощью можно осуществить грубую оценку сдвига или смещения данных.

Подобным способом можно сравнивать любые прогнозируемые показатели, например, скорость роста, время генерации, длительность лаг-фазы, время достижения определенного увеличения или снижения численности и D-значение [4, 31, 48. 77].Кроме того, подобные графики позволяют оценить, является ли модель «надежной» или «рискованной», «Надежные» модели характеризуются тенденцией завышать прогнозируемую скорость роста микроорганизмов по сравнению с наблюдаемой в пищевых продуктах, и таким образом ошибка прогноза работает в пользу пищевой безопасности. «Рискованные» модели, наоборот, прогнозируют более медленный рост но сравнению с наблюдаемым, что может приводить к возникновению проблем, связанных с порчей или безопасностью пищевых продуктов (табл. 10.1).

Преимущество графического анализа – простота этого метода, не требующего знания статистических методов анализа [15]. Кроме того, возможность разнообразного оформления экспериментальных значений (например, различные температурные данные можно отображать разными символами или цветом) позволяет наглядно представить области неадекватности модели.

Таблица 10.1. Примеры надежных и рискованных прогнозов для моделей роста, выживания и инактивации микроорганизмов

Ошибка прогноза Кинетическая
модель роста
Модель гибели/
инактивации
Модель выживания Модель рост/
нет роста
Безопасная: имеется встроенный запас надежности Прогнозируемая скорость роста больше, чем наблюдаемая в пищевом продукте; например, прогнозируемый срок хранения 5 сут, наблюдаемый – 7 сут Прогнозируемая скорость гибели меньше, чем наблюдаемая; например, прогнозируемое D-значение – 4 мин, наблюдаемое – 3 мин Прогнозируемое время выживания больше, чем наблюдаемое; например, прогнозируемое выживание Salmonella составляет 6 нед., наблюдаемое – 4 нед. Рост прогнозируется, но не происходит
Небезопасная: возникают проблемы с безопасностью или порчей пищевых продуктов Прогнозируемая скорость роста ниже, чем наблюдаемая; например, прогнозируемый срок хранения 5 сут, наблюдаемый – 3 сут Прогнозируемая скорость гибели выше, чем наблюдаемая; например, прогнозируемое D-значение – 4 мин, наблюдаемое – 5 мин Прогнозируемое время выживания меньше, чем наблюдаемое; например, прогнозируемое выживание Salmonella составляет 6 нед., наблюдаемое – 8 нед. Рост не прогнозируется, но происходит

 

Графики остатков

При построении других полезных графиков (например, «графиков остатков», то есть разниц между наблюдаемыми и прогнозируемыми значениями) используют результаты статистического анализа. Они позволяют наглядно оценить величину отклонений Прогнозируемых значений от экспериментальных в любой конкретной области модели и случайность разброса этих отклонений.

 

10.3.2. Биологический смысл моделирования

Многие из рассматриваемых ниже методов основываются на статистических показателях эффективности моделей, однако не следует упускать из вида один важный аспект, а именно, имеет ли вообще данная модель биологический смысл. Плохо разработанные модели или модели с избыточным числом параметров могут хорошо согласовываться с исходными данными, но при этом прогнозируемая реакция может оказаться ошибочной [43]. Модели и компьютеры могут генерировать «бессмыслицу», и очень важно, чтобы результатам давалась и биологическая, и математическая интерпретация [78]. Оценить, является ли биологическая интерпретация результатов моделирования реалистичной, помогают графические методы.

 

10.3.3. Выбор параметров сравнения

Выбор параметров, которые будут использоваться при валидизации и верификации модели, в некоторой степени зависит от предполагаемого применения модели. Во многих случаях вторичные модели роста основываются или на максимальной скорости роста, или длительности лаг-фазы, что ограничивает свободу выбора.

По отношению к сроку хранения портящихся охлажденных пищевых продуктов самым важным фактором может быть время заданного увеличения численности микроорганизмов (например, Т1000 – время, в течение которого происходит 1000-кратное увеличение их численности), так как микробиологическое качество зависит от времени достижения определенной численности вызывающих порчу продукта микроорганизмов. В случае патогенных микроорганизмов или продуктов длительного хранения наиболее важным критерием может быть окончание лаг-фазы, поскольку оно указывает на точку, в которой происходит инициация роста, потенциально связанного с возникновением проблем безопасности и порчи пищевого продукта. На эффективность моделей влияет выбор параметра, используемого для сравнения.

Известно, что в целом валидизация моделей длительности лаг-фазы оказывается менее успешной, чем моделей скорости роста. Вариативность лаг-фазы обычно больше, чем скорость роста микроорганизмов [72], особенно когда параметры близки к условиям, необходимым для предотвращения роста бактерий [14]. Точность моделей для прогнозирования времени задержки роста Listeria monocytogenes в два раза ниже, чем у моделей скорости роста [4]. При анализе точности нескольких полиномиальных и корнеквадратичных моделей было установлено, что погрешность прогноза длительности лаг-фазы составляет 36-40%, а для скорости роста – 11-36% [22].

Если модель охватывает экстремальные условия роста, то общая точность прогноза падает даже при прогнозировании скорости роста. Большие погрешности были обнаружены в прогнозе для Е. coli в условиях, близких к границе роста, там, где прогнозируемые значения скорости роста оказались в 14 раз больше наблюдаемых значений [60].

 

10.3.4. Методы статистического анализа*

Множественная корреляция

В качестве меры точности прогноза часто используют коэффициент множественной корреляции (R2)(см., например, [25]). Чем ближе его величина к единице, тем точнее прогнозируемые значения [72]. R2 представляет собой долю общей дисперсии исходных данных, объясняемой моделью, построенной на этих данных (например, насколько хороню изменения микробной реакции объясняются изменениями pH, αωтемпературы и других средовых факторов). R2 принимает значения от 0 до 1, которые иногда выражают в процентах (например, при R2 = 0,95 можно считать, что 95% дисперсии объясняется данной моделью). Необъясненная доля дисперсии (100 - R2) приходится на неизвестные или неучтенные факторы, а также на случайную составляющую дисперсии данных роста микроорганизмов. Систематическая ошибка может не сказываться на значении R2, так как при полной корреляции (R2 = 1) между экспериментальными и прогнозируемыми значениями эти значения могут быть смещены относительно друг друга на некоторую постоянную величину.

Коэффициент множественной корреляции не всегда является хорошим показателем эффективности модели, так как чем больше параметров содержит модель, тем лучше она может быть «подогнана» к исходным данным. Следовательно, статистика R2в чистом виде не может использоваться для сравнения моделей, например, на ее основе трудно сказать, является ли новая модель лучше предыдущей [5].

Аналогичной мерой согласованности модели с экспериментальными данными является процент объясненной дисперсии (V, %) с поправкой на объем выборки, при вычислении которого используется статистика R2[20, 21]:

Формула.(10.1) – С. 242

Следовательно, если модель имеет 33 параметра (N = 33) (это означает, что для характеристики модели потребуется 33 экспериментальных показателя), количество экспериментальных точек данных n = 173 и статистика R2 = 0,949, то V, % вычисляется следующим образом:

Формула 10.2. – С. 242

Таблица 10.2. Определения статистических терминов

R2 Множественный коэффициент корреляции
V, % Процент дисперсии
D, % Процент различия
N Количество измерений в выборке
N Количество параметров в модели
S Количество подбираемых параметров (то же что N)
Y Значения оцениваемого показателя, например, длительности лаг-фазы, скорости роста, времени генерации микроорганизмов
Yobserved или Y0 Значение, экспериментально измеряемое в бульонной питательной среде или пищевых продуктах
Ypredicted или Yp Значение, прогнозируемое моделью
T1000 Время достижения 1000-кратного увеличения количества микроорганизмов
RSS Остаточная сумма квадратов экспериментально измеренных (Y0) и прогнозируемых моделью (Yp) показателей
Syx Стандартное отклонение отстатков
Σ Сумма всех текущих значений

  n

  Σ

i = 1

Сумма значений данных (n), начиная с первого значения (i = 1)
|Y| Абсолютное значение Y

При заданном значении R2величина V, % уменьшается при увеличении числа используемых в модели параметров. Иногда V, % называют исправленным коэффициентом множественной корреляции (R2adj), который во многих статистических программах вычисляется автоматически. Если для построения модели используют относительное небольшое количество экспериментальных данных, то V, % или R2adj) дает более адекватную оценку модели, поскольку учитывает количество экспериментальных точек данных и число параметров модели [19].

Среднеквадратическая ошибка

Для вычисления средней квадратичной ошибки (Mean Square Error, MSE) используют следующее уравнение [67]:

Формула 10.3. (с. 243)

МSЕ характеризует остаточную изменчивость при использовании данной модели, то есть дисперсию, которая не объясняется учтенными в модели факторами, такими как температура, рН и т. д. Чем меньше MSE, тем лучше модель согласуется с экспериментальными данными.

Стандартное отклонение остатков

Стандартное отклонение остатков (Syx) или стандартную ошибку измеряемого показателя [53] иногда вычисляют по уравнению [10.4]. Syx характеризует возможное отклонение любого прогнозируемого значения от предсказанного моделью. Чем меньше Syx, тем лучше.

Формула 10.4 (с. 243).

В табл. 10.3 приведены статистические характеристики одностадийной модели поверхностного отклика с линейными членами и смешанными произведениями (взаимодействиями) для группы видов Enterobacteriaceaeпри 16 комбинациях рН, температуры, содержания нитрита и αω. Согласно этой таблице модель характеризуется высоким значением R2adj(93,7%), свидетельствующим о хорошей ее согласованности с исходными данными, а Syx = 0,737 означает, что средняя ошибка каждого прогноза логарифма численности составляет 0,737 log-единиц.

Таблица 10.3. Статистические характеристики модели для Enterobacteriaceae

Источник DF SS MS
Регрессия 33 1,411E+03 42,8
Ошибка 139 75,5 0,543
Сумма 172 1.487Е + 03  
Syx= 0,737 R2 = 94,9% R(adj) = 93,7%  

DF– степени свободы; SS – сумма квадратов отклонений; МS – среднеквадратичная ошибка; Syx – стандартное отклонение остатков.

Коэффициенты смещения и точности

В работе [57] для определения эффективности модели предложены два различных показателя. Коэффициент смещения Вf – мера обшей согласованности между измеряемыми и прогнозируемыми значениями, указывающая на расположение прогнозируемых значений относительно линии эквивалентности: выше или ниже этой линии они располагаются и насколько (в среднем). Этот коэффициент вычисляется по уравнению (10.5), при этом завышенные и заниженные (по сравнению с измеряемыми) прогнозируемые значения имеют равный вес:

Формула 10.5. (с. 244)

При полном согласовании измеренных и прогнозируемых значений Вf = 1. Если Вf > 1, то прогнозы в среднем были выше измеренных значений, и модель следует считать небезопасной; например, Вf  = 1,2 означает, что прогнозные значения были на 20% выше измеренных. Если Вf< 1, то модель можно считать безопасной, поскольку прогнозы в среднем оказались ниже измеренных значении. В настоящее время показатель Вf широко используют в качестве меры эффективности модели – он предоставляет общий критерий сравнения различных моделей. При вычислении Вf завышенные (+) и заниженные (-) прогнозы могут взаимно компенсировать друг друга. Следовательно, Вf не учитывает абсолютные ошибки модели. Этого можно избежать при использовании коэффициента точности Аf, который основан на уравнении (10.6), аналогичном уравнению (10.5), с тем отличием, что при его вычислении не принимается во внимание знак разницы между измеренным и прогнозируемым значением:

Формула 10.6 (с. 244).

Так как в этом случае все слагаемые в уравнении 10.6 положительны, Аf будет всегда равно (в случае полнойсогласованности) или больше 1. Точность 1,5 означает, что в среднем прогнозируемое значение на 50% отличается (в меньшую или большую сторону) от измеряемого значения. Коэффициенты точности и смещения были изначально предложены для сравнения прогнозных и измеренных значений, не использовавшихся при создании модели, в частности, экспериментальных данных, полученных на пищевых продуктах. Впоследствии эти статистические показатели были несколько видоизменены для их использования при сравнении моделей, при этом коэффициент Аf был заменен на процент различия (D, %) [10]:

Формула (10.7) (с. 245)

Относительная ошибка

Валидизацию моделей в работах [50, 51] производили на экспериментальных данных, не использовавшихся при их разработке, с использованием уравнения 10.8 для каждого индивидуального прогноза. Нулевое значение относительной ошибки (RE) указывает на полную согласованность между измеряемыми и прогнозируемыми значениями для каждой кривой.

Формула (10.8) (с. 245)

Медианная относительная ошибка

Для оценки смещения прогноза модели используют медианную или срединную относительную ошибку (Median Relative Error, MRE) [52]. Если MRE всего набора данных равна нулю, то данная модель в среднем не была смещена (MRE – это медиана значений RE).

 

Среднюю абсолютную ошибку (Mean Absolute Relative Error, MARE) [50, 51] определяют как

Формула 10.9. (с. 245)

Этот показатель подобен ранее описанному коэффициенту Аf рассматривается как ошибка прогноза в процентах. Сообщается [22], что значения MARE уразличных моделей длительности лаг-фазы микроорганизмов находятся в диапазоне 36-40%.

 

10.3.5. Выбор критериев эффективности моделей

Для оценки эффективности моделей на стадиях валидизации или верификации применяют различные критерии. Многие из них основаны на схожих принципах и дают похожие результаты. Так обстоит дело с оценкой смещения и точности модели. Ниже приведен пример вычисления Вf, Аf, MRE и МАRЕ дляэкспериментальных данных из работы [30]о росте Salmonella в триптоносоевом бульоне. В табл. 10.4, а приведены измеренные и прогнозируемые значения Т1000 для 20 различных значений pН, температуры и содержания NaCl.

Таблица 10.4, а. Прогнозируемые (Рr) и измеренные (Ob) значения T1000 для Salmonella (данные работы [30]): пример вычисления различных показателей эффективности модели

ОbT1000, ч* PrТ1000, ч** Значения, используемые
для вычисления Аf , и Bf
Значения, используемые
для вычисления REи МАRЕ
Log10(PrТ1000/ OrТ1000)

Абсолютное
значение
Log10(PrТ1000/
OrТ1000)

RE

Абсолютное
значение RE

176 180 0,00976 0,00976 2,2727 2,2727
237 171 -0,14175 0,14175 -27,8480 27,8480
240 188 -0,12204 0,12204 -24,4980 24,4980
288 236 -0,08648 0,08648 -18,0560 18,0560
394 372 -0,02495 0,02495 -5,5840 5,5840
37 47 0,10389 0,10389 27,0270 27,0270
41 45 0,04043 0,04043 9,7561 9.7561
47 52 0,04391 0,04391 10,6383 10,6383
85 70 0,08432 0,08432 -17,6470 17,6470
98 99 0,00441 0,00441 1,0204 1,0204
14 17 0,08432 0,08432 21,4286 21,4286
19 17 -0,04830 0,04830 -10,5260 10,5260
20 19 -0,02228 0,02228 -5,0000 5,0000
36 38 0,02348 0,02348 5,5556 5,5556
8,5 9,4 0,04371 0,04371 10,5882 10,5882
10,7 9,2 -0,06560 0,06560 -14,0190 14,0190
16 17 0,02633 0,02633 6,2500 6,2500
20 21 0,02119 0,02119 5,0000 5,0000
9,6 7,2 -0,12494 0,12494 -25,0000 25,0000
14,2 17 0,07816 0,07816 19,7183 19,7183

* ОbT1000, измеренное время 1000-кратного увеличения численности.

** PrТ1000прогнозируемое время 1000-кратного увеличениячисленности.

Из табл. 10.4, b следует, что для этого набора данных Аf и MARE дают близкие значения точности модели, а Вf и MRE – схожие оценки ее смещения. Возникает вопрос, каким критерием легче воспользоваться? Эта проблема относительно легко решается при использовании компьютерных программ, работающих с электронными таблицами и позволяющих вычислять различные меры эффективности модели, но, как мы видим, сходные методы дают близкие результаты. В настоящее время в качестве критериев эффективности моделей роста микроорганизмов наиболее широко используются показатели Аf и Вf[57]. По существу они являются оптимальными индексами при проведении валидизации или верификации моделей, так как полученные результаты можно легко сравнивать с другими данными. При оценке эффективности модели рекомендуется использовать комбинацию графических и статистических методов, поскольку при использовании лишь одного метода существует риск не выявить некоторые виды систематических ошибок [67].

Таблица 10.4, b. Значения критериев* эффективности модели [30]

Af MARE Вf MRE
1,15 (ошибка 15%) 0,133 (ошибка 13%) 0,97 (ошибка 3%) 0,0164 (ошибка 1,64%)

* Af – фактор точности; МАRЕ – абсолютная относительная ошибка; Вf – фактор отклонения; МRЕ – относительная ошибка.

 

10.3.6. Ожидаемая эффективность

Микробиологические данные по своей природе очень вариативны. Микробиологи предпочитают выражать численность микроорганизмов в значениях десятичного логарифма (log-едииицах). Различия между микробиологическими данными, превышающими 0,5 log-единпц, обычно считается практически значимыми. Менее значимые различия находятся в пределах погрешности микробиологических измерений вследствие вариативности методов и гетерогенного распределения микроорганизмов в пищевых продуктах. Так, последние исследования свидетельствуют, что для рубленого и парного мяса погрешность измерений составляет 0,3-0,4 log-единиц для общего содержания KОЕ и 0,4-0,5 log-единиц – для Enterobacteriaceae [3]. Подобные данные приводятся и в работе [32], где показывается, что при любом методе подсчета количества жизнеспособных микроорганизмов ошибка составляет примерно ±0,3 log-единиц. Следовательно, всегда существует уровень погрешности, внутренне присущий любым микробиологическим данных, включая, естественно, и моделируемые. Разработчики и пользователи моделей всегда должны иметь это в виду и не ожидать «идеального» соответствия модели и экспериментальных данных.

Может возникнуть вопрос, какая из описанных стадий оценки является самой важной? Очевидно, что если результаты валидизации модели неудовлетворительные, то практически нет смысла проводить ее верификацию. Если модель характеризуется хорошим значением Af при проверке на лабораторном бульоне и плохим – на экспериментальных данных, полученных на реальных пищевых продуктах, то в производственных ситуациях эту модель применять нельзя. Проблема здесь заключается не в том, насколько хорошо данная модель согласуется с какими-то данными, а насколько хорошо она позволяет прогнозировать поведение микроорганизмов в пищевых продуктах. Погрешность в модельных прогнозах возрастает по мере прохождения стадий валидизации и верификации. Какой бы хорошей ни была согласованность модели с использовавшимися при ее разработке данными, по мере использования новых экспериментальных условий, результатов исследований пищевых продуктов и других опубликованных данных эта степень согласованности снижается. Ошибка, составляющая 11,2% на лабораторном бульоне, возрастает до 26,6% для искусственно инокулированных пищевых продуктов, а для естественно портящихся пищевых продуктов она составляет уже 53,5%.

Валидизация модели поверхностного отклика для молочнокислых бактерии с помощью графика прогнозируемых значений Т1000 для экспериментальных данных, полученных при различных значениях рН (2,9-5,8), содержания NaCl (0,5-10% масс/об.) и температуры (2-30°С) [12]: как и следовало ожидать, степень согласованности между экспериментальными и прогнозными значениями оказалась очень хорошей. Это свидетельствует о том, что в модели не было существенных ошибок или смещения данных.

Верификация модели по опубликованным данным. Для этой модели Вf = 0,93 (то есть ее можно считать относительно безопасной) и Af = 1,2 (ошибка 20%). Степень согласованности прогнозных оценок с независимыми данными остается хорошей, хотя и несколько хуже, чем при валидизации по экспериментальным данным, полученным на бульоне. Наглядность графического представления данных, а также легко вычисляемых значений Вf и Af, очевидна. Самая неудовлетворительная степень согласованности оказалась для данных по сыру, где прогнозы были самыми безопасными. Это означает, что в сыре присутствовал какой-то ингибитор, повлиявший на точность прогноза, или экспериментальные данных из опубликованных источников оказались неточными.

В некоторых работах приведены количественные характеристики ожидаемого при оценке модели уровня ошибки. Так, сообщается, что для моделей скорости роста Listeria monocytogenesошибки находятся в интервале 7-10% по сравнению с данными, использовавшимися при создании моделей [6], а ошибка прогноза скорости роста для каждой независимой переменной оценивается примерно в 10% [59]. Рекомендуется руководствоваться следующим эмпирическим правилом: каждая дополнительная независимая переменная снижает приемлемую точность модели на 10% [48]. Следовательно, модель с тремя независимыми переменными (например, значение pН, температуры и αω)может характеризоваться ошибкой в 30-40%, то есть Af в диапазоне 1,3-1,4.

Что же касается Вf, то при использовании моделей для патогенных микроорганизмов с Вf > 1 следует проявлять осторожность, так как это значение данного показателя свидетельствует о небезопасности модели. В зависимости от значения Вf модели можно разделить на четыре нижеуказанные категории, где данные по «хорошей», «приемлемой» и «неприемлемой» моделям приведены по [58], а категория «применять с осторожностью» является новый:

  • хорошая модель                       Вf=0,9-1,05
  • приемлемая модель                  Вf =0,7-0,9
  • применять с осторожностью   Вf =
  • неприемлемая модель              Вf < 0,7 и Вf > 1,15.

В категорию «приемлемых» входят относительно безопасные модели, а относительно небезопасные входят в категорию «применять с осторожностью». Некоторые данные о критериях Аfи Вf для патогенных микроорганизмов и микроорганизмов, вызывающих порчу пищевых продуктов, приведены в табл. 10.5.

Безопасные и небезопасные модели

Существует общее правило – модели для патогенных микроорганизмов должны быть безопасными. Если анализ графиков экспериментальных значений относительно прогнозируемых или вычисленные значения Вf показывают, что модель небезопасна, то в этом случае ее не следует использовать для прогнозирования сроков хранения пищевых продуктов по соображениям пищевой безопасности. Необходимо исследовать моделируемые параметры или данные, используемые для валидизации. В областях недостаточной согласованности следует организовать сбор большего количества данных или сузить область применения модели.

В случае микроорганизмов, вызывающих порчу, модели не обязательно должны быть безопасными. Напротив, если они «слишком» безопасные, то становятся менее полезными. Если модель считают небезопасной (Вf > 1), по ее точность достаточно высока, она может оказаться весьма полезной. Для этого следует принять конкретное решение – допустима ли вообще какая-либо возможность порчи продукта. Для верификации модели для этой конкретной рецептуры можно провести провоцирующее тестирование продукта.

Верификация динамических моделей роста

Многие микробиологические модели создаются на основе данных, полученных для статических условий роста (например, при постоянных температуре, активности воды или значении рН), однако во многих производственных ситуациях внешняя среда не всегда является постоянной или изменяется циклически (например, температура может возрастать и падать, а значение рН в ходе производства и хранения продукта может снижаться). Известны модели прогнозирования роста микроорганизмов в условиях динамики температур для Brochrothrix thermosphacta [8] и необработанных рыбных продуктов [35], а также для динамических условий по αω [38]. Очень важно, чтобы данные, используемые для верификации модели, были получены в изменяющихся условиях среды. В работе [49] верификация модели, разработанной для видов Pseudomonas при постоянной температуре, проводилась с использованием экспериментальных и производственных данных, полученных при изменяющихся условиях. У такой модели для лабораторных данных о пищевых продуктах при постоянной температуре показатель Аf был равен 1,1, для опубликованных данных о пищевых продуктах при постоянной температуре – 1,3, а для производственных данных о пищевых продуктах при переменных температурах 1,21. Таким образом, эта модель, разработанная для постоянных температур, давала вполне удовлетворительные прогнозы роста при переменных температурах. Наименьшая степень согласованности характерна для опубликованных данных – в этом случае ошибка между измеренными и прогнозными данными составила 30%. В результате был сделан вывод, что при использовании опубликованных данных оценка эффективности модели может занижаться, и связи с чем предпочтительнее использовать данные, полученные в контролируемых условиях. Если модель предполагается использовать для описания широкого спектра пищевых продуктов в промышленных условиях, то полезно сравнить ее эффективность с достаточно большой выборкой независимых данных (при условии, что ошибки находятся в пределах общепринятых критериев эффективности моделей).

Таблица 10.5. Опубликованные данные о коэффициентах точности (Аf) и смещения (Вf) при оценке эффективности моделей для пищевых продуктов

Микроорганизм Модель* Среда Параметр роста** Вf Аf Источник
Е. coli

Собственная модельa

FMM

РМР

Мясо (49) GT

1,05

0,93

0,72

1,11

1,15

1,38

[48]
Молочнокислые бактерии Собственная модельb Собственная модельc Рыба (34) GR

1,14

1,09

1,22

1,19

[37]
Lactobacillus sake Собственная модельa Вареное мясо (10)

Lag

GR

1,26

0,96

1,26

1,26

[24]
Listeria

FMM

РМР

Мясо (92) GR 0,75 1,73 [67]
L. monocytogenes Собственная модельd Вяленое мясо (4) GR 1,24 1,97 [62]
L. monocytogenes Собственная модель3 Приготовленное отварное мясо

Lag

GR

1,33

0,97

1,51

1,21

[26]
L. monocytogenes Собственная модельc Приготовленное отварное мясо

Lag

GR

1,03

0,98

1,17

1,16

[26]
Pseudomonas Собственная модельb Собственная модельc Рыба (33) GR

0,93

1,11

1,22

1,17

[37]
Психротрофные псевдомонады Собственная модельa Рубленое Куриное мясо (8) GR 0,92 1,29 [49]
Salmonella Собственные моделиa,c,f Вареная курица (21) Lag 0,75-L29 1,1-1,36 [53]
S. aureus

FММ,

РМР

Пищевые продукты

с овощами

и куриным мясом (22)

GR

Lag

L3

0,37

2,0

2,2

2,67

2,0

2,32

[71]
S. aureus Собственные моделиa,e Ветчина GR 1,56-6,85 1,64-7,12 [18]
Индейка GR 0,55-2,85 1,91-3,07
Курица GR 1,09-5,68 1,84-5,89
S. aureus

FMM,

РМР

Ветчина GR 2,85-11,6 3,01-11,64 [18]
Индейка
Курица

1 FMM – Food MicroModel; PMP – Pathogen Modelling Program

2 GT – время генерации; GR – скорость роста; Lag – лаг-фаза; L3 – увеличение количества клеток на 3 log-единицы Собственные модели: (а) квадратного корня (модель Ратковского); (b) полиномиальная модель; (с) модель Аррениуса; (d) модель линейной регрессии; (е) модель поверхностного отклика; (f) гиперболическая модель.

В круглых скобках указано количество различных типов оцениваемых сред.

Верификация моделей роста или отсутствия роста микроорганизмов

Вследствие недостатка или отсутствия количественных данных в некоторых случаях трудно выполнить стадии валидизации и верификации так, как это было описано выше. Например, модели роста (или отсутствия роста) микроорганизмов служат для нахождения границы между условиями, допускающими и не допускающими их рост в заданный период времени. В большинстве экспериментов рост микроорганизмов не будет наблюдаться вовсе, в других же случаях будут иметь место длительные периоды лаг-фазы с последующим очень медленным ростом, значительно отличающимся от типичных кривых роста, используемых в традиционных подходах к моделированию.

В подобных случаях требуются иные способы валидизации модели. Подобранная при помощи модели выживания микроорганизмов кривая для времени начала роста дрожжей при различных уровнях содержания спирта, сахарозы, сорбата, значениях рН и температуры [27], построенная относительно экспериментальных данных на бульонах. Графики для границы рост - отсутствие роста относительно Е. coli приведены в работе [47]. В моделях такого типа важно не точное время начала роста микроорганизмов, а способность к росту в определенный период времени.

Полезным приемом при валидизации или верификации является группировка данных о росте микроорганизмов в широких временных диапазонах (например. 1 – рост в течение 2 нед., 2 – рост в течение 2 мес.) с последующим вычислением точности прогнозов в процентах. Модель выживания дрожжей показана в табл. 10.6 (по [27]).

Таблица10.6. Валидизация модели для прогноза времени начала роста путем сравнения прогноза с наблюдаемыми экспериментальными данными (на бульоне), использовавшимися при создании модели

Фактический класс роста1 Прогнозируемый класс роста1 всего
1 2 3
1 194 43 0 237
2 3 30 7 40
3 4 45 574 623
Всего 201 118 581 900

1 Класс 1 – рост в течение 30 сут; класс 2 – рост между 30 и 149 сут; класс 3 – нет роста в течение 150 сут.

Прогнозируемое время до начала роста, классифицированное по трем широким категориям, сравнивается с данными, полученными экспериментально на бульонах. В 798 случаях из 900 испытаний отмечается хорошая степень согласованности между результатами измерений и прогнозируемым классом, то есть доля успешных испытаний составляет 88,6%.

Зачастую модели времени начала роста базируются на замутненности питательной среды, а не на данных чашечного подсчета. Это вызывает проблемы при валидизации модели на пищевых продуктах, так как замутнение не всегда можно наблюдать в высоковязких или окрашенных пищевых продуктах. В таких случаях могут потребоваться другие способы определения роста микроорганизмов – например, по видимому газообразованию или запаху [33], однако эти показатели связаны с численностью микроорганизмов не обязательно однозначно, в связи с чем можно ожидать некоторого смещения данных.

*Определение терминов см. в табл. 10.2

 

яндекс.ћетрика