第 卷 第 期
2014
年
9
月
食 品 科 学 技 术 学 报
Journal of Food Science and Technology
Sep. 2014
doi:10. 3969 / j. issn. 2095鄄6002. 2014. 05. 014
文章编号
:
2095鄄6002(2014)05鄄0074鄄06
引用格式
:
刘翠玲
,
胡玉君
,
吴胜男
,
等
.
近红外光谱奇异样本剔除方法研究
.
食品科学技术学报
,2014,32(5):74 - 79.
LIU Cuiling, HU Yujun, WU Shengnan, et al. Outlier sample eliminating methods for building calibration model of near
infrared spectroscopy analysis. Journal of Food Science and Technology, 2014,32(5):74 - 79.
近红外光谱奇异样本剔除方法研究
刘翠玲
,
摇
胡玉君
,
摇
吴胜男
,
摇
孙晓荣
,
摇
窦森磊
,
摇
苗雨晴
,
摇
窦
摇
颖
(
北京工商大学 计算机与信息工程学院
,
北京
摇 100048
)
摘
摇
要
:
采用近红外光谱分析技术建立面粉校正模型
,
对面粉中灰分含量进行定量分析
,
并对异常
样本进行剔除
.
试验中采用马氏距离法和蒙特卡洛采样法分别对异常样本进行了剔除
,
结果表明
:
用马氏距离法剔除异常样本
,
当权重系数为
1郾 5
,
剔除样本数为
3
时
,
得到最好结果
,
相关系数
(
R
2
)
为
92郾 67
,
交互验证均方差
RMSECV
为
0郾 048 5
;
MCCV
法剔除异常样本
,
剔除样本数为
3
,
得到最
好结果
,
相关系数
(
R
2
)
为
94郾 64
,
交互验证均方差
RMSECV
为
0郾 041 1.
故马氏距离法剔除异常样
本能在一定程度上提高校正模型的精度和预测精度
,
但
MCCV
法剔除异常样本后模型精度和预测
精度优于马氏距离法
.
关键词
:
近红外光谱
;
异常样本
;
马氏距离法
;
MCCV
;
灰分
中图分类号
:
TS211郾 7
;
TS207郾 3
;
TP391郾 9摇 摇 摇 摇 摇
文献标志码
:
A
收稿日期
: 2014 03 06
基金项目
:
北京市科技创新平台资助项目
(pxm_2012_014213_000023);
北京市教委科技发展重点资助项目
(KZ201310011012);
北京市
优秀人才基金资助项目
(2012D005003000007).
作者简介
:
刘翠玲
,
女
,
教授
,
博士
,
主要从事检测技术及智能信息处理方面的研究
.
摇 摇
人们的日常生活离不开面粉
,
面粉的品质问题
随着生活水平的提高而得到普遍关注
,
食品监管部
门对面粉品质的控制尤为重要
.
目前对面粉的评价
指标主要有水分
、
灰分以及面筋等
[1 - 4]
.
传统的面
粉品质检测方法
(
物理化学法
)
存在多种缺陷
,
不仅
耗费时间
,
而且容易对面粉造成二次污染
[5]
,
而被
广泛应用于农作物品种检测和分析的近红外光谱分
析技术能够在不破坏样品的前提下对样品进行准
确
、
迅速的检测
,
在一定程度上克服了传统检测方法
的缺陷
.
近红外光谱分析技术是一种物理测试技术
,
主
要通过建立近红外光谱分析模型对未知的面粉样品
进行预测
,
分析模型的准确程度能够直接影响对未
知样品的预测精度
[6 - 8]
.
在建立面粉的近红外光谱
分析模型时要求面粉的近红外光谱图和化学值之间
存在一定的相关性
,
异常样品的存在能够降低谱图
与化学值之间的相关性
,
降低模型的预测精度
,
因此
需要对异常样本进行判别和处理
.
王建义
[9]
等人对
产生异常样品的原因进行了详细的介绍
,
本文主要
探讨马氏距离法以及蒙特卡洛交叉验证法对剔除异
常样本后的数据建立近红外光谱分析模型
,
通过测
定模型的准确度对两种方法进行比较
,
从而提高近
红外光谱面粉品质检测模型的精确性和可靠性
.
1摇
试验材料
、
仪器与方法
1郾 1摇
样品的准备
试验所用面粉样本
,
是从合作单位古船面粉厂
取得的不同日期
、
不同生产线生产的不同种类的面
粉
,
共计
60
个
.
1郾 2摇
样品化学值的测量
试验采用国标法
850 益
乙酸镁法
,
准确测量面
粉样本的灰分含量
,
所测值作为建模时的化学值
.
1郾 3摇
样品近红外光谱的采集
本次试验使用傅里叶变换近红外光谱仪
VER鄄
47