图
2摇
近红外光谱交叉验证计算值与化学分析值
Fig. 2摇 Near鄄infrared spectroscopy cross鄄validation calculated
values and chemical analysis values
图
3摇
校正集的马氏距离分布图
Fig. 3摇 Calibration set Mahalanobis distance distribution
从图
3
中可以看出
,
一些样品如
30,39
等的马
氏距离过大而成为异常样本
.
设定
6
个不同的权重
系数对异常样本进行判断和分析
,
可将权重设置为
e
(3,2郾 5,1郾 5,1郾 2,1郾 0, 0郾 5) ,
分别剔除异常样本
为
:30(
e
= 3);30,39(
e
= 2郾 5);30,32,39(
e
= 1郾 5);
1,30,32,39(
e
= 1郾 2);1,14,30,32,39(
e
= 1郾 0);1,
14,27,30,32,39(
e
= 0郾 5)
.
剔除异常样品后
,
对光
谱信息贡献量最大的谱区范围
4 848郾 4 ~ 4 246郾 7
cm
- 1
.
采取偏最小二乘方法建模
,
所得结果如表
1,
表
1摇
不同阈值剔除后
PLS
校正模型交互校验结果
Tab. 1摇 Interact verification results of PLS calibration model af鄄
ter removal of different thresholds
权重系数 剔除个数 主成分数
R
2
RMSECV
肄
0
6
85郾 69
0郾 067 2
3
1
6
88郾 47
0郾 060 5
2郾 5
2
7
91郾 78
0郾 051 6
1郾 5
3
8
92郾 67
0郾 048 5
1郾 2
4
8
92郾 48
0郾 049 5
1郾 0
5
8
92郾 35
0郾 049 1
0郾 5
6
8
91郾 60
0郾 052
马氏距离法剔除异常样品后交叉验证计算值与化学
分析值如图
4
.
由表
1
可知
,
当权重系数为
1郾 5,
主成分数为
8,
剔除异常样本数为
3
时
,
得到最好结果
,
相关系数
(
R
2
)
为
92郾 67,
交互验证均方差
(RMSECV)
为
0郾 048 5
.
图
4摇
马氏距离法剔除异常样品后交叉
验证计算值与化学值
Fig. 4 摇 Cross鄄validation calculated and chemical values of
Mahalanobis distance method excluding anomalous
samples
2郾 3摇
蒙特卡洛交叉验证算法剔除异常样本
在
50
个校正集样本中
,
用蒙特卡洛随机取样法
选取校正集和预测集
,
然后建立偏最小二乘模型
,
循
环
2 000
次后得到各样本的预测残差值
,
并计算出
均值与方差的
MEAN鄄STD
图
,
如图
5,
为了确定异常
样本
,
绘制误差的火柴梗图
,
如图
6
.
图
5摇
均值方差分布
Fig. 5摇 Mean鄄variance distribution
从图
5
可知
,
某些样本明显偏离主体样本
,
如
39,12
这些样本可视为奇异样本
,
应该剔除
,
由
MEAN鄄STD
图和火柴梗图确定出需要剔除异常样
本
.
奇异样本剔除前后
PLS
校正模型的
RMSECV
的变化情况见表
2
.
MCCV
剔除异常样品后交叉验
证计算值与化学分析值如图
7
.
由表
2
可知
,
剔除异常样品个数为
3,
得到最好
结果
,
相关系数
(
R
2
)
为
94郾 64,
交互验证均方差
RM鄄
SECV
为
0郾 041 1
.
67
食品科学技术学报
摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
摇 2014
年
9
月