Volume 33 Issue 3
Oct.  2016
Turn off MathJax
Article Contents

NI Qianqian, QI Hengnian, ZHOU Zhu, WANG Hangjun. Identifying Dalbergia spp. wood with hyperspectral imaging technology[J]. Journal of Zhejiang A&F University, 2016, 33(3): 489-494. doi: 10.11833/j.issn.2095-0756.2016.03.017
Citation: NI Qianqian, QI Hengnian, ZHOU Zhu, WANG Hangjun. Identifying Dalbergia spp. wood with hyperspectral imaging technology[J]. Journal of Zhejiang A&F University, 2016, 33(3): 489-494. doi: 10.11833/j.issn.2095-0756.2016.03.017

Identifying Dalbergia spp. wood with hyperspectral imaging technology

doi: 10.11833/j.issn.2095-0756.2016.03.017
  • Received Date: 2015-05-27
  • Rev Recd Date: 2015-08-31
  • Publish Date: 2016-06-01
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

Figures(5)  / Tables(4)

Article views(2930) PDF downloads(570) Cited by()

Related
Proportional views

Identifying Dalbergia spp. wood with hyperspectral imaging technology

doi: 10.11833/j.issn.2095-0756.2016.03.017

Abstract: To rapidly and nondestructively identify common Dalbergia spp. of wood on the market, wood from Dalbergia spp. (D. cochinchinensis, D. bariensis, D. oliveri, and D. retusa) was identified using hyperspectral imaging technology. The hyperspectral images were collected and the reflectance spectral from the region of interest were extracted from the images. Wavelengths from 955 to 1 642 nm were preprocessed by Savitsky-Golay smoothing(SG), standard normal variate(SNV), and Multiplicative Scatter Correction(MSC). Then, a partial least square-discriminant analysis(PLS-DA) and an extreme learning machine (ELM) were used to build discriminant models based on selected sensitive wavelengths using principal component analysis (PCA), regression coefficient (RC), and successive projections algorithm (SPA) from the preprocessed spectra. Results showed that for selected sensitive wavelengths using SPA from SG and MSC preprocessed spectra, ELM models obtained the best classification accuracy (100.0%) for both the calibration set and the prediction set. Thus, this study provided a new method to identify Dalbergia spp. wood rapidly and nondestructively.[Ch, 5 fig. 4 tab. 17 ref.]

NI Qianqian, QI Hengnian, ZHOU Zhu, WANG Hangjun. Identifying Dalbergia spp. wood with hyperspectral imaging technology[J]. Journal of Zhejiang A&F University, 2016, 33(3): 489-494. doi: 10.11833/j.issn.2095-0756.2016.03.017
Citation: NI Qianqian, QI Hengnian, ZHOU Zhu, WANG Hangjun. Identifying Dalbergia spp. wood with hyperspectral imaging technology[J]. Journal of Zhejiang A&F University, 2016, 33(3): 489-494. doi: 10.11833/j.issn.2095-0756.2016.03.017
  • 红酸枝类Dalbergia spp.木材拥有温润的质地和细腻的纹理,打磨成家具后,经久耐用,不易腐朽。相比黄花梨Beniodendron minus木和紫檀Ptericarpus spp.木,红酸枝木的市场价格能被更多人接受,极具投资和收藏价值[1]。红酸枝木在国家标准GB/T 18107-2000 《红木》中共有7种,不同的种类价格和性能均相去甚远。例如,交趾黄檀Dalbergia cochinchinensis,又称“老红木”“大红酸枝”等,是红酸枝木中的上品,比同类红酸枝木价格高出很多。因此,有些不法商贩用价格便宜的奥氏黄檀Dalbergia oliveri或其他红酸枝木假冒交趾黄檀,引发的消费纠纷此起彼伏。所以,对红酸枝木的种类进行识别,有助于规范红酸枝的市场秩序和保护消费者的利益。目前,孙书冬等[2]对交趾黄檀,巴里黄檀Dalbergia bariensis,奥氏黄檀和微凹黄檀Dalbergia retusa的宏观与微观解剖特征进行研究,实现4种红酸枝木材的识别。伏建国等[3]对7种黄檀属Dalbergia木材和降香黄檀Dalbergia odorifera的DNA进行提取和纯化,通过碱基位点差异区分8种红木。张蓉等[4]对8种酸枝类木材的材色进行量化,可用于识别上述树种。这些方法都为不同红酸枝木材的识别提供了可能的途径。但同时以上方法都存在一些不足之处,如费时、耗力、成本较高,或是破坏木材无法做到无损检测。因此,研究一种能对红酸枝木种类进行快速无损识别的方法具有实用价值和科学意义。高光谱成像技术是近年来研究较为广泛的无损检测技术[5-7]。它可以同时获取被测对象的图像及光谱信息,由于图像数据能反映被测物外部特征、表面缺陷等,而光谱数据可对其物理结构及化学性质进行分析,因此高光谱成像技术是图像技术与光谱技术的完美结合[8]。目前,尚未有运用高光谱成像技术对红酸枝类木材品种的识别研究。因为本试验所选波段(900~1 700 nm)红酸枝木材的高光谱图像分辨率不高,其中包含的能区分红酸枝木材的纹理特征信息很少。所以,本研究的目的在于利用高光谱成像技术提取样本中感兴趣区域(region of interest,ROI)的全光谱信息以及通过挑选特征波长,结合多种化学计量学方法建立判别模型,实现对红酸枝木材的种类识别。

  • 本试验研究对象为市场上常见的4种红酸枝木材(表 1),分别是交趾黄檀、巴里黄檀、奥氏黄檀和微凹黄檀,样本来源于广州渔珠木材市场,均为35.00 mm×27.50 mm×14.50 mm的实木木块,各获取木材9块·种-1。实验所选取的4种红酸枝木材同属黄檀属,材色相近、纹理和构造特征相似,肉眼不易区分。

    木材种类产地气干密度/(g·cm-3)
    交趾黄檀老挝1.01~1.09
    巴里黄檀老挝1.07~1.09
    奥氏黄檀缅甸1.00~1.04
    微凹黄檀尼加拉瓜0.98~1.22

    Table 1.  Information of red rosewood in the experiment

  • 试验用红酸枝木材高光谱图像采集系统如图 1所示。该系统主要包括:成像光谱仪(N17E-QE,Spectral Imaging Ltd.,芬兰),IRCP0076型电控移位平台、成像镜头OLES22(Specim,Spectral Imaging Ltd.,Oulu,芬兰)、2个150 W的光纤卤素灯、暗箱和计算机等。光谱分辨率为5 nm,采集的高光谱图像分辨率为320×256。高光谱图像采集的光谱范围是874~1 734 nm共256个波段。为了得到清晰、不失真的图像需要对相机的曝光时间、物镜之间的距离以及电控移位平台的移动速度进行调试。试验采集的是试样的反射高光谱图像,成像系统的相关参数设置如下:曝光时间设置为4 ms,物镜之间的距离为12 cm,平台的移动速度为18 mm·s-1。本研究采用的高光谱数据分析软件是ENV I4.6(ITT,美国),MATLAB R2009a(The Math Works,美国)和Unscrambler 10.1(CAMO Process AS,挪威)。

    Figure 1.  Hyperspectral imaging system

    光源强度在不同波段下分布不均匀,光源分布较弱的波段所含噪声较大,对红酸枝木的高光谱图像采集时要进行图像校正。扫描白色标准校正板获得白板校正图像IW,盖上镜头后扫描得到黑板校正图像IB,采集得到的红酸枝木原始图像为IO,按照图像校正公式R=(IO-IB)/(IW-IB),得到校正后的图像R。依次从每块红酸枝木材高光谱图像中手动选取大小同为30×30像素点的感兴趣区域各4个,4种红酸枝木均获得36个感兴趣区域计为36个样本,共计144个样本。将所有红酸枝木材样本按照Kennard-Stone算法[9]以2∶1的比例分成建模集和预测集,其中建模集样本为96个,预测集样本为48个。

  • 为挖掘所选波段中有效的光谱信息和去除由试验环境引起的噪声,本研究采用Savitsky-Golay平滑算法(SG),标准正态变量变换(standard normal variate,SNV)和多元散射校正(multiplicative scatter correction,MSC)对感兴趣区域光谱进行预处理。其中SG平滑算法是消减噪声最常用的一种方法[10],SNV与MSC可以校正样本间由颗粒散射带来的误差[11]

  • 红酸枝木样本光谱变量矩阵庞大,为了减少模型输入变量和缩短分析计算时间,需要从全波段提取出对建模最有效的波长,往往是与试样化学成分有关的特征变量。由于每种木材的木质素、纤维素等含量有区别,导致不同种类的红酸枝木材对光谱的吸收程度不同,这是区分4种木材的一个重要方面。本研究采用主成分分析法[12](principal component analysis,PCA),回归系数法[13](regression coefficient,RC)和连续投影法[14](successive projections algorithm,SPA)选择特征波长。

  • 通过对红酸枝木材的全部光谱数据以及经过特征波长选择后的光谱数据分别建立偏最小二乘判别分析[15](partial least square-discriminant analysis,PLS-DA)和极限学习机[16](extreme learning machine,ELM)判别分析模型。本研究采用识别率作为模型评价标准即样本品种识别正确个数占总样本数的百分比。

  • 由于受外部环境和仪器本身性能等因素的影响,光谱前后端含有大量噪声,经预试验研究采用25~229波段的光谱信息,光谱分析范围是955~1 642 nm。4种红酸枝木材的平均光谱曲线趋势相近,但反射率存在差异。如图 2,波长均在1 106 nm和1 308 nm处有较高的光谱反射率,纤维素的C—H二级倍频伸缩位于1 214 nm[17],纤维素的O—H一级倍频伸缩位于1 476 nm,4种红酸枝木材在这2个波长附近都出现了明显的吸收峰。此外,巴里黄檀与奥氏黄檀的光谱有部分重叠,相似度很高。

    Figure 2.  Mean spectra from raw data

  • 主成分分析是通过线性变换从多个变量中选取较少个数重要变量的过程。根据PCA分析得到的各波长平均权重系数绝对值的大小来选取特征波长,以经MSC预处理后光谱的PCA特征波长选择为例,PC1(73.00%),PC2(25.00%)和PC3(1.00%)的累积方差贡献率达到了99.00%。一些平均系数绝对值大的点所对应的波长在PC1和PC2中是相同的,如图 3所示,故从PC1和PC2中挑选了1 103,1 143(与木质素的C—H二级倍频伸缩振动有关),1 193(与木质素的C—H二级倍频伸缩振动有关),1 307,1 394和1 479 nm(与纤维素的O—H一级倍频伸缩振动有关)6条特征波长。

    Figure 3.  Effective wavelength selected by PCA from MSC spectral preprocessed

  • 回归系数法是基于PLS-DA建模分析过程中得到的。回归系数绝对值越大说明对所建模型性能影响也越大,故根据每个波长点所对应的回归系数绝对值的大小来选择特征波长。由图 4可见:对经MSC预处理后的光谱利用回归系数法挑选的特征波长为1 127,1 147,1 177,1 366(与纤维素的C—H一级倍频伸缩和C—H弯曲振动的合频有关),1 417(与木质素的C—H一级倍频伸缩和C—H弯曲振动的合频有关),1 453,1 619和1 632 nm(与纤维素的O—H一级倍频伸缩振动有关)。

    Figure 4.  Effective wavelength selected by RC from MSC spectral preprocessed

  • 连续投影法是从光谱矩阵中找出冗余信息最少的变量组,使组内变量间的共线性达到最小。对经过MSC预处理的光谱数据利用SPA进行特征波长选择如图 5所示。设定特征波长变量个数为5~30,当提取8个变量时,模型的RMSE值达到最优为0.377 5,所对应的波长依次为1 123,1 224(与纤维素的C—H二级倍频伸缩振动有关),1 284,1 362,1 423,1 433,1 565和1 605 nm。经过不同特征波长选择算法统计出的特征波长的个数如表 2所示,通过PCA算法选取的特征波长的个数要少于RC算法和SPA算法。

    Figure 5.  Effective wavelength selected by SPA from MSC spectral preprocessed

    预处理特征波长选取个数/个
    PCA(主成分分析法)RC(回归系数法)SPA(连续投影算法)
    SG(平滑)676
    SNV(标准正态变量)91010
    MSC(多元散射校正)688

    Table 2.  Number of effective wavelengths selected by different methods

  • 对未经预处理和经过3种方法预处理后的光谱分别建立PLS-DA和ELM模型。PLS-DA算法是通过计算光谱信息矩阵与类别信息矩阵的相关关系建立回归模型,模型的隐含变量数(latent variables,LVs)为5,阈值为0.5,若回归模型得到的预测值与真实值之差的绝对值小于阈值则判断正确,反之则判断错误。ELM模型具有学习速度快,泛化性能好等特点,隐含层激励函数为‘sigmoid’,将隐含层神经元个数设置为20,模型的预测性能最佳。2种模型的判别分析结果如表 3所示。

    模型PLS-DAELM
    建模集预测集建模集预测集
    识别数/个识别率/%识别数/个识别率/%识别数/个识别率/%识别数/个识别率/%
    未处理8992.714287.509396.884491.67
    SG9093.754287.509598.964593.75
    SNV9497.924491.679598.964695.83
    MSC9598.964491.6796100.004797.92
    说明:G为SG平滑;SNV为标准正态变量;MSC为多元散射校正。

    Table 3.  Identified results of different discriminant models based on full spectra preprocessed

    表 3可知:ELM的整体识别效果要好于PLS-DA模型,经过预处理的识别效果要好于未经预处理的数据模型,所有判别模型的识别正确率均高于85.00%。其中,经MSC预处理后的建模集识别正确率达到100.00%,预测集的识别正确率也达到97.92%,取得最优识别效果。通过判别模型的分析比较,说明基于全部光谱的红酸枝木材的种类识别是可行的。

  • 基于特征波长建立的判别分析模型的分析结果如表 4所示。

    预处理模型PCA/%RC/%SPA/%
    建模集预测集建模集预测集建模集预测集
    SGPLS-DA77.0879.1780.2172.9293.7589.58
    ELM100.0097.9298.9695.83100.00100.00
    SNVPLS-DA72.9272.9280.2175.0080.2187.50
    ELM97.9291.6797.9295.83100.0097.92
    MSCPLS-DA64.5870.8383.3387.5085.4289.58
    ELM98.9695.8396.8893.75100.00100.00
    说明:SG为光滑;SNV为标准正态变量;MSC为多元散射校正;PCA为主成分分析法;RC为回归系数法;SPA为连续投影算法。

    Table 4.  Identification rates of different discriminant models based on different wavelengths selection methods

    表 4可知:运用SPA提取的基于SG和MSC预处理光谱的特征波长建立的ELM模型均取得了最优识别效果,建模集和预测集都取得了100.00%的识别率。运用PCA挑选的基于MSC预处理光谱的特征波长建立的PLS-DA模型取得了最差的识别效果,建模集的识别率仅为64.58%,预测集的识别率为70.83%。因为经MSC预处理的光谱只运用PCA提取的前2个主成份,所以在进行PLS-DA建模时效果较差。相比较PCA,RC和SPA这3种特征波长选择算法建立的识别模型可知,运用SPA算法的识别正确率最高。此外,在相同光谱预处理方法的前提下,运用同一种特征波长挑选方法建立的模型,ELM模型的识别正确率要高于PLS-DA模型,可能是因为ELM不需要调整网络的输入权值和隐元的偏置,容易获得全局最优解。

  • 本研究利用高光谱成像技术结合不同的光谱预处理方法和特征波长选择方法建立了不同的判别分析模型,实现了对4种红酸枝木材的种类识别。通过比较发现,基于全部光谱以及采用PCA,RC和SPA方法分别提取的特征光谱建立的判别模型,ELM模型的识别正确率均高于PLS-DA建立的模型,而经SPA提取的特征波长建立的模型识别效果最优。其中,SG-SPA-ELM模型、MSC-SPA-ELM模型的建模集和预测集的识别率都达到100.00%。以特征波长建立的判别模型,相比全光谱而言,缩小了变量数又取得了较好的识别效果,具有一定的优势。本研究的初步结果表明,基于高光谱成像技术结合判别分析模型,对交趾黄檀、巴里黄檀、奥氏黄檀和微凹黄檀等种类识别提供了一定的参考依据。

Reference (17)

Catalog

    /

    DownLoad:  Full-Size Img  PowerPoint
    Return
    Return