基于正例和未标文档的半监督分类研究
Research on Semi- Supervised Classification Based on Positive and Unlabeled Text Document
范新 沈闻 丁泉勋 沈洁
针对负例类别很难获得训练样本的情况,提出了一种基于正例和未标文档的半监督分类方法。已知仅有正例文本的情况下,引入k—means聚类算法对未标样本集进行聚类,从未标样本集中选出最为可靠的负例样本信息,初始化分类器。基于EM的极大似然估计理论,在每步迭代的E—step中,将中间分类器最有把握对其类别进行预测的未标注样本进行分类,并应用到M—step中修正分类器的参数值,迭代选择最优分类器。实验结果表明,该方法取得了较好的分类效果。
基于监督分类分区域的特征因子提取
Extraction of Characteristics of Sub-regional Factor Based on the Supervised Classification
薛廉 周春兰
以南充市2000年8月的LandsatTM影像为信息源,利用监督分类方法对南充市的土地利用进行了分类,采用了分区域提取特征因子这一改进方法,有效地降低混合像元带来的影响,提高土地利用信息的精度。
一种基于支撑向量机的遥感影像不完全监督分类新方法
刘志刚 史文中 李德仁 秦前清
不完全监督分类是研究在只有目标类训练样本的情况下如何准确地将目标类从数据集中提取出来。在许多遥感应用问题中,往往只需要从遥感影像中提取某一类地物。如果分类过程中只要选取目标类训练样本,将节省在训练样本选取过程中的大量人力物力。因此不完全监督分类是一个值得研究的遥感分类问题。提出了一种基于加权无标识样本支撑向量机(WUS—SVM),并在其基础发展出一种不完全监督分类方法。该方法分3个步骤:(1)在影像中随机选取一定量的无标识样本,将它们作为具有不同权重的非目标类训练样本;(2)用目标类的训练样本和加权无标识训练样本一起训练WUS-SVM,得到初步的分类器;(3)利用初步的分类器确定无标识样本的类别,并与原目标类训练样本一起再次训练SVM得到最终的分类器。通过对模拟数据和遥感影像的分类试验初步证明了该分类方法的有效性。