知识驱动智能质量问题解决系统&期刊翻译转载&
以下为论文摘要,包括部分直译和本人理解的转译,详细内容可参考附件原文(英文)。文中部分本人的观点,为了和原文内容以作区别,使用蓝色字体表达。本人能力不堪,可能存在翻译或理解错误的地方,请参考原文斟酌。
++++++++++++++++++++++++++++++++++++++
原文标题:《********************************* 》看附件
关键词:质量管理,智能质量问题解决,知识管理,汽车行业,数字鱼骨图,本体论(信息学概念)
摘要简译:在现代汽车制造行业中,质量问题解决系统(QPS)很重要,但企业中有大量现有质量数据未被使用,本文介绍质量数据挖掘方法,以及由此建造的智能质量问题解决系统(IQPSS)。内容包括:
1.使用OGM模块从原始质量数据中挖掘出本体库。
2.根据本体库和原始数据中的文本信息,通过KTM模块中的算法,生成质量问题解决知识库(QPSKB)。
3.通过成分和缺陷相关矩阵挖掘算法(CFRMM),将成分(可以理解为因子)与缺陷进行关联。
4.使用半监督分类算法(基于K最近邻判别法(KNN)),将即时对策,缺陷原因,长期对策进行分类并归类到主体库下。
5.使用二叉树支持向量机(SVM)算法,将缺陷原因进行4M1E分类,并生成鱼骨图。
6.在某国内车企进行测试。
第一节: 介绍
内容概译:讲了智能质量管理时代即将到来,很多学者在此方面进行研究,但是对质量问题解决方面(我们可以理解为纠正预防措施),研究和落地方案不多,本文提出了一种通过过往数据挖掘,以替代人员经验和头脑风暴的质量问题诊断解决办法。
亮点是: 1.本文所提方法为新创。2. 智能生成鱼骨图。3. 问答式质量方案提取替代检索式质量信息搜集。
第二节:相关研究
介绍了一些智能质量管理系统的研究方向和进展。(与本文所讲系统无关,不做展开,有兴趣可以看原文)
第三节:IQPSS系统框架
IPQSS系统的框架如下,从下图可以看到,这个系统的基本运行逻辑,将产线质量问题和对策进行数据库化(纠正预防措施数字化),从这个数据库出发,使用OGM模块生成主体,并通过KTM模块,生成5M1E因子_ 缺陷_即时对策,缺陷_原因_长期对策相互关联的知识库,并通过人机交互支持一线人员做出决策。其中OGM和KTM模块是其技术亮点。
http://www.pinzhi.org/data/attachment/album/202203/29/141207nqumwqsk7wkkq7ks.jpg
第四节:OGM模块介绍
主体可以理解为一些信息体(Entity)关联形成的集合,以区别与单个信息点。
本论文中使用文本挖掘算法和人工调校,生成主体。本论文中的主体包含了缺陷,即时措施,原因,长期措施四个信息关联的信息体,其关系可参考左下示意图(比较简单,不翻译了)。而OGM模块的处理流程参考右下图:
1. 原始文本预处理,包括缩写展开,词形还原,词干提取,剔除停用词(无用的感叹词,定语等)。
2:词性标注。(识别词汇形态,名词动词等)
3. 使用 TF-IDF法识别关键词(特征项目),并进行(行业专家)人工调整并标准化(同义词合并)。(TF-IDF即词频和逆文本率,是一种根据词汇出现频率进行挖掘的统计算法)
4. 形成后的标准化关键项目集(向量空间),包含缺陷,即时措施,原因,长期措施四个变量维度,进行多轮K-均值聚类。(K均值聚类是常用的分类方法之一,MINITAB上有,有兴趣可以去了解)。
5. 第一次聚类形成母分类,对母分类下的各类别再进行K均值聚类,生成子分类,如此再往下聚类分析,直到不可分。聚类后的分类关系树,即是主体树。
http://www.pinzhi.org/data/attachment/album/202203/29/141207pr4mmrzrd7edudvy.jpg
第五节:KTM模块介绍首先,使用KTM模块转化后的数据库,其结构如下ER图。(其结构与很多公司内结构化SQL数据库相似,多表单使用主键相关联)
http://www.pinzhi.org/data/attachment/album/202203/29/141208ii89h1zezea7p7t7.jpg
5.1 成分(因子)与缺陷相关矩阵挖掘
使用CFRMM算法,文中指出这是关联规则挖掘方法的一种应用,使用已有的缺陷项目,成分项目库和质量问题对策数据库中的文本数据,进行成分和缺陷之间关系建模。论文提供了伪代码已展示算法结构,如感兴趣可进入原文查看。文中也提出此种方法可支持FMEA的制作。
5.2 根因分类并提取关键描述
论文中使用品质问题对策数据库中的历史数据,
1.首先对根因进行4M1E分类,论文讲解了选择支持向量机(SVM)算法的理由。由于传统SVM算法只适用于二项分类,因此导入二叉树与SVM合并使用,首先将根因分为两类,然后每一类再进行二分,直到不可分为止,形成二叉树结构。文中提供了伪代码,可查看算法结构。
2.分类后对每项根因进行加权(依照出现频度)。
3.然后,根据已经生成的主体树,将根因的主要描述提出。方法是从原纠正措施数据的题头中提取关键描述,论文使用规则及文本挖掘合并方法,主要是识别关键词,如“根因”,“原因”,“因为”等等,可查看论文中详细规则。如无关键词,则使用聚类方法中的半监督KNN算法提出主体,使用主体中的原因描述。
5.3 关键描述提取
主要讲得是对即时对策和长期对策中的关键描述提取并加入主体树中。
1,问题_即时对策集:包括即时对策编号,质量问题编号,即时对策责任人,状态和即时对策关键描述。其中前4项直接从原始数据提出,第5项使用KNN算法,首先将一部分即时对策进行标注,使用这一部分数据作为训练集,使用KNN算法机器学习,然后再对未处理的数据进行处理。
2. 原因_长期对策集:包括长期对策编号,有效性,对策责任人,对策关键描述以及原因编号。其提取方法同上。
第六节:知识处理模块
比较简单,可参考下图或原文,不再赘述。
http://www.pinzhi.org/data/attachment/album/202203/29/141208ihdf3objsbdifh3z.jpg
第七,八,九节: 某国内车企应用案例,包括实际数据和应用界面等,此外作者的一些探讨和下一步优化方向。可查看原文。
+++++++++++++++++++++++++++++++++++++
这是一个数据挖掘和机器学习在工业文本数据上应用的案例,其他就不多讲了。(本来想聊一聊的,还是算了...)
如下附件,如需自取,注意仅供交流学习,如有任何商用,务必联系原文作者沟通。 {:1_180:} {:1_97:} {:1_180:} {:1_180:}{:1_180:} 谢谢分享 {:1_89:} {:1_89:} 谢谢分享 感谢分享!