分享: |
收录于话题
《汽车工程》2023年第1期发表武汉理工大学胡杰教授团队研究成果"基于深度学习的汽车故障知识图谱构建"一文。论文基于某公司售后业务数据,针对故障文本中的嵌套实体问题和非连续实体问题,提出一种知识图谱构建流程,并利用知识图谱技术、自然语言处理技术,完成汽车故障知识图谱的构建。该研究在汽车故障诊断中可帮助快速准确地定位故障。
研究背景随着汽车新四化水平的提高,售后汽车检测维修的难度也逐渐加大。据统计,在汽车维修过程中约有70%的时间用于寻找故障,而只有30%的时间是用于故障维修。因此,在汽车故障诊断中如何快速准确地定位故障是十分必要的。
研究内容1. 数据来源与分析:论文所使用的数据为某公司某款新能源车型一年的维修数据,该数据包含车辆信息、故障信息和维修信息3部分内容,同时只有故障描述和处理结果字段为非结构化数据,其中故障描述字段包含车辆故障现象内容,处理结果字段包含排查步骤、故障原因、更换配件等内容。
2. 汽车故障知识图谱构建:车辆故障知识图谱属于垂直领域知识图谱,专业性较强,图谱中 包含实体数量较少,论文采取自上而下的构建方式。图1 汽车故障知识图谱构建框架
(1)基于DPCNN的文本预分类:基于DPCNN的文本分类模型用于从目标字段剥离出故障原因相关内容,缩小了实体抽取范围;图2 DPCNN模型结构(2)基于BERT-BiLSTM-MUL-CRF的实体抽取 :将故障现象、故障原因拆分为故障部位+失效形式的组合模式,采用基于字向量的BERT-BiLSTM-MUL-CRF模型完成实体抽取任务;
图3 BERT-BiLSTM-MUL-CRF模型结构
(3)基于语法规则的实体重组:使用基于语法规则的匹配模块完成实体重组,有效解决了文本中的嵌套实体和非连续实体问题,提升图谱构建效率和准确率;
图4 实体匹配示意图
(4)知识融合:采用结合术语相似度和结构相似度的方法完成知识融合。3. 算例分析:通过文本分类实验、实体抽取实验、实体重组、知识融合和知识存储,对论文所提方法进行论证。
研究结果
1. 文本分类实验:选用机器学习中的SVM模型、Naive Bayes模型和深度学习中的TextCNN、VDCNN模型,进行对照实验。与机器学习模型相比,3 种深度学习模型表现更好,而 DPCNN模型取得了最好的实验结果。2. 实体抽取实验:与其他模型相比,论文所使用的BERT-BiLSTM-MUL-CRF模型各项评价指标均最优。3. 实体重组:根据所提出的基于语法规则的匹配模板,对得到的故障部位实体和失效形式实体进行重组,得到故障现象实体和故障原因实体,人工对重组的结果进行核验。首先,选取既包含嵌套实体又包含非连续实体的样本452条,经过计算,匹配模板的准确率可达到63.3%;然后,选取只包含嵌套实体的样本共计2000条,采用同样的方式进行重组,经过人工校验,准确率为86.8%。
4. 知识存储:在对故障现象和故障原因实体融合处理后,论文使用Neo4j图数据库对构建的汽车故障知识图谱进行存储。
图5 知识图谱部分存储结果创新点与意义
论文基于某公司售后业务数据,针对故障文本中的嵌套实体问题和非连续实体问题,提出一种知识图谱构建流程,并利用知识图谱技术、自然语言处理技术,完成汽车故障知识图谱的构建。该研究在汽车故障诊断中可帮助快速准确地定位故障,具有重要的工程应用价值。 扫描上方二维码,免费获取全文关于《汽车工程》
1.行业声誉:汽车工程领域高质量科技期刊分级目录T1级别期刊2.检索收录:Ei & 核心3.首轮评审:< 30工作日4.在线投稿:www.qichegongcheng.com
联系我们
联系人:杨老师电话: 86-10-50923970邮箱:jae-editor@sae-china.org《汽车工程》2022年虚拟专辑分领域虚拟专辑1:智能网联汽车技术—感知&HMI&测评分领域虚拟专辑2:智能网联汽车技术—规划&控制分领域虚拟专辑3:新能源汽车技术—动力电池&燃料电池分领域虚拟专辑4:新能源汽车技术—电驱动&能量管理分领域虚拟专辑5:发动机&排放分领域虚拟专辑6:车身设计&轻量化&安全分领域虚拟专辑7:底盘&动力学&整车性世展网公众号 |
微信小程序 |
销售客服 |
门票客服 |