发表:一类基于分级聚类的可解释性模糊建模方法的研究(一)

时间:2020-08-28 17:37:45 通信工程毕业论文 我要投稿

发表:一类基于分级聚类的可解释性模糊建模方法的研究(一)

摘 要 提出了一种基于两级聚类算法的可解释性模糊建模方法。首先指出模糊模型可解释性的重要地位,分析影响可解释性的主要因素;然后利用减法聚类和加权模糊C均值聚类算法辨识初始模糊模型,紧密/分离性函数确定最优划分和模糊集合的相似性融合约简初始模糊模型,从而提高其可解释性;最后采用约束优化算法整体优化模型,提高其精度。通过对Box-Jenkins火炉数据的模糊建模,验证了该方法的有效性。

发表:一类基于分级聚类的可解释性模糊建模方法的研究(一)

关键词 模糊建模,可解释性,减法聚类,加权模糊C均值聚类

 Key words fuzzy modeling, interpretability, subtraction clustering, weighted fuzzy c-means algorithm

引言
 近些年来,基于规则的模糊建模以其众多优点成为一个活跃研究的领域,并在仿真、分类、数据挖掘、模式识别、预测及控制等方面得到广泛的应用。与神经网络等模型不同,模糊模型的知识表达形式和推理机制符合人的思维习惯,可为人们所理解,成为模糊模型最显著的特征。
 在模糊建模中,一般要求所建立的模型既要有较好的拟合精度,又要有较简单的模糊结构。目前,众多聚类算法在模糊逻辑系统的结构辨识中得到了广泛的应用,据此而得到的模糊结构往往以拟合精度作为指标,从而得到的模糊模型含有大量的冗余信息,泛化能力差,不具备可解释性。
 为了提高模糊模型的可解释性,诸多学者进行了相关研究.文献[7-11]给出了模糊模型可解释性的一些必要条件。文献[12-18]给出了提高模糊模型可解释性的一些具体方法,包括模糊集合的相似性度量、正交变换和遗传算法的规则约简,全局与局部学习算法等。文献[6]利用模糊聚类辨识含有冗余的模型,然后利用模糊集合相似性度量和相似性奖励遗传算法对模型进行迭代简化,最后利用相似性惩罚遗传算法整体优化模型。文献[19]提出了一种新分级聚类算法,利用最近领域聚类算法和加权模糊C均值聚类算法辨识出较少的模糊规则,但没有考虑模糊集合的相似性融合,同时最近领域聚类算法对于高维系统易产生维数灾难。
 本文提出了一种基于两级聚类的可解释性模糊建模方法。首先利用减法聚类算法对输入输出数据进行预处理;然后将一次聚类的聚类中心作为二次FCM聚类的样本,并由紧密/分离性函数(XB)确定最优划分,模糊集合的相似性融合约简所得的初始模糊模型;提高其可解释性;最后采用梯度下降算法整体优化模型。Box-Jenkins火炉数据的模糊建模,验证了该方法的有效性。
预备知识
TS模型
 Takagi和Sugeno[22]于1985 年提出了著名的TS模糊模型,是一种被广泛使用的模糊模型,其典型规则形式如下:
                 (1)
 其中Ri表示第i条模糊规则,xj为输入变量,Aij为定义在输入论域中的隶属函数,可以取三角形、高斯型、梯形或者钟型等.本文采用高斯型隶属函数:
          (2)
其中分别代表函数的中心和方差.
 TS模型的输出为所有规则输出的加权平均:
          (3)
其中pi是第i条规则的激励强度:
         (4)
 对于数据{xk, yk | k=1, …, N},式(3)可以写为线性回归方程:
                                     (5)
其中为规则后件参数矩阵,e为误差矩阵.
 TS模糊模型规则前件是模糊变量,而规则后件是输入输出线性函数,它以局部线性化为基础,通过模糊建模实现了全局的非线性,能克服以往模糊模型的高维问题,已经成为一种被广泛使用的模糊模型.
模糊模型的可解释性
 模糊模型的可解释性问题在九十年代末期,开始得到部分研究学者的重视[7-21]。2000年4月,在ERUDIT“关于模糊系统与技术的未来”专题学术讨论会上,Babuska R等人建议将模糊建模研究的焦点由精确性转移到可解释性上,标志着模糊模型可解释性研究的重要里程碑[24]。
 模糊模型的可解释性是指模型的输入输出接口形式、模型结构形式、数据处理形式等符合人的思维,可以直接或者通过简单分析来表达和洞察系统内部的运行机理,从而获得对系统深入的认识。
 一般认为,模糊模型的可解释性,与模型结构、输入变量和模糊规则数目、隶属函数特性等密切相关,现将主要因素陈述如下[7-11]:
 1) 输入变量数目:人们很难通过高维模糊模型来分析系统行为,因此模糊模型应该采用尽可能少的输入变量.
 2) 模糊规则数目:模型的规则数目越多,其可解释性越低.经验认为,可解释的模糊模型,其规则数目不超过10个,这是由人在理解、推理时的思维能力所决定的.
 3) 模糊规则库的完整性、一致性和精简性:模糊规则要完整覆盖输入论域,对每一有效的输入变量组合,至少有一条模糊规则被激励,即完整性。模糊规则之间必须相容而不能有任何两条规则相互矛盾,即一致性。在规则数目尽可能小的前提下,不能包含冗余规则,如某规则的前件是另一规则的子集等,即精简性。
 4) 隶属函数的特性:隶属函数必须是凸和正规的,常用的三角函数、高斯函数等都满足这两个要求。隶属函数划分必须是完备的,即对于任何的输入变量,在其论域内的任何值,至少有一个隶属函数相对应,在形式上表现为隶属函数之间存在位置的交叉隶属函数划分必须是可区分的,即对于同一变量,隶属函数之间存在明显的位置区别,以便赋予一定的语义项。
可解释性模糊建模
一次聚类
 本文提出了一种基于两级聚类的可解释性模糊建模方法。首先利用减法聚类算法对输入输出数据进行预处理,起到精简样本,滤去样本中重复信息的作用,减少了二次聚类算法中的迭代次数;然后将一次聚类的聚类中心作为二次加权FCM聚类的样本,并由紧密/分离性函数(XB)确定最优划分,模糊集合的相似性融合约简所得的初始模糊模型;提高其可解释性;最后采用梯度下降算法整体优化模型。
 减法聚类算法思想为:考虑维空间的个数据点,不失一般性,假定数据点已归一化到一个超立方体中。每个数据点都是聚类中心的候选者,则数据点处的密度