基于SOM网络的城市分类探讨及实证分析

时间:2020-11-11 11:00:04 计算机网络毕业论文 我要投稿

基于SOM网络的城市分类探讨及实证分析

  摘要:科学的城市分类不仅便于我们对各个城市的发展进行评估,并且为我们制定城市的发展决策提供了依据。而基于人工神经网络(ANN)的自组织特征映射网络(SOM)具有强大的聚类功能。文章探讨了SOM网络在城市分类方面的应用,并利用MATLAB软件,对山东省各地级市城市进行了实证分析,从而指出了SOM网络在城市分类方面的优缺点及意义。

  关键词:人工神经网络;SOM;城市分类

  一、引言

  城市分类不仅便于我们对各个城市的发展进行评估,并且为我们制定城市的发展决策提供了依据。然而,如何能够进行科学的城市分类一直备受关注。而基于近些年来人工神经网络的飞速发展,它帮助我们解决了许多棘手的难题,其中的自组织特征映射网络(SOM)具有强大的聚类功能,利用它可以帮助我们根据各个城市的特点从而进行科学分类,为加速我国城市的发展和城镇化建设有着重要的意义。2005年吴聘奇、黄民生利用SOM网络对福建省城市进行了职能分类,同年,刘耀彬、宋学锋又基于SOM人工神经网络对长江三角洲地区城市职能分类做了研究。从而可见,基于人工神经网络的自组织特征映射网络(SOM)在城市的分类问题确实可以发挥强大的作用。

  评价一个城市的各个行业的发展,有许多指标。其中行业就业人口是评价一个城市该行业的发展的基础指标。本文对山东地区城市的分类实证分析中,对各个城市的各行业就业人口数量进行了采集,其中包括农林牧渔业,采矿业,制造业,电力、煤气及水的生产和供应业,建筑业,交通运输、仓储和邮政业,信息传输、计算机服务和软件业,批发和零售业,房地产业,住宿和餐饮业,金融业,租赁和商务服务业,水利、环境和公共设施管理业,居民服务和其他服务业,教育,科学研究、技术服务和地质勘查业,卫生、社会保障和社会福利业,文化、体育和娱乐业,公共管理和社会组织等19个行业的从业人员数。然后,通过MATLAB软件进行编程构建,成功地将山东省的17个城市进行了分类,从而说明了SOM网络在城市分类方面的确有优于其他传统方法的优点。

  二、SOM网络的基本原理

  (一)SOM网络简介

  自组织特征映射网络也称Kohonen 网络,或者称为Self - Orgnizing Feature Map( SOM) 网络,它是由芬兰学者Teuvo Kohonen于1981年提出的。该网络是一个由全连接的神经元阵列组成的无教师自组织、自学习网络。Kohonen认为,处于空间中不同区域的神经元有不同的分工,当一个神经网络接受外界输入模式时,将会分成不同的反应区域,各区域对输入模式具有不同的响应特征。

  SOM网络的一个典型特征就是可以在一维或二维的处理单元阵列上,形成输入信号的特征拓扑分布,因此SOM网络具有抽取输入信号模式特征的能力。SOM网络一般只包含有一维阵列和二维阵列,但也可以推广到多维处理单元阵列中去。

  (二)SOM网络学习算法

  1、初始化。对N个输入神经元到输出神经元的连接权值赋予较小的权值。选取输出神经元j个“邻接神经元”的集合Sj。其中Sj(0),表示时刻t=0的神经元j的“邻接神经元”的集合,Sj(t)表示时刻t的“邻接神经元”的集合。区域Sj(t)随着时间的增长而不断缩小。

  2、提供新的输入模式X。

  4、给出一个周围的邻域Sk(t)。

  7、提供新的学习样本来重复上述学习过程。

  三、基于SOM网络的城市分类实证分析

  城市分类可以便于我们了解各个城市的发展状况,从而为我们制订城市的发展决策提供依据。现在人工神经网络已经得到了很大的发展,它为我们研究此类问题提供了一种新的工具和思路。所以基于这个问题,我们尝试利用SOM网络来进行城市分类。SOM网络是一种具有聚类功能的神经网络,并且它是无教师训练方式,我们只需要采集输入样本,而不必如入目标值就可以得到我们想要的结果,可见SOM网络使用也十分方便。

  (一)网络样本设计

  从山东省统计局网站,我们得到了山东省17个地级市城市的样本。从中我们看出,原始指标数据波动较大,而一般来说,神经元的输出函数在0-1之间最为灵敏,为了提高训练的效率,所以要把数据进行归一化处理。归一化处理方法为:找出每个指标数据中的最大和最小值,利用(x-min)/(max-min)公式把所有数据归一化为0到1之间的数。

  (二)网络设计

  本文利用MATLAB R2008进行编程构建。确定网络的输入模式为:

  Pk=(P1k,P2k,…pkn) ,k=1,2,…17,n=19

  即一共有17组城市样本向量,每个样本中包括19个元素。

  1、首先利用函数newsom创建一个SOM网络。根据实际情况本文创建网络的竞争层分别选用3、4、5、6层的结构。然后经过实验,分别观察其性能,从而选取分类效果最好的.一组。

  2、利用函数train和仿真函数sim对网络进行训练并仿真。仿真的步数大小同样影响网络的聚类性能,这里我们设置步数为1000。

  最后经过分类结果如表1所示。

  (三)实验结果分析

  最后经过分析筛选,发现当这17个城市被划分为6类时和现实情况较为符合。分类情况如表2所示。

  第一类:从表中看出,济南和青岛被归为了一类,并且在分类数为3、4、5、6时,济南和青岛都被列为了一类。从表中我们可以看到济南、青岛在各方面都优于其他城市,尤其是制造业、教育、以及公共管理和社会组织方面。济南是山东省省会,是全省、文化、经济,金融,教育中心,也是国家批准的沿海开放城市和十五个副省级城市之一。青岛是全国70个大中城市之一,全国五个计划单列市之一。工业有纺织、机车车辆、机械、化学、石油化工、钢铁、橡胶、家用电器、啤酒、卷烟等。有驰名中外的青岛啤酒、海尔集团、海信集团等大企业集团。并且,二者都有丰富的教育资源,全省大多高校均聚集在此。

  第二类:淄博、泰安、德州、聊城在发展方面,各个方面较为均衡,没有特别显著的特点。四者的制造业、建筑业和教育大约位于全省中间地位。

  第三类:枣庄、东营属特殊职能类型城市。两个城市相对其他城市来说,采矿业较为发达。枣庄境内已探明地下矿藏36种:煤、铁、铜、铝、金、银、锶(天青石)、石膏、萤石、水泥原料灰岩等。其中煤、石膏地质储量为15.4亿吨和4.1亿吨。而东营又称“石油之城”,丰富的石油、天然气资源。但是,两个城市的制造业相对薄弱,其他产业大约处于平均水平。