您的当前位置:首页正文

基于神经网络

来源:个人技术集锦
第45卷第6期

2005年11月

大连理工大学学报

JournalofDalianUniversityofTechnology

.45,No.6Vol

Nov.2005

文章编号:100028608(2005)0620902205

基于神经网络的GIS和RS数据融合

孙燕楠1, 韩 敏31, 王教河2, 孙 忠2

(1.大连理工大学电子与信息工程学院,辽宁大连 116024;2.水利部松辽水利委员会,吉林长春 130021)

摘要:地理信息系统(GIS)是对地观测的核心技术,遥感(RS)是其重要的信息源和更新手

段,GIS同时辅助遥感信息的处理.两者集成是空间信息实时采集、处理、分析的有力手段,目前为实现此目标主要进行数据一体化存储结构的研究.鉴于此提出了根据所要实现的目标,不改变数据存储形式,用神经网络对GIS和RS进行数据融合的方法.首先建立5层网络结构,提取遥感影像和GIS数据库中属性数据的特征值作为网络的输入,然后通过调节输入向量与中心向量的距离及中心向量的值确定网络权值,将两种数据进行融合,利用输出的属性变化,自动更新数据库.以扎龙地区遥感影像与地理信息系统的矢量图层相结合检测地物变化、更新属性数据库为实例,证明了该方法的可行性.

关键词:地理信息系统;遥感;神经网络;数据融合中图分类号:TP118文献标识码:A0 引 言

地理信息系统(geographicinformation

system,GIS)支持空间数据的采集、管理、分析、建模和显示,以便解决复杂的规划和管理问题[1].遥感(remotesensing,RS)不直接接触物体而利用传感器探测地表物体的电磁波谱特性,是一种快速进行大区域空间数据采集和分类的有效手段[2].GIS和RS随着自身技术和使用领域的不断拓展,两者相互支持、补充,两种技术的集成成为必然.两者的集成形式由低级向高级发展:分开但平行的结合;表面无缝的结合;整体集成.第1种集成形式主要是通过矢量和栅格的数据格式交换来连接两个系统,进行环境变化监测和更

4]

新[3、.这种方法明显的不足是处理数据的效率低,并且有些分析处理功能,如区域生长方法不能实现[5].第2种集成形式通过在GIS中应用图像处理功能,或在图像处理系统中应用部分的GIS

3种形式整体集成,即图像处理和分析过程与GIS

数据的处理和分析过程已成为一个系统.目前许多文献为实现这一目标进行了基础性的研究(矢量、栅格一体化数据结构的建立),而这之后的处理分析工作还有待进一步研究.

GIS与RS是对同一地理环境不同方面的描述,两种信息是互补、协同的,但两种数据在测量精度、范围、输出形式方面根本不同.数据融合是近10年发展起来的信息处理技术,可以将不同方法、时间和空间得到的信息进行处理,得到对对象的一致性描述[7].根据所要实现的目的使用数据融合方法,可以避免两种数据结构的变化和相互转换,即数据融合方法可作为实现整体集成的一种手段.

本文尝试用数据融合方法实现RS与GIS的整体集成,主要完成RS对GIS的数据更新.利用扎龙地区2002年的遥感影像与1989年的矢量图层,建立神经网络融合两种信息,进行地物变化检测,同时更新属性数据库,通过此过程具体证明利用数据融合方法实现RS与GIS整体集成的可行性.

分析功能来实现[6],这种方法已在某些软件中体

现,如ArcGIS、ERDASIMAGINE等.但此方法实行松散结合,并没有真正地集成为一体.第  

收稿日期:2004210221; 修回日期:2005210228.

基金项目:国家自然科学基金资助项目(重点项目50139020).

作者简介:孙燕楠(19792),女,博士生;韩 敏3(19592),女,博士,教授,E2mail:minhan@dlut.edu.cn.

 第6期  

孙燕楠等:基于神经网络的GIS和RS数据融合903

1 基于神经网络的数据融合方法

1.1 问题提出

目前RS对GIS更新的方法有2种.一是对遥感影像分类解译之后矢量化,直接作为GIS的数据,需要2种软件系统:图像处理软件和地理信息系统软件,是引言中提到的第1种集成形式的实现;另一种方法是遥感影像校准之后在ArcMap中与矢量图层叠加,直接手工编辑[8].这2种方法都比较费时费力,所要更新的信息越多,需要的时间越长,一般都需要几天的时间.为缩短工作时间并实现第3种集成形式——整体集成,本文利用神经网络直接融合RS与GIS数据,得到土地覆盖的变化结果,并对属性数据库进行添加或删除.1.2 神经网络的建立

数据融合有3种层次结构:像素层、特征层、决策层,需要根据数据的类型确定所要融合的层次.对于不同的融合层次有不同的融合方法:像素层融合方法主要有加权平均法、卡尔曼滤波法等;特征层融合方法主要有模糊推理法、神经网络法等;决策层融合方法主要有贝叶斯概率推理法、证据推理法等.GIS中的数据与RS的数据结构根本不同,所以使用特征层融合.从要融合的数据中得到代表某种特性的数据,称为特征提取[9].对不同类型的特征量进行非线性关联并形成一个融合矢量比较困难,而神经网络能够通过学习进行各种非线性映射,最适用于特征层融合.

1.2.1 输入输出确定 本文所用到的数据有2种.第1种数据是1989年扎龙地区GIS数据(shape文件),通过纸质地图扫描矢量化后得到.具体操作过程是:选择合适的分辨率,扫描纸质地图存为3.jpg文件;设置控制点,转换坐标;对地图信息进行分层;利用R2V软件,根据不同的数据层进行手工矢量化;进行错误修正;在ArcInfo工作站下建立拓扑关系;添加属性信息.第2种数据是2002年扎龙地区的TM影像数据.将这2种数据进行融合,得到土地覆盖的变化情况,对属性数据库进行更新.

首先进行特征提取,确定神经网络的输入.从GIS矢量图层数据中取3.dbf文件里名字字段中的名称作为特征量,代表原地表覆盖物特性;从RS影像数据中取某一像素的RGB值,作为代表新的地表覆盖物特性的特征量.显然,3.dbf文件中的名称直接表示了地物的种类.遥感影像

是地物的光谱特征记录,不同的光谱特性表示为不同颜色,而显示器通常是用三原色RGB来实现颜色显示的,所以RGB值可以代表地物的种类.

本文以这2种特征量同时作为神经网络的输入.从矢量图层中获得的名称必须进行编码才能作为神经网络的输入.即使是同一矢量层中的同一种地物,名字字段名称也不一样.为了统一编码,要求矢量化地图时,同一层地物名称的填写遵循一定的规则.例如,某一层为居民区,需要对每个区域取名字时,除了要录入此区域的名称,还要对此区域进行标记,可标记为“resident”.于是取“R”“T”的ASCII码82、84作为网络输入向量中的两个元素.影像的RGB值共有3个,可以编程得到.因此输入向量由名称的编码和影像的RGB值共5个元素构成,则确定输入向量为5维.

为了得到地物的变化结果,输出应代表地表覆盖的变化情况.所监测地区的可能地物变化情况如表1所示(共为10种).将每种变化进行编码,并用二进制表示.则输出可编码表示为“0001(Resident2Salina)”到“1010(Lake2Lake)”.例如原地物由Resident变化为Farmland,则编号为3,转化为二进制编码为“0011”,即“0011”代表了由Resident变化为Farmland的情况.所以输出向量为4维.

表1 地物变化编号

Tab11 No.oftheLanduseChanges转化地物

ResidentFarmlandLakeGrassSalinaMarsh

21

原地物

Resident   Lake   Farmland

43

10978

65

1.2.2 网络结构确定 多层前馈网络是实现聚

类普遍使用的网络结构,其结构简单,且相对应的训练算法实现方便.本文利用多层前馈网络,进行聚类以得到地物的变化情况.

网络设计如果考虑先验信息和不变性,那么不必经过学习就可确定优化的网络结构.选用高‖X-P‖2

(X为输入斯函数f(X)=Αexp-(1󰃗Γ)2向量,P为某类的中心向量,1󰃗Γ为宽度,Α为系

数)表示输入向量X属于某类的程度,即用输入

904大连理工大学学报

第45卷 

向量与每个中心向量的距离来判断输入向量归于哪一类.此函数中需要调整的变量为中心、宽度以及系数,分别将这些变量作为神经网络某一层的权值,使得网络中每一层具有确切的意义,从而根据其意义可以确定每一层的神经元个数.基于此建立了如图1所示的网络结构.将中心向量、宽度、系数分别作为B、C、D层的权值.此3层各有10个神经元,分别表示10种不同的地物转化情况,各层之间对应相连.D层的输出为输入向量隶属于不同种类的程度,然后利用加权平均确定所属类别,得到神经网络的输出.

称作为原地物的特征量;相对应的遥感影像的RGB值作为现在地物的特征量.本文共取样本200组(部分样本如表2所示),170组用来训练网

络,30组作为测试样本检验网络的泛化能力.

网络训练前,首先对数据进行归一化,以确保

C层输出不会太小.中心向量Pi=

(pi1 pi2 

pi3 pi4 pi5)(i=1,2,…,10)的初始值由训练

样本确定,如属于第一类地物变化的训练样本集为{S1,S2,…,Sm},P1中各元素的初始值为这些样本的输入向量中每个元素的平均值.然后利用梯度下降法分别调整中心向量、宽度、系数及最后一层的权值.在训练过程中,先选取较大的学习速率,如果后一步的训练误差大于前一步的训练误差,就减小学习速率,使得网络收敛.由于加入了每个类别中心向量的先验信息,网络权值的调整限制在了一定范围内,避免陷入局部最小点.

表2 部分样本

图1 神经网络结构图Fig11 Structureoftheneuralnetwork

No.12345

Tab12 Partsamples

输入

 名称编码      RGB值   

8282707676

8484686969

1571079993123

9175595588

158167159113138

输出

00010010010101111001

  每层的神经元以及层与层之间的权值含义

具体如下:

A层神经元代表输入向量X=(x1 x2 x3 x4 x5),x1和x2是矢量图层的某一地域名称的编码,x3、x4和x5分别是像素的R、G、B值;A、B层间的权值代表中心向量Pi=(pi1 pi2 pi3 

pi4 pi5)(i=1,2,…,N);B层神经元输出代表输

…………

对网络进行10次训练,每次训练50000步,所用的时间在2~3h,训练误差和泛化误差的精度都符合要求.取10次训练的误差值的平均值,其训练误差曲线、泛化误差曲线如图2所示.在  

入向量分别与N个中心向量的距离;B、C层之间权值为Γi(i=1,2,…,N),

1󰃗Γi代表高斯函数

宽度;C层神经元函数为高斯函数OutCi=

exp(-(InputCi)2),OutCi是C层各神经元的输出,InputCi是C层各神经元的输入;C、D层之间权值ΑE层之间为完全连i是高斯函数的系数;D、

接,权值为Ξij(i=1,2,…,N,j=1,2,3,4);E层神经元的函数为sigmoid函数:OutEj=1󰃗[1+exp(-InputEj)],InputEj是E层各神经元的输入,OutEj是E层各神经元的输出,也是网络的最终输出,代表地物的变化情况.

1.2.3 样本选取及网络训练 样本的选取利用VB与MapObject组件结合编程,叠加校正配准后

图2 神经网络训练误差与泛化误差曲线图

Fig12 Trainingerrorandgeneralizationerror

curvesoftheneuralnetwork

的遥感影像与矢量图层,同时获取已知变化区域中的2种数据:编码后的矢量图层中某地物的名

 第6期  

孙燕楠等:基于神经网络的GIS和RS数据融合905

50000步时,平均的训练误差为0.0826,平均的

训练结束的网络的实际输出与期望输出对照如表3所示.

泛化误差为0.1061.对于部分测试样本,某一次

表3 网络的实际输出与期望输出对比

Tab13 Contrastbetweenrealoutputsofthenetworkandexpectedones

No.123456

0.03280.96840.99990.00060.05180.0032

网络实际输出

0.99990.00530.00250.99980.99900.1090

0.95880.28400.86140.00240.99350.9226

0.09360.047700.99910.99990.3080

011000

期望输出

100110

101011

000110

所代表含义

Farmland->ResidentLake->MarshLake->LakeFarmland->Farmland

Lake->SalinaResident->Grass

1.3 融合结果及对属性数据库的更新

移到新的记录中.设原记录有30条,则添加记录为 FID 31ShapePolygonID0Area(m2)2417

网络训练到50000步时,已经达到了误差精度的要求,所以固定网络权值,此时的网络就可以用来直接对矢量层的属性数据和遥感影像的RGB值进行融合.训练过程所花费的时间虽然最  但本文中矢量图层的边界变化目前还不能自动修正并在图层上显示出来.

长达3h,但比起手工更新过程要快很多,而且网络只要训练到期望的误差范围,就可以直接用于融合过程.图3为Resident矢量层与遥感影像叠加图的一部分.设鼠标所在处为图3箭头所指的区域2(resident).“R”、“T”的ASCII码和此处的像素RGB值组成了输入向量,代入已经训练好的权值固定的网络,得到输出为Resident→Grass的改变.图3中,2(resident)属于Resident层,其在属性数据库中的记录为FID37

ShapePolygon

ID0

Name2(resident)

Area(m2)2417

2 结 语

利用神经网络融合GIS与RS数据,只要知道某点原矢量图层的名称及这一点所在影像的RGB值,就可以通过训练好的网络得到正确的地

物变化情况,并通过编程实现属性数据的添加与删除.本文根据RS更新GIS数据库这一目的,提出了神经网络的数据融合方法,同时利用RS与GIS两种数据,直接得到结果,没有频繁费时的转

换,所以数据融合方法可以用于实现GIS与RS的整体集成.目前还有待进一步研究的是:矢量图层地物边界的变化更新;RS与GIS结合实现其他目的时采用的具体融合算法.

参考文献:

[1]刘妙龙,吴原华.时间2空间GIS时空数据库基础模

型初探[J].同济大学学报,2004,32(2):2292233.

[2]朱文泉,陈云浩,潘耀忠,等.基于GIS和RS的中国

图3 Resident矢量图层与遥感影像叠加部

分图

Fig13 PartoftheResidentvectorlayerand

remotesensingimageoverlay

植被光利用率估算[J].武汉大学学报,2004,29(8):

6942699.[3]MATIN

F,

CALERA

A,

DOMINGUEZA.use

by

combining

Monitoringirrigationwater

用delete函数将该记录删除后,在Grass层的属性数据库中用addnew函数添加记录,并将面积值转

irrigationadvisoryservice,andremotelysenseddatawithageographicinformationsystem[J].

Agric

906

WaterManage,2003,61(2):1112124.

大连理工大学学报

第45卷 

ComputandElectrinAgric,2002,31(2):2012209.[7]SEEL,ROBERTA.Multi2modeldatafusionfor

hydrologicalforecasting[J].ComputandGeosci,2001,27(8):9872994.

[8]温秀萍.RS、GIS技术在福建省1∶250000地理地图

[4]NINAK,KARINT.WebGISformonitoring

″SuddenOakDeath″incoastalCalifornia[J].

Comput,EnvironandUrbanSyst,5272547.

[5]李德仁,关泽群.空间信息系统的集成与实现[M].

2003,27(5):

数据库编制中的应用[J].

1072112.

福建地质,2002(2):

武汉:武汉测绘科技大学出版社,2000.1232124.

[6]SHANER,ZHANGN,TAYLORK.Development

ofafield2levelgeographicinformationsystem[J].

[9]刘敏华,萧德云.基于相似度的多传感器数据融合

[J].控制与决策,2004,19(5):5342537.

DatafusionofGISandRSbasedonneuralnetwork

SUN Yan2nan, HAN Min

1

31

22

, WANG Jiao2he, SUN Zhong(1.SchoolofElectr.andInf.Eng.,DalianUniv.ofTechnol.,Dalian116024,China;2.SongliaoRiverWaterResour.Comm.,Minist.ofWaterResour.,Changchun130021,China)

Abstract:Geographicinformationsystem(GIS)isakerneltechnologyoftheearthobservation.

Remotesensing(RS)isanimportantexternalinformationsourceofGISandausefultoolforrenewingdata.Ontheotherhand,GIScanassistinanalyzingRSdata.IntegrationofRSandGISisanimportanttoolforcollecting,managingandanalyzingthespatialinformation.Forthispurposenowthescholarsarestudyingthebasaldatastructureforintegratingthetwotypesofdata.AmethodofdatafusionofGISandRSisprovidedusingtheneuralnetworkwithunchangingdatamemorystructurebasedonusers′aim.A52layernetworkisconstructed.

Inputsofnetworkarethe

characteristicvaluesofRSandGIS.Thenthedistancebetweentheinputvectorandcentervectorsandthevalueofthecentervectorstodetermineweightsofthenetworkareadjusted.Atlasttheoutput,thechangedattributevalue,isusedtoupdatedatabase.ThevalidityofthismethodisverifiedbysupervisingthelandcoverchangingwithZhalongTMimageandthevectormaptoupdatetheattributedatabase.

Keywords:geographicinformationsystem;remotesensing;neuralnetwork;datafusion

因篇幅问题不能全部显示,请点此查看更多更全内容