用户名
密码
(30天内有效)
注册
注册

首页 > 资料下载 >

大数据时代的地理信息科学与科研能力培养

我要收藏
2015-08-08

(来自全国地研联对刘瑜的采访)

刘瑜,北京大学遥感与地理信息系统研究所教授。目前主要研究方向包括:1)地理信息科学领域的若干理论问题,包括地理空间认知与推理、空间数据不确定性;2)基于海量时空数据的行为模式分析;3)地学分类问题;4)基于对象的遥感图像分析等。参与或负责科研项目十余项,发表论文100余篇,其中SCI/SSCI收录40余篇。目前任Computers,Environment and Urban Systems副主编、中国地理学会青年工作委员会副主任。

 

各位朋友、同学,很高兴有今天的交流机会。我准备从三个方面分享自己的一些想法:首先简单介绍一下个人的经历以及最近开展的研究;其次,分享一下最近关于地理学与地理信息科学的一点思考;最后,对于研究生同学的学习和科研,谈一点期望和建议。

 

1、关于个人经历以及最近的研究

自己本科是人文地理学专业的,研究生转到地理信息系统方向,导师是周一星教授和邬伦教授,当时周老师希望自己做一些利用GIS进行城市群研究,可当年自己是全力投入到软件开发中,那时在邬伦教授带领下,开发了当时在国内比较知名的GIS软件:城市之星,而研究工作相对就做得较少。在软件开发过程中,认识到软件工程的价值,所以在1999年师从杨芙清院士攻读软件工程方向博士。在博士阶段学习过程中,自己觉得获益最大的方面是培养了对于复杂问题的抽象建模能力。


城市之星的开发最终还是没有成功,自己的工作重心转到科研,在08年之前,主要从事GIS模型方面的研究,包括空间关系、不确定性等,简而言之,就是探讨人如何理解和认识地理世界,并在此基础上形成概念模型。在08年之后,主要侧重于大数据研究,即通过建立新的空间分析方法,提取海量个体的时空行为模式并进而解释其背后的地理影响。由于城市是人类活动最密集的区域,也是产生各种大数据最多的区域,这方面工作很自然的和城市及区域研究相结合,所以最近和周老师汇报说自己的工作重心又重回城市地理学了,也算在二十多年后实现了先生当初的期望,周老师也很欣慰。


最近,我们研究团队在基于不同类型数据进行实证研究的基础上,提出了社会感知概念,认为时空大数据使得研究者基于人的时空行为特征感知并理解地理环境特征成为可能,对于地理学尤其是人文地理学研究具有重要意义。在社会感知中,每个居民个体扮演了传感器的角色,所获取数据涵盖了人们的活动和移动、社交关系以及情感和认知三个方面的行为模式,而这些模式在聚集层面上则有助于认识用地类型、空间交互以及地理语义等空间特征及演化过程。我们指出集成社会感知和传统遥感技术是联系人文地理学和自然地理学的一条可行途径,可以帮助全面研究地理环境,而在使用社会感知数据时也需要注意一些问题,如数据质量、代表性、时空尺度等。

 

2、关于地理学与地理信息科学的一点思考

GIS形式化了地理学的基本概念、基本知识、以及基本分析方法。例如,GIS利用栅格模型和矢量模型表达了地理现象的空间分布以及不同地理对象的特征,同时GIS实现了一系列分析方法,体现了地理学研究中的一些基本概念。举例而言,Tobler地理学第一定律表达了距离对于地理现象的影响,实际上蕴含了两个方面的含义,一个是地理分布的相似性,即空间上越近的地方属性越相似,二是空间联系的强度,距离越近的两个地物,空间联系和交互相对越强。在GIS中,空间插值、空间自相关度量、分布模式检测等体现前者,而重力模型等则用于量化后一方面。


地理学作为一个学科,其科学性经常受到质疑。我们经常需要回答,地理学研究某一特定问题(如移民),和其它领域(如经济学和社会学)研究同一问题,有什么区别。简而言之,地理学者是在一个地理空间的框架中研究这些问题,必须要考虑地理空间的特点。在地理研究中,空间分布的异质性、距离影响、尺度效应都是必须要要注意的问题。比如,我们需要了了解由于空间自相关的存在,在进行相关分析时需要考虑样本独立性假设是否成立。而地理分析没有天然的空间单元,在分析中需要注意可变面状单元问题(MAUP),即对研究区采用不同的划分方式,得到的分析结果可能就会有差异。因此,在进行地理分析时,需要对上述问题有深刻的认识,而如前所述,GIS恰恰通过一系列分析方法和工具处理上述问题。


作为结论,GIS对于地理学的科学化具有重要的意义,北大承继成先生曾经说过,地理信息系统就是地理学,而在西方学界甚至有GIS拯救了地理学的说法。考虑到地理学的学科特点,自然地理学不同方向(如水文、土壤、气象)很容易在对应的专门学科找到落脚点,而人文地理学则肩负了坚守地理学核心价值的重任,更需要好的方法和工具的支撑。在中国,人文地理学发展相对落后于自然地理学。如前所述,大数据时代带来了社会感知,能够透过海量人群的时空行为模式研究地理环境,对于地理学尤其是人文地理学是个很好的机遇,而对于GIS也是一个挑战,需要GIS研究新的分析方法和工具,为不同应用提供支撑。简而言之,人文地理学者需要和GIS学者联起手来,共同应对大数据带来的机遇和挑战,研究地理学核心问题,并最终服务于解决社会问题。

 

3、对研究生尤其是硕士研究生的建议

实际几年前自己写过对于GIS专业硕士研究生的建议,现在看来,也不算过时,并且对于其它专业也还合适,再把它翻出来,分享给同学们。概括而言,研究生阶段主要目的是学习到一技之长,为后面的工作,不论是学界、业界还是政府部门的工作,打下基础。


与攻读博士主要是为了以后走学术之路相比,硕士研究生阶段的三年,目的可以更多样化。一般来说,它可以被视为参与工作的锻炼和缓冲(或者提升)期,以及进入学术研究的起步期。从这个意义上来讲,自己并不反对学生出国,同样的,出国的目的也是要明确。对于希望进入学术界的学生,我觉得更有出国的必要。不论是上面两个目的的哪一个,有两个基本能力的培养非常重要,一个是学习能力,一个是沟通能力。当然,这两个方面都不是仅仅在研究生阶段建立的,但是如果到了研究生阶段还没有很好地建立的话,那么必然会影响将来的发展。首先说前者,因为现代社会各方面都发展迅速,是个终生学习的社会,所以学习能力很重要,而学习能力的关键是对被学习事物的兴趣。其次,沟通能力包括表达能力和理解能力,它是情商的主要构成,我们往往说“情商比智商更为重要”,就是这个道理,当然,情商也包括其它一些方面,比如自制力、同情心等等。这里单提沟通能力,是因为它可以提高,比如一些学生说话吞吞吐吐,影响表达,我希望他们有意识地多加锻炼。


下面说到专业的学习了,对于目标是毕业后工作的同学,因为主要是进入各种应用GIS的业务部门,尤其是工作最初可能还是从最基本的工作做起,所以我觉得以下几个方面比较重要,1GIS软件的使用能力;2、掌握一门编程语言;3、学习GIS项目中一些技术文档(如需求分析,系统设计)的写作;4、了解一个GIS项目的组织和管理。而对于走学术研究的学生而言,尽管自己目前主要做理论方面的研究,但是应用研究还是GIS领域的主体。而要做应用研究,首先是地学的功底要比较扎实,也就是说了解问题域,其次是掌握足够多的数学方法和工具。可以形象的比喻为一个三角形,底边反映了你对问题域的了解,高则表示你掌握方法和工具的多寡,最终三角形的面积与这两个方面都有关。这两者对于自然地理学和人文地理学,我想也是同样重要的。总之,做研究包括两个方面,一个是全面了解所要解决的问题,一个掌握各种方法。通常,掌握的方法越多越好,但是如果不知用在何处,也是枉然,就真的是“为了方法而方法”了。


与创造工具的数学家、信息科学家相比,地理学者往往只需要掌握方法原理,用好相应工具就可以了。每年在地学应用领域都会有一些新的方法被引入,比如早一点的人工神经网络,后来的支持向量机,现在的矩阵分解、深度学习、复杂网络等,希望同学们能够掌握。相对而言,如果做GIS应用研究,自己觉得统计学是其基础。而要做理论研究,离散数学的相关知识更为重要。还有一点值得指出的是,即使是做研究,也要具备一定的软件应用和编程能力,否则何以分析数据,何以试验你的想法?


自己很久前也写过指导学生的博客,觉得科研指导可以分为三个层次。这三个层次对于从事科研活动的研究生而言,也许有借鉴意义,也分享给大家。

第一个层面,基本上属于让学生做“体力活”的范畴,就是导师设计好题目,确定了一系列基本方法,并且对于每一步所得到的结果有一定预期,学生做的工作主要是实现具体方法,填充其中的“空隙”。这是最低层面的指导,学生扮演了助手的角色,但是在这样一个过程中,可以得到基本的科研训练。

第二个层面,是导师帮助选定一个较为宽泛的方向,指出需要注意的问题,如问题边界,相关研究现状等,然后放手让学生去做。在这个过程中,需要导师和学生共同商量解决其中可能遇到的困难。

第三个层面,是学生能够自己提出问题,导师基于其经验和视野,评估所研究问题的创新性、价值和难度。如果确定是可做的,基本上由学生独立完成。

基本上这三个层面,对应了本科生、硕士研究生和博士研究生的学习阶段。在第三个阶段后,学生能够自己提出问题、评估可行性、进而确定研究技术路线,那么就算是具备了独立研究的能力,这时导师和学生之间将是合作关系而不是指导关系了。

 

互动问答:

Q:我想请问一下研究中大数据的获取渠道都有哪些呢?网络爬虫还是实地监测,有没有比较好的获取平台之类的?

A:很好的问题,应该说目前大数据还没有很好的获取渠道,政府部门和相关企业往往是大数据的拥有者,由于涉及隐私、国家安全等原因,他们往往不愿意公开共享数据。这使得我们学界处于比较尴尬的境地。但是,我们在实践中也看到很多企业拥有不同类型大数据,但是由于种种原因,没有或者不愿意深入挖掘,这个是学界的机会,我们可以通过合作方式得到他们数据的访问权限。实际我们团队已经开始这么尝试了。

 

Q:刘老师,你有计算机软件工程的背景,你对计算机专业转GIS专业有什么建议,我想听听计算机背景的学生如果考研学习GIS ,我们该如何指导?

A:从计算机转GIS我个人觉得比较容易,在研究中我觉得要加强对于地理空间的认识。前面也略谈了一些,可供参考。换言之,就是如何对地理空间概念形式化,如何表达距离、尺度、分布、交互等地学分析基本要素。

 

Q:刘老师将“社会感知”与“遥感数据”并列,很有创新性!但感觉“社会感知”的数据与“人”密切先关,而“人”是飘忽不定且多变的,这就会是数据效力降低,没有“遥感数据”更硬,刘老师更深入谈一下吗?

A:这个问题很好,我们社会感知的文章也谈了该点,简而言之的话,我们要充分认识到时空大数据的不足和局限,如代表性问题。

 

Q:但我想知道什么样的数据能称之为大数据?我发现不少学者做的大数据方法都是基本的数理方法, 于是我就又疑惑,所谓大数据是指分析的数据量大?亦或有专门所谓大数据分析方法?还是用大数据软件分析就是大数据分析?

A:确实大数据没有好的定义,学界也有不同的看法。个人认为这个词被屡屡提起,实际有赶时髦的原因。我个人倾向于用海量时空数据这个词,但是大数据更简洁,所以也就从众了。就如同于显微镜使得我们能够看到细胞等微小物体,从而促进了生物学发展一样,大数据提供了对海量个体时空行为模式的一种新途径,从而帮助我们更好理解人与地理环境的交互关系。

 

Q:所谓大数据就是一种分析手段或者观测技术?

A:在地理学研究中,大数据两个特点我觉得比较明显,1、与人有关,2、时空标记。它提供了对于时空行为模式的观测手段和相应分析方法,这正是社会感知的定义。

 

Q:大数据是巨量数据,但是在计算机界常常强调云计算或一些分布式处理方法,那么现在地理学上有什么比较好的方法或算法可以应用于大数据研究呢?

A:很好的问题,这是我们GIS工作者面临的重任。简单而言,我觉得时空点模式、时空流模式是亟需GIS发展的。这两方面分别对应了空间分布和联系——它们正是地理学的传统命题。从赫特纳、厄尔曼就在讨论这些问题,而大数据时代到来后,为观测与人有关的分布和流动提供了新途径。

 

Q:刘老师您好:GIS的应用范围越来越广,那些不是学GIS的培训几天也能用的非常熟悉,甚至远远超过学GIS的。我想请教一下刘老师:和非GIS专业相比,GIS 专业的学生在学习方面最主要的区别是什么?还有怎么才能发挥专业知识?

A:很好的问题,这要感谢有了很好的GIS软件。但是会用工具是一回事,在用工具过程中理解其原理则是另一回事,需要对一些概念有扎实的掌握。举个例子,坡度分析大家都会做,但是很少人知道坡度分析结果与分辨率有关,这就是尺度问题,需要GIS专业的训练。再比如,地理分析中大都有MAUP问题,如何处理,也是一个问题,这需要GIS专业人员参与,才能解决的更好。

 

Q:老师,您觉得大数据将来发展的方向是什么?大数据会在哪些方面更加多一些?

A:泛泛说大数据太大了,在地理领域,我觉得最有价值的应用方向就是智慧城市。智慧城市这个词也有些叫滥了,个人认为智慧城市核心是人。而大数据恰恰提供了对人的观测,所以大数据有助于智慧城市规划和建设。

 

Q:听过刘老师的一个报告,启发很大。我想知道 remote sensesocial sense 是否有很好的可以结合得地方?未来可以在哪些方面进行拓展研究?能否举例说明一下?。您觉得未来两方面的结合可以继续在哪些方面拓展呢?

A:我们在做鬼城的研究,集成了遥感和社会感知数据,是一个较好的例子。还是有一些,我们社会感知文章也谈了,如长时间尺度的地理过程观测和建模。现在大数据实证研究所采用的数据往往时间跨度小,反映静态特征居多,而时间跨度更大的数据有助于我们认识地理过程。

 

Q:老师能不能推荐一下研究智慧城市与大数据结合的文章或者研究啊?

A:智慧城市与大数据的文章,可以看看Batty的论著。另外龙瀛提出的DAD(Data Augmented Design),郑宇的城市计算,都值得关注。

 

Q:最后请刘老师谈谈发SCI 论文的注意事项吧?

A:好的,我个人觉的一篇文章最终发表,最关键是创新,你要把你新的地方充分写出来。要么是新方法,要么是新发现。这个在表述中必须清晰,让主编和审稿人认识到你工作的价值。力戒Nothing wrongbut nothing new的文章。再就是论文写作中注意精炼语言,逻辑要顺,这是很多同学容易犯的毛病。举个例子,自己英语水平很难说比我的学生好多少,考GRE的话,他们肯定比我高,但他们写的文章经常会被审稿人指出有语言问题,自己则很少,这其实不是语言问题,而是逻辑问题。逻辑不清楚,别人就不容易懂,再加上语言问题,就更难懂了。

 

Q:为什么期刊只关注学术性理论性强的文章?感觉与实际应用有些脱节,举例说,地理数据组织模型方面,都是用于指导通用平台的,在行业地理信息组织上就比较缺乏,而行业GIS平台建设, 意义更重大,我了解的规划、交通、水利都建的不成功。

A:这位同学的问题有些意思,学术论文还是重视理论性吧,工程实践方面的,除非创新点写得很清楚,否则不易发表。当然,行业数据模型,如果有新意,还是可以发表的。CEUS前年就有三维建筑模型的专辑。


本站声明

本文仅代表作者观点,不代表城市数据派立场;
本文系作者授权城市数据派发表,未经许可,不得转载;
本网站上的所有内容均为虚拟服务,一经购买成功概不退款,请您理解。

点赞0

全站浏览排行

TOP ARTICLES
  • 联系微信客服
    xiaopaipai_udparty
  • 顶部