用户名
密码
(30天内有效)
注册
注册

首页 > 案 例 >

刷爆朋友圈的谷歌机器学习速成课程,究竟对规划师有用不?

我要收藏
2018-03-08

阅读数:650

收藏数 3

城市数据派导读

www.udparty.com

3月的第一天,谷歌就为AI开发者和研究人员带来了超级重磅福利:机器学习速成课程上线啦!谷歌的这个免费课程,不仅讲解了机器学习的基本概念和工作流程,也把当红的TensorFlow纳入到了课程里面。


据说,该课程之前主要用于谷歌内部员工的培训,最初旨在帮助谷歌员工对AI和机器学习基础知识进行介绍,已有18000+名员工入学。因此在诸多行业内,引发了相当的关注和讨论。


BigIcy为你测评


1.png

BigIcy

TA的达人主页


数据分析师,曾任职于北京清华同衡规划设计研究院、摩拜单车,现就职于深圳市城市交通规划设计研究中心。既经历过传统规划院的训练,又在最火热的互联网企业中得到过熏陶。在城市大数据研究、空间数据挖掘、机器学习等领域,均积累了丰富的实战经验。


新年伊始是最容易冲动立下目标的时段,身为规划师的你,面对来势汹汹的人工智能热潮,是不是也想加入这个课程里面呢?先别急着憧憬像大片里面的黑客们一样,敲敲代码整个世界都尽在掌握。对于规划师来说,是否需要学习谷歌的这门黑科技课程?我为派友们带来了对谷歌课程的测评。



首先快速了解课程基本情况

谷歌的人工智能学习网站 Learn with Google AI开设的这个免费机器学习速成课程(Machine Learning Crash Course ,MLCC)是基于谷歌的内部课程,最初旨在帮助谷歌员工对AI和机器学习基础知识进行介绍。

 

现在,谷歌向所有人开放MLCC,该课程能提供训练,采用交互式可视化和教学视频以帮助教授机器学习概念。最重要的是在本次发布中,谷歌除了提供了英文,西班牙文,法文,韩文版本,还有普通话版本!MLCC课程中文版网站


正如官网所描述的,这是“机器学习热爱者的自学指南”。课时总长约15小时,包括一系列视频课程、讲座、实际案例分析和实践练习等等。


1520524476206267.jpg

该课程解决什么问题呢?

根据官网介绍,这个课程可以了解 Google 专家针对机器学习方面的关键概念提供的最佳做法。包括:

  • 机器学习与传统编程有何不同?

  • 什么是损失,如何衡量损失?

  • 梯度下降法的运作方式是怎样的?

  • 如何确定我的模型是否有效?

  • 怎样为机器学习提供我的数据?

  • 如何构建深度神经网络?


作为机器学习的课程,课程本身就通过AI,提高了很多技术含量。例如课程的中文音频和中文PPT都是由机器学习技术生成的,真是良心之作啊!

如果你还不知道机器学习到底是什么?我们可以通过课程的第一节视频,3分钟快速了解下(快来听听这AI中文配音!):


几个概念的关系:大数据、云计算、机器学习、人工智能

对于每天埋头于PPT和CAD之间的规划师来说,要想搞清楚这个课程适不适合你,首先,请先问问自己:大数据、机器学习、人工智能这几个概念,听了这么多年,他们到底是什么,有什么样的关系,自己心里真的有数么?

 

先说说大数据

数据是什么?是excel表。没错,那大数据呢?超大的excel表,大到excel装不下,打不开。但终归还是有为大数据设计的excel软件,来打开这个表。这么看来,大数据就是菜市场里的菜,米缸里的米。作为原材料,得有好的烹饪手法,才能出好菜。同样,分析方法用的对,指标选得好,那样的研究成果才能出彩,才能有实际指导意义和价值。

 

从这个角度来看,大数据这个概念是最好理解的。但是具体这个数据有多大才能算做大数据?目前并没有官方权威的解释,只能说,体量庞大,维度很高的数据,都可以被纳入到大数据的范畴中。


再来谈一谈机器学习:监督学习与非监督学习

机器学习这个概念经常跟人工智能一起出现,那么到底让机器学习的是什么呢?先来举一个例子,到菜市场买西瓜,这个经历很多人都有。那怎么才能买到比较甜的西瓜呢?很多人可能会说,观察西瓜的颜色、大小,再用手弹一弹,听听声音,就可以根据各自的“买瓜之道”,挑选出心仪的西瓜了。

对于一个人来说,在菜市场挑上十几个瓜,买回来其中一个,是可行的。但你要让一个人把整个菜市场的所有瓜都敲一遍,看一遍,这一个人就忙不过来了。但是你可以把你的“买瓜之道”总结一下,颜色多绿,大小多大,声音听起来是什么样子的瓜最甜,让其他人帮你来一起挑。那么,机器学习中的监督学习,干的就是这么一件事情。

1520524892573632.jpg


简单来说,监督学习就是通过提取、总结、归纳历史的特征经验(买过的瓜的颜色、大小、弹瓜的声音),输入给计算机这些特征对应的结果(买过的瓜甜不甜),达到预测结果(新买的瓜甜不甜)的目的。

640.jpg


机器学习中与监督学习相对的另外一大类方法,称之为非监督学习。非监督学习与监督学习之间最大的区别,在于非监督学习只对数据集基于特征本身进行归纳分类,而并不做基于特征的预测。

1520524975546278.jpg

还用刚才西瓜的例子来说,如果将西瓜的颜色、大小、弹瓜的声音三个特征放入非监督学习模型中,模型给出的结果,是将每一个瓜,基于模型自身的算法特点,分入一个类别中去,从而将所有的瓜分为了若干类。而对于每一类瓜到底是为什么被分在一类中的,是都很甜?还是都很大?还是又大又甜?这就需要研究者基于分类的结果,自己进行近一步总结了。


非监督学习可以帮助你根据特征进行分类,但分类的依据,则需要自己近一步归纳。

 

最后看一看人工智能

了解完机器学习的基本功能后,我们再来看一看人工智能。人工智能是通过一系列以计算机科学为基础的技能组合,达到对人类智力与能力的延伸的前沿学科。在组成人工智能的计算机技术中,就包括了机器学习、计算机视觉这样的学科。而且机器学习是人工智能中重要的组成部分。

1520525046917680.jpg

依然用买瓜的例子来说,假如现在我们已经构建了一个基于瓜的颜色、大小、声音来预测瓜的甜度的监督学习模型,但是距离创造一个全自动买瓜的人工智能,还有很多工作要做。想要创造一个“买瓜神器”人工智能,我们需要构建一套图片识别系统,基于摄像头就可以自动识别出西瓜,并让预设好的程序来通过图像识别出每个瓜的大小、颜色。


我们还需要一个机械手臂,模仿人手弹瓜的动作,再通过麦克风把弹瓜的声音采集回来,辨别弹瓜声音的具体波形和特征。有了这些前置铺垫,才能将每一个瓜的特征自动化测量出来。


到了这一步,再把这些特征输入到我们的监督学习模型中,才能得出这个瓜甜不甜的结果。所以说,人工智能是一系列计算机技术的集合,而机器学习,则是人工智能中的核心技术之一



谷歌这个课程,讲的是上面几个概念中的哪些部分呢?

现在,我们再回头看看,谷歌的这个课程,讲的到底是上面几个概念中的哪些部分呢?从课程的名字就可以看出,这个课程主要讲机器学习。更具体的,整个课程的绝大部分篇幅和技术,是针对监督学习的。


从刚才买瓜的例子中也可以体会到,监督学习也是当前在实际的、相对成熟的行业应用中,使用较多的技术手段。毕竟预测的结果可以直接指导下一步的判断与计算,而非监督学习还要再归纳、再总结,在例如预测点击链接、购买商品、贷款偿还等实际场景中,我们的确需要具体的预测结果来辅助判断。


这是谷歌机器学习课程目录:

1520525132472496.png


通过浏览机器学习概念这一部分的章节大纲,也可以发现,课程所主要关注的技术细节和概念,均集中面向监督学习。

 

Python

1520525220500571.jpg

分析过课程主要内容,再来看一看使用的工具。课程是以python作为讲授语言进行代码演示的。python在近年来的数据分析工作中,因其粘合剂的特性和第三方机器学习工具包的支持众多,而受到了数据分析行业的欢迎,相信很多规划师也有所耳闻。

 

第三方库

另一方面,课程使用python的原因,是因为在机器学习模型构建的过程中,大量使用tensorflow工具包来搭建模型。第三方库就是将算法或程序功能封装好供他人直接调用的代码集合。以tensorflow举例,使用者可以通过直接调用tensorflow中已经定义好的功能,达到快速搭建机器学习模型的目的,从而不必自己来编写机器学习模型所需的底层算法和功能,大大提高了代码的编码效率。像tensorflow一样的机器学习第三方包在Python语言中还有很多,比如scikit-learn,pytorch等,他们均在不同的机器学习场景中被广泛使用。




那么机器学习在规划圈的应用情况如何呢?

目前,机器学习在城市规划行业中的应用,还处在比较初级的阶段。最关键的一点是,城市规划的场景中,像买瓜这样,通过若干特征(西瓜的大小、颜色、声音),来预测某一目标(甜度)的逻辑框架非常少,无法很好的套用到机器学习的框架中去,这也就导致了虽有大量有识之士前赴后继前来挑战,但实际的成果,特别是应用到规划实际工作中的,却寥寥无几。


之前看过有人基于街景图像进行的街道空间研究,但即使有了像街景图片识别这样的实际需求,在机器学习模型构建过程中,仍需要大量的人工标注,来给模型提供足够的样本量进行训练(也就是要有大量的人去试吃每一个瓜,告诉模型到底有多甜)。这一问题不仅阻碍着城市规划行业对机器学习的近一步应用,也是其他行业在应用机器学习时,所遇到的普遍困难。

 

谷歌这个课程适合规划师学习吗?

官网对课程的学习者提出了要求:

  • 掌握入门级代数知识。你应该了解变量和系数、线性方程式、函数图和直方图(熟悉对数和导数等更高级的数学概念会有帮助,但不是必需条件);

  • 熟练掌握编程基础知识,并且具有一些使用Python进行编程的经验。

  • 机器学习速成课程中的编程练习是通过TensorFlow并使用Python进行编码的。你无需拥有使用TensorFlow 的经验,但应该能够熟练阅读和编写包含基础编程结构(例如,函数定义/调用、列表和字典、循环和条件表达式)的Python代码。


也就是说谷歌速成课程对学习者的python基础和代数基础做了一定的要求。代数基础方面,规划师在大学所学的高等数学内容,基本可以满足课程中的要求。课程中对python的基础要求,包括python原生代码的编写语法,还有pandas(python中常用的数据分析第三方包)的基本操作和使用。


我们再看谷歌课程,现阶段里面能够让规划师学来直接用的,可以说只占非常少的一部分。由于目前城市规划行业的工作流程、及其所面对的实际问题,难以套用机器学习模型的逻辑框架。

 

所以,当下规划师更应该关注的,是如何在规划分析中,有意识地去构建适合用机器学习去解决的问题模型


在这些问题上,笔者曾进行过一些尝试,包括对POI(Points of Interest,兴趣点)、出租车OD、人口活动曲线进行非监督学习中的聚类,达到对城市地块进行画像的目的。也包括对包含人口、职住、交通、商业等信息在内的多维数据进行特征提取,预测这些因素对人口年龄构成的影响等。因此,在笔者看来,在了解机器学习算法的基础之上,再去探索如何将机器学习应用在城市规划中,会更有针对性,也会达到更好的效果。


是否有为规划师量身打造的机器学习课程?

对于大多数都是python零基础的规划师来说,则需要在学习谷歌课程之前进行学习,否则难以跟上课程内的进度。笔者结合自身多年的实战经验,精心制作了一套在线视频课程《使用Python进行城市研究系列课程》总共包括4个专题课程:

1520525448293072.jpg


其中,【使用Python进行城市研究系列课程1】面向城市规划分析的Python基础语法入门是专门为零基础的规划师进行了python语法的零基础讲解,使得规划师可以在较短的时间内,迅速的上手python的基础语法,为接下来的机器学习模型构建所需的python代码编写打好基础。

1520525555755544.jpg

1520525577961287.jpg


使用Python进行城市研究系列课程2】使用Python获取常用城市数据对当下最主要的两类爬虫方法——网页爬虫和API爬虫——进行入门讲解和实战演练。通过对网页结构的基础知识进行介绍,同时对网络爬虫的概念、逻辑、设计思路和实施方法进行详细的演示,使零基础学员能够对网络爬虫有系统的了解与认识,并建立自己抓取数据的能力。

1520525680451765.jpg

1520525680929499.jpg


另一方面,在谷歌课程中并未系统介绍的pandas数据分析工具,在【使用Python进行城市研究系列课程3】使用Python进行大数据清洗、处理与复杂统计中进行了专题讲解,通过具体实例,系统的介绍了pandas的使用方法,从数据的基础清洗、处理,到统计、计算和高级分析,均有所介绍,可以很好的作为谷歌课程的前置学习资料。

 

在现实世界的应用实例中,谷歌课程以癌症预测和18世纪文学两个应用案例作为介绍,对于规划师来说,与自身平时的工作内容相距甚远,代入感较差,难以通过学习推广至平日的工作中来。


而【使用Python进行城市研究系列课程4】城市研究中的Python机器学习实践,则以规划师更为熟悉的房价预测、北京地块用地画像作为案例,使规划师在学习过程中,迅速增强代入感,从而能够更好的将所学机器学习的模型构建和思维方式代入到工作层面。

1520525787634361.jpg

1520525787962847.jpg

1520525787179967.jpg


总体来说,谷歌的这门机器学习课程诚意满满,在最短的时间内将机器学习的工作流程,重点方法清晰明了的进行了讲解。因此,对有一定python基础的、有志于探索机器学习在城市规划行业中应用的规划师来说,这15小时是值得一学的。

 

对于希望入门学习的规划师来说,笔者则建议将此课程与《使用Python进行城市研究系列课程》进行配套学习,在打好基础的前提下,谷歌的这套课程学起来才会更有针对性,收获更大。



本站声明

本文仅代表作者观点,不代表城市数据派立场;
本文系作者授权城市数据派发表,未经许可,不得转载;
本网站上的所有内容均为虚拟服务,一经购买成功概不退款,请您理解。

分享:
点赞0

全站浏览排行

TOP ARTICLES
  • 联系城市数据派
    info@udparty.com
  • 顶部