大数据与城市规划
第一章 课程概况习题
1新数据的出现使得城市规划与城市研究更加深入,下面哪个不属于新数据(大数据+开放数据)?
A、 公共交通刷卡记录数据 B、 人口普查公报 C、 社交媒体数据 D、 手机信号数据
解析:新数据为大数据以及公开数据,人口普查公报是汇总的数据,也是传统数据,因此不属于新数据。
2、请问以下数据几何形式上属于哪种类型?
A、 线状数据(polyline) B、 面状数据(polygon) C、 点状数据(point) D、 以上皆非
解析:根据图片的点状分布以及核心字段的说明,可推断出本数据为point点状数据。 3、下列关于“街道步行指数”核心字段的解释,下列叙述哪个不恰当? A、WalkScore:街道步行指数,是街道可步行性的综合指标
B、 function_density:街道功能密度,以街道的商业建筑面积密度做参考 C、function_mix:街道功能混合度,一个区域内设施的功能多样性
D、junction_density:道路交叉路口密度,街道周边一定范围内的道路交叉路口数量与面积的比值
解析:unction_density:街道功能密度是以计算该街道的兴趣点POI密度。公式如下: 4、请问以下哪个字段不包含在“ResidentialCommunity居住小区”数据里? A、小区占地面积 B、小区内容积率 C、邻近设施状态 D、小区住房成交量
解析:此字段不包含于该数据中
5、下面哪项属于本课程的教学内容?
A、数据抓取 B、数据分析 C、数据可视化 D、数据增强设计 E、以上皆是
第二章 变化中的中国城市与未来城市
1、 以城市规划学科而言,下面对于城市的定义哪个不恰当? A、 行政地域是一般大家所熟悉的城市范围,其边界大多依据历史、地理等要素划定 B、 实体地域是指利用地形地貌所刻画出来的适宜城市建设的范围
C、 功能地域侧重于实质功能上的关联,如:通勤交通所体现的劳动力市场
解析:实体地域是实际情况下城市化的土地,一般以城镇建设用地的范围作为表征。 2、 关于当前中国城市的叙述,下列叙述哪个不恰当?
A、现在的行政地域与真实的城市状况有所出入的,不足以客观表达中国的城市化进程以及中国城市的基本规模和分布
B、过去的人类社会发展属于“硅基文明”,演化进程相对于“碳基文明”更为缓慢
C、互联网的发展虽为人类带来了高效与便捷,却也出现了碾压城市空间,造成城市空间凋敝甚至是衰败等现象 解析:人类社会发展以来长期属于碳基文明,如今,硅基文明以更低耗的进化速率席卷而来,驱动着世界朝向更高阶层的进化。
3、 近几年中国城市正在面临各种变革,以下何者为本章所提及的变化之一? A、 全天候在线化 B、 小型化 C、 居家化 D、 以上皆是
解析:以上三种皆为本章提及的 \当前中国城市所面临的变化\。 4、 智能化的快速发展逐步冲击各行各业,下列叙述哪个不恰当? A、 亚马逊的无人商店 Amazon Go 有自动识别商品、自动结账等技术,对传统零售商产生
较大冲击 B、 国际四大会计事务所之一的德勤与人工智能企业合作,将人工智能引入会计和审计等工
作中
C、 设计师、教职人员、医务人员等职业并不会被智能化的趋势所影响和取代。
解析:阿里巴巴在2016年已经使用了智能机器人“鲁班”设计商品广告的海报。在不久后,教职人员、分析師、医务这些以往被认为无可取代的工作,都有可能受到智能化的趋势所影响。
5、 下列关于“共享化”趋势的叙述,下列叙述哪个不恰当?
A、 近年来,“共享”概念在城市里蓬勃发展,闲置物品、空间,甚至是知识经验获得了
更有效率的重新分配或交换,同时也对城市空间带来了巨大影响 B、 在北上广深等城市,共享单车仍旧无法改善交通盲点(以公共交通工具服务半径无
法到达的区域)的困境
C、 不只是交通设施的共享化,从Maker Space、Co-working Space、Co-living Space
等共享空间的出现说明了城市空间也越来越注重此趋势
解析:在北上广深等城市,共享单车对交通盲点的覆盖超过99%,甚至达到全覆盖。
第三章 城市数据类型和数据介绍
1、 下列何种数据不属于“传统数据” ? A、 航拍影像图 B、 社交平台签到数据
C、 中国城市建设统计年鉴
D、 北京市家庭交通出行调查问卷
解析:社交平台签到数据属于新数据类型
2、 下列关于新数据环境的叙述,下列叙述哪个不恰当? A、 近年来,随着信息通信技术与物联网技术的发展,大数据与开放数据共同构成了“新数
据环境” B、 与传统数据相比,新数据环境主要呈现出精度低、覆盖广、更新慢等特点 C、 新数据环境不仅意味着更大的数据量,更反映了数据背后关于人群行为、移动、交流等
活动的丰富信息 D、 新数据环境的特点与新型城镇化时期“以人为本”、“存量更新”、“自下而上”等城市规划理
念不谋而合,被认为是促进城市规划科学化与城镇治理高效化的有力工具
解析:与传统数据相比,新数据环境主要呈现出精度高(以单个的人或设施为基本单元)、覆盖广(不受行政区域限制)、更新快(每月、每日、甚至每分钟更新)等特点。 3、 兴趣点(Point of Interests, POIs)为一种常见的城市数据,下列叙述哪个不恰当? A、 多以“点状数据型态”呈现 B、 是目前城市规划分析领域使用较广的数据类型 C、 用以标示出该地所代表的政府部门、各行各业之商业机构、旅游景点、古迹名胜、交通
设施等处所 D、 就目前的技术与数据环境而言,尚属于较难获取的数据类型
解析:目前多个互联网公司如导航公司、在线地图等均提供兴趣点获取的API,即应用程序编程接口,可通过其获取。
4、 关于“数据有偏性”,下面哪个是适当的应对方法? A、 可以充分利用数据的有偏性,并与其他有偏数据研究互补 B、 利用有偏数据并不会影响关注整体的行为特征 C、 新数据类型的偏差并不会影响研究结果的可信性
解析:(B) 关注局部整体的行为特征。 (C) 新数据类型的偏差使得研究结果的可信性受到质疑。
5、 关于当前城市大数据所面临的问题,下列叙述哪个不恰当? A、 新数据大多不是为城市研究“量身定做”,但是仍旧可以作为传统数据的重要补充 B、 目前城市大数据的分析多见于图片的元数据或文本数据,而对信息量最为丰富的图片内
容挖掘较少,还有较大的信息挖掘空间 C、 在新数据环境下,各种不同数据平台或是用户所提供的空间数据精度都相当一致,有效
地提升了研究结果质量 D、 利用新数据的城市研究需要一些经典的共享数据集,作为标准来对各种研究方法与结果
进行比较
解析:各平台的空间定位精度不同是目前数据存在问题之一,同时用户刻意提供不正确或者假冒(location spoofing)的地理坐标,也会影响数据的空间定位。这些不确定空间位置信息对于研究结果质量的影响将会被放大。
第四章 城市大数据的获取与清洗
1、 以下哪一种方式属于当前城市空间大数据的获取方法? A、 人工搜集大量数据 B、 直接购买数据
C、 购买抓取数据的服务 D、 研究组织共享的大数据 E、 学习数据抓取的技术并自我实践 F、 以上皆是
解析:有些数据不是直接呈现在网页上,不能直接爬取,比如:以可视化方式呈现的百度迁徙网页,但是抓包工具可以实现这种数据的爬取 传统数据
2、 请依序排列结构化网页数据采集的步骤: 甲、地理编码及坐标系统转换;乙、将获取
的网络开放数据保存在本地; 丙、数据的清洗、预处理;丁、定位查找数据源的网络地址
A、 甲→乙→丙→丁 B、 乙→丙→丁→甲 C、 丁→乙→丙→甲 D、 甲→丙→乙→丁
3、 以下对于抓包工具及其抓取数据的说明,下列叙述哪个不恰当? A、 抓包工具只能针对直接呈现数据列表的网页进行爬取 B、 抓包工具的原理是查找数据源从而得到相应数据,通过抓包方式得到完整JSON并字段
化 C、 除了电脑端网页的数据,也可以通过安装Fiddler软件等软件进行手机端的网页抓包 解析:有些数据不是直接呈现在网页上,不能直接爬取,比如:以可视化方式呈现的百度迁徙网页,但是抓包工具可以实现这种数据的爬取。
4、 以下对于Google Earth Engine的说明,下列叙述哪个不恰当?
A、 GEE(全称Google Earth Engine)是一款可以批量处理卫星影像数据的工具,属于
Google Earth的系列工具
B、 相比于传统的处理影像工具,GEE可以快速、批量处理数量“巨大”的影像
C、 GEE可通过影像分析全球植被指数,但是还无法预测作物相关产量和监测全球森林变
化
D、 GEE可以做全球尺度、长时间序列的数据分析出图,是地球科学领域的强大工具 解析:通过GEE可以快速计算比如NDVI等植被指数,可以预测作物相关产量、监测旱情长势变化、监测全球森林变化等。
5、 以下关于地理坐标系的说明,下列叙述哪个不恰当? A、 坐标体系(GCJ-02),又称“火星坐标”,由国测局2002年发布,是国内广泛使用的坐
标系
B、 地面上任一点的位置,通常用经度和纬度来决定,这两组正交的曲线构成的坐标,称
为地理坐标系
C、 坐标系统的不同,会导致空间位置无法完全匹配,需要进行坐标纠正 D、 百度、搜狗等公司目前都开发了自己的坐标体系,一般是由火星坐标GCJ-02经过偏移
算法得到,各个互联网公司之间的坐标系非常兼容
解析:不同公司开发的坐标体系一般与其他坐标体系不兼容
第五章 城市大数据的统计与分析
1、 以下对于空间数据的概述,哪一项是正确的? A、 空间数据分成点、线、面,并且每一个空间数据都带有标签及属性 B、 空间数据的分析主要由两方面组成,分别是空间分析和统计分析 C、 空间数据是城市大数据的主要组成部分 D、 以上皆是 解析: