数据可视化笔记6 空间数据可视化
概括
坐标系:地理坐标系、投影坐标系、投影
空间数据格式:矢量、栅格
空间数据可视化:点数据、线数据、面数据、等值线/等高线图 不同空间数据可视化中需要注意的问题
文章目录
空间数据概念
空间数据(Spatial data)
在某些空间区域的多个地点取得观测
如果同时获得了这些地点的位置,并且位置与观测相关联,则称之为空间数据
探索空间数据最简单的方法就是用地图,把数据放在地理坐标系中,以经纬度表示位置
坐标系介绍
地理坐标系:为球面坐标。参考平面是椭球面,坐标单位:经纬度
投影坐标系:为平面坐标。参考平面是水平面,坐标单位:米、千米等
投影:地理坐标转换到投影坐标的过程。(将不规则的地球曲面转换为平面)
地理坐标系
地理坐标系如何定义:即参考椭球面的标准,地球是一个不规则的球形,因此若用经纬度去定义地球上的位置,一定会对地球做相应的抽象。
投影坐标系
将地球椭球面上的点通过建立点与点之间函数关系映射到平面上的方法,成为地图投影
投影的理由:
地理坐标为球面坐标,不方便进行距离、方位、面积等参数的量算;
地球椭球体不可展曲面;
地图为平面,符合视觉心理;
地理坐标系是个“球”
将球面坐标转化为平面坐标的过程便是投影,投影所需要的必要条件是:
任何一种投影都必须基于一个椭球(地球椭球体);
将球面坐标转换为平面坐标的过程(投影算法);
简单的说投影坐标系是:地理坐标系+投影过程(算法)
地图投影
地图投影模式
等角投影(conformal):保持局部角度和形状,可正确显示方向
等面积投影(equal area):保持面积,但角度和形状失真
等距离投影(equal distant):保持距离,但面积和角度变形
地图投影类型
圆柱投影(Cylindrical):将球型表面映射到圆柱上
圆锥投影(Conic):将球型表面映射到圆锥上
方位投影(Azimuthal):将球型表面映射到平面上
从投影面与地球位置关系划分为:
正轴投影:投影面中心轴与地轴相互重合
横轴投影:投影面中心轴与地轴相互垂直
斜轴投影:投影面中心轴与地轴斜向相交
相切投影:投影面与椭球体相切
相割投影:投影面与椭球体相割
亚尔勃斯投影:投影时经纬线长度做了相应的比例变化
等面积圆锥投影,可正确显示面积
方位角投影:地图上任何一点沿着精度线到投影中原点的距离保持不变
麦卡托投影:将地球的经纬网投影到圆柱面上,将圆柱展位平面后,获得麦卡托投影后的地图
等角圆柱投影,局部角度和形状不变,
空间数据格式——矢量和栅格
栅格数据:点实体由一个栅格像元来表示;线实体由一定方向上的栅格像元来表示;面实体由具有相同属性的相邻栅格像元的块集合来表示。
矢量数据:矢量数据一般通过记录坐标的方法来尽可能的将地理实体的空间位置表现的准确无误。
点数据:在二维空间中,点实体可以用一对坐标(x,y)来确定位置
线数据:用坐标串的集合来表示,如(x1,y1)、(x2,y2)、(x3,y3)……(xn,yn)
面数据:记录面实体通常通过记录面状地物的边界来表现,因而有时也称为多边形数据,表示方式也是通过坐标串(x1,y1)、(x2,y2)、(x3,y3)……(xn,yn)来记录
点数据的空间可视化
散点图
北京市大学分布散点图:
散点图 - 小图标
小图标:
直观符合常识
符号种类不易过多
配有图例解释
由于数据分布不均,容易导致在数据密集区域出现大量的数据相互遮盖现象。解决这个问题可以采用以下方法:
-对区域做网格化处理,即分箱:在每个网格内统计相关数据,
-可以使可视化粒度更细,使提供的信息更完整,例如热力图。通过合适的重建或插值算法将数据转成连续的形式呈现
-将重叠的点在一个目标位置周围的小范围内随机移动
-透明化标记
-采样
散点图 - 分箱
北京市大学分布散点图:
气泡图
线数据的空间可视化
地铁/公交图
北京地铁线路图:
流式图(Flow map) - 人口迁徙
流式图 (Flow map) - 飞行航线
Varflight实时飞行航线图:
流式图(Flow map) ——线捆绑算法
线数据中值得关注的一个问题是,如何减少重叠和交叉的相关算法。
对数据做一定的聚合和抽象
现实生活的启发
面数据的空间可视化
地区分布图(Choropleth)
美国经济衰退/失业率地区分布图:
等值线图(Isopleth)
美国的地热能源潜力:
热力图(Heat Map)
北京欢乐谷区域热力图
等高线图(Contour)
北京市大学分布等高线图(百度地图)