基于 Java 标准库读取 CSV 实现天地图 POI 分类导入 PostGIS 数据库

前言

在之前的文章中，曾经对高德地图和百度地图的 POI 分类以及使用 PostGIS 数据库来进行管理的模式进行了详细的介绍。虽然天地图在移动端的使用市场没有前两者的份额多，但是作为官方的标准，天地图还是拥有自己得天独厚的优势，除了本身最具权威的地理数据，同时还有承载着官方标准的执行。因此天地图的 POI 数据也是非常重要的，可以作为日常数据分析和处理的一个可靠信息来源。不同的平台对 POI 的分级分类都有所不同，不同的厂商对于 POI 分类时，它的大类和小类的定义一定是不一样的。天地图 POI 的分类存在非常大的差异，层次结构也是不一样的。

文章配图

天地图的 POI 分类从大类来说就跟高德和百度不一样。单从一级大类的数量来说，百度拥有 32 个，而高德只区分了 25 个，天地图居然有 58 个，在数量上天地图是比较多的。另外从层级上来说，高德通常只区分了 3 级分类，而百度竟然有 5 级分类，然而天地图在层级上非常简单，只有 2 级展示，从扁平的角度来说，天地图的扁平化做的不错。

本文重点讲解天地图 POI 分类与高德 POI 分类以及百度 POI 分类存在什么不一样的地方，同时结合代码深入讲解使用 Java 标准库来读取天地图的 POI 分类并进行数据导入到 PostGIS 空间数据库中。

一、天地图 POI 分类简介

本节将首先重点介绍天地图地图的 POI 分类信息，在之前的博客中我们设计了用于 POI 管理的物理表，这里可以继续用来存储天地图对应的 POI 分类信息。然后使用数据库脚本的方法对 POI 分类信息进行录入管理。对于天地图而言，其 POI 的分类较多，但是层级简单，因此这一节我们来详细的解读一下天地图的 POI 分类，让大家对分类信息有进一步的了解，为下一步对数据层级组装和批量解析入库打下牢固的基础。

1、数据表格

与之前介绍的内容一样，大家可以从天地图的地图开放平台中获取其最新的 POI 分类的 CSV 表格（是的，你没有看错，官方提供的确实是 CSV 而不是 Excel，如果需要使用 Excel 也可以将 CSV 转一下格式），这里我将从官网下载的类型截取一部分给大家参考。下载链接传送门：分类编码表。

参数值	参数说明	参数类型	是否必备	备注（值域）
keyWord	搜索的关键字	String	必填	无
specify	指定行政区的国标码（行政区划编码表）严格按照行政区划编码表中的（名称，gb 码）	String	必填	下载行政区划编码表。9 位国标码，如：北京：156110000 或北京。
queryType	服务查询类型参数	String	必填	12：行政区划区域搜索服务。
start	返回结果起始位（用于分页和缓存）默认 0	String	必填	0-300，表示返回结果的起始位置。
count	返回的结果数量（用于分页和缓存）	String	必填	1-300，返回结果的条数。
dataTypes	数据分类（分类编码表）	String	可选	下载分类编码表，参数可以分类名称或分类编码。多个分类用","隔开 (英文逗号)。
show	返回 poi 结果信息类别	String

private static LinkedHashMap<String,PoiCategory> csv2Map(){ // UTF-8, GBK, GB2312, ISO-8859-1, Windows-1252 Charset charset = Charset.forName("GBK"); // 根据实际文件编码设置 LinkedHashMap<String,PoiCategory> amapPoiTypeMap = new LinkedHashMap<String, PoiCategory>(); try (BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(TDT_POI_CSV_FILE), charset))) { int rowNum = 0; while ((line = br.readLine()) != null) { rowNum++; String[] cells = parseCsvLine(line); // 使用自定义解析方法处理带逗号的字段 boolean foundTrigger = false; List<String> poiCategories = new ArrayList<String>(); //获取每一行的的每个格子的数据 for (int i = 0; i < cells.length; i++) { String cellValue = cleanCellValue(cells[i]); //System.out.println(cellValue); if (cellValue.contains(TRIGGER_CHAR)) { foundTrigger = true; //System.out.println("[行 " + rowNum + "] 触发单元格：" + cellValue); if (i + 1 < cells.length) { String nextValue = cleanCellValue(cells[i + 1]); String poiCategoryCode = nextValue; //System.out.println("→ 终止单元格：" + nextValue); } else { System.out.println("→ 终止单元格：(空)"); } break; }else { poiCategories.add(cellValue); } } if (!foundTrigger) { System.out.println("行 " + rowNum + ": 未找到触发字符"); } //执行分类预处理 if(foundTrigger) { String prefix_head = poiCategoryCode.substring(0,4); String prefix_tail = poiCategoryCode.substring(4); if(prefix_tail.equalsIgnoreCase("00")) {//00 表示大类 String levelFirst = poiCategoryCode; //处理一级，添加到集合中 if(!amapPoiTypeMap.containsKey(levelFirst)) { PoiCategory category = new PoiCategory(IdWorker.getId(),1944421516292726785L,"0,100,1944421516292726785",String.join("/", poiCategories),StringUtils.EMPTY,levelFirst); amapPoiTypeMap.put(levelFirst, category); } }else {//剩下表示小类 if(!amapPoiTypeMap.containsKey(poiCategoryCode)) { String _parentKey = prefix_head + "00"; PoiCategory parentCategory = amapPoiTypeMap.get(_parentKey); String ancestors = parentCategory.getAncestors() + "," + parentCategory.getPkId(); PoiCategory category = new PoiCategory(IdWorker.getId(),parentCategory.getPkId(),ancestors,String.join("/", poiCategories),StringUtils.EMPTY,poiCategoryCode); amapPoiTypeMap.put(poiCategoryCode, category); } } } } } catch (IOException e) { e.printStackTrace(); } return amapPoiTypeMap; }

基于 Java 标准库读取 CSV 实现天地图 POI 分类导入 PostGIS 数据库

前言

一、天地图 POI 分类简介

1、数据表格

更多推荐文章

相关免费在线工具

2、分类结构

二、从 CSV 导入到 PG 数据库

1、CSV 解析流程

2、数据转换及入库

3、入库成果及检索

三、总结

更多推荐文章

相关免费在线工具

基于 Java 标准库读取 CSV 实现天地图 POI 分类导入 PostGIS 数据库

前言

一、天地图 POI 分类简介

1、数据表格

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2、分类结构

二、从 CSV 导入到 PG 数据库

1、CSV 解析流程

2、数据转换及入库

3、入库成果及检索

三、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具