在万物互联的时代,数据每时每刻都在产生,万物都将数据化,数据量和计算量呈指数爆发。另一方面,随着高时空分辨率测绘卫星、倾斜摄影、激光雷达测量和移动测量等数据测绘采集技术的迅速发展,地理大数据的更新越来越频繁,传统的数据生产模式已经无法满足海量数据的快速生产和高频更新需求。新基建的开展、实景三维中国建设、新型智慧城市的推进等现实需求,亦促使着人们思考如何更好更快地处理海量地理大数据。2021年mapgis 10.5 Pro发布,其地理大数据技术能力的升级则为此带来新的解决之道。 MapGIS 10.5 Pro从地理大数据的技术体系上,新增丰富的分布式分析算子以及分布式地理处理流程引擎,整体优化了地理大数据GIS技术体系,强化了地理大数据全流程的处理能力。本文将针对MapGIS分布式地理处理流程引擎进行展开描述。 一 便捷的分布式处理流程引擎 MapGIS 10.5 Pro针对地理大数据,新增了分布式地理处理流程引擎,其基于可视化的建模框架,以零代码的拖拽式搭建各种各样的地理处理模型,最终将以服务的方式提供出来,实现地理大数据处理与分析流程的批量和自动化运行。另外还可以根据业务需求自由扩展部件,所有的业务模型都可以自定义,重复使用。 图 MapGIS 大数据分布式处理引擎 二 丰富的大数据分布式算子 MapGIS 10.5 Pro提供丰富的地理大数据分布式服务,将GIS空间分析与Spark计算框架深度融合,提供矢量大数据的分布式分析服务;基于镶嵌数据集提供影像大数据分布式服务,极大缩短大规模影像数据处理时间;基于Spark Streaming提供实时大数据分析服务,高效接入各种实时大数据;另外提供文本大数据分析服务,支持动态分词与语义关联,快速提取与挖掘信息。 MapGIS 10.5 Pro在原有的地理大数据分布式分析功能的基础上,提供更为灵活的粒度更小的分布式分析部件,目前提供了覆盖到矢量大数据、影像大数据、实时大数据、文本大数据以及空间机器学习共五个维度300+的分布式算子,充分满足多场景、多业务的复杂任务处理需求。 图 MapGIS 大数据分布式算子 三 MapGIS分布式地理处理流程引擎应用场景 随着测绘数据采集手段越来越多样,获取数据的方式越来越容易,数据的更新频率越来越高,传统的测绘数据成果生产方式无法满足海量数据快速生产和高频更新的需求。MapGIS 10.5 Pro分布式地理处理流程引擎提供最佳的解决方案。针对全球10亿+要素级要素生产及更新的需求,MapGIS 10.5 Pro基于丰富的地理大数据分布式算子,通过分布式地理处理流程引擎流程,能够快速搭建数据生产和更新流程。通过该流程可以在4小时内完成全范围内完成矢量瓦片数据的生产,若采用传统方式的话至少需要15天,整体性能提升近70倍。另外通过这种高效的实时生产可以保证数据的现势性,同时还可结合矢量瓦片的主题,提供丰富的样式切换,以更多样的方式展示和挖掘数据信息。 MapGIS 10.5 Pro专注地理大数据,持续推动大数据接入、存储、计算、分析、可视化和应用的技术发展,新增的分布式地理处理流程引擎,极大地提升了地理大数据的处理能力,为挖掘数据价值服务国计民生提供技术支撑,进一步实现地理世界深度洞察。
|