GeoScene GeoAnalytics Server是GeoScene Enterprise的矢量大数据分析服务器产品,具有高性能、高稳定性、高可扩展性三大优势。它提供了一个分布式计算框架,来处理带有时间、空间、属性的大规模矢量数据或者表格数据。通过GeoAnalytics Server,可以大大提升千万级、亿级数据的分析计算效率。与此同时,还提供了基于业务需求的场景化模型构建能力,如常用的时空数据处理、洞察分析挖掘、趋势价值预测等能力。
1. 数据汇聚:把离散的、分散的、不同来源的时空数据和表格数据,进行统一汇聚,汇聚到大数据分析资源池中,通常大数据分析资源池以分布式存储形式提供;
2. 数据清洗:对数据进行多个维度的清洗和检查,包括空间数据结构检查和处理、空间数据自相交检查和处理、异常点检查和处理、空间数据投影检查等内容;
3. 数据融合:实现不同维度的数据融合处理,如针对二调数据的线、与面进行转换和融合处理;
4. 数据质检:空间数据的几何错误检查、拓扑关系检查、数据的质量和精度保障;
5. 数据存储:针对时空数据进行基于业务流程的汇聚和管理、清洗和质检以后,对数据进行入池存储。
GeoScene GeoAnalytics Server提供了多种大数据分析工具和能力,这些工具覆盖了数据治理、空间统计、模式分析与洞察预测等众多方面,能够针对全域时空数据进行分析计算和洞察挖掘。
GeoScene GeoAnalytics Server产品能力是以用户业务逻辑为导向的,旨在解决传统业务难题、洞察数据背后的信息和价值、预测事务时空发展态势,因此,基于业务需求的模型构建方式方法,是平台的一大核心能力。
GeoScene Geoanalytics Server提供了原生的大数据分析工具和可自定义扩展分析工具的接口,通过Pyspark,结合空间分析算法和Spark算子,实现大数据分析能力扩展。GeoAnalytics Server具备多种开发接口和扩展能力,包括Rest API、JS API、Python API等开发方式,同时可以基于RunPythonScript,基于需求进行自定义工具扩展。
GeoScene GeoAnalytics Server支撑多种计算框架,包括产品内置框架、第三方分布式计算框架,通过产品配置,可以实现多重分析能力使用,便于资源整合,也提升了大数据平台建设中,统一资源调度能力,通过灵活的任务调度机制,和智能化调度策略,实现多种计算框架支撑能力。
GeoScene GeoAnalytics Server通过分布式计算框架,把一个复杂计算任务通过分解,由集群中多个节点统一执行,通过合理的资源调度,实现多次迭代和快速运算,从而大大提升复杂业务流程的计算效率。
在国家级、省级土地利用现状分析过程中,数据规模在千万级、亿级以上,通过对业务模型进行改造、优化业务流程,对比传统分析方式,使用GeoAnalytics Server的性能提升90%以上。
GeoScene GeoAnalytics Server具有稳定的运行框架,能够连续支撑复杂业务计算,及良好的故障处理和恢复机制,从而保障业务连续性。一个中等城市一年的国土空间规划项目和业务应用中,调用空间分析运算的次数为129598次,涵盖了用地红线智检、建设用地审批、村规划审查、多规合一、矿业权审批、叠加分析等一系列部门日常业务。 GeoAnalytics Server实现了单次运算小于4分钟、且7*24小时无故障运行的支撑能力。
GeoScene GeoAnalytics Server大数据分析产品具有高可扩展性,除了原生大数据分析工具,还可以基于PySpark扩展机器学习工具,实现产品能力扩展。
GeoScene GeoAnalytics Server广泛应用于众行业、多领域,通过对复杂业务流程进行优化,对多源数据进行融合探索分析,通过多次迭代和性能优化,形成了一系列模型库,具有性能较高、可复用性强的优势,极大程度上解决了用户在空间大数据时代关于空间数据治理、分析、应用的难题。