数据科学是一个跨学科的领域,它使用科学的方法、过程、算法和系统来从结构化和非结构化数据中提取知识和见解,帮助企业更智能的决策。数据科学涉及到的领域包括但不限于数学、数据挖掘、统计学、机器学习、人工智能、模式识别、可视化技术等。
从事数据科学的数据科学家们,往往面临工作效率低、算法匮乏、环境升级维护和部署花费大量时间导致无法“只专注于核心工作”等挑战,而GeoScene数据科学平台能有效解决上述问题。
GeoScene平台提供了GeoScene Notebook Server,以GeoScene Enterprise为基础,为数据科学家们在GIS环境中打造了一个统一、高效的数据科学平台(以下简称GeoScene数据科学平台)。
GeoScene提供端到端的深度学习解决方案和即拿即用的深度学习产品,包含样本制作、模型训练和模型使用三个层面。
1.快捷的样本标注工具和一键式样本制作工具
2.内置丰富的深度学习模型,且无需切换工作环境即可完成全部工作流
3.支持目标检测、对象分类、语义分割、实例分割等多种场景
4.支持视频识别、自然语言处理、点云分类等场景
5.提供基于深度学习的推理工具,且服务器端可使用分布式计算框架,使推理过程更高效
6.丰富细致的后处理工具,方便分析成果的优化与输出
7.面向多种类型的用户提供灵活的入口,所有功能即拿即用,快速上手
GeoScene提供近20种机器学习工具,覆盖分类、聚合和预测,后续还会提供更多算法:
1.分类算法:最大似然分类、随机森林分类、支持向量机、图像分割
2.聚类算法:空间约束多元聚类、多元聚类、基于密度的聚类、热点分析、聚类和异常值分析、时空挖掘分析
3.回归算法:经验贝叶斯克里金、EBK回归预测、普通最小二乘回归、地理加权回归、基于随机森林的分类与回归、2D和3D面插值
可以利用预测类工具来预测全球气候变化对当地气温的影响,用时空立方体工具箱进行热点分析和时空模型挖掘,用影像分类工具对影像中的建筑物、道路、植被、水体等进行提取
空间分析帮助用户在数据中发现模式,预测未来,是数据科学中最核心的一环,是数据科学平台的核心竞争力,GeoScene数据科学平台的分析能力包含以下4个方面:
1、内置ArcPy和PythonAPI两大核心Python库,超过1200种经典的地理处理工具,其中包含超300种空间分析和统计方法,让用户无需桌面产品即可在Web端使用GeoScene的地理处理框架
2、内置数十种矢量大数据、栅格大数据分布式计算方法,且支持扩展
3、内置超20种人工智能工具,包括机器学习和深度学习两个方面
4、内置100+开源数据科学库,开源方法一键调用,另可方便导入更多开源库
GeoScene数据科学平台可以与公有云、私有云平台无缝集成,轻松获取云端整合的庞大数据资源以及分析能力。
基于空间位置的科学算法支持,提供丰富和专业的空间处理和分析工具,包括数据互操作、制图可视化、空间分析、大数据分析等1200+专业工具,且无需安装桌面端即可在云中一键调用。
提供在线可交互式的集成开发环境,内置空间分析、机器学习、深度学习、开源科学计算库等工具和算法,支撑分析建模、部署、应用与分享等全工作流。
基于Docker技术,支持容器化部署,具有资源隔离、数据安全、部署简单、方便扩展等优势。
无缝兼容各种来源的数据,包括易智瑞平台的数据,OGC标准数据、RESTFUL风格的标准数据,本地GIS数据格式、数据库等。