产品架构

产品功能

精心打造强大的功能
支持不同的存储方案和计算方案,灵活满足客户的各类场景
支持 HDFS、Hbase、Kudu 等从 GB 到 PB 级别的存储方案,支持 Hive 和 MapReduce 等批量计算、Spark 内存计算、Kylin 多维分析、Impala 和流式计算(开源 Spark Streaming 和自研 Sloth)等计算方案,灵活满足客户的各类场景。
支持全量离线接入和关系型数据库和日志的增量实时/准实时接入
全量离线接入:将业务数据从各类数据源(MySQL、Oracle、PostgreSQL、MongoDB 等)离线导入数据仓库以及其他相关大数据环境,适用于对数据导入实时性要求不高以及静态数据源的场景,例如将某业务上个月的所有数据导入数据仓库用于数据分析。关系型数据库和日志的增量实时/准实时接入:分别使用了自研的 NDC 系统和 DataStream,将业务库中增量数据和 APP 日志实时导入到大数据环境,延迟可控制在秒级,适用于对数据导入实时性要求高,且业务快速增长的场景。
提供 SQL 开发、依赖配置与调度管理、交互式查询等,提高开发效率
传统软件的开发过程中,有大量丰富的软件保证开发、调试、发布等步骤井然有序地进行。从业人员的高素质和这些管理过程的工具保证了线上应用的高质量。但目前大数据商用软件领域,很少有足够好用的 IDE 来帮助企业构建数据应用。猛犸提供了 SQL 开发、依赖配置与调度管理、交互式查询等,协助管理开发过程,提高开发效率。
提供元数据管理,标准化企业内部的元数据定义
元数据管理的主要目标是标准化企业内部的元数据定义。而随着数据依存度逐年增加,追踪数据流动,了解数据含义和血缘关系越发困难。猛犸通过数据地图、数据字典、数据血缘三个方面保证企业的元数据标准。同时对主题、维度、指标进行一致性定义和管理解决了数据生产过程中的质量问题。
通过认证、授权、审计三个方面来保证数据安全
平台采用 Kerberos 做用户级别的认证。基于加密方法建立用户(和系统)识别自己的方法,对个人通信以安全的手段进行身份认证,用户和服务器都能验证对方的身份。针对角色授权数据访问。对 HDFS、Hive 等实现了统一的,细粒度的数据权限控制。从数据角度,可以查看当前何种角色有何种权限。从角色角度,可以查看对哪些数据有何种权限。审计提供较直观事件跟踪,包括实时监测对系统敏感信息的访问和操作行为,根据规则设定报警并及时阻断违规操作,收集并记录用户行为。

产品优势

  • 安全

    个人 Kerberos 认证,列级底层权限,管理员和用户全部动作审计三者保证数据安全
  • 敏捷

    面向数据类应用开发场景,设计的一站式平台,基于互联网敏捷开发模式,流程设计快捷灵活
  • 稳定

    网易十年大数据技术和业务积累,专家级数据架构和技术支持

应用场景

数据仓库建设
基于猛犸强大的计算和存储、多样的编程接口和计算框架、严格安全防护等特征来进行数据集成,数据处理,数据模型设计,数据分层主题设计,数据质量,数据生命周期管理,数据血缘,数据统计等全方位管理数据,实现企业数仓建设
汽车工艺优化
猛犸大数据平台基于自身成熟稳定的大数据分析处理技术,沉淀焊装、尺寸和力矩的最优模型,通过调度配置,实现模型自动化调度运行,使用算法优化工艺参数,为汽车的研发和制造过程提供优化解决方案,缩短研发周期,提高研发效率
电商精准化营销
基于猛犸平台,网易电商搭建了精准化营销平台,将所有日志,用户行为数据在平台上进行离线调度和分析,在上亿用户人群里面,精确的找到目标人群,进行资源营销策略

进一步了解网易大数据

获取方案与报价