未发布 DataStage On Cloud,构建云端的企业数据集成平台 随着云时代的到来,越来越多的企业将面临本地资源与云端资源整合的迫切需求,而DataStage on Cloud 则是继 DataWorks 之后,IBM发布的又一款重量级云化ETL解决方案!
未发布 大数据处理过程之核心技术ETL详解 ETL (数据转换)就是对数据的合并、清理和整合。通过转换,可以实现不同的源数据在语义上的一致性。抛开大数据的概念与基本知识,进入核心。我们从:数据采集、数据存储、数据管理、数据分析与挖掘,四个方面讨论ETL在大数据实际应用中涉及的技术与知识点。
未发布 DataStage 最佳实践之读取解析EXCEL文件 InfoSphere DataStage 是 IBM 统一数据集成平台InfoSphere Information Server的重要组件,是业界主流的ETL(Extract, Transform, Load)软件。
未发布 IBM专家亲自解读 Spark2.0 操作指南 本文带大家一起进行Spark的大数据之旅。本文的内容主要分为两个部分:一是Spark的背景介绍,二是介绍Spark的基础。