2014-07-31 10:08来源:网赢天下网0
2014年7月26日,由51CTO传媒主办的2014WOT全球软件技术峰会在北京富力万丽酒店召开。在实时计算与数据分析专场,来自缔元信.网络数据(曾任EasyHadoop的开源社区创始人之一)的赵修湘老师为我们带来了主题为《Hive数据仓库实战》的主题演讲。分享了大数据时代的挑战以及Hive应用结构化/非结构化数据的数据仓库优势。
(赵修湘老师现场演讲)
Hadoop是一款运行在廉价商用服务器之上的,能够对大量数据进行有效存储和处理的软件框架,主要由HDFS分布式文件系统和Mapreduce计算框架组成,而Hive分布式数据仓库构建于hadoop的hdfs和mapred之上,用于管理和查询结构化/非结构化数据的数据仓库。
赵修湘老师表示虽然Hadoop的hdfs和mapred已经能够很好的解决大数据的存储和分析问题,但是对于传统的数据分析人员来说,依然面临着理解mapred计算模型、自行开发代码实现业务逻辑等挑战。Hive的出现,完美的解决了传统数据分析人员所面临的问题。Hive使用类SQL查询语法,最大限度的实现了和SQL标准的兼容,是关系型数据库绝佳的替代者。
(Hive分析实战)
缔元信.网络数据作为第三方互联网数据服务提供商。凭借自主研发的超大型网络数据服务平台(DDMP),为各类媒体网站、品牌企业、公关及广告代理公司、电商网站及移动APP等提供翔实专业的数据监测、分析及咨询服务。上一篇:移动营销的10大关键词