开拓SQL Server Hadoop大数据新领域



  Sqoop导入导出的数据支持一些存储类型:

  -文本文件:基础的文本文件,用逗号等相隔;

  - 序列文件:二进制文件,包含序列化记录数据;

  - Hive表:Hive数据仓库中的表,这是针对Hadoop构建的一种特殊的数据仓库架构。

  总体来说,SQL Server和Hadoop环境(MapReduce和HDFS)能够让用户处理海量的非结构化数据,并将这部分数据整合到一个结构化的环境中,进行报表制作以及BI分析。

  微软大数据策略才刚刚开始

  SQL Server Hadoop连接器在微软大数据之路上算是迈出了重要的一步。但与此同时,由于Hadoop、Linux和Sqoop都是开源技术,这意味着微软要对开源世界大规模地敞开胸怀。其实微软的计划并不只如此,在今年年底,他们还将推出一个类似于Hadoop的解决方案,并以服务的形式运行在Windows Azure云平台上。

  在明年,微软还计划推出针对Windows Server平台的类似服务。不能否认,SQL Server Hadoop连接器对于微软来说意义重大,用户可以在SQL Server环境中处理大数据挑战,相信在未来他们还会带给我们更多的惊喜。