搜索、Office和云安全:姓“微软”的大数据有何不同?

今天, 微软公司举办以“大掌控,大智汇,大洞察”为主题的大数据媒体日活动,与数十家国内媒体一起分享了微软在大数据领域的最新研究成果、解决方案,以及对于大数据未来发展趋势的看法。来自国内银行、汽车、交通运输、医疗卫生和零售业的微软大数据解决方案用户,通过他们的切身体验介绍了微软大数据解决方案为众多行业带来的进步与改变。

微软全球高级副总裁,大中华区董事长兼首席执行官贺乐赋(Ralph Haupter)先生表示:“大数据不仅要从数据挖掘、数据分析的层面去解决“大”的问题,更重要的是如何将挖掘与分析的结果直观呈现给出来,转换为用户真正需要的有价值的洞察力。微软大数据的使命,就是通过先进算法帮助用户更高效地挖掘有用数据,通过智能化的、甚至是基于云端的平台和服务去管理和分析数据,从中获取有价值的洞察信息,再以用户最熟悉、最直观的形式表现出来,从而帮助用户做出决策。微软提供全套解决方案,让任何数据都能产生真正的价值。”

文件、图像、视频、博客、流、地理空间数据,面对这些非结构化数据,以及来自微博、Twitter等社交网站的实时数据,传统的数据批处理手段难以有效对其进行分析应对。如何有效处理结构化和非结构化数据?如何从社交媒体网站中挖掘数据?如何将内部和外部的数据及服务结合起来?如何基于捕获的数据更及时地做出决策?这些让用户倍感困扰的难题,正是微软大数据解决方案致力于解决的。

从数据发现商业价值

在“大数据”成为流行名词之前,微软便已着手于相关应用与研发,例如微软Bing的高质量搜索结果,便是通过分析超过100PB的数据得到的。微软大数据解决方案的目标,是让所有用户都能获得来自任何数据的可行洞察力。为了实现这一目标,微软为大数据解决方案制定了全面的战略:

大掌控:支持所有的数据类型的现代化的管理层

微软大数据解决方案的数据管理平台可以无缝地存储和处理包括结构化、非结构化和实时数据在内的所有类型的数据。微软推出的HDInsight是一种适合企业使用的、基于HDP的Hadoop服务,它将Windows的简易性和可管理性带给Hadoop,提供了结合Hadoop的扩展平台,并为大数据提供了灵活且可扩展的云,用户可以根据自己的需求选择Windows Server或Windows Azure平台。

大智汇:搜索并结合全世界数据,对其进行先进的分析与精炼,从而提高数据价值的富集层

微软大数据解决方案,通过将数据和模型与公开的数据服务相结合,实现了突破性的数据发现,例如自动发现与共享防火墙外部和第三方数据源等。通过使用Windows Azure Marketplace中的应用程序和智能挖掘算法,用户还能发现更多隐藏的信息与数据挖掘模式。此外,微软大数据解决方案还能通过企业信息化管理工具将原始数据转换成可靠一致的数据,并通过SQL Server 分析服务(SSAS)的高级分析功能来实现数据的精炼。微软大数据解决方案支持Mahout等常用的第三方工具和框架,,还可支持以C++, C#, Python, Ruby和Pearl来编写定制的挖掘算法。

大洞察:通过大家熟悉的工具,如微软 Office,为所有用户提供直观洞察力的洞悉层

微软大数据解决方案致力于人人可用,它可以使客户通过大家非常熟悉的由Hive add-in for Excel生成的Excel界面,从Hadoop功能中获取有价值的洞察力。也可以经由企业熟悉的BI工具,如SQL Server 分析服务(SSAS)、PowerPivot以及通过Hive Open Database Connectivity (ODBC) 驱动生成的Power View来分析Hadoop中的非结构化数据。通过集成.NET和新的JavaScript库,微软简化了Hadoop中的编程。开发者可以在JavaScript中使用新的JavaScript库来轻松编写MapReduce程序,然后通过一个简单的浏览器来部署他们的JavaScript代码。

行业大数据应用的商业潜能

今年2月微软在全球市场上进行的调查显示,有超过75%的中大型企业将在一年内部署大数据解决方案,而推动解决方案得到迅速应用的关键在于客户关系、市场推广与销售部门的迫切需求。在中国,这种现实需求同样迫切,事实上在商业智能、公共服务、市场营销这几个大数据应用潜力最为巨大的领域中,微软解决方案已经得到了成功的应用和用户的认可。

植根公共医疗,加速疾病响应和诊断决策:上海市复旦大学附属中山医院在微软SQL Server 2012的帮助之下,积极利用大数据推动卫生医疗信息化走上新的高度,医院和公共卫生部门可通过覆盖区域的居民健康档案和电子病历数据库,快速检测传染病,进行全面的疫情监测,并通过集成疾病监测和响应程序,快速进行响应。与此同时,得益于对X光、CT影像等非结构化数据的分析能力的日益加强,大数据分析技术也使得临床决策支持系统更智能。