将大数据转化为大价值

Version 2

    将大数据转化为大价值

     

    实用战略

     

    摘要

     

    当今,一些最成功的公司通过捕捉、分析和利用大量各式各样、快速移动的“大数据”获得了强大的业务优势。本文介绍了三种使用模型,可帮助您实施灵活、高效的大数据基础设施,以获得自身业务的竞争优势。本文还描述了英特尔在芯片、系统和软件领域的多项创新,可帮助您以最佳的性能、成本和能效来部署这些和其他大数据解决方案。

     

    大数据机遇

     

    人们常将大数据比作海啸。当前,全球五十亿手机用户和近十亿的 Facebook* 与 Skype*用户正在生成规模空前的数据,而这些用户只占全球网民人数的一小部分。英特尔估计,2012 年流经云中的数据总量超过了 1,500 EB,即 1,5000 亿 GB。与此形成鲜明对比的是,整个人类历史中所说话语的总量估计仅约 5 EB。


    然而,大数据的洪峰还未到来。目前,我们正在快速迁移至“物联网”,企业、家庭、汽车和公共场所中数量庞大的联网传感器正在生成几乎无法估量的数据量。然而,将大数据比作海啸忽略了最重要的一点。

     

    虽然海啸极具破坏性,但大数据却拥有巨大的潜在价值。借助正确的工具和战略,企业可从大数据中有所领悟,帮助自身实现强大竞争优势。目前,许多公共和私营组织已经在这么做了。


    • 零售商以前所未有的规模和精度实时分析社交媒体趋势,以便为最有可能的买家提供最热门的产品。

     

    • 金融公司分析信用卡交易、账单支付和银行账户活动,以实时检测和防止欺诈行为,并提高丢失资金的找回概率。

     

    • 内容提供商实时分析用户的选择,以便向用户推荐相关内容并提供新的产品和服务,以此提高收入和客户满意度。

     

    • 城市使用大数据来预测并缓解交通拥堵状况,并避免进行昂贵的道路扩建。

     

    • 公用事业通过实时监控能源使用状况来实现其能源网络的负载平衡,以便更加高效、可靠地输出功率并避免增建大型基础设施。如要利用大数据获得这些优势,需采用新的数据管理方法。大数据不同于传统的业务信息。虽然交易数据也是其中的一部分,但大数据具备多结构化和快速移动的特性,且其数量可能会远超您的基础设施的处理范围。


    • 大数据以 PB 而非 TB 计算,因而远远超出传统的业务数据。

     

    • 大数据包含多种不同格式的结构化和非结构化内容,如电子邮件、社交媒体、视频、图像、博客、传感器数据和“影子数据”(如访问日志和 Web 搜索历史记录等),以及许多其他类型数据。


    • 大数据不断动态生成,瞬时洞察可改善实时业务场景的结果。虽然批量分析仍发挥着重要重要,但来自现场或流数据的按需查询则拥有巨大的潜力。


    由于大数据的价值蕴藏在大量复杂、快速移动的内容中,因此,获得有意义的洞察通常需要广泛的挖掘和深入的分析,其广度和深度远超传统的商业智能(BI)查询和报告。利用机器学习、统计建模、图形算法以及其他新兴技术可以挖掘出随时可用的重要内容,从而为企业提供显著的竞争优势。


    从大数据中提取业务价值

     

    本文探讨了从大数据中提取价值的三种使用模型。这三种使用模型适用于各种不同的组织。每种使用模型都建立在前者基础之上,旨在提供更高的价值。


    • 使用模型:提取、转换和加载(ETL)。ETL 在分析数据之前,必须先执行收集和预处理操作,并将数据存储在数据库中。但传统的 ETL 工具和战略可能无法满足大数据的需求。ApacheHadoop* 为解决这一挑战提供了一种经济高效的方法。


    • 使用模型:交互式查询。最新的技术创新极大提高了传统数据仓库模型的性能和可扩展性。借助这些改进,实时分析可以在规模更大、更多样化的数据集上运行,以扩展现有 BI 投资的价值,并更有效地与全新大数据解决方案(如 Hadoop 等)相集成。


    • 使用模型:预测分析。全新的分析技术不单包括数据挖掘和可视化,通过对所有可用数据,包括来自外部来源的实时数据流进行分析,不仅能够确定已发生事情的情况及原因,还能预测可能会发生的事情。最后一种使用模型构建于前两者基础之上,旨在创建一个更加统一、可扩展的分析环境。


    下载文档:将大数据转化为大价值