尽管大数据研究越来越成为主流,我们仍能从硅谷的数据科学家那里学到很多经验教训,因为他们所从事的职业大都依赖大数据才得以生存。虽然与更传统些的商业模式相比,他们运用数据的方式存在很大不同,但他们积累了足够的科学知识和技术,值得刚刚投身于大数据业务的后来者学习和借鉴,借以尽可能规避失败的风险。
那么,公司如何才能围绕大数据重构商业模式,或者如何重新思考商业经营理念?针对这一问题,大数据以及数据科学领域的专家持何种观点?结合IE Group创新会上的所闻所见,可以归结出5大理念,助你运用好大数据。
一、Hadoop并不意味着一切
虽说这一观念如今应该是业内常识,但仍需不断重复,以便铭记于心。当论及Hadoop最大拥护者、Fayyad前雇员(时任首席数据官)Yahoo如何在这方面得到惨重教训时,ChoozOn公司的CTO Usama Fayyad深入探讨了这一观点。Yahoo原本试图借助Hadoop做一些客户细分方面的工作,却发现,相较于采取更传统的数据库架构做同样的工作,成本竟然高出50倍。认识到这点后,这个项目最终被否决了。后来,数据分析初始企业nPario复活了此种项目,如今,Yahoo已成为nPario的付费用户。
二、大数据使数据科学变得更亲和
Sparked.com网站的首席数据科学家Daniel Wiesenthal清晰阐述了大数据和数据科学这两个不时会重合的概念,他认为,从本质上讲,诸如支持向量机(SVM)以及类神经网络类的技术,都是经时间检验而且被证实切实有效的方法,可用来“从数据库中获取细致到最后每一‘盎司’的信息”,即使这些数据库规模很小。这些技术非常复杂,而且很难被口头解释,在一定规模下还会趋于失效。
然而,大数据使数据科学家们得以运用更简单的模型技术,比如决策树或者回归技术,以便更精确地做大量数据账目管理,使其更具统计意义,而不是仅为追求超级复杂的演算系统。Wiesenthal认为,运用Hadoop之类的通用大数据技术,意味着大数据科学家可以更快地开发和测试模型,因为这种架构不需要与特殊的规则系统或者类型问题相协调,它只是被设计用来更好地处理大数据。
三、知道如何做减法有时更为重要
作为SaaS的市场先锋,Salesforce.com一直在运用自己的大数据平台监测各种产品性能付诸实施的情况,产品管理主管Narayan Bharadwaj认为,这么做的目的不仅是希望预测下一步应该添加什么功能,更多则是为利用数据来支持决策,那些不能帮助公司有所提升的功能将被鉴别出来,相关资源被转投到更具价值的功能上去。“知道如何做减法有时更为重要。”他说。
下一步该怎么做?依照逻辑,自然是分析鉴别功能特性,包括实施良好的和实施效果欠佳的,在布局未来远景时,公司因此会获得一个基本认知,什么样的设计会有成效,什么样的设计反之,由此趋利避害。
四、内容决定价值
简单来说,如果用户事先就知道某些内容为什么会被展示给他们,或者为什么他们会被作某种推荐,他们或许更有可能为此买单。StumbleUpon麾下的一位高阶数据科学家表示,为将相关度最高的网页内容呈现到每位用户面前,公司在大数据及数据科学技术方面投入大量人力、物力,但事实证明,如果寄希望于用户信任这种服务决策方式,仅这么做还远远不够。Sparked.com的Wiesenthal在其论述中同样指出了这一点,他认为诸如Pandora与Netflix这类的服务之所以流行,原因部分在于,在推荐类似内容的时候,它们实际上都向客户传递了自己的一些特性。
五、交易数据远胜研究数据
PayPal的首席科学家Mok Oh论述了从产品研究到购买的产业链,以及从产业链一端努力走向另一端时,决策信号为什么变得越来越难以辨别。PayPal试图跨越这一障碍,做法如下:首先从交易过程着手,然后综合其他数据(包括内部数据以及由Facebook以及Gnip等处得来的外部数据资源),尽可能鉴别出哪些人是真正的客户,以及哪些产品或服务是这些客户真正需要的。他认为,相对于Google努力追踪客户购买行为的研究,这样做更容易些,当然,在另一种情况下例外,如果客户确实使用像Google Wallet这样的工具购买了某些商品,后一种研究方式更易操作。
将柠檬汁从柠檬汽水中分离出来,这正是大数据研究所要做的。一个公司所拥有的最有价值的数据资源,就是它针对自身业务特别搜集的数据,大数据处理的成功之路在于,从利用这些数据开始,探索出一些创新方式,然后深入发掘出更具洞察力的内涵。