在数据里面淘宝—Kaggle

最新一期的Businessweek里面提到了一家用Open-Innovation方式做Data Mining的公司Kaggle,并且已经得到1000万美元的风投。其商业模式一点都不新鲜,而且早在我读硕士时候,Innocentive这样的用开放式创新的公司早就诞生,并且非常收欢迎。而Kaggle的最大特点就是在于,他不是让大家去创造一个新的东西,而是根据某个公司给的Data和问题,去做数据挖掘,建立预测模型。

这种是非常传统的开放式创新概念,与开源软件工程一个道理,保持开放性从而所有认为自己有能力去参与的人都可以参与到开发当中。Innocentive就是通过这种方式,把某个创新性问题或者公司本身的难题公布到网络上,提供一定的奖金,从而把解决问题变成一项竞赛。通常一个竞赛都能够吸引到不少人的参与,公司也能得到意外的惊喜。这就是Open Innovation的价值。

Kaggle的最大特点在于,给公司和感兴趣的普通人一个机会去玩数据挖掘。对于公司来说,这些海量的数据放着也是浪费,虽然像MS、Amazon、Google这类的公司本身就人才济济,但是总是不可能吸引到世界上所有的天才。因此,把一项数据挖掘算法“外包”出去,却可能会得到意外收获,比如Netflix的一项关于DVD推荐算法的竞赛,最终便得到了比现有算法要精确10%的答案。Kaggle已经吸引到了很多公司,很多非常有趣的问题。

为什么很多人会去愿意参与其中?除了奖励,本身一个最大原因就是在于一种好奇心和证明自己的能力的成就感。这种挑战可能在日常生活中非常缺乏,而很多程序员本身有着非常出众的能力,可是这种能力并不一定会在日常工作中有机会展现,因此像Kaggle这样的公司便有这样的机会,成为公司与所有大众智慧的桥梁,满足双方的需求。同样,Kaggle也给了很多在校学生一展身手的机会,或许会因此吸引到某些大公司的青睐。

而对于公司来说,Kaggle上的所有数据都是被匿名化的,挑战者只会看到A、B、C这样的参数,而不会知道ABC本身到底包含这什么意义,因此Kaggle理论上并不会泄露任何公司的商业数据机密,这是这种商业模式最大的前提条件。而对于中国很多互联网公司或者电商,苦于挖掘顾客喜好,是否也能利用起Kaggle这样的平台?

想要看看更多关于Kaggle的故事,可以看一下这期Bloomberg Businessweek上的那篇文章

吉力理财

您可以选择一种方式赞助本站

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: