Einmal ist keinmal

数据的历史与展望

“大数据”时代已在路上

如果下一个稍微准确的定义,我们大概生活在一个娱乐的信息时代。在facebook,twitter,人人网和新浪微博,大量毫无意义的信息充斥其中。有些信息的生命周期很短,比如“我正在吃饭”或者“今天天气格外不错”,而有些信息的生命周期却很长,传播的广度和深度超过了任何一个时代的大众媒介(mass media)所触及的疆土。欢迎来到互联网时代。

我们可以尝试着为互联网时代写一部纪年史,它的起源大概处于千禧年——互联网巨头们发迹的时间段。人们开始使用网络黄页,这曾是印刷页长期占据的市场。人们开始使用电子邮件沟通,发明网络缩略用语,颜文字表情(这让数据有了感情,不是吗?),在此之后,web迎来了丰富的交互元素,人们可以自由编辑网页,提交文字,图片,表格数据到各种网站,维基百科出现了。在中国,颜色绚丽的链接挤满了门户网站,网民渴望从互联网上寻找几乎所有的信息,当然这不可能,由于信息爆发式的增长,互联网引来了大规模管制,争夺信息的长期博弈开始了。flash被大规模应用到UI以吸引用户,差异化的设计风格开始出现,flash游戏如日中天,没有什么比娱乐更加重要,投资者的热钱开始砸向网络游戏。实际生活中的关系网络最终被迁移到互联网上来,关系时代由此展开,关系重构了我们所接受的信息,每个人成为了自媒体(self media),关系也重构了游戏,娱乐方式,网络营销,广告,又吹起一个不大不小的泡泡。

在互联网的发展历中,没有明确的时代分界,不同的服务叠加在彼此之上,成功的产品脚下是无以计数的失败者,完全竞争市场将蓝海活生生变成了血海,然而互联网让人激动之处,在于每个创业者都相信总有属于自己的一片未经开垦的处女地。下一个处女地会是什么呢?

信息爆发的副产品

古代文字被保存记录在竹简或简易纸张上,难以储存和运输,是否造成了古人惜字如金?

古代文字总比现代文字显得更加精炼?如果你是这么认为的,或许可以在我发起的知乎问题上贡献一份回答。在这个例子中,我们把自己享有的知识分享到知乎,并查看他人的回答,认识到世界上不同人的不同看法。回到这个问题本身,在古代的孔子学院或者古希腊哲人讲坛,人们通过口授,文字记录等方式交换思想,这一本质从未改变。改变的是什么呢?

信息爆发产生了许多垃圾信息,这些信息占据着我们看不到的硬盘空间,在一段时间内不会被清除。这些信息也都包含在大数据(big data)之中。互联网的发展使我们改变了交流思想的方式,广度,深度和速度。设想一下,如果纸张拷贝可以像计算机中的文件拷贝一样廉价和迅速,古代文字可能并不需要那么精炼地隐含丰富信息,因为这一切都简单易行,成本低廉。

工业的发展让纸张网络(设想以纸张为媒介的互联网络)产生,那就是大众媒介中的报纸。在中国以外的许多国家,报纸是以免费派送的方式发放的,因为其带来的影响力产生的附加收入远超过了印刷成本,这有点儿像早期的互联网(web 1.0),不是吗?如果每个人都有能力和权利成立报社,自媒体时代应当早在papernet(设想中的纸张网络)就产生了。

但这当然不可能,papernet没有足够快速的检索方法,这意味着数据的生命周期短的可怜。为什么斯图尔特·兰德的《地球目录》在《乔布斯传记》出版前鲜有耳闻?设想一下我们走进一家没有互联网检索系统的图书馆,就能知道原因了。

是的,原因在于数据。

苹果也开口说话

苹果终有一天也能接入“物联网”

我可不是说siri,是真正的苹果,砸中牛顿脑袋的那种。

苹果的智商或许不及人类的万分之一,直至目前,它也许只能说“我熟了,把我摘下来吧!”这种简单的句子。当然,在世间万物中,总有一些智商逼近人类,比如说浙大软件工程学院的饮水机,它不但可以说话,而且可以与人对话,接受指令从而进行操作。或者清华大学图书馆小图,这货不仅会说话,而且说的很无节操

物联网(internet of things)让我们意识到,语言不仅仅是属于人类,苹果也可以制造数据。通过让人类生产过程中的物体接入感应器和网络等等方式,输出这些物体的参数数据,用以展示,监控甚至传递给生产关系的下一方,日益成为智能家庭和智能社区的基础设施。

IOT派生出许多过去难以想象的机遇——这似乎证明,机遇和市场是随着数据基数的增长而增长的——比如公共交通,远程教育与医疗,科学考察,新型家电,以及中介式接口服务(如ifttt)等等。这是一张难以想象的,承载着巨大数据的网络。我们很少接触如此巨量的信息,以至于在处理这些毫无关系而有纷繁复杂的信息时缺乏必要的工具,这是一个新方向,为IOT建造混泥土高速公路,已经有不少公司在进行这种尝试,并付诸实践。比如informatica

数据即财富

嘿,我们知道你妻子的妈妈的三表姑前天买过什么。

有人断言说,这是一个偏好推荐的时代:不仅意味着知道你买过什么,而且很可能知道你想买什么,并鼓励你去买。

占据硬盘空间的一个个比特不可能创造财富(可不是比特币),不过商业驱动力比我们想象的要更加强大,偏好推荐实际上意味着互联网大鳄掌握着消费者偏好,我们的隐私毫无私密可言。通过匹配算法,诸如amazon和淘宝这样的大型数据库中给我们提供了数以万计的相似产品:这远不足以满足商人的美好展望,我们并不知道自己在明天如何花掉手里的余钱,但他们知道得再清楚不过。

我曾在微博上说到这样一段话:“国内的LBS应用同质化太严重了,除了交友还是交友。难道除了约炮就不能干点别的吗?LBS最擅长的是信息整合,渗入垂直行业,才可能创造O2O的行为转化,微信5千万用户又怎样,倘若有一天我打开微信,提示我门口小卖部套套买一送一,7天酒店打五折,快打电话给女友吧!那才真叫创新生活方式呢。”

微信已经在做本地商家的地理位置匹配,引入了商户微信账户系统和展现平台,这对于腾讯的电商战略来说,无疑是非常重要的一个潜在支撑点。结合在线支付工具的应用,微信产品可以完成从简单即时通讯软件到移动应用集成平台的转变,微信的应用模式结合地理位置信息,相信可以产生为数不少有趣的创新应用。

网络数据的历史不过短短十余年,未来仍大有可观。我们生活在这样机会丰富的时代,正应了ipad2电视广告的一句话:“这是一个再好不过的时代,去学习。”