数据来自哪里,怎样搜集,这是一个问题。
作者在这一章既介绍了那些很容易想到的数据集,也向我们展示了一些你从未想过的收集数据的方法。
总之,用一句概括:一切皆可“数据化”。
数据搜集案例:
1. 莫里根据老的航海日志修订了一份新的航海图
2. 日本越水重臣教授根据人体对座位的压力识别乘坐者的身份,准确率高达98%。
把一个人的坐姿转化成数据,这真是一个很创新的想法,创新的想法必然会产生独特的价值。
通过这套系统就可以识别乘坐者的身份,然后可以衍生很多服务。
比如:
(1)识别驾驶者是否是车主,如果不是发出警告或自动熄火。
(2)比较事故发生前后的坐姿,看看坐姿和行驶安全之间的关系。
(3)搜集驾驶者疲劳时坐姿数据,当发现驾驶者疲劳时,发出警告。
我觉得还要加上一些其它考虑,比如车主胖了或瘦了,需要重新校准数据,呵呵。
3. 由图书衍生出来的信息服务
3.1 谷歌的数字图书馆:http://books.google.com/ngrams
谷歌希望能够每个人都能分享人类文明以来的所有知识 ,这真是一个有气魄的想法。
为此谷歌和各大图书馆开展合作,扫描馆藏书籍。
3.2 亚马逊的Kindle图书馆:http://www.amazon.cn/
与谷歌的数字图书馆不同,亚马逊的Kindle图书馆侧重的是新书,很多新书都伴随发行了Kindle电子图书版本。
顺便说一句,如果谷歌和亚马逊的数字图书馆建成的话,那些抄袭者将无处遁形。
4. 由GPS衍生出来的信息服务
4.1 安装在汽车上的GPS
汽车安装了GPS后,可以记录时间、地点和行驶路线图等信息。
4.1.1 汽车保险公司根据GPS记录的信息制定个性化的保险服务
通过分析GPS记录的数据,汽车保险公司可以制定个性化的保险服务,而不是仅仅依靠驾驶员的年龄、性别和履历等等。
4.1.2 过路过桥费的收取
可以根据GPS记录的行驶路线图,让实际使用这些道路的人承担相应的费用。
作者在这一章既介绍了那些很容易想到的数据集,也向我们展示了一些你从未想过的收集数据的方法。
总之,用一句概括:一切皆可“数据化”。
数据搜集案例:
1. 莫里根据老的航海日志修订了一份新的航海图
2. 日本越水重臣教授根据人体对座位的压力识别乘坐者的身份,准确率高达98%。
把一个人的坐姿转化成数据,这真是一个很创新的想法,创新的想法必然会产生独特的价值。
通过这套系统就可以识别乘坐者的身份,然后可以衍生很多服务。
比如:
(1)识别驾驶者是否是车主,如果不是发出警告或自动熄火。
(2)比较事故发生前后的坐姿,看看坐姿和行驶安全之间的关系。
(3)搜集驾驶者疲劳时坐姿数据,当发现驾驶者疲劳时,发出警告。
我觉得还要加上一些其它考虑,比如车主胖了或瘦了,需要重新校准数据,呵呵。
3. 由图书衍生出来的信息服务
3.1 谷歌的数字图书馆:http://books.google.com/ngrams
谷歌希望能够每个人都能分享人类文明以来的所有知识 ,这真是一个有气魄的想法。
为此谷歌和各大图书馆开展合作,扫描馆藏书籍。
3.2 亚马逊的Kindle图书馆:http://www.amazon.cn/
与谷歌的数字图书馆不同,亚马逊的Kindle图书馆侧重的是新书,很多新书都伴随发行了Kindle电子图书版本。
顺便说一句,如果谷歌和亚马逊的数字图书馆建成的话,那些抄袭者将无处遁形。
4. 由GPS衍生出来的信息服务
4.1 安装在汽车上的GPS
汽车安装了GPS后,可以记录时间、地点和行驶路线图等信息。
4.1.1 汽车保险公司根据GPS记录的信息制定个性化的保险服务
通过分析GPS记录的数据,汽车保险公司可以制定个性化的保险服务,而不是仅仅依靠驾驶员的年龄、性别和履历等等。
4.1.2 过路过桥费的收取
可以根据GPS记录的行驶路线图,让实际使用这些道路的人承担相应的费用。
4.1.3 制定最佳行车路径
UPS利用GPS记录的数据,制定了最佳行车路径(尽量少的左转弯)。
在2011年,少跑了4828万公里,节省了300万加仑的汽油,以及减少了3万吨的二氧化碳排放量。
4.1.4.微软亚洲研究院分析北京市出租车2年的GPS数据,提供不同时段的最佳出行路线
4.2 安装在智能手机上的GPS
安装在手机上GPS,可以获取用户位置信息,由此产生很多Location Based Service(LBS)。
4.2.1 分析高速公路上的手机的数量和移动的速度来预测交通状况
4.2.2 分析城市夜生活最繁荣的地方
4.2.3 分析游行队伍聚集了多少人
4.2.4 Foursquare等足迹类的LBS
Foursquare针对商家推出了顾客消费习惯分析工具,增加用户的活跃度及粘性。
5. 把关系“数据化”
Facebook就是一个将关系“数据化”的典型例子,是由10亿用户编织的一张关系大网。
一项分析表明,个人偿还债务的可能性与其朋友偿还债务的可能性相关,如此一来,Facebook中存储的关系数据就可派上用场。
6. 把情感“数据化”
Twitter记录和分享人们的情绪片段和思想火花,它把人们的情绪和想法“数据化”了。
对Twitter做句法分析,可以获得顾客的反馈意见,预测电影的票房,预测股市的涨跌等等。
一项分析表明,从微博使用者的软件和设备,语言,地理位置,关注的人以及粉丝的数量和名字,可以得出不同文化背景下人们每天的心情模式。
7. 把经历“数据化”
LinkedIn将工作经历“数据化”,帮我们认识朋友的朋友,以及找到一份好工作。
不过,说实话,LinkedIn动不动就发一封信骚扰,我是挺烦这个的。
也许,等哪天真的通过这个找到一份好工作,我才会改变对LinkedIn的看法。
8. GreenGoose:销售能放置在物品上的微型运动感应器,监测物品的使用次数。
9. 政府公开的各种档案
9. 政府公开的各种档案
如果一切皆可“数据化”,那么是不是可以说,一切皆是信息。
看过《源代码》的人是不是有这样的体会:世界的本质是信息,你所看到的一切,经历过的事,爱上的人,都是信息,都是一段段代码片段。
那么我们应当怎样去利用这些信息而不被这些信息所利用呢?
参考文献:
1. http://coolxll.me/2010/03/foursquare/
2. http://baike.baidu.com/view/3054611.htm
3. http://itindex.net/detail/41677-%E5%BA%94%E7%94%A8-foursquare-%E9%BB%91%E5%AE%A2
4. https://developer.foursquare.com/
没有评论:
发表评论