2013年7月11日星期四

BigData_004:《大数据时代》读后感之四:Hadoop 全球案例

Hadoop的出现也许不是必然的,但处理大数据的软件的出现是必然的,没有Hadoop,也会有Madoop,或Wadoop。
Hadoop的出现适应了这个时代对海量数据处理的要求,它认为数据量是如此巨大,以至于无法移动,所以必须本地分析。
当然,Hadoop不适用于卫星发射、银行交易等这种对精确度要求很高的任务。

Hadoop全球案例:

1. VISA使用Hadoop分析可疑交易
VISA两年会产生730亿笔交易,使用Hadloop以后,处理这些交易的时间,从原来的1个月缩短到现在的13分钟。

2. ZestFinance:是否该向有不良信用记录的人贷款
银行当然不喜欢有不良信用记录的人,但ZestFinance不这样认为。
与其它贷款信用评级软件不同,ZestFinance通过分析大量不是那么突出的事件,而不是少量的突出事件,来判断是否该向有不良信用记录的人贷款。
所谓不突出的事件,指的是包含社会网络等等信息的70000多个变量信息。
也许你不相信,但这是事实,通过这种分析,巨额贷款拖欠率比行业平均水平降低了1/3。
这里顺便说一下,ZestFinance的创始人Douglas Merrill有一篇讲话很有意思:请招聘那些惹恼你的人。
他认为,雇用克隆体就是一场灾难。要用人就要用那些能激怒你的人,不同类型的人有不同的观点,在讨论中的意见分歧才会产生更多有意义的结果,并不是说这些人就无法融入你的公司文化,他们完全可以,只是同时他们也会挑战你的想法,可能因为方式错误而惹怒你,但这同时也证明了他与你的不同。
多样化的团队更容易取得成功,反之亦然,如果你建立了一个外形相似,想法相似,穿着相似的团队,那么在很多事情上,你的团队idea可能只有一个,即便你认为这不是最佳方案,但是你必须接受,只能认为这个想法就是正确的,因为你们想不出别的东西。
当然这是题外话,供那些想要创业的人参考,而且你自身必须足够强大,能够面对这些质疑和挑战;如果你是个打工的,没有创业的打算,还是干好你自己的本职工作吧。

3. 沃尔玛:制定促销策略,寻找新商机
沃尔玛使用Hadoop来分析顾客搜寻商品的行为,以及用户透过搜索引擎寻找到网站的关键词,利用这些关键词的分析结果发掘顾客需求,以规划下一季商品的促销策略。

4. e-Bay:降低数据仓储负载
e-Bay使用Hadoop来进行数据预先处理,将大块结构的非结构化数据拆解成小型数据,再放入数据仓储系统的数据模型中分析,加快分析速度,减轻对数据仓储系统的分析负载。

5. 台湾中华电信:拆解大型资料
一个非结构化档案的大小可能达到数十GB,甚至TB,使用Hadoop将其拆解为大小相等的小型结构化资料块,然后再进行结构化分析。

参考文献:
1. http://www.oatos.com/5174.html
2. http://www.ithome.com.tw/itadm/article.php?c=73977&s=2
3. http://w-w.cn/thread-2262-1-1.html
4. http://www.weste.net/2013/2-18/89047.html
5. http://www.leiphone.com/0823-annie-zestfinance-ceo.html
6. http://www.leiphone.com/tag/zestfinance
7. http://www.youtube.com/watch?v=18CyX5sJx5I&list=PL76C07D8FA8306382

没有评论: