主页 > 生活服务 >Big data 是什幺?《大数据》作者麦尔荀伯格为大家解惑(赠书活动截止)) >

Big data 是什幺?《大数据》作者麦尔荀伯格为大家解惑(赠书活动截止))

Big data 是什幺?《大数据》作者麦尔荀伯格为大家解惑(赠书活动截止))

远见天下文化集团,出版《大数据》这本谈论 big data 现象的书。2014 年 6 月 12 日上午,请来作者到台湾演讲。这次的讲者维多.麦尔荀伯格 (Viktor Mayer-Schönberger),他是大数据 (Big data: a revolution that will transform how we live, work, and think) 一书的作者,也就是从他开始,big data 这个名词广为流传。维多他在牛津大学网路研究所任教,研究领域为网路治理和管制。

维多演讲重点摘要

维多先从 Google Flu Trend 开始谈,Google 里的几位工程师,从 Google 搜寻最常用的 5 千万的搜寻关键字,并与流感有关最常出现的搜寻关键字比对,最后成功预测流感的发生。相比之下,卫生当局做的严仅预测模形逊色不少,疾管局的资料会延迟二星期之久。

比价是人类的天性,早在 big data 爆红之前,就有人想办法从可获得的资料中,预测价格走势。例如美国资讯科学家伊兹奥尼 (Oren Etzioni),有一次坐飞机去参加婚礼,出于好奇,问了邻座乘客票价以及购票时间,结果却发现那个人明明是最近才买,票价却是便宜得多,违反早买机票会便宜的通则。他一气之下决定要从网路挖所有能找到的机票资讯,想办法预测机票票价走势。伊兹奥尼将这个计画取名为「哈姆雷特」,他认为「要买还是不买」的问题贯穿整个计画——像极了莎翁名剧《哈姆雷特》的经典独白:to be or not to be,于是伊兹奥尼把这个研究计画命名为「哈姆雷特」。最后这个计画扩大为 Farecast 公司,预测的对象从原先的机票,延伸到饭店房价、演唱会票券价格等。

维多也讲到其他 big data 资料分析的例子,像是 DNA 定序在时间及金钱花费上大幅减少,让分析整个基因组变成可能。Walmart、Target 等大型量贩店针对顾客资料,分析顾客喜好,推出客制化的优惠券。运用随处可得的社群网路发言资料,归纳网路族群的主流言论。

Big data 是什幺?《大数据》作者麦尔荀伯格为大家解惑(赠书活动截止))

不过讲了这幺多应用的 big data 例子,维多提醒大家,big data 也有其黑暗应用面,像是由史诺登揭露的 NSA 大规模监视网路言论,甚至与网站合作直接有后门能截取资料,侵害一般人的隐私权。

Big data 是什幺?《大数据》作者麦尔荀伯格为大家解惑(赠书活动截止))

NSA 的大规模监控网路的言论,big data 技术的发达,反倒让情报单位活用,让大家害怕有一天 1984 这本书的情形会发生面对 Big data,台湾该怎幺做?

在综合座谈上,教育部长蒋伟宁从教育切入,提到台湾以製造业闻名,该如何配合目前 big data 的趋势,转成 data-driven 的经济体?维多回答,在这个新的时代中,学生要培养对事物的好奇心,因为好奇心是趋动 big data 发展背后的原动力,而教育应该扮演维持学生对事物求知的推手。

新北市长朱立伦提到正在进行的 Smart City,有用到 big data 的概念。一般来说 Smart City 要能做到让民众有感,需要搭配物联网,使用不同感测器记录累积数据,最后分析后与市民互动。但要达到好的效果,除了以上的工作流程,政府标案规格,是否有具体描述也必须要兼顾。而实际情形是政府往往没仔细思考到底要什幺,造成标案公司即使有能力,执行出来的成果不尽理想。

Big data 是什幺?《大数据》作者麦尔荀伯格为大家解惑(赠书活动截止)) Panel 的五位参与者讨论 big dataBig data 所衍伸出的问题

维多谈到 big data 遇到的困难,就是资料分享。显而易见不同公司不大会分享资料,但即便是同公司不同部门,其中一个部门有资料,另一个部门有技术能分析,但很难说服有资料的部门分享。有鉴于此,big data 最终不是纯技术问题,是文化上,与人的问题。

论坛后有签书会,但需要领取号码牌,如果没拿到就很可惜无法得到作者亲笔签名。这次可以亲眼看到作者,听到作者讲述书中的例子,并且看到作者生动活泼的动作示範,手舞足蹈的一边讲一边做。很可惜时间因素并没有 Q&A,许多想问的问题无法透过现场的问答解惑,只能等待远见整理出来,请作者回应后刊载在杂誌上了。

我这边最大的疑惑,维多一直强调卖资料,但为什幺不是卖资讯或 wisdom?经过处理的 data 变成资讯,而资讯分析后才会变成 wisdom,卖 wisdom 照理说会更好卖才是。拥有资料的人会很小心保护资料,只有少数人有机会真得接触到 big data,那一般人要怎幺在 big data 领域发挥呢?另外想问维多觉得 data anlytics 的 startup 面临什幺样的挑战。

Big data 是什幺?《大数据》作者麦尔荀伯格为大家解惑(赠书活动截止)) 维多唱作具佳,活灵活现的谈论书中举的例子,并且有动作搭配

传统的资料处理方式,如统计学强调抽样和因果关係。如今资料量相当大,样本可说等于母群,传统统计学的抽样在数据量大,而且可能随处可得的情形下,已经不需要特地用抽样的方式从样本推测母群。因果关係因 big data 可因应瞬息万变的状况,赶紧做出决策,而着重在相关性上面。big data 对于发现现像,做出相对应的决策,而且是快速反应,带来革命性的影响。未来可以期待 big data 带来的发展。

Big data 是什幺?《大数据》作者麦尔荀伯格为大家解惑(赠书活动截止)) 由于机器演算法的进步,可以由程式找出可能的事件原因由 Technews 科技新报贴文。



上一篇: 下一篇:

相关阅读RELEVANT