张荣显:网络舆情研究需讲求科学性,让数据发挥最大价值

2017-06-09 | 博易动态

(黄钧波)6月9日,代表澳门易研方案及珠海横琴博易数据的张荣显博士,在汕头大学举行了题为“重新认识大数据与网络舆情分析”的专题讲座,向观众介绍了大数据的发展现状和在网络舆情分析上的应用。

张荣显博士从事研究教学工作二十年,范畴涵盖民意调查、公众咨询、数据挖掘、网络挖掘及电子政务研究等,曾在澳门大学、香港浸会大学、葡萄牙里斯本大学任教。

范东升院长致欢迎辞 (吴静文摄)

 

大数据是什么?

在互联网日益进步的今天,大数据开始被越来越多地提及,可实际上大数据究竟是什么呢?

大数据简而言之,就是巨量资料,意思是传统数据处理软件不足以的大或复杂的数据集的术语。“大数据是未来12项颠覆性技术的脑脊液”,它具有数据容量庞大、处理速度快、信息多样性和不确定性,四大特点,张显荣介绍说。

大数据在如今多用于商业领域,通过对顾客的行为数据的计算,预测商业趋势,提前采取应对措施。

 

 张荣显博士在演讲。(吴静文摄)   

 

大数据在网络舆情分析的应用

面对复杂的网络信息环境,学术界对动态数据的获取、不同语境下的语意分析、情感分析,以及大数据对多变项的分析能力,存在很多疑问。针对此,张荣显博士提出,当前学术界及业界有必要对大数据重新认识,尤其是不少人对网络舆情大数据的诸多误解。张荣显提到网络舆情数据具有非结构化(没有有规律的数据)、来源多样性、快速、海量和不确定的特征。需要利用先进的网络技术把数据结构化,整合,筛选,处理,才能得出可视化的结果。

以当前的技术水平,网络数据的采集、清洗、结构化、索引、分词、关键字搜索等等技术问题,都已经可以通过机器解决,利用机器演算法、语意分析技术和自动化情感分析,就可以快速地挖掘舆情的传播来源、传播声量、传播路径、社会网络关系等信息。

 

网络大数据的面临的挑战

网络大数据并非无所不能,张荣显表示,“当前处理网络舆情大数据还面临着3大挑战:覆盖度、测量和解释。”大数据处理还无法精确预测热点舆情的发展趋势,分析结果流于单变量分析及往往以主观判断做结论,也容易把事物相关关系当成因果关系,在数据采样方面也存在着代表性不足的缺点。

他举了谷歌流感预测失败的例子,谷歌利用搜索引擎的相关数据数据对流感流行趋势进行预测,在前几年它的预测数据与美国疾病预防中心的官方数据比较接近,但是在2013年预测数据偏差高达两倍,后来这个项目也停止了在网上发布结果。这其中的原因就是没有处理好数据覆盖度的问题,因为存在一些看似与流感相关,实质没有关联的数据。

他还指出,不能过于依赖“关键字”,这容易造成概念化不足,布林逻辑设定的缺失等问题。

 

解决措施

张荣显及其带领的博易数据团队经过多年努力,研发出网络大数据挖掘平台(DiVoMiner),从线上及线下对数据进行采集、结构化、清洗,方便研究人员能够利用平台数据或自有数据扩充数据库,建立研究者专属的数据库;同时透过机器学习及人工编码方式,让研究人员在平台上执行科学严谨的内容分析法,具有驾驭数据、设定研究类目、实时编码、控制质量及进行统计分析的能力。

他强调研究网络舆情,应该回归到理解舆情的分布、方向及其强度、潜伏性、重要性及稳定性的本质,将5W1H,亦即What、Who、When、Where、Why及How还原,并可通过交叉及相关的统计分析,才能更好地理解事件的面貌,达到到快、广及深的效果。

张荣显指出,总括来讲,研究网络舆情,需讲求科学性,对数据及分析的质量予以更多的关注,摒弃Garbage in, Garbage out(垃圾进,垃圾出)的套路,以Data in, Value out(数据进,价值出)为目标,力图让数据发挥它的最大价值。

主办方与嘉宾合影。(丁志威摄)

最新动态

博易代表应邀出席两大重要传播学会议并发表主旨演讲

近日,博易代表应邀出席两大重要传播学会议——亚太传播论坛2020和第五届中国公共关系学术年会,并分别在会上发表主旨演讲。亚太传播论坛嘉宾与各校师生合照第五届中国公共关系学术年会与会专家学者合照亚太传播论坛2020暨亚太传播论坛联盟成立大会于2020年10月24-25日在珠海横琴·澳门青年创业谷及澳门大学澳门研究中心举行,此会议由亚太传播交流协会(APCEA)主办,是新冠肺炎疫情以来澳门主办最重要的国际传播会议之一。博易代表应邀出席会议并发表题为《为什么大资料在研究方法论中很重要:从传统到创新?...

连接琴澳创新科技合作的秘诀是什么?

2020年10月28日,由三一(珠海)投资有限公司及珠海市青年创业协会主办的珠澳科技创新合作论坛暨招商成果发布会在珠海横琴新区三一南方总部大厦举行,澳门互联网研究学会会长、珠海横琴博易数据技术创始人兼总裁张荣显博士应邀出席,与珠澳两地专家学者及企业家等共同解读珠澳创新合作新机遇。 论坛出席嘉宾合照 论坛现场 当日,张荣显博士在论坛上发表题为《用数据架起琴澳科技合作的桥梁》的主题演讲。 易研张荣显博士...

长假之后,聊聊双节假期的热点和槽点

疫情稳定之后,等来了中秋加国庆,相信大家都度过了一个愉快的假期,那么今年国庆的哪些地区或景点较为受大家追捧呢? 为此,小编整理了9月30日至10月8日的微博数据,为大家梳理下国庆长假期间的热点。   01  今年长假旅游有哪些热门? 热门地区——江浙沪、西南、西北、北京、广东皆为大热门 据文旅部数据中心统计,国庆假期前七天,全国共接待国内游客6.37亿人次,实现旅游收入4665.6亿元。今年地处大西北的陕西、甘肃也成为微博上讨论热门旅游地区,有网友戏称“大西北堵骆驼”。 热门景区——双“黄”最热门...

【DiVoMiner x 浸大】社媒品牌分析比赛获奖作品赏析

这学期,香港浸会大学传理学院传播系的同学们,以“社交媒体品牌分析”为题举办数据分析比赛。一个月时间内完成分组报告,为指定品牌进行社交媒体运营分析及制定一系列商业数字传播策略。   本次比赛由DiVoMiner®与香港浸会大学传理系课程合作,利用社交媒体数据集(Facebook、Instagram、YouTube、Office Website、Mobile App),同学们使用DiVoMiner®文本大数据挖掘与分析平台作为分析工具。   “Digital Report...

张荣显博士应邀到浙江越秀外国语学院作讲座

2019年10月23日,澳门互联网研究学会会长、易研方案总裁兼博易数据创始人张荣显博士应邀到浙江越秀外国语学院网络传播学院作题为《人工智能与文本数据研究方法新路径》的讲座,分享了系统、科学、严谨的大数据技术辅助在线内容分析法在网络文本大数据研究中的实践和应用。 以下文章来源:微信公众号“长三角网络新舆情”,作者陈徐来,标题《张荣显博士来我校讲座》 讲座相关...