【文科生救星】文本大数据分析利器-DiVoMiner®在汕大亮相,众师生热切期待应用
2018-12-03 | 博易动态
智媒时代,传媒业未来将面临何种颠覆式创新?12月1日,博易数据高级研究顾问曹文鸳老师和研究主任茹萦莹老师作为特邀嘉宾,受邀出席2018年汕头大学第十四届新闻传播学研究生学术论坛。
博易数据高级研究顾问曹文鸳老师(左)
博易数据研究主任茹萦莹老师(右)
本届论坛聚焦智能媒体语境下人与技术、人与社会的关系,曹文鸳老师和茹萦莹老师作《如何利用DiVoMiner®帮助做大数据研究》的专题报告,向与会的各高校新闻院系师生介绍如何在智媒时代下进行内容分析研究,提供前沿大数据技术辅助方法,及时“授之以渔”。
讲座开始,曹老师以一连串问题迅速俘获台下师生的兴趣,这都是日常做社科研究最常碰到的难题。“千万别被枯燥的算法、艰深的机器学习唬住了,”曹老师从大数据是什么、大数据分析的通常做法等“大数据ABC”说起,深入浅出,包括坊间常见对大数据的误解,文本分析软件对比等,为师生梳理思路。其后,曹老师提出了当年处理文本大数据的3大挑战:覆盖度、测量、解释,而博易数据对此提出了新路径,以社会科学概念指导文本大数据分析,博易大数据技术辅助在线内容分析法正是在大数据环境下应运而生,为社科研究提供了崭新的视角和解决方案。
曹老师表示,DiVoMiner®平台兼具定量与定性分析功能,包揽全球网络可爬取的海量数据采集,透过网络挖掘、机器学习、社交网络分析以探索未知的规则,更在已知中进行深度挖掘,即以人工编码+机器编码+机器学习编码进行在线内容分析,兼顾系统化、客观性、可量化等原则,而对研究者来说,这个平台就是 “Data In”、“Value Out”的过程。
曹老师深入介绍DiVoMiner®平台设计时,形象地以四“库”全书作比喻,即:来源大水“库”、编码“库”、测试“库”、回收“库”,以四“库”确保数据的代表性与高质性;而声量趋势、来源分布、情绪分析、焦点热词则是最基础的舆情研究“四重奏”,在DiVoMiner®平台上可实现“一秒产出”。研究者利用DiVoMiner®平台进行深度分析时,亦能游刃有余,在曹老师的演示下,DiVoMiner®平台进行统计分析、情绪分析、关系分析皆是“顺手拈来”,在场师生深感现有认知被颠覆。
随后,曹老师以时下最受关注的“基因编辑婴儿”事件为分析个案,引导师生从创建新议题、建立数据库到建立新类目、机器编码到可视化效果的产出做实操训练。现场师生兴致高涨,对使用大数据技术辅助在线内容分析、高效产出成果感到振奋。有研二级学生感叹,以往耗时最长的编码、前测工作,如今均可在线操作,且可透过平台实时查看编码进度、校验编码结果,兼容各类数据上载,简化了从数据收集到可视化结果产出的绝大部分流程为大家使用内容分析法做研究提供了极大的便利。
同学们纷纷表示受益匪浅,报告会结束后,仍围着两位老师认真提问,期望可深入学习平台使用。
此外,可视化结果不仅仅是简单的单变量统计,系统变量、用户变量均可在平台上拖拽完成交叉分析,美观和深度兼备,从数据传入到结果导出最终完成研究报告撰写,你们的认可是我们最大的动力!