加入收藏 | 设为首页 | 会员中心 | 我要投稿 好传媒网 (https://www.haochuanmei.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

大数据的优势是什么,如今面临的困境是什么?

发布时间:2022-12-05 14:01:47 所属栏目:大数据 来源:未知
导读: 大数据时代的到来使得学界兴奋不已,传统的小数据研究似乎一下子变得微不足道。然而,虽然大数据有着诸多的优势,但在短时间内无法取代抽样调查和实验研究等小数据研究在社会科学中的地位,

大数据时代的到来使得学界兴奋不已,传统的小数据研究似乎一下子变得微不足道。然而,虽然大数据有着诸多的优势,但在短时间内无法取代抽样调查和实验研究等小数据研究在社会科学中的地位,原因在于技术发展的限制、社会科学研究的特点和人类社会的复杂性。

大数据特点_大数据的4v特点_大数据特点 4v

随着互联网的普及,信息总量正以空前的速度爆炸性增长,人类社会进入到一个可以用“BB”(brontobyte,千亿亿亿字节)为单位的数据信息新时代,即大数据时代。从社会科学研究的角度来看,大数据是指巨大而多样化的数据集,是对全世界每一个人所做的每一件事的即时记录。大数据在网络时代正在成为可能,人们生活中的每一个空间正在越来越多地成为网络空间,购物、理财、工作、娱乐等都是通过网络来实现,而这些行为都会留下数字足迹,也就是说大量的信息数据。而在网络时代之前,这些物理意义上的行为很难被观察、测量和记录下来。

大数据的标志性优势是研究者不必担心数据的代表性问题,即大数据试图展示的是“全数据”,同时可以进行大背景式的可视化展现。以往,社会科学的研究对象即便是整个社会、国家或人口,由于技术条件和人力物力的限制,通常也只能在总人口中抽取一个有代表性的样本(随机抽样),或者在实验室中对更小的人群进行各种测试,从而采集研究数据。大数据的出现,似乎颠覆性地解决了传统数据不具代表性的问题,因为大数据是总人口的数据,不存在抽样,因此不存在误差的问题。

大数据的另一个显著优势是可以从大海里捞针――也就是海量数据的检索功能,从而鉴别个别人的非正常行为,这对防止恐怖主义等对人类社会危害极大但又比较罕见的行为会起到很好的效果。此外,大数据大海捞针的功能还可以使研究者搜寻具有某种特征但是数量相对稀少并且地域分布广泛的特定人群。

在处理海量信息的过程中,大数据还可以揭示出一些被忽视的相关联系。例如,通过对《新闻联播》海量信息的处理,研究者不仅可以发现不同关键词出现的频率,还可以发现这些关键词之间的相互联系,从而可以在成百上千的关键词之间建立一个语义网络图,让我们十分清晰地发现各个关键词之间的关系。

大数据的优点还包括,可以避免社会调查中的敏感问题。例如,人们难以启齿的一些信息可以通过特有的技术手段,诸如用浏览器的cookie统计出来。

大数据特点_大数据的4v特点_大数据特点 4v

大数据的困境

姑且不谈大数据在挖掘、收集和分析上的困难,假设我们通过日益完善的科学技术,可以收集到每个人的每个行为,并且有足够的计算能力来分析这些数据,大数据还是会面临诸多问题:

第一,大数据并不是在所有时候都是“全数据”。大数据虽然在有些时候收集的是总人口的信息,而不是像抽样调查那样依靠随机样本,但网络用户并不是全部人口。例如,在2012年的世界价值观中国部分的调查中,只有40%的受访者表示通过网络获取政治社会新闻信息,而通过电视获取同样信息的比例则高达88%;这40%的人具有高学历、低年龄和白领阶层的显著特征,但并不能代表中国人口的全体。显然,如果用这一群体的网络行为来推算中国人口的信息摄取偏好和民众意见的分布,就很有可能出现偏差。

第二大数据特点,大数据并不是大家都可以用。绝大多数的大数据推崇者认为它是比较容易得到的,因为大数据是公开、透明的。然而在很多方面,大数据涉及个人隐私、商业机密或国家安全,因此不仅有侵犯个人隐私的道德问题要处理,更重要的是根本无法得到许多涉及商业或政府行为的数据。此外,研究人员如果只能依靠政府公布的大数据来寻找研究题目,而无法根据本领域理论和现实的需要来设计研究计划,将会大大限制社会科学研究的发展。

第三,大数据并不意味着数据的多样化。大数据的支持者认为,大数据时代的特点不仅仅是数据量上的庞大,还具有数据种类来源多的特点。然而,大数据无论有多么全面,也只能记录人的行为,而不能确切描述人的思维。在社会科学研究中,很多时候研究的关注点是人的主观态度和价值观,例如人际信任、社会公平观、政治效能感、民族主义情绪等等。这些概念都是社会科学关注的重要理论问题(因变量),也是社会现象和个人行为的重要解释变量(自变量),但是大数据在测量这些主观态度方面却显得有些力不从心。

第四,大数据重相关而轻因果。在大数据库中,由于数据量庞大,通常很容易得出统计意义上显著的回归系数,但这并不意味着两个变量之间存在因果关系。

第五,大数据特别是以网络为基础的大数据不能准确反映人的社会政治行为。原因有三:首先,有些人认为,基于网络社交媒体而收集的大数据可以用来预测社会运动等社会政治行为。然而,大数据无法回答的问题是,同样有社交网络和网络意见表达的国家中,为什么有些发动了成功的社会变革(例如突尼斯),而有些却没有(例如埃及)?显然,网络行为不是社会运动成功与否的决定因素。

大数据走入我们的生活,让我们的一切都将被记录和被分析,有兴趣的朋友,可以关注多智时代,及时查阅相关知识,如有疑问,请留言斧正

(编辑:好传媒网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!