龙源期刊网 http://www.qikan.com.cn
大数据背景下数据科学分析工具现状及发展趋势
作者:周琪栋 薛冰洁
来源:《智富时代》2019年第06期
【摘 要】在大数据背景下,利用云计算等智能型平台对大数据进行相应的分析,已经成为一种必然的趋势,而开放式共享与个性化定制也逐渐成为软件发展的一种主流途径。本文基于大数据背景下,首先介绍了数据科学分析工具的发展现状,接着探讨了数据分析工具在未来的发展趋势,以期为相关人员提供一定的参考。 【关键词】大数据背景;数据科学;发展趋势
大数据的出现,也衍生出一门全新的科学——“数据科学”,其作用则是利用自动化的方式去分析大量的数据,然后从中得到一些有用的信息。但是从现阶段的发展现状来看,数据分析工具在实际应用的时候,还面临着一些难题,基于此,相关人员就应该强化对这些数据分析工具的研究工作,着重突显出大数据的分析能力。 一、数据科学分析工具的现状
大数据正改变着人们的生活方式和思维模式,对于文化和一些学术研究也产生了一定的影响。一方面,大数据时代给各个学科领域都带来了一些机遇,将“知识范式”逐渐的转变成为“数据范式”。但是另一方面,也增加了数据获得与储存的难度性,各个学科领域中的传统知识与新兴数据之间的矛盾也愈加突出,当传统知识已经无法有效的适应现阶段的新型知识时,就会促使传统理论和方式发生一些革命性的变化。同时,从现阶段的发展情况来看,大数据已经受到了各个领域的高度重视,也成为计算机学和统计学等多个科学领域研究的重点内容,这也表示当前不同领域中數据研究开始向着一个高度融合的趋势发展。 二、现阶段数据科学分析工具面临的挑战 (一)数据的多样性
大数据可以看作是数据科学的一部分,无论是在科学领域,还是在教学范畴中,都为这些行业的发展提供了巨大的机会,但是在发展的过程中,也存在着诸多的挑战。首先就是数据格式的多样化,当我们开始进入大数据时代的时候,数据量也会有所上升,数据的格式也开始向着一个多样化的方向发展。如企业、银行的数据一般是以文本的形式存在的,而YouTube中的数据则是以视频或者是语音的方式出现。这些数据形式除了传统的关系数据之外,还包含了一些网页搜索、电子邮件和社交媒体软件等,这些实际上就是属于一种非结构和半结构的数