统的本质也是一种信息系统,构成这一信息系统的是数据。全球语言生态是一个大系统,涵盖所有语系、语族、语支、语种、语言变体、语言人、语际关系,以及语言的地理环境和社会环境。这个大系统由大量中系统和海量小系统构成,中小系统之间以及系统内关系错综复杂,形成无以计数的语言信息突触,并产生浩如烟海的过程性、交互性、变异性语言数据。
4. 2 大数据时代的思维方式
产生于通信技术创新与发展的大数据使人们得以全面感知、收集、分析和共享语言信息,同时为人们提供了一种全新的看待世界的方法。让数据说话的思维方式改变了传统的八九不离十的思维方式。
全球性问题需要全球性思维,全球性思维需要由全球脑来支撑。在小数据时代,看山是山,看水是水; 头痛医头,脚痛医脚。而在大数据时代,看山不是山,看水不是水; 头痛可医脚,脚痛可医头; 宇宙只有统一的法则,而没有中心,形成的是点对面的网状相连关系,而非点对点的线性因果关系。
大数据时代的思维之道是群蜂之道,信奉群体规律和集群智慧,众愚可成智。群体规律是大数据定律,大数据定律也是必然定律,由无形之手操纵。网状世界,没有中心,没有边缘,没有开始,没有结束,周而复始,互为因果。大数据可避免偏见,消除纠结。人们不受时空和形式的限制,全天候、全方位地进行点对点、点对面的交流。
以大数据理念观察事物,世界的均衡是暂时的,流变是必然的,均衡的生态系统是僵死的系统,多样化的生态系统是绚丽多姿的系统,是开放多元的系统,也是不断流变的系统。
以大数据视角看待语言生态,就是以网状的整体论和循环论观点看待语言和语言数据。数据不仅是名词和代词,更是动词和介词,甚至是助词、副词和修饰词。数据既是逗号和句号,也是引号和问号,甚至是省略号和惊叹号。数据既是因之果,也是果之因,甚至是一种多重叠加的并行关系或串行关系。
4. 3 大数据时代的计算模式
大数据和云技术使追求全样而非取样本数据成为现实。
面对海量数据,云计算技术为我们提供了强大的计算能力,使我们并处物质和数字两个世界。
大数据具有四 V 特征: 第一,数据体量大( Volume) ; 第二,信息类型多( Variety) ,包括文本、音频、视频、图片、社交网络、地理位置等; 第三,价值密度低( Value) ; 第四,处理时效高( Ve-locity) 。数据处理的云计算技术为数据资产提供了保管的场所、访问的渠道和采用的空间。盘活并使用数据资产为语言生态研究、维护和改善提供了保障。
传统意义上的数据是结构化的,而大数据含结构化数据、半结构化数据和非结构化数据。数据一部分来自内部( 语言内部) 自身的信息系统中产生的数据,这些数据大多是标准化、结构化的,另一部分来自于外部,包括广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据源于各种社交网络、移动计算和传感器等信息渠道和技术不断涌现和应用,如 ore,1999) 。在 Dadash;轻瓦尔皮瑞语。
轻瓦尔皮瑞语属新型混合语,该语言的大部分名词源于瓦尔皮瑞语和英语,动词及相关结构则来自克里欧语和澳洲土着英语。轻瓦尔皮瑞语的产生有其深刻的历史性和社会性,不是仅限于澳洲大陆的一种孤立现象,需要我们广泛关注。
近年来,我国生态语言应用研究取得了一定的突破,学界也发表了一些研究成果。主要进展涉及语言濒危与语言消亡的问题、强势语言与弱势语言的问题、语码混用与语码转换的问题、语言态度与语言转用的问题、人口迁移对语言影响的问题、网络时代语言符号多样性的问题、全球环境下政府语言政策的问题,等等。至于生态语音、生态文字、生态语法、生态词汇、生态语篇、生态修辞、生态语用、生态语言规范、生态语言学教学、生态语言学翻译、语言符号变异的生态研究等等,还需要在大数据时代采用新媒体、新技术和新手段开展更深入的研究。