·专题:人文社科大数据研究·
编者按:近几年来,大数据不断融入到人文社科领域,两者之间产生了诸多“碰撞”,这其中既有机遇,也有挑战。一方面,数据驱动模式拓展了人文社科研究者的视域边界,过去很多知识生产层面的不可知、不可流等问题得以突破;另一方面,新范式在一定程度上冲击到传统人文社科研究的基本认知,由数据驱动带来的人文社科科学性、人文性、伦理性、价值性等问题仍然存在较多争议。
在实践中,随着大数据的持续深入影响,数字人文、社会计算等领域活力绽放,很多以大数据为逻辑的人文社科数据(服务)平台、人文社科数据研究中心等如雨后春笋般增长。 在此背景下,数据资源建设与管理成为人文社科领域的“新宠儿”,有效支撑着新环境下的人文社科创新性研究。目前,人文社科大数据研究正在成为一种学术“时尚”,但在新的语境、场景和业态中,它仍然面临着很多基本问题和方向定位的再定义与再出发,这也需要我们信息科学研究者去解答。
基于上述背景及需求,本刊特邀南京大学信息管理学院院长、长江学者孙建军教授,从数据科学、图书情报学等视角出发组织了《人文社科大数据研究》本专题。 专题四篇文章分别围绕实现人文社科大数据研究的价值自信、国内外人文社科大数据研究的脉络分析、大数据与人文社科研究深度融合的策略、人文社科知识服务创新框架等多个视域,勾勒了一幅从价值认识到现状概述,从融合策略到框架构建的人文社会大数据研究路线全景图。
我们相信,本专题所刊发的4 篇文章,必将为人文社科与大数据研究融合的价值认识、现状分析、策略选择、服务创新等提供体系化的学术支撑!
摘 要:大数据作为一种科学图景为人文社科发展提供了新的生机与活力,人文社科大数据研究正在成为一种学术“时尚”。 文章梳理了人文社科大数据研究的逻辑缘起、发展脉络与主要特征,剖析了人文社科大数据研究的二元价值困境,指出了人文社科大数据知识生产转型与人文意蕴强化的价值追寻路径。 文章认为,大数据融入人文社科领域本质上是对传统人文社科研究的一种延伸和拓展,人文社科大数据发展需要迈向“智慧化”,以支持和助推全新的智慧社会建设。
关键词:大数据;人文社科;价值实现;智慧社会
1 问题的提出
当前,大数据不断融入人文社会科学(以下简称“人文社科”)的学理研创之中,诞生了人文社科大数据研究这一前沿议题和领域,诸多新视角、新命题被不断开拓和延展。尤其是近些年数字人文、计算社会科学等领域兴起的新方向、新热点,如历史迁移、“文学指纹”、“空间转向”等,有效推动了数据驱动的人文社科知识发现的纵深化发展, 人文社科研究不再“望数”而“兴叹”。
在此背景下, 人文社科领域的数据观和研究范式发生了重要改变。一方面,数据资源越来越成为人文社科领域的重要资产。通过大规模量化数据库、特色专题数据库和数据支撑平台建设, 支持全域的社会认知重构、记忆再现、文化传承、决策支持等跨学科交叉研究与应用, 已经成为人文社科大数据综合开发利用的重要途径;另一方面,人文社科大数据研究范式逐渐受到青睐和重用。 过去人文社科以小规模数据、 抽样数据等为主要特征的数据研究模式发生改变,“人文计算”、复杂网络分析、计算机模拟与实证、 大规模数据分析等研究方法逐渐被采纳和使用,人文社科的精确性、共享性、“科学性”得到显著性增强[1]。
在大数据持续影响人文社科的同时, 学界对人文社科大数据的认知却一直存在较大争议, 未能形成普遍性共识, 这主要源于人文社科与生俱来的特殊性,如研究相对独立、人文价值偏向、客观化悖论、意识形态关联等。在大数据范式的冲击和影响下,各种问题也接踵而至,传统的人文社科的思辨逻辑、知识生产、伦理价值、创新思维等要素发生了潜移默化的改变, 促使原有的人文社科学术精神面临着重新洗礼的困惑, 人文社科大数据研究在价值观层面面临着新一轮的深度考量。
从文献检索和实际情况来看, 目前的人文社科大数据研究主要经历了三个典型的阶段:(1)大数据概念与思维的引入与思考。 这一阶段着重于考量大数据对人文社科带来的机遇与挑战, 学理方面的研究多是使用大数据的概念和背景, 对大数据的实质性内容并没有作进一步的细化分析与应用;(2)大数据技术与方法的嵌入与探讨。在这一阶段,人文社科领域研究学者对大数据的看法逐渐理性化, 从过度关注大数据本身带来的理念变革转为关注具体的大数据技术与方法对人文社科研究的影响以及相关人文社科现象解读与知识发现。在此背景下,很多以大数据为语境和背景的人文社科类研究项目逐步扩大和深入;(3)人文社科大数据研究能力的转化。 这一阶段的特点是“研究”与“服务”逐步融合,重点关注系统化的人文社科大数据生态建构问题, 以服务于数据驱动的人文社科研究范式。在此背景下,很多高校和研究机构建立了人文社科领域相关的大数据中心或研究平台,如重庆市社会科学大数据中心、南京大学人文社会科学大数据研究院等, 旨在通过打破过去人文社科的学科壁垒和信息孤岛, 以数据为基点推动“大人文”“大教育”的实现。目前,我们正处于第二阶段与第三阶段的双重转型期, 即在探究具体的大数据模型与分析学对人文社科领域影响的同时,关注人文社科大数据领域的智慧化建设问题。
2 人文社科大数据研究的兴起与特征
2.1 人文社科大数据研究的逻辑缘起与发展脉络
人文社科大数据研究的兴起并不是一蹴而就,而是一个随时代发展兼容性不断变强的过程。 在早期的一段时间内,数字技术不断进步,人文社科领域本身就面临着数字化转型的过渡。 在长期的争议与发展过程中,人文社科积累了多种量化研究方法,促使了数字人文、社会计算等新兴研究范式的出现,这些研究思路和模式的变革为大数据与人文社科的结合奠定了坚实的理论和方法基础。 而随着大数据环境的到来, 我们认识人文社科的思维和手段发生了重要改变, 人文社科的很多研究问题以数据形式被记录下来, 与大数据相关的思维理念与工具方法不断渗透到人文社科领域之中, 海量人文社科数据的持续生成与整合分析有了可靠的空间和技术支持。尤其是国家大数据战略的提出, 为人文社科大数据发展打开了“另一扇窗口”。 在科研需求与政策驱动的背景下, 人文社科领域开始关注大数据的相关研究与应用,以金融、社会治理、图情档、文学、历史等为代表的多个学科领域深受大数据“红利”影响,人文社科大数据研究由此迎来了发展机遇。
肥胖症属于因多种因素导致的一种慢性代谢性疾病,主要临床特点就是以体内脂肪细胞体积增加以及细胞数增加,体脂占比增高以及过多沉积脂肪。单纯性肥胖患者存在均匀的全身脂肪分布情况,不存在内分泌紊乱以及代谢障碍性疾病[4]。轻度认知功能损害实际指存在轻度认知或者记忆功能障碍,但并不会对日常生活能力带来严重影响,是处于早期痴呆和正常老化中间的临床状态[5-6]。轻度认知功能损害存在一定可逆性,早期干预以及适当治疗,有利于恢复正常认知[7]。TMT是一项评估患者注意力与定向力的认知功能量表,可提示早期认知功能损伤[3]。
可见, 人文社科学者虽然可以通过大数据分析更加敏锐地发现问题, 但与此同时也可能触发人文精神的消弭和理论品格的丧失。 尤其在新一轮人工智能、系统仿真等技术环境下,长期“阿尔法狗”式的侵扰可能会造成人文社科创新思维的逐渐弱化。 而从更深层次来看, 这种唯技术论的大数据分析引发的社会结构变革很容易与文化领域产生断裂, 进而制约社会交流活动,最终对人文社科领域的(公共)文化观、社会治理观、发展观、服务观等带来不同程度的影响和改变, 使得数据驱动下的人文意蕴面临重重危机。
现如今,随着数字化、物联网、移动终端等新应用场景的不断涌现以及智慧型知识服务需求的不断升级, 人文社科大数据领域面对的环境与情境更加复杂, 新场景的新老问题所带来的挑战日益严峻[2]。目前, 大数据与人文社科相互融合的学理探讨与实践应用仍处于发展阶段, 面对全新的科学大数据范式逻辑赋予的人文社科使命[3],如何在新的语境、场景和业态中,进一步推进人文社科大数据研究从“解释型”向“求是型”转变,实现人文社科从“数据赋能”到“智慧服务”的进阶,是我们亟待深入思考的问题。基于此,本文立足新环境的现状与特点,并撇开了传统逻辑上的人文社科大数据研究意义分析, 试图从价值追寻角度审视人文社科大数据研究的图景认知、道路自信与可持续发展问题,探究人文社科大数据研究的新特征、新逻辑、新路径与新趋势,为更加“智慧”的人文社科大数据发展提供理论参考,同时也寄期望于为繁荣人文社科事业指明方向。
2.2 人文社科大数据研究的主要特征
大数据的出现促使了自然世界及人类思想、行为的数据化,将自然、社会和人类思维映射为一个由数据构成的数据世界[4],让人文社会科学能够像自然科学一样进行大数据分析与挖掘, 进而获得知识发现。从数据层面来看,人文社科大数据研究的数据对象是指那些描述或反映人类行为导向以及社会发展取向的、 能够用于人文社科发展并创造巨大价值的各类原始性数据、 基础性数据以及相关数据产品和信息的综合。当然,其大数据范畴并不是涵盖了所有的数据世界,而是带有明显的学术属性(面向科学研究)。 目前比较典型的数据类型有电子踪迹大数据、社会媒体大数据、文本大数据、空间位置信息大数据等[5]。 基于数据环境的变化,人文社科大数据研究呈现出其独有的特征:
(1)人文社科大数据研究更强调开放协作式创新。在全新的复杂社会环境下,人文社科面临的研究问题更加多元化和交织化, 更加依赖不同学科之间在数据基础、技术能力、平台条件等方面的跨域合作与协同创新。 尤其是伴随着社会人文与科技的逐渐融合,数据通约性不断增强,人文社科大数据研究的很多场景逐渐靠拢自然科学, 而自然科学的很多理论、 方法与技术也被广泛运用到人文社科大数据研究之中[2]。 人文社科与自然科学之间的对话逐渐增多,相互交叉和跨界融合愈加明显。 从实践来看,当前很多人文社科大数据研究项目往往汇集具有基本数据素养、专业领域技能和项目协作能力的团队,并由跨度较大的不同学科的专业学者共同完成。总之,人文社科大数据研究更强调开放、 互动、 协作与交互, 以实现人文社科不同数据集和知识域的深度融合与价值共创。
随着社会的快速发展,文化形式呈现多元化的发展趋势。为了适应社会经济的发展形势,需要建立统一的文化产业,更好地满足市场文化的发展需求。而群众文化在文化产业的发展中起到了一定的支撑作用,文化产业是文化建设中的重要内容,有效地反映了社会经济的发展情况。与此同时,文化产业体现了人民群众的文化艺术消费水平,而群众文化活动的开展,在建设文化产业的过程中发挥着重要作用,在很大程度上实现了文化产业的稳定发展。
(2)人文社科大数据研究更注重量化思维与计算思维。 传统的人文社科研究结论多通过观察、思索、感悟等定性方法获得,或通过“小数据”来获得知识发现。 人文社科大数据研究更注重引入量化分析和计算分析方法, 以通过大量数据的汇集实现研究成果的“自动涌现”。 当前,数字人文(人文计算)、计算社会科学等领域都强调利用量化分析和计算型思维, 以从海量数据中找出人文与社会发展中的演变规律或潜在关系。在这种背景下,人文社科领域的可计算数据资源正在发挥越来越大的学术价值, 并进一步推动了大尺度宏观分析、长程量化、视觉计算、时空可视化等新兴研究方向的出现[6]。 总之,大数据提供了大规模技术分析的可能, 提升了人文社科研究的精确化程度。与传统的人文社科研究相比,人文社科大数据研究的量化元素与计算元素更显见,技术性“深度分析”成为其典型特点。
(3)人文社科大数据研究极富创造性。由于人文社科的研究对象常常具有自我发展与演变演化的能力,因此,创造性一直是人文社科研究的重要方法论原则。 当前,随着大数据进入应用摸索阶段,数据赋予了人文社科研究探索未知、追求新知识、支持新见解论证的更多条件, 人文社科研究拥有了更多的指向空间与价值创造可能。因此,基于数据驱动的创造性思维与科学想象力逐渐成为人文社科大数据研究的新考量。相比于自然科学的线性数据集合模式,人文社科大数据研究更加强调多变量、多要素、多维度的系统化论证,是一种高度的前瞻性立体式思维。总之,人文社科大数据研究往往极富创造性,常常需要突破原有的思维框架和研究模式,力求实现“已知—未知”与“未知—已知”的结合。
万姐的话,让我冷静下来。她扶我回卧室躺在床上,不停地呵气搓手,直到手掌暖了,才轻轻放在我的肚皮上,缓缓摩挲。她的手很硬,却也很暖,让我和肚子里的孩子都安静下来。
3 人文社科大数据研究的价值困境
人文社科大数据研究的二元价值困境, 其根源在于大数据的“双刃剑”属性与人文社科领域过去的认知观、资源观发生了“碰撞”,促使了人文社科原有的知识体系和话语体系产生了演变、分化与重构。而这其中带来的问题和挑战恰恰是人文社科大数据研究不能回避的时代命题。基于此,人文社科大数据研究应在知识生产转型与人文意蕴强化两个层面推动其价值追寻, 实现学理层面乃至应用实践层面的价值自信。
3.1 数据“展示”引发的人文社科知识内容“浅层化”
众所周知,在大数据环境下,人文社科研究不再拘泥于纯粹的规则预设,而是可以直接从数据出发,根据事物之间的相关性规律和联系进行知识发现。这种逻辑起点的变化使得人文社科研究逐步摆脱了对直接研究对象的依赖, 转而将人文和社会世界映射的数据世界视为新的研究对象[7]。 诚然,大数据为人文社科带来了全新的维度与介入方式, 但福音传播者们并没有意识到大数据的无节制应用同时带来了人文社科学术话语体系中知识获取、理解、组织、传播的潜在“降维”。 换句话说,从“数据”直接到“价值”的新捷径使得人文社科的很多研究执迷于“解释过滤”和追求新奇,研究问题过于单一,习惯于将更大的数据混淆为更多的知识, 将更多的数据混同为更多的服务。 这种对数据的“狂热”直接导致了人文社科知识内容的“浅层化”甚至泛“娱乐化”趋势,其结果是事实仅仅是聚合而不是质问, 数据大多是被“展示”而不是被处理[8],缺少对人文社科机理和本质性诉求的科学逻辑回应, 对许多难以辨析的问题常常无法做出必要解读、给出针对性对策。
在这种逻辑下, 人文社科大数据的很多研究缺乏问题意识, 出现了很多盲目可疑的知识与人文假设,知识创造与知识型输出呈现粗放式模式,高质量和特色化的研究成果比较鲜见。也就是说,人文社科大数据带来的知识生产转型是否对人文社科整个开放谱系格局产生变革意义的学术价值和应用价值仍然有待进一步明确和解答。
3.2 新一轮技术陷阱带来的人文意蕴迷失与匮乏
人文社科领域的数据获取常常强调直接接触(如直面访谈、电话对话等),因而有其感性直观和可靠的一面[9]。 在人文社科大数据范畴下,数据由于被剥离具体环境,因而可理解性和适用性较差。在这种非场景化逻辑下, 人文社科如果纯粹的依赖于大数据的相关技术性分析, 往往就会缺乏必要和足够的人文关怀和人文精神。目前,大数据技术的通约性使得人文社科的技术性色彩更加浓厚, 但很多数据模型和算法工具多带有一定的偏见、误解和“偏爱”,大规模数据分析系统常常会忽视或消灭个性化特征,或者产生更多的个性固化与信息孤岛化现象。 而这种人文意蕴的“忽略”本质上就是一种技术陷阱的后遗症,且仅仅是部分,因为更多的如数据敏感、数据人权、踪迹监控等问题依旧层出不穷。
首选观点是12月19日和12月20日的时间节点开始为期两三个交易日的反抽运行,大约运行到12月24日结束,随后市场继续向下运行,于2019年元旦前后一个交易日结束下跌回落;
2016年河南省战略性新兴产业的有效发明专利拥有量为8091件,比2017年增加21%,然而,其增幅仅位于全国31个省、市、自治区的中游(第14位),落后于同处于中部的湖南省、湖北省,这与河南省GDP在全国的位次(多年来蝉联第5名)是极不相称的。
①整体拆除重建与新房置换模式。对于修建时间早,现已成为危房的住房。有关部门应制定相应的拆迁和房屋置换条例,确保拆迁合法性与民主性。②针灸式精准改造模式。对于居住条件较差的房屋,主张改善其居住环境并加强对公共服务设施的填充,提高公共服务设施的质量。
3.3 人文社科大数据研究的二元价值困境寻思
本文基于二元价值困境进行相关诠释, 进而发现其指向性本源问题:首先,人文社科大数据知识生产的“形变”本质上是大数据资源的泛在化“淤积”和低质量产出的矛盾问题。 在全新的数据化与智能化环境下, 人文社科所处的介质和场景发生了根本性变化,人文社科的确需要通过“让数据说话”模式来推动一些新问题的发现以及进一步的潜在价值挖掘,但数据贪婪症、数据沉迷、数据过度解读等所带来的数据“展示”终会限制人文社科大数据的高质量和可持续发展,数据“展示”的千人一面和“标识性”研究成果的缺失势必会影响人文社科在大数据时代乃至未来新的时代中的学术自信和价值自信。 换句话说, 人文社科大数据研究的宗旨并不是为了通过大数据分析来建立一个吸引人的表达系统, 而是为了获得更多对问题域的求解法与答案。
另外, 技术陷阱所带来的人文价值意蕴丢失问题本质上是人文社科在不可逆和高度渗入化的数字和数据技术环境下所做出的一种偏离式“错误”响应,在当前以粗放式认知为主流的智能化环境下,数据约束并不代表人文社科大数据可以走向吞吐式产出模式, 这显然与人文社科研究一贯倡导的科学严谨和高度创造性相悖。实际上,二元价值困境本质上是相互影响和相互作用的, 要解决人文社科大数据研究面临的知识“展示”型危机和人文价值意蕴丢失的二元价值困境问题,就必须探究更具“智慧化”的人文社科大数据研究价值创造路径, 引导人文社科大数据研究的健康良性发展。
4 人文社科大数据研究的价值自信
当前, 人文社科大数据研究在多个领域都呈现出美好的发展前景。但仍面临着如知识表象、意蕴丧失、算法霸权、“黑箱”运作等一系列不可控、不可用、不可延展的问题。 尤其在新一轮的数据智能化革命和人文反思中, 人文社科大数据研究面临着知识生产与人文意蕴的二元价值困境。
男孩名叫唐小果,9岁,父母主要从事和传统文化相关的视频制作工作。在小果很小的时候,父母就爱用各种新奇玩具、美味糖果来“诱惑”他拍摄可爱、逗趣的小视频,并传到网上,吸引了大批粉丝,他的头像还被制作成表情包广为传播。因此,小果现在算是犀城小有名气的网红了。
4.1 内容自信:从“数据展示”到“知识标识”
人文社科大数据研究的“数据展示”模式在某种程度上是将大数据这一知识原料进行了“折变”,在新时期,我们亟需跳出这种粗放式的知识藩篱,转变过去的知识生产思维和路径。 人文社科大数据研究如果需要重视内容层面的“知识标识”问题,就应积极强调知识生产与知识服务在“量”与“质”层面的综合,通过打造基于人文社科大数据的“内容品牌”,推动内容层面的价值自信。
对于任何科学研究,问题都是其最佳入口,科学研究问题的层次性与延展性是学科突破和内容创新的关键[10]。 在大数据环境下,人文社科的很多研究都发生了重要变化,首要的就是充分认知和探索新场景的变化及特点, 强化人文社科研究面对新环境的问题意识,为知识内容的创新奠定基础。 显然,新场景下的人文社科研究问题域更加多元且交织复杂,但数据驱动带来的新研究起点的准入度也相对更高。在此背景下,人文社科研究需要对新场景的新老问题进行重新思量[2],并借助社会化媒体、知识付费业态、公众科学项目等新逻辑激发自身的知识创作灵感,更加重视以目标为导向的知识价值争论,实现“数据域”与“问题域”的联动与对接。 可以说,强化人文社科大数据研究的问题意识, 对于增强人文社科研究的敏锐识别能力与知识转换效应具有积极意义。
大数据环境下全新的人文社科问题体系是实现其研究内容知识创新的前提支撑, 而人文社科大数据研究的“知识标识”问题则是实现其价值创造与增值的可靠路径。 “知识标识”强调兼顾历史传承奥义与社会发展趋向,重视研究成果的系统性、创新性、特色性、前沿性与适用性。目前可以从“全景知识”和“精炼知识”两个方面的深化和融合来打造这种“知识标识”。“全景知识”即利用大数据技术和方法对特定问题或对象进行点、 线、 面的数据叙事和知识解读, 通过打造面向人文社科领域的新型知识服务构件、知识图谱与知识全景图,满足知识全面化趋向的需求。 “全景知识”产出需要基于人文与社会世界的数字脚印或数据轨迹展开原始性创新, 通过学术资源的整合与协同培育, 助推人文社科隐性知识与显性知识的泛在聚合与全域服务。 如数据画像研究即是一种基于“全数据”的知识挖掘与呈现,人文社科大数据研究应积极关注用户画像、科技画像、城市画像等新领域方向的探讨。另外,大数据的新认知观认为数据并非一定要“大”,智慧化才是大数据的核心。因此,“精炼知识”是其另外一个方向,这种知识生产模式更加重视需求敏感、 语义挖掘与知识深层次加工的结合,而不是单纯的将数据进行叠加与淤积。如智慧数据理念即强调从大数据的“大”聚焦到知识层面的数据精华[11],更加关注大数据的“V”(Value)的实现方式和支持模式,重视对不同场景数据的高度凝炼性知识集成与规范化。 目前来看,用户体验与商业智慧[12]、数字记忆项目、城市记忆工程等领域以及各类特色专题数据库建设都已经广泛运用到智慧数据理念,重视这个新动能,对于人文社科大数据研究的纵深化发展具有重要意义。当然,随着知识需求的进一步层次化、细分化、个性化,将“全景知识”和“精炼知识”进行融合,转换为“智慧知识”“智慧情报”[13],将成为人文社科大数据研究的未来发展方向, 而这更依赖于不同学科疆域之间的知识交融与协同创新,目前这方面的进展仍然任重而道远。
4.2 人文自信:从技术“热”到技术与人文的智慧耦合
在大数据的推动下,人文社科研究的技术“热”问题已经比较凸显。 诚然,大规模计算、自动监测识别、可视化分析、语义自动匹配等技术对于推动重塑和改造人文社科知识具有积极意义,但这并不意味着人文社科就需要将过去长期积淀下来的范式传统进行颠覆或推倒重来。 毕竟,大数据对人文社科学术而言更多地是承担着时代变量因子的角色。 因此,“技术理性”与“人文价值”必须以一种合适的姿态融合到一起,更好地发挥大数据对人文社科研究的积极效应。
“萨姆尔生活在四百年前的丹麦,是一位著名作家,”史黛西小姐耐心地解说起来,“你看到的这本《神秘的魔法城》,是他的绝笔之作。创作这本书的时候,萨姆尔已是82岁高龄了,据说他是为了纪念死去的孙子而创作的。可惜的是,他并没有完成这部作品,他因为伤心过度,在写作的过程中吐血而亡了。所以博物馆里的这本书是他离世前的手稿,具有特殊价值。”
当前, 人文社科领域的知识供给和知识需求的界限日益模糊,地理空间、人文空间与信息空间的三元世界趋向融合,“智能”与“人文”的连接与对话成为人文社科大数据研究的新兴方向。 在这种复杂的交织背景下, 人文社科大数据研究不仅需要不同技术范式的合作,还需要政治、法律、伦理等不同人文范式的融合。 因此,对于人文社科研究人员而言,不但要掌握一定的大数据技术工具与方法, 还要深度了解人文社科的背景知识和人文智慧, 尤其是对于跨学科问题的阐释与解读, 技术和人文的交叉更为明显。在具体研究中,人文社科大数据研究不仅需要考虑“大数据” 的技术共性问题——追求精确和实效, 还要考虑人文价值的个性问题——凸显个性和规范。换句话说,一方面我们需要通过技术嵌入解决人文社科研究广为诟病的不可计算和不可检验问题,另一方面还要关注人文语境和应用逻辑的结合,在“接地气”的研究立场下推动大数据“技术理性”与“人文价值”的智慧耦合。
(21)蒙者,不智也。鄙者,不慧也。(《太上說玄天大聖真武本傳神呪妙經註》卷三,《中华道藏》30/551)
当然, 这种智慧耦合仍然是要以人文社科研究的价值追求为根本导向, 因为人文社科除了与自然科学一样要发现客观事物发展规律, 其本身还承载着传播传统文化与促进现代文明的使命[2]。 因此,凸显人文社科大数据研究在探索规律与揭示本真方面的价值本性和价值立场, 创造具有人文社科意义的新知识, 是人文社科大数据研究实现人文自信的根本。 如冯慧玲[14]就主张以人文为指导和灵魂,设计开发出能够凸显人文核心概念的工具, 形成“人文感性”,才有可能在本体论和社会性层面塑造适用型知识。可见,摆脱技术陷阱、避免唯科学主义倾向,就必须考虑人文社科话语系统中的逻辑、文化、关系等语境要素,提倡技术透明化并重视人工智慧干预,通过打造基于大数据的人文社科元语言, 解决人文社科大数据研究成果的可用、可控、可知与可延展。因此,将人文与社会属性以一种新的表达方式嵌入到人文社科大数据研究之中, 在不断迭代中延展人文社科自身的功能与边界, 促使人文社科能够具有自我表述和自我塑造的能力, 是促进大数据时代人文社科思想谱系的拓展和话语体系建构的有效途径。
实际上,将技术因素同体制、机制、法制等人文智慧进行融合, 仅仅是提供了一种人文社科大数据研究意义建构的新模式, 在实践中仍然依赖于我们去搭建这样一个具备“技术”与“人文”双属性的数据文化乃至数据全生态景象。从研究角度出发,大数据与人文社科的紧密联动与数据资源的消耗和数据环境的成长问题密切相关。因此,目前的人文社科大数据研究可以围绕数据资源和开放服务平台建设的示范带动作用,通过“研究”与“服务”的结合,面向产业研用价值链架构起人文社科大数据“建、管、服”的全生态体系,带动技术范式与人文范式的一体化成长,更好地推动“大数据成果”与人文实践的同频共振,真正实现人文社科大数据研究的价值自信。
5 结语
大数据为人文社科提供了新的生机和活力,纵观当下,数据业俨然成为人文社科领域的重要“实验地”,大数据的触角已经遍及到人文社科产学研的各个环节和空间, 人文社科大数据研究正在成为一种学术“时尚”。 对人文社科大数据研究的不同定位会产生不同的理论范式和解释方式, 本文以价值论为问题导向, 剖析了人文社科大数据研究的缘起与特征,并基于其二元价值困境,重点探讨了人文社科大数据研究的价值追寻问题。 人文社科大数据的知识生产转型与人文意蕴强化, 对于推动面向人文社科领域的大数据善治,实现“智慧化”发展,形成具有中国特色的人文社科学术体系和话语体系都具有长远意义。当然,这并不意味着人文社科大数据研究的历史性地位已经到了颠覆阶段,实际上,人文社科大数据研究并没有替代过去人文社科对“无数据”“小数据”的追逐,倒是作为一种延伸和拓展发挥着重要作用[15]。 智慧社会建设的提出给人文社科大数据发展带来了新机遇,它所强调的开放共享、多元互动、扁
平化、协同治理等智慧特质,本质上与本文所理解的人文社科大数据研究的价值追寻相得益彰。 大数据是智慧社会的原材料,是智慧生产生活的新“能源”。而人文社科与大数据的融合对于更好地启动、支持、
促进智慧社会建设具有重要意义,尤其在智慧经济、智慧文化、智慧治理等方面可以发挥关键作用。
参考文献:
[1]孙建军.大数据时代人文社会科学如何发展[N].光明日报,2014-07-07(11).
[2]马费成.推进大数据、人工智能等信息技术与人文社会科学研究深度融合[N].光明日报,2018-07-29(6).
[3]孙建军,李阳.科学大数据:范式重塑与价值实现[J].图书与情报,2017(5):20-26.
[4]黄欣荣,沈秋莲.大数据促进科学与人文融合[N].中国社会科学报,2018-09-11(5).
[5]郝龙,李凤翔.社会科学大数据计算——大数据时代计算社会科学的核心议题[J].图书馆学研究,2017(22):20-29.
[6]王晓光.加强人文社科数据资源建设与管理[N].光明日报,2018-07-05(11).
[7]黄欣荣.大数据主义者如何看待理论、因果与规律——兼与齐磊磊博士商榷[J].理论探索,2016(6):33-39.
[8]Brennan T.The digital-humanities bust——After a decade of investment and hype,what has the field accomplished?Not much[EB/OL].[2018-10-15].https://www.chronicle.com/article/The-Digital-Humanities-Bust/241424.
[9]欧阳康.大数据与人文社会科学研究的变革与创新[N].光明日报,2016-11-10(16).
[10]马费成,张瑞,李志元.大数据对情报学研究的影响[J].图书情报知识,2018(5):4-9.
[11]罗琳,顾新.智慧数据驱动的产学研协同创新知识管网研究[J].软科学,2017,31(6):15-18.
[12]芮祥麟.大数据时代的智慧数据[J].软件和集成电路,2014(7):66.
[13]化柏林,李广建.从多维视角看数据时代的智慧情报[J].情报理论与实践,2016,39(2):5-9.
[14]冯惠玲.数字人文——在跨界中实现交融[N].中国社会科学报,2017-12-21(8).
[15]孙建军.大数据使社科研究不再“望数兴叹”[N].人民日报,2016-02-18(7).
Value Pursuit of Humanities and Social Sciences Big Data Research
Abstract As a scientific prospect, big data has provided new vitality for the development of humanities and social sciences. Under this background, the humanities and social sciences big data research is becoming an academic focus. The paper summarizes the logic origin, development vein and main features of the humanities and social sciences big data research. On this basis, this paper analyzes the binary value dilemma of the humanities and social sciences big data research, and points out its value pursuit path of knowledge production transformation and humanistic implication strengthening. The paper considers that the integration of big data and humanities and social sciences is a kind of extension compared with traditional humanities and social sciences research. Moreover, the development of big data in humanities and social sciences needs to move towards "wisdom" to support the construction of new smart society.
Key words big data; humanities and social sciences; value realization; smart society
中图分类号:G250.2;C3
文献标识码:A DOI:10.11968/tsyqb.1003-6938.2019001
*本文系国家社会科学基金重大项目“人文社科专题数据库建设规范化管理研究”(项目编号:18ZDA326)研究成果之一。
收稿日期:2018-12-20;
责任编辑:魏志鹏
作者简介:李阳(1989-),男,南京大学信息管理学院博士后,研究方向:信息资源管理、竞争情报;孙建军(1962-),男,南京大学信息管理学院教授,博士生导师,研究方向:网络信息资源管理、大数据分析。
标签:数据论文; 人文社科论文; 知识论文; 人文论文; 价值论文; 社会科学总论论文; 社会科学现状及发展论文; 《图书与情报》2019年第1期论文; 国家社会科学基金重大项目“人文社科专题数据库建设规范化管理研究”(项目编号:18ZDA326)研究成果之一论文; 南京大学信息管理学院论文;