中国期刊网-投稿、查重、发表有保障。
您的位置: 主页 > 学术论文 > 艺术论文 >

数智赋能视域下的数字人文研究:数据、技术与应用

发布时间:2022-09-20 08:39:27

  摘    要:探索数智赋能视域下的数字人文研究,可为“数据驱动、技术创新、应用引领”的数字人文发展提供参考引。文章将研究视角聚焦到数字人文的基础要素“数据基础”、“技术支持”与“应用场景”三个维度,在分析数字人文研究的数据基础设施、数字技术体系的发展现状基础上,论述人文学科的应用场景与转型。数字人文数据基础设施的逐步完善以及数字技术的蓬勃发展,助推了文学、历史学、艺术学和图博档等传统人文学科的现代转型。同时,数字人文的发展仍面临很多挑战,包括学术研究的独创性与技术手段的同质化之间的矛盾、人文学者的数字学术需求与实际使用程度之间的矛盾、数字人文基础设施的公益性质与可持续发展之间的矛盾。


  关键词:数字人文;数智赋能;数据;技术;应用场景;


  Digital Humanities Research in the Perspective of Data Intelligence Empowerment: Data,Technology and Applications .


  Gao Dan He Lin


  Abstract:


  To explore digital humanities research from the perspective of data intelligence empowerment, so as to provide theoretical reference and path guidance for the development of digital humanities characterized by "data-driven, technology-innovated and application-led". This paper focuses on three dimensions of digital humanities: "data infrastructure", "technical support" and "application scenarios". Based on the analysis of the current development of data infrastructure and digital technology system of digital humanities research, this paper discusses the application scenarios and transformation of humanities. The improvement of digital humanities data infrastructure and the flourishing development of digital technologies have promoted the modern transformation of traditional humanities disciplines such as literature, history, art, libraries, archives and museums. At the same time, the development of digital humanities still faces many challenges, including the contradiction between the originality of academic research and the homogenization of methods, the contradiction between the digital scholarly needs of humanities scholars and the degree of practical use, and the contradiction between the public interest nature of digital humanities infrastructure and its sustainable development.


  Keyword:


  digital humanities; data intelligence empowerment; data; technology; application scenarios;


  0 引言


  数字人文研究、计算社会科学兴起推动数据驱动的人文社科知识发现的纵深化发展,实现了语义知识单元的精细粒度化、知识组织的语义化、知识呈现的可视化。以大数据、人工智能等为代表的信息技术突破了传统人文学科的思维模式,为传统人文研究提供了新方法、注入了新活力。传统人文中一些不能或难以解决的课题,在技术支持下可能得到新的解决路径。在保持传统人文学科既有特点与优势的前提下,文、史、哲、艺学科有必要考虑在数据驱动的新技术环境下,如何将中华优秀传统文化进行创新性发展、创造性转化。


  数字与人文的碰撞既产生了机遇,也存在挑战。一方面数智赋能为传统人文研究提供了新的思维模式和方法体系,拓展了新的应用场景和学科生长点。另一方面,新范式冲击着传统人文社科研究的基本认知,存在着如学科边界模糊、缺乏领域共识的标准规范、缺失评价体系、缺乏共建共享机制等问题。面对数智赋能带来的机遇与挑战,人文学者反思:在多学科交叉、人文与技术深度融合的基础上,如何实现人文定性与数字定量分析方法的互补?如何实现数据驱动与论证驱动研究的融合?如何实现人文研究从“解释型”向“求是型”的转变?本文立足于数智赋能的数字人文发展历程,将研究视角聚焦到数字人文的基础要素“数据基础”、“技术支持”与“应用场景”,通过概览数字人文的数据基础设施建设,归纳数字人文的关键技术体系,探究数字人文在文学、历史学、艺术学、图博档等传统人文学科的应用场景,以期全面综合地阐述数智赋能下的数字人文研究的进展与转型。


  1 数字人文研究的数据基础


  数据是数字人文研究的基石,能否充分获取和占有某一领域的事实、数据和文献对一项人文研究尤为关键[1]。数字人文研究的资源数量丰富、来源广泛,对人文资源的数据来源、数据类型、存储与管理方式进行阐述有助于对数据进行组织与重构。


  1.1数据来源


  (1) 官方来源。官方来源主要由图书馆、博物馆、档案馆等公共文化机构主导,以“国家图书馆出版社数字化项目”“全国报刊索引”为例,前者汇集国家图书馆及国内外其他图书馆的文献资源,后者依托于上海图书馆近代馆藏资源。


  (2) 民间来源。民间来源主要指来自出版社、科研院所、个人或非营利机构的自整理数据。例如,“中华经典古籍库”的资源是以中华书局整理本古籍图书为核心,同时涵盖多家专业出版社的古籍整理成果;“历代进士登科数据库”的数据是由浙江大学龚延明教授及其团队通过搜集、翻阅、辑录原始史料,历经二十多年整理而成;“中国哲学书电子化计划”和“国学大师”项目都是由个人或非营利机构参与创建与维护的。


  (3) 综合数据来源项目。此类数字人文项目汇集多种数据来源。比如,“大学数字图书馆国际合作计划”整合国内高校图书馆、图书情报服务机构、学术研究机构所拥有或生产的各类信息资源;“中国地方历史文献数据库”数据或来源于上海交通大学地方文献中心专家的田野调查,或来源于文物市场中抢救搜集,或通过走村入户获得授权复制。


  1.2数据类型


  随着信息技术发展,数字环境日益复杂化,数字人文数据超越传统文本形式的单一性,文本、图片、音频、视频、3D等多种数据类型并存。数字人文资源既包括针对古籍、档案、报刊、书目、家谱资料的文本型数据;又包括地图、画作、壁画、拓片、老照片、海报等的图像型数据;同时,还涵盖了访谈、纪录片等的音视频型数据;在三维数字化技术的推动发展下,学者们在馆藏文物、器皿、遗址、塑像、简帛、建筑等领域也积累大量的3D数据资源。数字人文研究的数据来源及类型如图1所示。


  1.3人文数据的重组维度


  数字人文资源具有海量、多源、异构、多模态、跨时空、跨领域、分布广、内涵杂等特点[2]。要对这些类型繁多、来源各异、数量庞大的数字资源进行深层次的描述、组织与重构,可从知识模态的集成化、知识单元的可计算化、知识领域的融通化维度进行探析。


  (1)知识模态的集成化。人文数据是多源异构、多模态的高维度数据。数字化技术将各类数据载体(如图书、报刊、乐曲、录音、照片、画作、视频)和数据类型(如文字、图像、音视频、数表)转换为二进制,经计算机统一处理,产生新的数据文本[3]。数字人文研究的多维度分析要求数据能覆盖不同研究视角、包含多个学科主题,因此将多模态的人文数据集成化、多资源互补,这也是数字人文项目趋势之一。比如,“威尼斯时光机(Venice Time Machine,VTM)”项目[4]资源来自威尼斯国家档案馆保存的海量历史文献档案资料,包括手稿、专著、画作、信函、地图等文献类型,内容涉及出生与死亡记录、医疗记录、纳税记录、建筑设计与城市规划、地图等,“威尼斯时光机”项目利用大量的多模态数据,从不同角度重构了威尼斯千年的历史文化发展与变迁。


  (2)知识单元的可计算化。随着语义网技术发展,知识控制单位从粗粒度文献单元向细粒度语义知识单元发展,揭示了更丰富的语义关系。数据标注的颗粒度决定应用场景的多元性,粗粒度文本被重组为细粒度的相关语义单元,用于辅助文本细读。以古籍智能处理为例,古代汉语通过自动断句、词汇处理(分词、词性标记、命名实体识别)、语义和句法标注等技术,生成新的微观知识单元,囊括了古文的音素、音节、音调、字、词素、词汇、实体、短语、句子、段落、篇章和文集等不同语言单位上的标注、组织和挖掘任务,计算机由此实现词汇级、实体级、句子级、段落级和篇章级等各个层级的文本分析与计算[5]。


  (3)知识领域的融通化。开展数字人文研究需要支持面向特定领域的多源异构数据的融合,在数据融合中产生新的知识[6]。从融合形式看,人文数据融合主要有异构融合、多源融合、多模融合3种方式[2]。异构融合和多源融合是针对不同存储结构和不同数据源的人文数据进行融合,为了支持多源异构数据的知识互操作,出现通用且可拓展的语义框架,自上而下地构建了一致的知识表示形式,代表性成果包括国际工作委员会开发面向文化遗产的概念通用参考模型CIDOC-CRM、Europeana构建的EDM模型、芬兰语义系列项目Sampo等。多模融合是指对文本、图像、语音等不同数据形式的融合。受限于人文资源的不同形式,人文数据的语义内容难以揭示与互通。以图文跨模态融合为例,学者们探究图像和文本底层特征和高层语义的映射方法,通过协作学习方法建立联合特征表示和联合空间,将图像标注的语义信息与文本中信息进行对比、匹配与集成,实现图像与文本的互相检索,形成跨模态的知识表示方法。


  1.4数据存储与管理方式


  在新技术推动下,文献资源内容结构和利用形式变革,使得数据存储与管理方式改变。从大规模建设各种类型的书目数据库、图像数据库到全文数据库,从量化数据库再到发展为数字人文应用平台,知识的表示程度更加细粒化和智慧化,知识工程导向的“数字基础设施建设”模式开始显现[7]。


  在数据库建设初期,以书目数据库、图像数据库和全文数据库为主。它们以典藏检索功能为导向,在本质上属于具备检索功能的数字化文本存储环境[8],主要功能是资料的数字化保存和简单检索。对用户而言,此类数据库提供的检索能力有限,存在部分书目数据库仅提供关键词检索、部分图像数据库不能实现检索、数据库整体开放程度较低等问题。


  随着自然语言处理技术发展,量化数据库展现出了在人文研究中的重要价值。此类数据库将具有同质性的文献资料,如个人履历、户籍材料、土地及财产登记、科举或官员铨选进行结构化处理,为大规模数据统计分析提供便利,如清代缙绅录量化数据库、中国多代人口系列数据库。然而,无论量化数据库数据量多大,通常都是以单一类型的史料为数据源搭建的,量化数据库的发展受其数据来源的局限。同时,数据结构化过程不可避免地带来压缩效果,数据脱节于其所在文献史料,信息被“降维保存”。


  近年诸多高校和科研机构开展数字人文项目实践,建立数字人文应用平台,如“中国历代人物传记资料库”“唐宋文学编年地图”“数字敦煌系统”。与前两类数据库相比,数字人文应用平台兼具检索和数据结构化特性,对信息进行更细粒度的标注,能更好地支持研究需求。数字人文应用平台可以揭示隐藏在数据下的历史过程和规律,呈现出相关文献之间的时空联系,协助学者发现新议题与开展研究。例如,“中国历代人物传记资料库”可以从不同角度(官职、入仕途径、著作、财产、社会关系等)重组人物信息,对彼此间的关联进行分析,不仅可以进行群体传记学的统计分析,还可以进行空间分析与社会关系网络分析。


  2数字人文研究的技术支持


  2.1 基于数字化技术的数据处理


  数字人文研究的基础条件是人文资料的数字化。这一阶段所用技术包括影像扫描、字符编码和文字识别等,涉及编码字符集少、生僻词输入、字形多样、文字识别率低等问题。


  为加快人文资料的数字化进程,影像扫描技术推陈出新。针对纸质资料数字化,欧洲时光机项目引入高速扫描仪,每小时可扫描数千张高清图像,并借鉴医学的计算机断层扫描技术,将其用于黏连成块、无法翻页的“档案砖”,实现高速、无损的扫描过程[9]。针对文物资源数字化,主要技术方法包括三维激光扫描、结构光扫描、多图像摄影测量技术等,可以高分辨率、非接触地获取文物本体的色彩和空间数据,输出二维数字图纸和三维数字模型,在博物馆展示、文物保护、文物复制、文创产品开发等应用中发挥着重要作用,例如云冈石窟第3窟复制窟的三维重建项目、故宫数字馆的“数字多宝阁”项目。


  以汉语古籍的数字化技术为例,主要涉及两方面:一是计算机编码汉字的问题,二是计算机图像识别并转换为字符的能力问题[10]。早期受限于字符集规模,古汉语数字化进程发展滞缓,随着全球通用的编码符集标准Unicode的制定,以及“龙语瀚堂四字节处理系统”等产品问世,古汉字编码字符较少、生僻词输入问题基本解决[11]。文字识别方法主要依赖OCR技术,中文古籍还存在古籍版面复杂、字形多样、大小字注及行间注并存等情况,这为文字识别增加了难度。在提高计算机对古汉语的文字识别率策略上,学者们一般采用古籍语料库与机器学习技术相结合的方式,构建错误恢复模型校正形近字,借助人名、地名、官名等词表及知识库,辅助计算机根据上下文关系进行学习和判断,最后再辅以人工复校。


  2.2 基于语义技术的知识表示


  (1)本体模型。本体具有较好的概念层次结构和逻辑推理能力,有助于实现异构数据的集成与融合。在数字人文领域,多通过复用或拓展部分已有的、较成熟的本体模型,来对领域知识进行组织。例如,面向口述历史资料[12]、古建筑[13]等进行本体构建及应用研究。


  (2)关联数据。关联数据强调多源异构数据的相互关联与相互联系,这为数字人文的进一步发展提供了新机遇,较成熟的应用有“欧洲数字手稿项目(Digitized Manuscripts to Europeana,DM2E )”[14]“关联爵士项目(Linked Jazz,LJ)”[15]“芬兰数字人文关联开放数据基础设施(Linked Open Data Infrastructure for Digital Humanities in Finland,LODI4DH)”[16],以及利用关联数据和本体技术重构家谱数据的网站。在国内,上海图书馆开放数据平台以关联数据方式向互联网公开发布数字人文项目所用的基础知识库(人、地、时、事、物)、文献知识库(家谱、手稿档案、古籍等)、本体词表等馆藏资源,为人文数据的组织、发布、共享与访问做出了示范。


  2.3 基于自然语言处理技术的知识组织


  数字人文研究在依赖于自然语言处理技术的应用。根据语言层级结构的不同,自然语言处理技术体系可以分为:基于字词级别的技术分析(包括自动分词、命名实体识别、词性标注等)和基于篇章级别的技术分析(包括信息抽取、文本分类和情感分析等)。


  2.3.1字词级别的技术应用


  (1)自动分词。词是含有完整语义信息且能独立运用的最小语言单位,自动分词问题是自然语言处理的首要基础性工作。分词方法可分为基于词表的分词方法、基于统计模型的分析方法,以及规则方法与统计方法相结合的分词技术[17]。由于覆盖性较差、可迁移性较弱等问题,基于词表的分词方法很少被单独使用。学者们一般采用条件随机场模型[18]、隐马尔可夫模型[19]、BERT模型[20]等机器学习模型,并结合预训练和后处理方式构建更为高效准确的自动分词模型,这也逐步成为中文自动分词的主流方法。


  (2)命名实体识别。早期的命名实体识别大都是基于规则的方法,先人工制定规则,再从文本中匹配规则字符串[21]。要使识别效果越高,就越需要构建大量的规则,但代价太高,可移植性低。学者们采取新的研究思路,使用基于统计机器学习的方法进行命名实体识别。为提高模型的计算效率,学者们尝试多种模型和方法[22,23,24],对经典模型进行优化、调整与改进[25,26],加入本地词汇、全局信息、外部知识等各种特征[27,28,29],综合多种方法[30,31]。随着深度学习发展,深度神经网络也被成功应用到命名实体识别问题,取到不错的识别效果,主要有卷积神经网络[32]、循环神经网络[33]以及引入注意力机制的神经网络[34]。


  (3)词性标注。词性标注主要有基于规则、基于统计模型和两者相结合的方法。基于规则词性标注的基本思想是按照兼类词语搭配关系和上下文语境构造词类的消歧规则,如美国布朗大学(Brown University, Brown)开发的TAGGIT系统[13]。在基于语料库统计的词性标注方法上,应用比较广泛的是隐马尔可夫模型[35]、最大熵模型[36]、条件随机场[37]和Bert模型[38]。有学者结合条件随机场和组合特征模板,在古籍文本词性自动标注的应用上做了积极探索[39],Bert模型非常适用于古汉语的词性标注处理[16]。


  2.3.2篇章级别的技术分析


  (1) 信息抽取。面向非结构化文本的信息抽取,具体包括实体抽取、关系抽取和事件抽取3种任务。实体抽取即命名实体识别,前文已经讨论。关系抽取是从文本中抽取多个实体之间的语义关系,一般采用基于模板、基于监督学习、基于弱监督学习的关系抽取方法[40]。已有的事件抽取方法可以分为流水线方法和联合抽取方法两类。流水线方法将事件抽取分解为4个基于分类的子任务,包括事件识别、元素抽取、属性分类和可报告性判别[38]。联合抽取方法是指关于事件的所有信息会通过一个模型同时抽取出来。比如,基于RoBERTa-CRF模型,先用多层Transformer提取语料特征,再结合前后文序列标签学习相关性约束,对古文历史事件进行联合抽取[41]。


  (2) 文本分类与聚类。分类与聚类是文本挖掘中常用方法,目的都是将高相似度信息进行归类,不同点在于分类采用有监督机器学习,聚类采用无监督机器学习。文本分类在数字人文领域有着较成熟的应用,如古籍目录的互著与别裁[42]、多模态非遗图片的分类[43]、典籍子部分类[44]。在数字人文研究中,常采用K均值算法和LDA主题模型方法进行聚类,在文本分析[45]、图像内容解析[46]、关键词抽取[47]、本体构建[48]等方面应用广泛。


  (3)情感分析[49]。早期学者一般用定量方法统计情感词的频率[50]。在数字人文领域,大多利用机器学习方法对文学作品的情感特征自动判别。比如,构建融入汉字语言特征的条件随机场模型和BERT-BiLSTM-CRFs深度学习模型,对唐诗宋词的诗文风格、体裁和情感进行识别与分类研究[51]。


  2.4 基于机器学习的知识发现


  近年以机器学习为代表的人工智能技术在数字人文研究中发挥了重要作用,较常见的模型包括朴素贝叶斯分类器、决策树和支持向量机模型特别适用于文本分类问题,而最大熵模型、隐马尔可夫模型、条件随机场等模型在词性标注、命名实体识别、信息抽取等自然语言处理问题上表现出色[52]。随着计算机性能提高,深度神经网络技术不断突破,特别是在语音识别、图像识别方面崭露头角。机器学习也被广泛应用到数字人文研究,如OCR手写体识别、对领域知识的细粒度处理、知识检索及智能问答。由于机器学习常与其他方法结合应用,在此不具体展开讨论。


  2.5 基于可视化技术的知识展示


  可视化技术能以更为直观、更易理解、更具有冲击力的视觉效果展现数据内在的信息和规律,辅助研究者开展分析、解释等学术活动。在数字人文研究中,可视化一般不是单独存在的,通常与远读、社会网络分析、地理信息系统等方法结合应用。


  (1)可视化技术与远读。可视化是远读的重要呈现手段[53],二者的结合应用为较大时间跨度、较大规模的数据资料提供了新的阅读与解读方法。有六类适用于远读的可视化方法:结构图、热力图、标签云、地图、时间线、网络图,用以展现文本的结构层级、频次、地理空间分布、时间演化、对象间的关系[54]。


  (2)可视化技术与社会网络分析。社会网络分析是根据图论、数学方法发展而来的定量分析方法,将社会关系看作节点(node)与边(relational tie)组成的网络,通过可视化技术可以直观地揭示出文本中的人物关系、人物功能、关系强度等信息。例如,基于英国国家档案馆123850封书信的都铎王朝通信网络可视化项目(The Tudor Network, TN)[55],通过计算度中心性、介数中心性、特征向量中心性等指标,能够直观展现出通信网络中的关键性人物和关系网。


  (3)可视化技术与地理信息系统。地理信息系统(Geographic Information System,GIS)能够对空间信息进行分析和处理,在环境演变、聚落变迁、舆情或疫病传播等方面广泛应用,数字人文领域中典型成果有“唐宋文学编年地图”“数字方志集成平台”“全球汉籍分布GIS系统”等。


  3 数智赋能:数字人文应用场景的转型


  数据基础设施建设以及数字技术发展为人文研究拓展了新的应用场景和学科生长点。数智赋能情境下,以往传统人文研究中一些不能或难以解决的课题,可以重新从不同学科领域、不同角度以及不同侧重点进行分析与解决。以文学、历史学和艺术学、图档博学科为例,对数字技术下的人文研究“新”应用场景进行梳理,有助于深入把握人文社科研究趋势,探索人文学科研究范式和知识生产模式的变革,促进相关学科领域的现代转型。


  3.1文学领域应用场景


  (1)远读与细读。大数据时代下,庞大的信息量超出个人阅读理解范畴,传统的细读经典方法不再适用于从宏观上把握文本。莫雷蒂提出“远读”(distant reading)的文学研究方法,即借助计算机对大规模文本集合所表现出的总体特征进行解读。其过程主要通过一系列的自然语言处理技术,将文本置换为便于计数的词汇集合,并借助可视化技术描述词汇集合的全局特征,从宏观层面把握文学体系。远读如同传统文献的目录和索引,为文档集合提供了全局图景,帮助学者在海量资料中筛选需要文本,辅助细读研究。在大规模文本集合上所做的远读,基本上可以归为两类:一类是对文本集合整体统计特征的描述。米歇尔[56]提出“文化组学(culturomics)”概念,通过统计数百万册图书中的单词随时间推移的使用频率,由此推导出人类文化的发展趋势和演变规律。另一类远读方法是对文本集合内在结构特征的揭示。比如群体传记学研究(Prosopography),“中国历代人物传记资料库”提供51万人的传记资料,通过对一群历史人物的生平信息(如出生、死亡、婚姻、家庭、经济地位、居住地、教育、宦历等信息)进行组合,找出具有显著意义的变量,探讨人物一般性、普遍性和共性的背景特征。


  (2)空间位置及时间序列分析。文学研究中存在时空分离难题,传统研究多按照时间序列呈现文学史的发展历程,如思想观念变迁、习俗演化,忽略空间信息。地理信息系统为古代文学研究提供了新方向,在计算机图形图像处理、数据库技术、测绘遥感技术及现代数学研究方法的基础上,集成历史文献、古地图、遥感影像、地名志、考古信息等多元史料,推动历史与地理交相为用,时间与空间互为表里。中南民族大学开发的“唐宋文学编年地图”提出编年与系地并重的建设理念,从作家、作品、时间、空间四个维度全时空呈现作家的活动场景,既可纵向观察历时性的文学发展进程,又可横向了解共时性的文学地域分布[57]。浙江大学与哈佛大学地理分析中心共建的“学术地图发布平台”为用户提供地理信息研究成果的发布、可视化分析及多功能查询服务,从空间维度展示中国人文与历史[58]。


  (3)文献循证。人文学界轻文献考辨、重义理阐发致使学风空疏[59]。数据驱动的数字人文研究提供了挖掘文献证据及其关联关系的新方法,给文献学、考据学等古籍整理工作带来新活力。上海图书馆“中文古籍联合目录及循证平台”是依靠自动化数据挖掘和推理技术来揭示文献证据的应用平台,就典籍中的内容提供全面的关系描述和推理,构建包括物理证据、内容证据、历史证据、关联证据的文献证据链。“中国哲学书电子化计划”具有相似段落数据库、引得或索引讯息检索的功能,可以提供关于原典成书历史的线索,将其作为校勘过程中的证据来辨章学术、考镜源流。


  3.2历史学领域应用场景


  (1)文化遗产智慧数据。进入数字社会以来,文化遗产数字化快速推进。如何将文化遗产经过数据化和智慧化加工,形成内容数字化、编码结构化、表示语义化、组织网络化和关联智能化的文化遗产智慧数据成为极具挑战的问题。王晓光[60]基于海量的敦煌文献和数字资源,探索敦煌文化遗产智慧数据的构建路径和方法,主要建设内容包括敦煌壁画主题词表构建与关联数据发布、敦煌石窟本体及相关数据模型、图像深度语义标注、图像数字资产管理系统、敦煌壁画图像交互式数字叙事系统,以及敦煌石窟知识图谱与应用服务。为解决多源异构的文化遗产数据跨领域跨机构的知识融通问题,夏翠娟[61]提出“本体应用纲要”设计方法和“一体化本体”融通模型,并运用于上海图书馆的家谱、手稿档案、古籍等资源的描述与揭示层面。


  (2)历史地理信息化与空间人文研究。2000年诺尔斯(Knowles)[62]率先指出历史学进入“空间转向(Spatial Turn)”阶段,历史学家将GIS技术引入历史研究。大量的国家历史地理信息平台被开发建设,如朴次茅斯大学(University of Portsmouth)“英国历史地理信息系统(Great Britain Historical GIS)”、根特大学(Ghent University)“比利时历史地理信息系统(Belgian historical GIS)”、哈佛大学与复旦大学合作开发的“中国历史地理信息系统(China Historical GIS)”。一些专题性历史地理信息系统也得到建设,如哈佛大学地理分析中心(The Center for Geographic Analysis, Harvard University)“哈佛世界地图(Harvard WorldMap)”、南京大学“六朝建康历史地理信息系统”、首都师范大学“丝绸之路历史地理信息开放平台”。这些历史地理信息系统利用数据库和GIS技术将文献资料与电子地图结合,侧重于探索重大历史事件的时空运行规律,将历史事件的自然背景信息耦合进系统,试图重现不同时空切面下的人文景观,实现人文空间的可视化呈现,在历史气候变动、河流地貌、市镇经济、乡村聚落、水利社会、环境变迁等方面取得了突破。


  随着数字人文发展,范毅军[63]提出发展空间人文、重回历史现场倡议,进而提出“Geo-Humanities(Spatial Humanities)=HGIS+Digital Humanities”概念。空间人文研究侧重于遗址或文物的三维建模与虚拟呈现,主要针对城市史、考古、墓葬、遗址田野调查、景观考古学领域开展研究工作。武汉大学“文化遗产智能计算实验室”、天津大学“空间人文与场所计算实验室”贡献了颇多开创性成果,探讨文物与大遗址三维建模、古城市重建、古代交通网络和河道复原、遗址墓葬空间分析等问题,促进了物质和非物质文化遗产从现实世界向数字空间的迁移。


  (3) 数字记忆工程。为实现对文化遗产的保护与传承,1992年联合国教科文组织发起世界记忆工程(Memory of the World, MoW),掀起数字文化记忆项目热潮,已有80多个国家超过2400个数字记忆项目[64],囊括国家记忆(如美国数字记忆)、城市记忆(如上海年华项目)、村落记忆(如高迁数字记忆)、事件记忆(如911数字档案馆)等类型。这些项目是对可承载记忆属性的资源进行开发利用,具有多资源互补、多媒体连通、迭代式增长、开放式构建特点[65]。通过利用地理信息系统、可视化、3D/4D历史城市重建、虚拟仿真、沉浸体验等技术手段,将多类型图书、报刊、乐曲、录音、照片、画作、视频等资源集成,使用户达到视听共鸣、记忆共振和文化回响的效果。


  3.3艺术学领域应用场景


  (1)艺术作品数字化。元数据标准、本体建模、开放关联数据和知识图谱等技术的应用推动了艺术领域的数字资源建设,艺术品的数字表示、数字存储、数字展示等环节取得长足发展。在艺术品的数字描述和数字建档方面,出现更为细化、更具针对性的艺术类本体模型,如描述印度传统舞蹈的Nrityakosha本体模型[66]、表示拜占庭教堂绘画的场景本体模型[67]、分析传统武术文化特征的本体模型[68]。在艺术品数字资料存储方面,随着Artstor、Art Net、Art Index等艺术数据库开发,各类艺术品、艺术家、拍卖机构、收藏人、展览信息被全面整合。陈静利用各类古籍、图像、实物资源开展中国非物质文化遗产的搜集与整理研究,从工艺、色彩和图纹三个维度对非遗知识进行拆解、再现和重组,建设“ZHI艺:非物质文化遗产虚拟展示平台”。在艺术品的虚拟展示和开放共享方面,各国博物馆开展藏品数字化工作,如大英博物馆MicroPasts项目、大都会艺术博物馆的开放获取政策。法国卢浮宫将超过48万件藏品数字化,免费供公众下载;谷歌与70多个国家和地区的1000多家博物馆合作,推出“艺术与文化项目(Google Arts & Culture)”,利用街景技术拍摄博物馆内部实景,以最高70亿像素的超高解析度向公众展示馆内经典藏品。


  (2)数据驱动的艺术分析。数字艺术发展使原本聚焦于各类艺术品的目光转移到作品之间的关系与关联语境的建构上,艺术家利用科学数据进行艺术分析与创作。艺术分析特点发生从定性到定量、从抽样分析到全景透视、从文本阐释到“看图说话”的转变[69]。向帆和朱舜山开发的交互可视化项目“Award Puzzle(全国美展获奖油画作品可视化在线平台)”[70]分析全国美展获奖2276张油画作品数据,通过设计“以作品为中心”和“以作者为中心”的两套元数据集,将时间、色彩、画幅、地理、获奖人等因素相联系,直观地辨别全国美展获奖油画作品中的同质化趋势,如获奖作品色彩集中于明亮的红黄调区域、画幅越来越大、多次获奖作者的作品主题重复。此类案例还有基于CBDB的中国家谱树绘制[71]、在线交互视觉平台“百老汇大街(On Broadway)”[72]等。


  (3)计算机辅助与生成艺术。1949年亚当斯(Adams)利用计算机生成简单图像《弹球》(Bouncing Ball),引发艺术家对于科技和艺术相结合的探索。随着机器学习、高清扫描、色彩还原、虚拟现实等技术应用,计算机能辅助艺术进行鉴定修复、评价、教学等。例如,使用宏观X射线荧光扫描技术对书法、油画作品的物理属性进行研究,以确认创作时期、辨识真伪或后期修复[73];利用深度卷积神经元网络和机器学习来验证创作者身份,预测艺术品的拍卖价格[74]。


  在计算机生成艺术上,学者们探索计算机自动生成诗歌、乐曲等创意作品的可能性,如微软小冰写作诗集、索尼模仿披头士乐队创作音乐。在神经网络技术加持下,人工智能在模仿和生成图像艺术品上也有突破性进展。2014年古德费洛[75]提出生成式对抗网络(Generative Adversarial Networks,GAN),通过让生成模型(Generative Model)和判别模型(Discriminative Model)两个神经网络相互博弈的方式进行学习和输出。计算机通过学习大量艺术作品的颜色、形状等特征,模仿并生成类似的艺术作品,然而这一过程在本质上不属于创作,只是复制粘贴已有的艺术品。艾哈迈德·艾尔加马尔[76]提出创意对抗网络(Creative Adversarial Networks),在GAN基础上学习艺术品风格,通过修改目标,最大限度地偏离已知的艺术品风格,从而使创造更具创意。在一项由艺术专业背景受试者评分的图灵测试中,CAN生成的作品创新度比人类作品评分更高。


  3.4图博档领域应用场景


  (1) 数据基础设施建设。图博档机构是社会信息、知识、文化的记忆装置,凭借其丰富的资源优势,成为数字人文项目的重要发起者和参与主体。同时,由于图博档机构具备相关的人员、环境、设备和技术支撑,可为信息资源的保存、组织、整合、开发、利用等数字人文的数据基础设施建设提供支持。一项对图书馆与数字人文关系的调查表明[77],97%受访者认为数字人文的资料和项目成果应保存在图书馆。在图博档领域,数字人文数据基础设施建设实际开展较早、较为成熟,数字图书馆时代的特藏库可以算是数字人文数据基础设施的前身。20世纪80年代以来,一批古籍藏量可观的图书馆参与古籍数字化、古籍普查登记、中华古籍联合目录和古籍数字资源库建设,如北京大学图书馆自建的“秘籍琳琅”数据库、收录30余家海内外图书馆所藏古籍善本的“中华古籍善本国际联合书目系统”。


  (2)标准规范应用与制订。人文资源具有多源异构、多模态的特点,如何将其转化为可发现、可访问、可互操作、可重用的优质资源是图博档领域关注的问题。图博档机构借助于元数据、关联数据等技术,对人文信息资源进行语义描述与组织,将无序的原始人文信息转换为结构化的RDF数据,并有意识地将可供同行参考借鉴的语义描述模型和数据发布标准整理成规范。在人文资源语义描述、标引以及管理的研究方面,已经出现例如面向文化遗产的CIDOC-CRM概念参考模型、艺术品描述类目(CDWA)、文物编目(CCO)、轻量级信息描述对象(LIDO)、芬兰时空本体(SAPO)、国际图像互操作框架(IIIF)、视觉资料核心类目(VRA Core)等本体模型,以及各类人名规范库、历史纪年表、地理名词表等人文辞表关联数据集。


  (3)平台工具算法的开发与服务。图博档领域致力于将智能计算和语义分析技术等前沿技术应用于人文语料,参与研发了相关的工具、算法及服务平台。例如,北京大学数字人文研究中心开发的“吾与点”古籍自动整理平台提供图片文字识别、自动句读、命名实体识别三项基本古籍整理功能,基于深度学习的预训练语言模型实现,句读准确率(F1值)超过94%,达到实用标准。这些服务平台、工具和算法可以极大提升古籍的数字化效率和利用率,为古籍内容的整理和深度挖掘提供了便利工具。


  4 研究挑战及未来展望


  数字人文数据基础设施的逐步完善以及数字技术蓬勃发展,助推了传统人文学科的现代转型,文学、历史学、艺术学、图博档等传统人文领域迎来新的应用场景和生长点。数智赋能为数字人文研究带来新的发展机遇,也存在一定的挑战。当下,数字人文仍然面临着研究方法同质化、算法崇拜、技术与需求脱节、利用深度不足、人文学者认同度低、不可持续建设等困境。究其根源,是数字人文领域存在的几点问题没有得到有效解决。


  一是学术研究的独创性与技术手段的同质化之间的矛盾。随着数字技术的发展,一系列的模型、算法、软件、工具、平台被开发出来以支持数字人文研究,这为研究者提供了共性的研究思路和可复制推广的研究方法。然而,便捷的技术手段极易造成研究成果产出的同质化,其模式往往是输入海量数据,使用最新模型、最好算法“炫技”,输出数据结果并进行解释。虽然这一过程也解释了数据是什么,但研究者容易陷入对数据、技术工具的依赖,忽略了人文学科思辨式的学理阐释,不利于学术研究的创新性发展。在运用大数据、人工智能等“新方法”去研究“老数据”的学术道路上,要注意协调数字技术与研究问题之间的平衡,最新模型、最好算法可能并不是最合适的技术手段,要针对人文特定语料和应用场景,选择最合适的技术手段,善于从“老数据”中发现新问题、取得新突破。


  二是人文学者的数字学术需求与实际使用程度之间的矛盾。为适应新兴学术环境的变革,人文学者对数据获取、技术应用的数字学术需求愈发迫切[78],数字人文基础设施数量随着增加。然而数字人文基础设施建设存在相互孤立、缺乏关联等问题,数字人文基础设施投入使用率低于预期[79]。究其原因,一是数字技术与领域知识之间存在鸿沟,由于缺乏专业领域知识,开发人员难以满足人文学者的深层需求,同时学者由于欠缺数字技能,对数字人文的认可和使用程度有待提高;二是数据表示不规范,人文学者不予认同,导致实际使用程度较低,数字技术能否完整记录人文研究的过程与结果,仍值得商榷[3]。在将传统思辨式的人文知识以数据形式表示时,应考虑遵循何种标准和规则转化数据,如何准确揭示异构资源所含的语义内容,这仍是需要解决的重点难点问题之一。


  三是数字人文基础设施的公益性质与可持续发展之间的矛盾。可持续性是数字人文基础设施建设面临的严峻问题,早期一些课题基金支撑的数字人文项,随着课题结项,不再进行增量更新及维护升级,逐渐变成僵尸数据库。对具有公益性质的数字人文基础设施而言,如何获得可持续的资金、技术、人力进行后续运营维护是亟待解决的问题。有学者提议营造学界和业界的可持续发展生态环境,将一些资源授权开放供学术研究,并且将有潜质的成果进行商业化,转化后的成果能够为后续研究提供支持,这样既能保护学术研究,也能保证商业利益[80]。还有学者探索公众科学模式,借助社会化众筹、众包社区等方式创建数字人文项目的共建共享机制,尝试为数字人文基础设施的可持续性发展带来新的契机。


  数智赋能已成为引领传统人文研究创新发展的驱动力,深入影响人文学科的研究范式和实践逻辑。从数据层面看,多源异构、多模态、数量庞大、跨领域的人文资源,为数据驱动的数字人文研究奠定了丰富的数据基础,数字人文的数据基础设施逐步完善。从技术层面看,数据驱动的分析手段能更好地进行多维度历史呈现,帮助学者发现隐藏在海量数据下的事实,辅助相关学科的学者进行论证分析。从应用场景看,数字人文浪潮助推了传统人文学科的现代转型,文学、历史学、艺术学、图档博领域迎来新的学科生长点。然而需要指出的是,目前数字人文研究仍处于初始阶段,技术方法同质化、需求与技术脱节、可持续建设等问题还没有得到有效解决,我们不能将数智赋能看成是人文学科发展的直通车。一方面,学者还需关注数字人文的标准规范和评价体系等具体问题,从需求和实践层面确立统一的框架标准,于细微处见真章;另一方面,数字人文的基础设施建设也需要顶层设计和统筹规划,为可持续发展提供切实保障。


  参考文献


  [1] 刘炜,林海青,夏翠娟.数字人文研究的图书馆学方法:书目控制与文献循证[J].大学图书馆学报,2018,36(5):116-123.


  [2] 王晓光,谭旭,夏生平.敦煌智慧数据研究与实践[J].数字人文,2020(4):11-23.


  [3] 刘石,李飞跃.大数据技术与传统文献学的现代转型[J].中国社会科学,2021(2):63-81.


  [4] Frédéric Kaplan. Venice Time Machine[EB/OL].[2022-02-26].


  [5] 黄水清,王东波.古文信息处理研究的现状及趋势[J].图书情报工作,2017,61(12):43-49.


  [6] 夏翠娟.面向人文研究的“数据基础设施”建设——试论图书馆学对数字人文的方法论贡献[J].中国图书馆学报,2020,46(3):24-37.


  [7] 赵薇.数字时代人文学研究的变革与超越——数字人文在中国[J].探索与争鸣,2021(6):191-206.


  [8] 卢彤,李明杰.中文古籍数字化成果辅助人文学术研究功能的调查[J].图书与情报,2019(1):70-79.


  [9] 龙家庆.数字人文项目中档案数据开发工具及应用研究——以“欧洲时光机”为例[J].北京档案,2021(3):10-15.


  [10] 陈力.数字人文视域下的古籍数字化与古典知识库建设问题[J].中国图书馆学报,2022,48(2):36-46.


  [11] 崔雷. 中文古籍数字化研究[D].吉林大学,2010.


  [12] 邓君,王阮.口述历史档案资源知识组织与关联分析[J].情报资料工作,2021,42(5):58-67.


  [13] 刘晓娟,潘银蓉,刘慧平,崔月强.数字人文视角下古建筑描述模型设计研究——以什刹海地区为例[J].图书情报工作,2020,64(19):119-127.


  [14] Vivien Petras.Digitized Manuscripts to Europeana[EB/OL].[2022-04-05].


  [15] Cristina Pattuelli.Linked Jazz Project[EB/OL].[2022-04-05].


  [16] Eero Hyvönen. Linked Open Data Infrastructure for Digital Humanities in Finland[EB/OL].[2022-04-05].


  [17] 宗成庆. 统计自然语言处理[M]. 北京:清华大学出版社, 2013:135-150.


  [18] 石民,李斌,陈小荷.基于CRF的先秦汉语分词标注一体化研究[J].中文信息学报,2010,24(2):39-45.


  [19] 钱智勇,周建忠,童国平,等.基于HMM的楚辞自动分词标注研究[J].图书情报工作,2014,58(4):105-110.


  [20] 张琪,江川,纪有书,等.面向多领域先秦典籍的分词词性一体化自动标注模型构建[J].数据分析与知识发现,2021,5(3):2-11.


  [21] 刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340.


  [22] McCallum A, Li W. Early results for named entity recognition with conditional random fields, feature induction and web-enhanced lexicons[C]// Proceedings of the Seventh Conference on Natural Language Learning at HLT-NAACL, Stroudsburg: Association for Computational Linguistics, 2003,4:188-191.


  [23] Bikel D M, Miller S, Schwartz R, et al. Nymble: a high-performance learning name-finder[C]// Proceedings of the Fifth Conference on Applied Natural Language Processing. Stroudsburg: Association for Computational Linguistics, 1997:194-201.


  [24] Isozaki H, Kazawa H. Efficient support vector classifiers for named entity recognition[C]// Proceedings of the 19th International Conference on Computational Linguistics. Stroudsburg: Association for Computational Linguistics, 2002, 1:1-7.


  [25] Zhou G, Su J. Named entity recognition using an HMM-based chunk tagger[C]// Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Stroudsburg: Association for Computational Linguistics, 2002:473-480.


  [26] Leaman R, Lu Z. TaggerOne: joint named entity recognition and normalization with semi-Markov Models[J]. Bioinformatics, 2016, 32(18):2839-2846.


  [27] Li C, Liu Y. Improving named entity recognition in Tweets via detecting non-standard words[C]// Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing. Stroudsburg: Association for Computational Linguistics, 2015:929-938.


  [28] Krishnan V, Manning C D. An effective two-stage model for exploiting non-local dependencies in named entity recognition[C]// Proceedings of the 21st International Conference on Computational Linguistics and the 44th Annual Meeting of the Association for Computational Linguistics. Stroudsburg: Association for Computational Linguistics,2006:1121-1128.


  [29] Kazama J I, Torisawa K. Exploiting Wikipedia as external knowledge for named entity recognition[C]// Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, 2007:698-707.


  [30] Li L, Mao T, Huang D, et al. Hybrid models for Chinese named entity recognition[C]// Proceedings of the Fifth SIGHANWorkshop on Chinese Language Processing. Stroudsburg: Association for Computational Linguistics, 2006:72-78.


  [31] 张晓艳,王挺,陈火旺.基于混合统计模型的汉语命名实体识别方法[J].计算机工程与科学,2006(6):135-139.


  [32] Lample G, Ballesteros M, Subramanian S, et al. Neural Architectures for Named Entity Recognition[J]. Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics,2016:260-270.


  [33] Ma X, Hovy E. End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF[J]. Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics,2016:1064-1074.


  [34] Rei M, Crichton G, Pyysalo S. Attending to Characters in Neural Sequence Labeling Models[J]. Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers, 2016:309-318.


  [35] 袁里驰.基于改进的隐马尔科夫模型的词性标注方法[J].中南大学学报(自然科学版),2012,43(8):3053-3057.


  [36] 孔海霞.基于最大熵的汉语词性标注[D].大连理工大学,2007.


  [37] 袁悦,王东波,黄水清,李斌.不同词性标记集在典籍实体抽取上的差异性探究[J].数据分析与知识发现,2019,3(3):57-65.


  [38] 向营.基于BERT和NLPIR的数学应用题向量化词性标注[D].华中师范大学,2020.


  [39] 王东波,黄水清,何琳.基于多特征知识的先秦典籍词性自动标注研究[J].图书情报工作,2017,61(12):64-70.


  [40] 王昊奋,漆桂林,陈华钧. 知识图谱:方法,实践与应用[M]. 北京:电子工业出版社, 2019.


  [41] 喻雪寒,何琳,徐健.基于RoBERTa-CRF的古文历史事件抽取方法研究[J].数据分析与知识发现,2021,5(7):26-35.


  [42] 张力元,王军.基于机器学习的古籍目录互著与别裁探析[J].中国图书馆学报,2022,48(2):47-61.


  [43] 范涛,王昊,李跃艳,邓三鸿.基于多模态融合的非遗图片分类研究[J/OL].数据分析与知识发现:1-14.


  [44] 胡昊天,张逸勤,邓三鸿,等.面向数字人文的《四库全书》子部自动分类研究——以Siku BERT和Siku Ro BERTa预训练模型为例[J].图书馆论坛:1-16.


  [45] 陈松.为学作记——从网络分析和文本分析视角看宋代地方官学碑记的作者与主题[J].数字人文,2020(4):24-72.


  [46] 王海沣,邓柯,陈静.基于卷积神经网络的近代报纸广告图片聚类方法[J].数字人文,2021(2):50-61.


  [47] 秦贺然,王东波.数字人文下的先秦古汉语关键词抽取应用——以《春秋经传》为例[J].图书馆杂志,2020,39(11):97-105.


  [48] 郑姝雅,黄奇,张戈,等.面向用户生成内容的本体构建方法[J].情报科学,2019,37(11):43-47.


  [49] 吴斌,吉佳,孟琳,等.基于迁移学习的唐诗宋词情感分析[J].电子学报,2016,44(11):2780-2787.


  [50] Mohammad S M . From once upon a time to happily ever after: Tracking emotions in mail and books[J]. Decision Support Systems, 2012, 53(4):730-741.


  [51] 张卫,王昊,邓三鸿,等.面向数字人文的古诗文本情感术语抽取与应用研究[J].中国图书馆学报,2021,47(4):113-131.


  [52] 刘浏,王东波,黄水清.机器学习视角的人工智能研究回顾及对图书情报学的影响[J].图书与情报,2017(6):84-95.


  [53] 王军.从人文计算到可视化——数字人文的发展脉络梳理[J].文艺理论与批评,2020(2):18-23.


  [54] Stefan Jänicke. On close and distant reading in digital humanities: a survey and future challenges[EB/OL].[2022-03-15].


  [55] R. Ahnert. The Tudor Network[EB/OL].[2022-03-15].


  [56] Michel J B , Yuan K S , Aiden A P , et al. Quantitative Analysis of Culture Using Millions of Digitized Books[J]. Science, 331(6014):176-182.


  [57] 王兆鹏,邵大为.数字人文在古代文学研究中的初步实践及学术意义[J].中国社会科学,2020(8):108-129.


  [58] 唐云芝.中国人文数据库建设的新动向——学术地图发布平台的建设、功能及其应用[J].浙江大学学报(人文社会科学版),2018,48(3):113.


  [59] 计亚男,杜羽. 人文研究数字化:一场方兴未艾的变革[N]. 光明日报,2021-10-09(4).


  [60] 王晓光,谭旭,夏生平.敦煌智慧数据研究与实践[J].数字人文,2020(4):11-23.


  [61] 夏翠娟.文化记忆资源的知识融通:从异构资源元数据应用纲要到一体化本体设计[J].图书情报知识,2021(1):53-65.


  [62] Knowles,A K. Special Issue: Historical GIS: The Spatial Turn in Social Science History[J].Social Science History,2000,24(3):451-470.


  [63] 王涛,陈静,吴雪映.“数字人文的学术评价体系:定义与规范建构”研讨会发言汇编[J].数字人文,2021(1):1-57.


  [64] 周耀林,刘晗.数字记忆建构:缘起、理论与方法[J].山东社会科学,2020(8):50-59.


  [65] 冯惠玲.数字记忆:文化记忆的数字宫殿[J].中国图书馆学报,2020,46(3):4-16.


  [66] Mallik A, Chaudhury S,Ghosh H. Nrityakosha: Preserving the intangible heritage of Indian classical dance[J].Journal on Computing and Cultural Heritage,2011,4(3):1-25.


  [67] Carboni N, Luca L D. Towards A Conceptual Foundation For Documenting Tangible And Intangible Elements Of A Cultural Object[J].Digital Applications in Archaeology and Cultural Heritage, 2016, 3(4):108-116.


  [68] Adamou A,Hou Y,Picca D,et al.Ontology-Mediated Cultural Contact Detection Through Motion and Style in Southern Chinese Martial Arts.[C/OL]//Proceedings of the International Joint Workshop on Semantic Web and Ontology Design for Cultural Heritage[2022-04-12].


  [69] 金家琴,夏翠娟.数字人文在视觉化艺术领域的应用前沿——图像艺术分析与计算机生成艺术[J].图书馆杂志,2021,40(6):101-109.


  [70] 向帆.视觉文献的视觉化设计——全国美展获奖油画作品视觉化工具AwardPuzzle设计探索[J].装饰,2016(7):92-94.


  [71] 向帆,朱舜山.中国家谱树的绘制实验报告——基于中国历代人物传记资料库的视觉化实践[J].装饰,2018(10):90-93.


  [72] Manovich L ,Stefaner M.On Broadway[EB/OL].[2022-04-13].


  [73] 陈静.生成、转化与知识生产——数字技术与艺术交融的三种路径[J].艺术理论与艺术史学刊,2019(1):224-238.


  [74] Jason Bailey. Can AI Art Authentication Put An End To Art Forgery?[OL]. [2022-04-14]. 


  [75] Goodfellow I J, Pouget-Abadie J, Mirza M, et al. Generative adversarial nets[C]//International Conference on Neural Information Processing Systems. MIT Press, 2014:2672-2680.


  [76] Elgammal A , Liu B , Elhoseiny M , et al. CAN: Creative Adversarial Networks, Generating "Art" by Learning About Styles and Deviating from Style Norms[EB/OL].[2022-04-15].http://www.arxiv-vanity.com/papers/1706.07068/


  [77] Stewart V,Patricia H.Special Report: Digital Humanities in Libraries[EB/OL].[2022-08-03].


  [78] 肖鹏,衣春波.万华镜里的自画像:关于中国人文学者数字学术认知与需求的质性研究[J].图书情报工作,2021,65(7):4-14.


  [79] Gao D, He L, Liu J, et al. "Construction over operation? A study of the usage of digital humanities databases in China", Aslib Journal of Information Management, 2022(1):1-18.


  [80]阮益嫘.让古籍“活下去"更要活起来”[EB/OL].[2022-08-11].让古籍活下去更要活起来”


相关文章
100%安全可靠
7X18小时在线支持
支付宝特邀商家
不成功全额退款