文献计量学论文

您当前的位置:学术堂 > 图书档案学论文 > 文献计量学论文 >

文献计量角度下中国电子文件长期保存相关文献探究

时间:2020-09-10 来源:资源信息与工程 共3761字
作者:李毅强,郑川 单位:湖南大学档案馆 中南大学档案技术研究所

  摘    要: 文章以中国知网为数据来源,运用文献计量、知识图谱和内容分析的方法,使用Note Express和Microsoft Excel对国内近二十年来关于电子文件长期保存研究进行计量分析。发现相关文献数量和各类基金项目数量稳步增长,已形成较稳定的核心作者群,档案学核心期刊是该领域研究的主要来源期刊,高等院校与档案局、档案馆等机构是电子文件长期保存的主要研究单位。

  关键词: 电子文件; 长期保存; 文献分析;

  Abstract: This paper used CNKI as the data source,bibliometrics,knowledge maps and content analysis as the methods,and Note Express and Microsoft Excel as the tools to conduct bibliometric analysis of domestic studies relevant to long-term electronic document preservation in the past 20 years. It was found that the number of relevant studies and various fund projects have been growing steadily,and a relatively stable core author group has formed.Journals belongs to core area of archives science are the major source journals,and the colleges,universities,and archives are the major research institutes.

  Keyword: electronic records; long-stem preservation; document analysis;

  1 、引言

  信息化时代,电子文件成为了人们记录、传递和交流信息的主要工具,它是一组相关信息的集合,包括文字、声音声像、图表等多种格式的计算机可读文件,具备传统纸质档案特有的原始性、记录性、凭证性等特点,成为了重要的社会记忆。但电子文件本身具有容易复制、容易删除、容易修改、容易损坏等特性,传统的工作流程、模式和技术,很难满足电子文件管理的要求。尤其在技术更新频繁、快速迭代的今天,使电子文件满足真实性、完整性、可用性和安全性四性检测要求,实现电子文件长期保存,更是业界所关注的焦点。本文从文献计量的角度对国内电子文件长期保存相关文献进行梳理和统计分析,以期为该领域研究提供参考。

  2 、研究方法和数据来源

  2.1 、研究方法

  通过文献计量法、内容分析法和知识图谱对我国电子文献长期保存相关文献进行分析。计量分析工具使用文献管理软件NoteExpress 3.2.0和电子表格软件Microsoft Excel 2016。NoteExpress是一款专业级的文献检索与管理软件,其核心功能涵盖文献检索、采集、管理、应用和挖掘等知识管理的所有环节[1]。Microsoft Excel可以方便地处理表格数据和进行图形分析,且具有直观的可视化界面和优秀的图表工具,适用于各种数据分析。
 

文献计量角度下中国电子文件长期保存相关文献探究
 

  2.2 、数据来源

  本文以中国知网CNKI为数据来源,检索式“主题=电子文件and长期保存(精确匹配)”;发表时间不限;文献来源不限,检索时间为2019年11月10日,得到中文文献376篇。将这些文献题录以自定义格式导出为文本文件后通过“CNKI-Export(Custom)”过滤器导入NoteExpress,再由“CNKI-中国知网(IP登录)”批量下载所有文献全文。通过逐篇阅读摘要的方式对文献进行数据清洗,剔除重复题录6篇、新闻资讯6篇、卷首语1篇、期刊要览1篇、内容无关文献15篇、访谈稿1篇,最终得到346篇国内电子文件长期保存的相关文献。

  3、 国内电子文件长期保存文献计量分析

  3.1 、发文时间计量分析

  在NoteExpress通过文件夹统计信息功能对346篇文献的“年份”字段进行统计,将结果另存为文本文件导入Microsoft Excel,按年度发文量绘制发文时间及数量分布曲线图如图1所示。国内电子文件长期保存相关文献最早出现在1997年,在随后的二十多年时间里,该领域发文数量呈明显上升趋势,由于文献收录存在一定的滞后和检索时点原因,2019年发文数量缺乏参考性。根据发文时间及数量分布曲线图,我国电子文件长期保存研究可分为两个阶段,1997年~2004年为起步阶段,年发文数量在5篇左右较为稳定;2005年至今为稳步发展阶段,年发文数量呈稳定增长态势,近3年年发文数量均在35篇以上。总体上看,我国对电子文件长期保存的研究与我国信息技术发展进步、科研投入的增长呈正相关[2]。

  图1 发文时间及数量分布曲线图
图1 发文时间及数量分布曲线图

  3.2 、文献作者计量分析

  在NoteExpress中使用数据及分词管理器对电子文件长期保存文献的“作者”字段进行统计,346篇文献共涉及作者405名,其中发文量最多的作者发文数量为9篇。根据普赖斯定律(Law of Price)计算公式,发文量在m=0.749×N槡max篇以上的作者为核心作者[3],计算得m=2.247,即发文量大于等于3篇的作者为该领域的核心作者:发表9篇的刘家真、刘越男,发表6篇的有钱毅、肖秋会,徐义全发表5篇,毛义春和张美芳各4篇,发表3篇的有陈晓晖、程妍妍、冯惠玲、侯衡、祁天娇、孙瑾、屠跃明、张健、张梦霞、张雅君、赵淑梅、赵屹等。由核心作者形成的核心作者群是推动学科发展和学术创新的重要力量。346篇文献中署名人数2人及以上的共106篇,独立作者论文240篇,论文合着率30.6%属于较低水平[4],说明该领域的科研合作有待加强。

  3.3 、发文单位计量分析

  直接统计346篇电子文件长期保存文献共涉及发文单位253个,分析发现作者署名单位通常为所在机构的具体部门,会给发文单位统计带来误差,因此对署名单位进行标准化处理:发文单位统一以一级单位统计,如“中国人民大学信息资源管理学院”和“中国人民大学电子文件研究中心”统一记为“中国人民大学”;合着论文以通讯作者所在单位进行统计。处理之后共有发文单位174个,发文量大于等于4篇的单位统计如表1所示。发文数量高的单位,与该领域的核心作者群所在单位的重合度较高,且高等院校与档案局、档案馆等档案管理机构是电子文件长期保存研究的主要单位。

  表1 发文数量≥4篇单位统计表
表1 发文数量≥4篇单位统计表

  3.4 、来源期刊计量分析

  346篇电子文件长期保存相关文献中,除会议论文与学位论文外,有期刊论文296篇。在Note Express中通过文献类型字段=“期刊”筛选后,使用数据及分词管理器统计来源期刊,296篇期刊论文分布在87种刊物上,取载文量前十(含并列)的期刊绘制环形图如图2所示。布拉德福定律(Law of Bradford)把载文期刊分为核心区、相关区和非相关区,理论上每个区间的载文量占总发文量的三分之一[5],可以发现电子文件长期保存相关文献的来源期刊中,核心区期刊和相关区期刊全部为档案学学科的期刊,档案学学科是该领域的主要研究力量。其中《档案学研究》和《档案学通讯》为CSCD来源期刊,也属于核心区期刊;《档案与建设》、《北京档案》、《档案管理》、《中国档案》和《浙江档案》为北大中文核心期刊,前两者属于核心区期刊,后三者属于相关区期刊。CSCD来源期刊和北大中文核心期刊在核心区期刊和相关区期刊中占比达46.7%,发文量占比达59.6%。可见档案学的CSCD来源期刊和北大中文核心期刊是电子文件长期保存研究领域最重要的刊发平台。

  图2 载文量前十(含并列)期刊统计图
图2 载文量前十(含并列)期刊统计图

  3.5 、基金支持计量分析

  基金项目是我国政府对科学研究资助的主要方式之一,基金项目的研究通常代表该研究领域的创新性成果和前沿性进展[6],也在一定程度上成为文献创新性和前沿性的衡量指标之一[7]。从电子文件长期保存相关文献获得各类基金资助的情况看,346篇论文共有61篇标注了基金项目,占比17.6%。单篇论文标注多个基金项目的,取级别较高的进行统计,结果如表2所示。国家社科基金项目对电子文件长期保存的研究资助力度最大,共计29个项目占比8.38%;其次是省部级基金项目,共计19个项目占比5.49%,省部级基金项目以教育部项目、省级科技项目、省档案局项目为主。

  将标注基金项目的论文按发文时间做升序排列,得到不同年度各类基金项目对电子文件长期保存研究的资助情况。最早出现的基金项目为1999年教育部“九五”规划基金,标注该基金的论文为武汉大学刘家真的《保护数字信息长期存取研究综述》[8]。1999年~2008年期间,该研究领域所获基金项目支持数量较少,年均不到1项;2009年~2018年期间,各类基金项目对该领域的支持稳步增加,近3年年均接近9项。基金项目支持数量的逐年增加,与图1所示的年发文数量增长呈现同步的趋势。

  表2 文献标注基金项目情况统计表
表2 文献标注基金项目情况统计表

  4 、结语

  随着社会信息化程度越来越高,各类信息系统在人们的生产生活活动中不断深入,电子文件的长期保存问题也越来越重要。通过对该领域文献的计量分析发现,二十年来相关文献数量和各类基金项目数量稳步增长,已形成较稳定的核心作者群,档案学核心期刊是该领域研究的主要来源期刊,高等院校与档案局、档案馆等档案管理机构是电子文件长期保存的主要研究单位。

  参考文献

  [1]王正晶.Note Express实现文献计量分析的方法-以五种情报学核心期刊统计分析为例[J].情报科学,2013,31(10):80-82.
  [2]李国杰.新时期呼唤新的科研模式-中国70年信息科技发展的回顾与思考[J].中国科学院院刊,2019,34(10):1125-1129.
  [3]姚雪.基于普赖斯定律和二八定律及在线投稿系统构建某科技期刊核心作者用户库[J].编辑学报,2017,29(1):64-66.
  [4]范爱红.国内外研究型大学国际合着论文的比较研究[J].情报杂志,2013,32(11):59-63.
  [5]赵隽.基于布拉德福定律区域法的学术论文分布研究[J].现代情报,2007(5):26-28.
  [6]温美荣,吴金鹏.中国社会科学研究政府资助的发展向度与推进逻辑-基于2008~2018年国家社科基金资助项目的计量分析[J].行政论坛,2019,26(5):134-142.
  [7]陈会琴,王琦琪.基于2011~2015年文献计量学的统计分析[J].宁夏大学学报(人文社会科学版),2017,39(6):153-160.
  [8]刘家真.保护数字信息长期存取研究综述[J].情报杂志,1999(4):32-35.

原文出处:李毅强,郑川.国内电子文件长期保存文献计量分析[J].资源信息与工程,2020,35(04):157-159.

相关内容推荐
相关标签:
在线咨询