"大数据时代"科技期刊的出版革命及面临挑战

“大数据时代”科技期刊的出版革命及面临挑战

2013年08月28日 14:38:00 吴锋 出版发行研究 浏览 :

摘 要:伴随着海量数据生产、关联、消费和处理的常态化,“大数据”成为新近学术界、IT界和各国政府关注的热点,也成为科技期刊界不可回避的焦点问题。研究认为,大数据对科技期刊出版具有革命性的影响,将推进科技期刊编辑流程的再优化、科技期刊出版业态的多媒体化和科技期刊评价规则的多元化。但大数据也是一把“双刃剑”,科技期刊面临赢利模式、竞争环境透明化,工作量加大等挑战,而政府立法和国际合作亦面临全新课题。

关键词:大数据 科技期刊 出版革命

早在1980年,美国著名未来学家托夫勒就预测了“大数据”将在“第三次浪潮”中扮演重要角色;2009年,“大数据”作为一种新的专业术语和商业模式引起各界瞩目,它不仅是学术界的下一个创新前沿,而且是商业界另一个热门市场,还是各国政府关注的战略领域,许多外国媒体和专家将2013年称为“大数据元年”[1]。那么,“大数据”会给科技期刊出版带来哪些革命性的影响?科技期刊又将面临哪些严峻挑战?

一、“大数据”的概念及基本特征

虽然“大数据”作为一个名词早在1980年托夫勒出版的《第三次浪潮》一书中已经出现,但新近流行的大数据概念是一个新的专业术语。[2]进入新世纪以来,随着物联网、云计算、移动互联网等信息技术的快速扩散,社会各领域的数据种类和生产规模正以前所未有的速度增长。在公共领域,国际社会对数据

透明化与数据共享的需求日益强烈,全球范围内广泛兴起的数据关联运动、政府数据公开运动增加了数据资源的可获得性与可用性。[3]在私人领域,随着PC、智能手机、iPad、iPhone等新型数字产品的普及,以论坛、微博和微信等为代表的自媒体迅猛崛起,公众每天都在生产、交换、消费或积累着海量的多样化数据。国际数据公司(IDC)的最新研究显示,2011年全球数据生产量达1.8 ZB,且全球信息总量每隔两年增长一倍。[4]海量数据的产生深刻地改变了人们对客观事物的描述手段,也为人们探寻数据背后的客观规律提供了新的分析工具。2007年,计算机图灵奖得主吉姆·格雷(Jim Grey)在美国国家研究理事会计算机科学和远程通讯委员会(NRC-CSTB)的一个演讲报告中提出了科学研究的“第四范式”,即以数据为中心,以协同化、网络化与数据驱动为主要特征的数据密集型科学研究,[5]强调大数据对现今科研工作的重大影响。2008年《自然》杂志率先推出了“大数据”专刊,[6]使其迅即成为全球计算机科学界的显学。2009年初,微软、IBM、甲骨文、惠普等IT巨头纷纷携巨资挺进大数据市场。国际信息产业界认为,大数据包含两大市场:一是大数据核心技术及相关的硬件、软件和个人服务市场。2010年全球该领域的市场规模达到30 亿美元,2015年则将超过170 亿美元;未来中国大数据潜在市场规模近2万亿元,并将成为全球最大的大数据市场。[7]二是政府及行业公共领域的服务市场。据麦肯锡预测,通过高效使用公共大数据,美国医疗服务业每年可节省3000亿美元,欧洲的公共管理每年可节省2500亿欧元,英国政府每年可节约开支330亿英镑,制造业在产品开发、组装等环节可节省50%的成本。[1]缘于此,2012年美国奥巴马政府发布《大数据研究和发展倡议》,投资2亿美元启动“大数据发展计划”。

关于大数据的定义,目前尚无统一说法。有论者从数据规模的量级上进行度量,认为仅当数据累加量值在10 TB 至1 PB(P为T的千倍)以上方可称为“大数据”[8]。维基百科认为,大数据是指无法在一定时间内用通常的软件工具进行捕获、管理的数据集合。[9]笔者认为,大数据是在数据密集型科学环境下的一套用于超大规模数据的采集、存储、分析及知识再发现的信息处理范式的统称。学术界普遍认为大数据具有3V特性,即反映数据量级的规模性(volume)、反映数据类型属性的多样性(variety)和反映数据产生及变化时效的高速性(velocity)。但笔者认为还应强调其“3R”的特性:一是可记录性(recordable),大数据存在前提是客观事物的活动状态得以便捷高效、低成本、全方位地数字化记录;二是关联性(relevance),只有数据孤岛被打破、数据公开获取成为常态,海量数据之间的关联才成为可能;三是再组织性(reorganization),利用数据分析工具对常规数据进行再组合加工,推动“知识的再发现”,进而构建“以数据为核心”的商业服务模式。

二、大数据时代科技期刊的“出版革命”及战略机遇

1. 科技期刊编辑流程的再优化

大数据技术对科技期刊的影响首先表现在助推期刊作业的流程再造,实现编辑操作的流程革命。过去许多难以控制、不能细化、不可数字化描述的流程转为可控制、可细化、可用数据精确描述的作业流程;过去许多无序的手工作业模式将逐步转为标准化、程序化的作业模式;过去因人而异、隐蔽无序的编辑规则模式转为统一规范、透明有序的编辑规则模式。可以预见,未来基于大数据的科技期刊编辑系统是以多维度数据处理为基础,以计算机网络和人工智能计算工具为

手段,以增加编辑透明度为原则,以减少重复劳动和简单劳动、提升编辑质量及效率为目标的复合型、动态型、智能型编辑管理工具。在大数据时代,由于作者、编者、专家的信息传输和决策行为等均纳入了数字化管理轨道,并与中外公共文献数据库实现了连接与共享,这使期刊编辑中的数据互通共享、数据计算分析及数字化作业成为可能(图1),进而催生出“智能编辑管理”“时间管理”和“透明化管理”等全新的编辑管理模式。

其一,基于大数据平台的“智能编辑管理”,引入人工智能计算分析工具,对作者来稿进行“预处理”编辑,自动生成反映作者学术水准、学术贡献、学术知名度等特性的分析和评估报告,自动生成反映来稿内容特性及分类的监测、分析和评估报告,进而大大减轻编辑的人工作业负担。其具体功能:一是学术不端来稿的智能甄别功能,利用作者投稿与已发表的中外公共文献数据进行比对,可有效甄别有抄袭、中文重复发表、跨语言重复发表嫌疑的来稿。此外,若多家科技期刊共用一个期刊编辑系统平台,或者国内多家期刊编辑系统实现了后台数据的连接协作,则可利用科技期刊编辑系统后台的数据查重计算工具,进而识别有“一稿多投”嫌疑的来稿。换言之,在大数据平台背景下,计算机智能编辑可从投稿环节杜绝学术不端类稿件,减少无效劳动。二是作者评估分级功能,帮助编辑对来稿作者的层级分布属性进行科学评估,并加以分级或排序。如利用来稿的作者信息与中外已发表公共文献数据库平台中的作者进行比对,利用投稿作者的发表数和弃用稿数信息,计算作者稿件的发表比例,对作者发表论文的数量、期刊层次、被引次数等历史信息进行梳理,可将作者分为权威作者、高端作者和一般作者等层次类型,便于对不同作者的来稿做个性化处理。三是稿件属性预评估,引入在线文本分析工具,将作者来稿关键词与国内外公共文献数据库进行比对分

析,帮助编辑对海量来稿的时效性、选题热度、学科领域等属性进行评估和分类,进而判断来稿是否属于特定学科领域的新近热门主题或重要选题。最后,依据上述三方的数据自动生成综合性评估报告或报表(见图2)。

其二,基于大数据平台的“时间管理”,对论文的审稿周期和出版周期进行控制管理,达到编辑流程的可控化目标。对期刊社来说,可以依据期刊的学科特性和自身条件,自主决定稿件编辑的周期,对需要快审的重头稿件、需要多方审定的难点稿件、需要反复斟酌的争议稿件等设置个性化的时间节点,进而提升编辑的质量和效益;对审阅者而言,期刊编辑平台可以利用三网融合工具,用短信、微博、微信等移动工具自动提醒专家及时审阅稿件,审稿专家可利用移动通信工具登陆审阅系统,在iPad或智能手机平台上进行审阅,进而加快审稿进度;对作者而言,不仅可获知稿件动态,而且可以及时获取论文发表后被转载、被引等情况的信息。

其三,基于大数据平台的“透明化”管理,打破编辑流程中的信息阻隔和信息孤岛,使得多方信息的连接与互动成为可能。传统科技期刊编辑过程中,编辑和评审人的决策多不为外界知晓,其决策不透明的方式一直饱受诟病。在大数据编辑平台中,编辑亦可将修改建议、专家审稿结论等信息及时反馈给作者,并允许作者进行答辩或申诉,进而建立作者、专家和编者三者之间的良性互动框架,最终实现编辑流程的透明化,确保审稿和编稿的公平公正。

2. 科技期刊出版业态的多媒体化

近年来,全球生态恶化问题凸显,以节能减排和清洁生产为核心诉求的低碳经济成为全球经济的主流。期刊印刷中的纸张、油墨等皆属高能耗、高污染产品。

自2008年起全球范围的原油价格暴涨,使纸质出版物物流成本大幅攀升。在此背景下,传统出版物的“业态革命”由理念层面的前沿构想变为实践层面的实际行动。2009年4月,曾七获普利策新闻奖的美国百年大报《基督教科学箴言报》停止纸质印刷日报出版,转为每天24小时随时更新的电子出版物;2010年9月,拥有119年历史的《巴西日报》停出印刷版,成为巴西第一家仅以网络版形式存在的报纸;2013年1月,全球知名的老牌期刊《新闻周刊》正式放弃印刷版杂志,实现全部数字化。目前,国内科技期刊仍沿用传统的纸质出版模式,但在世界范围内,除极少数综合性知名科技期刊外,大多数科技期刊属于专业性期刊,传播对象局限在较窄的细分领域。由于发行量小,大多数科技期刊的印刷量均在批量印刷临界点以下,故而印刷成本高昂;缘于科技期刊的发行面分散,其投递发行成本亦居高不下。科技期刊的上述特性和实情表明,由传统的纸质出版转向数字出版将是未来不可逆转的趋势,而大数据的理念与技术使得这场转型成为现实。

大数据将为科技期刊出版新型业态的实现提供全面的技术支持和平台支撑,并将引发科技期刊出版介质的革命、传播平台的革命和多媒体编辑的革命。首先是科技期刊出版介质的革命,即由原来单一的纸质出版介质转为多媒体出版介质,能够容纳平面媒体和数字媒体等多种形式,并可将音频、视频等动态信息纳入期刊出版框架。数字出版只需运用软件将通过审核的论文转化为符合数字出版的格式即可,不仅省去了印刷与投递环节、大幅降低了科技期刊的出版成本,而且可以实现实时发布,大大提高了科技论文的传播时效,具有无可比拟的优势。在可以预见的一段时间内,未来科技期刊的纸质版将与数字版并存,纸质印刷的数量会保持现有印量或逐步减少单期印量;未来另一种可能的出版模式是:科技期刊

每期论文直接制作成电子版上传至数据库平台出版,但无须每期每篇文章均印刷出版,而是精选部分下载量大、被引频次高、社会影响较大的最优内容,推出精简的双月或季度印刷版、半年或年度印刷版,使优秀科技论文获得更好的传播效果。其次是传播平台的革命,即由传统的单一纸质传播平台转为多样化平台共存的传播模式,包括纸质传播平台(含纸质转载)、综合性数据库和专业数据库平台、iPad和iPhone平台等,达到科技期刊全媒体传播的效果。最后是多媒体编辑的革命,即科技期刊需突破平面文本信息编辑的传统模式,能够编辑包含文字、图片以及音频和视频在内的多媒体文件,实现由平面编辑向多媒体编辑的转型。在大数据时代,缘于科技期刊出版实现了完整的数字化,科技论文既不受版面容量的限制,亦不受媒体符号样式的制约,预计未来科技论文发表的多媒体文本结构将可能包含三方面的信息:一是由文字和图片表述的平面媒体信息,它是论文的主体,与传统论文的表述方式类似;二是用音频和视频表述的动态性质的数字媒体信息,它是对主体论文信息的重要补充,也是对传统论文单一平面表述方式的重要突破;三是附件信息,即在论文后附带的用以描述实验过程的视频、用以证明科技论文结果的原始数据或实验过程数据等(见图3)。这种多媒体的论文结构框架,不仅便于作者更为充分地展示自身的科研过程和创新程度,而且可以有效遏制数据造假等学术不端行为,这将是科学研究史上的重大进步。但这对科技期刊编辑提出了更高的要求,即不仅要精通平面文字符号的编辑,而且还要熟悉多媒体音频及视频信息的编辑。

3. 科技期刊评价规则的多元化

在世界科技期刊发展中,评价规则的创设、应用与发展起到了风向标的作用。目前,全球科技界普遍采用基于文献计量学的定量评价规则来评判科技期刊及论文的影响力,科技期刊的影响因子及论文的被引频次是两个最受瞩目的指标[10],美国物理学家赫希和比利时著名科学计量学家埃格赫分别提出了评价个人科技论文影响力的H指数和G指数。[11]这些量化指标在评价科技期刊及论文的质量和水准方面起到了一定的积极作用,但这种一刀切的量化指标未能考量不同学科发展水平的差异,无法解读文献引用背后的具体含义(如无法区分真引与伪引、正引与反引、应引与漏引等情形),无法解释论文被引的时效滞后等问题。近年来,学术界逐渐意识到需要构建多维度的综合评价法,[12]对科技期刊及论文的质量或影响力进行更为全面的评估,但总体上未能取得根本突破。在大数据时代,科技期刊及论文影响力评价将面临一场新的革命:在评价方法上,大数据平台将为科技期刊及论文评价提供更庞大的数据样本和更多样的挖掘分析工具,不仅能够拓展定量分析的指标框架,而且能够运用文本分析和语义分析技术构建定性分析指标,实现定量与定性评估的结合;在评价时态上,大数据平台是一个实时更新的动态信息网络,运用在线数据挖掘与跟踪技术对科技论文的被引情况进行动态跟踪和科学预测,进而将静态结论性数据与动态的变化数据结合起来,实现静态评估与动态评估的结合;在反馈信息上,数据库平台可以开放科技期刊及论文评价窗口,允许受众参与意见反馈,引入论文反馈计量和统计工具,不仅可以收集专家的评价信息、同行作者的分析和引用信息、读者的推荐或批评反馈信息,还可以收集业界厂商应用推广的市场效果信息,并将这些信息纳入期刊及论文评价体系。概言之,基于大数据平台的科技期刊及论文评估是定性与定量相结

合、静态与动态相结合、主观评价与客观评价相结合的多样化、综合性评价规则,也是更为科学、更为多元化的评价机制(见图4)。

三、大数据时代科技期刊发展面临的挑战

虽然在大数据时代,科技期刊的运营主要围绕“数据”展开,科技期刊的审稿、编辑、传播渠道和阅读终端等皆可步入数字化的运行轨道,但需指出的是,基于数据的纯数字化操作并不能完全代替传统的手工编辑作业。例如,在科技期刊编辑的校对环节,经验丰富的编辑均认为,基于电子界面的数字化校对存在“视觉盲区”,最有效的校对(尤其是最后一轮校对)仍需沿用纸质文本校对的方式,因为在纸质界面上编辑的视觉敏锐性得到强化,进而提升了对差错的识别能力。与此同时,大数据环境下科技期刊的发展还面临一系列更为严峻的挑战。其一,基于大数据平台的信息透明化生态可能进一步强化科技期刊的“马太效应”。例如,在CNKI推出的2013年版期刊数据库中,所有入库期刊的复合影响力因子、综合影响力因子等均属于公开数据,这意味着起点不同、竞争力悬殊、类型各异的期刊将在同一公共平台上进行实力比拼,这势必造成“强者更强、弱者更弱”的马太效应。此外,这种数据公开机制对新创办的期刊和某些弱势学科领域的期刊是明显不利的。其二,科技期刊的赢利模式面临新的挑战。科技期刊的数字化转型使其依靠纸质发行和广告赢利的传统模式发生巨变:科技期刊在发行环节的收入可能更少,甚至可能完全失去订阅费;在数字化产品中,广告植入的难度更大,可能进一步减少广告刊载收入;由于发行和内容传播将依赖大数据平台,科技期刊的发展可能更加受制于大型数据库运营商。预计未来科技期刊将与数据库运营商建立一个利益分享机制,以期刊论文的点击量、下载量和被引量来分享发

行和广告收入,但双方的分成比例究竟如何确定,则是一个棘手的难题。其三,在大数据时代,科技期刊论文的发稿时效将大大加快,对期刊编辑和审稿专家提出了更高要求,不仅需要建立一支高素质的编辑队伍,而且需要一批乐于奉献的高水平审稿专家队伍,因而需要作者、编辑和专家协同创新,以适应新的编辑环境。其四,国家科技期刊的监管面临一系列的新问题。例如,国家是否应该放开电子科技期刊的刊号审批?电子科技期刊的常规审读和年检该如何进行?其五,在大数据时代,科技期刊的数据、数据运营商的数据乃至国外期刊及数据运营商的数据均需互通、互联和共享,但数据的公开、共享与数据的版权保护、信息安全是一对孪生矛盾,如何在数据公开和数据保护之间找到一个平衡点,进而在有效保护版权的前提下促进科技期刊之间的数据合作,这将是未来立法领域的一个亟待破解的难题。此外,在大数据平台上,中外科技期刊及数据库运营商之间的数据共享和交换将更为频繁,如何在平等互利、保障国家信息主权的基础上促进中外科技期刊及数据库运营商之间的国际合作,亦成为未来国际立法领域的紧迫课题。

参考文献

[1]冯海超.大数据时代正式到来[J].互联网周刊,2012(24):36-38. [2]杨绎.基于文献计量的“大数据”研究[J].图书馆杂志,2012(9):29-32.

[3]侯经川,方静怡.大数据时代的数据引证研究:进展与展望[J].中国图书馆学报,2013(1):1-7.

[4]本刊编辑部.拥抱大数据时代[J].数据,2012(12):8.

[5]周晓英.数据密集型科学研究范式的兴起与情报学的应对[J].情报资料工作,2012(2):5-11.

[6]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(1):146-169.

[7]李萧然.大数据成新战场 IT厂商奋勇掘金[J].IT时代周刊,2013

(1).

[8]陈明奇,姜禾,张娟,等.大数据时代的美国信息网络安全新战略分析[J].信息网络安全,2012(8):33-35.

[9]维基百科.大数据[OL],

http://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B0%E6%8D%AE,2012-10-05.

[10]刘勇敏.利用引文数据库进行科研绩效评价——河南科技大学科技论文的文献计量学研究[J].现代情报,2007(6):138-140.

[11]姜春林,刘则渊,梁永霞.H指数和G指数——期刊学术影响力评价的新指标[J].图书情报工作,2006,50(12):63-65.

[12]杨桂涛,苏博,刘鉴汶.对科技论文进行综合评价初探[J].中华医学科研管理杂志,2003,16(2):118-120.

(作者单位:江南大学数字媒体学院)

来源 :《出版发行研究》

“大数据时代”科技期刊的出版革命及面临挑战

2013年08月28日 14:38:00 吴锋 出版发行研究 浏览 :

摘 要:伴随着海量数据生产、关联、消费和处理的常态化,“大数据”成为新近学术界、IT界和各国政府关注的热点,也成为科技期刊界不可回避的焦点问题。研究认为,大数据对科技期刊出版具有革命性的影响,将推进科技期刊编辑流程的再优化、科技期刊出版业态的多媒体化和科技期刊评价规则的多元化。但大数据也是一把“双刃剑”,科技期刊面临赢利模式、竞争环境透明化,工作量加大等挑战,而政府立法和国际合作亦面临全新课题。

关键词:大数据 科技期刊 出版革命

早在1980年,美国著名未来学家托夫勒就预测了“大数据”将在“第三次浪潮”中扮演重要角色;2009年,“大数据”作为一种新的专业术语和商业模式引起各界瞩目,它不仅是学术界的下一个创新前沿,而且是商业界另一个热门市场,还是各国政府关注的战略领域,许多外国媒体和专家将2013年称为“大数据元年”[1]。那么,“大数据”会给科技期刊出版带来哪些革命性的影响?科技期刊又将面临哪些严峻挑战?

一、“大数据”的概念及基本特征

虽然“大数据”作为一个名词早在1980年托夫勒出版的《第三次浪潮》一书中已经出现,但新近流行的大数据概念是一个新的专业术语。[2]进入新世纪以来,随着物联网、云计算、移动互联网等信息技术的快速扩散,社会各领域的数据种类和生产规模正以前所未有的速度增长。在公共领域,国际社会对数据

透明化与数据共享的需求日益强烈,全球范围内广泛兴起的数据关联运动、政府数据公开运动增加了数据资源的可获得性与可用性。[3]在私人领域,随着PC、智能手机、iPad、iPhone等新型数字产品的普及,以论坛、微博和微信等为代表的自媒体迅猛崛起,公众每天都在生产、交换、消费或积累着海量的多样化数据。国际数据公司(IDC)的最新研究显示,2011年全球数据生产量达1.8 ZB,且全球信息总量每隔两年增长一倍。[4]海量数据的产生深刻地改变了人们对客观事物的描述手段,也为人们探寻数据背后的客观规律提供了新的分析工具。2007年,计算机图灵奖得主吉姆·格雷(Jim Grey)在美国国家研究理事会计算机科学和远程通讯委员会(NRC-CSTB)的一个演讲报告中提出了科学研究的“第四范式”,即以数据为中心,以协同化、网络化与数据驱动为主要特征的数据密集型科学研究,[5]强调大数据对现今科研工作的重大影响。2008年《自然》杂志率先推出了“大数据”专刊,[6]使其迅即成为全球计算机科学界的显学。2009年初,微软、IBM、甲骨文、惠普等IT巨头纷纷携巨资挺进大数据市场。国际信息产业界认为,大数据包含两大市场:一是大数据核心技术及相关的硬件、软件和个人服务市场。2010年全球该领域的市场规模达到30 亿美元,2015年则将超过170 亿美元;未来中国大数据潜在市场规模近2万亿元,并将成为全球最大的大数据市场。[7]二是政府及行业公共领域的服务市场。据麦肯锡预测,通过高效使用公共大数据,美国医疗服务业每年可节省3000亿美元,欧洲的公共管理每年可节省2500亿欧元,英国政府每年可节约开支330亿英镑,制造业在产品开发、组装等环节可节省50%的成本。[1]缘于此,2012年美国奥巴马政府发布《大数据研究和发展倡议》,投资2亿美元启动“大数据发展计划”。

关于大数据的定义,目前尚无统一说法。有论者从数据规模的量级上进行度量,认为仅当数据累加量值在10 TB 至1 PB(P为T的千倍)以上方可称为“大数据”[8]。维基百科认为,大数据是指无法在一定时间内用通常的软件工具进行捕获、管理的数据集合。[9]笔者认为,大数据是在数据密集型科学环境下的一套用于超大规模数据的采集、存储、分析及知识再发现的信息处理范式的统称。学术界普遍认为大数据具有3V特性,即反映数据量级的规模性(volume)、反映数据类型属性的多样性(variety)和反映数据产生及变化时效的高速性(velocity)。但笔者认为还应强调其“3R”的特性:一是可记录性(recordable),大数据存在前提是客观事物的活动状态得以便捷高效、低成本、全方位地数字化记录;二是关联性(relevance),只有数据孤岛被打破、数据公开获取成为常态,海量数据之间的关联才成为可能;三是再组织性(reorganization),利用数据分析工具对常规数据进行再组合加工,推动“知识的再发现”,进而构建“以数据为核心”的商业服务模式。

二、大数据时代科技期刊的“出版革命”及战略机遇

1. 科技期刊编辑流程的再优化

大数据技术对科技期刊的影响首先表现在助推期刊作业的流程再造,实现编辑操作的流程革命。过去许多难以控制、不能细化、不可数字化描述的流程转为可控制、可细化、可用数据精确描述的作业流程;过去许多无序的手工作业模式将逐步转为标准化、程序化的作业模式;过去因人而异、隐蔽无序的编辑规则模式转为统一规范、透明有序的编辑规则模式。可以预见,未来基于大数据的科技期刊编辑系统是以多维度数据处理为基础,以计算机网络和人工智能计算工具为

手段,以增加编辑透明度为原则,以减少重复劳动和简单劳动、提升编辑质量及效率为目标的复合型、动态型、智能型编辑管理工具。在大数据时代,由于作者、编者、专家的信息传输和决策行为等均纳入了数字化管理轨道,并与中外公共文献数据库实现了连接与共享,这使期刊编辑中的数据互通共享、数据计算分析及数字化作业成为可能(图1),进而催生出“智能编辑管理”“时间管理”和“透明化管理”等全新的编辑管理模式。

其一,基于大数据平台的“智能编辑管理”,引入人工智能计算分析工具,对作者来稿进行“预处理”编辑,自动生成反映作者学术水准、学术贡献、学术知名度等特性的分析和评估报告,自动生成反映来稿内容特性及分类的监测、分析和评估报告,进而大大减轻编辑的人工作业负担。其具体功能:一是学术不端来稿的智能甄别功能,利用作者投稿与已发表的中外公共文献数据进行比对,可有效甄别有抄袭、中文重复发表、跨语言重复发表嫌疑的来稿。此外,若多家科技期刊共用一个期刊编辑系统平台,或者国内多家期刊编辑系统实现了后台数据的连接协作,则可利用科技期刊编辑系统后台的数据查重计算工具,进而识别有“一稿多投”嫌疑的来稿。换言之,在大数据平台背景下,计算机智能编辑可从投稿环节杜绝学术不端类稿件,减少无效劳动。二是作者评估分级功能,帮助编辑对来稿作者的层级分布属性进行科学评估,并加以分级或排序。如利用来稿的作者信息与中外已发表公共文献数据库平台中的作者进行比对,利用投稿作者的发表数和弃用稿数信息,计算作者稿件的发表比例,对作者发表论文的数量、期刊层次、被引次数等历史信息进行梳理,可将作者分为权威作者、高端作者和一般作者等层次类型,便于对不同作者的来稿做个性化处理。三是稿件属性预评估,引入在线文本分析工具,将作者来稿关键词与国内外公共文献数据库进行比对分

析,帮助编辑对海量来稿的时效性、选题热度、学科领域等属性进行评估和分类,进而判断来稿是否属于特定学科领域的新近热门主题或重要选题。最后,依据上述三方的数据自动生成综合性评估报告或报表(见图2)。

其二,基于大数据平台的“时间管理”,对论文的审稿周期和出版周期进行控制管理,达到编辑流程的可控化目标。对期刊社来说,可以依据期刊的学科特性和自身条件,自主决定稿件编辑的周期,对需要快审的重头稿件、需要多方审定的难点稿件、需要反复斟酌的争议稿件等设置个性化的时间节点,进而提升编辑的质量和效益;对审阅者而言,期刊编辑平台可以利用三网融合工具,用短信、微博、微信等移动工具自动提醒专家及时审阅稿件,审稿专家可利用移动通信工具登陆审阅系统,在iPad或智能手机平台上进行审阅,进而加快审稿进度;对作者而言,不仅可获知稿件动态,而且可以及时获取论文发表后被转载、被引等情况的信息。

其三,基于大数据平台的“透明化”管理,打破编辑流程中的信息阻隔和信息孤岛,使得多方信息的连接与互动成为可能。传统科技期刊编辑过程中,编辑和评审人的决策多不为外界知晓,其决策不透明的方式一直饱受诟病。在大数据编辑平台中,编辑亦可将修改建议、专家审稿结论等信息及时反馈给作者,并允许作者进行答辩或申诉,进而建立作者、专家和编者三者之间的良性互动框架,最终实现编辑流程的透明化,确保审稿和编稿的公平公正。

2. 科技期刊出版业态的多媒体化

近年来,全球生态恶化问题凸显,以节能减排和清洁生产为核心诉求的低碳经济成为全球经济的主流。期刊印刷中的纸张、油墨等皆属高能耗、高污染产品。

自2008年起全球范围的原油价格暴涨,使纸质出版物物流成本大幅攀升。在此背景下,传统出版物的“业态革命”由理念层面的前沿构想变为实践层面的实际行动。2009年4月,曾七获普利策新闻奖的美国百年大报《基督教科学箴言报》停止纸质印刷日报出版,转为每天24小时随时更新的电子出版物;2010年9月,拥有119年历史的《巴西日报》停出印刷版,成为巴西第一家仅以网络版形式存在的报纸;2013年1月,全球知名的老牌期刊《新闻周刊》正式放弃印刷版杂志,实现全部数字化。目前,国内科技期刊仍沿用传统的纸质出版模式,但在世界范围内,除极少数综合性知名科技期刊外,大多数科技期刊属于专业性期刊,传播对象局限在较窄的细分领域。由于发行量小,大多数科技期刊的印刷量均在批量印刷临界点以下,故而印刷成本高昂;缘于科技期刊的发行面分散,其投递发行成本亦居高不下。科技期刊的上述特性和实情表明,由传统的纸质出版转向数字出版将是未来不可逆转的趋势,而大数据的理念与技术使得这场转型成为现实。

大数据将为科技期刊出版新型业态的实现提供全面的技术支持和平台支撑,并将引发科技期刊出版介质的革命、传播平台的革命和多媒体编辑的革命。首先是科技期刊出版介质的革命,即由原来单一的纸质出版介质转为多媒体出版介质,能够容纳平面媒体和数字媒体等多种形式,并可将音频、视频等动态信息纳入期刊出版框架。数字出版只需运用软件将通过审核的论文转化为符合数字出版的格式即可,不仅省去了印刷与投递环节、大幅降低了科技期刊的出版成本,而且可以实现实时发布,大大提高了科技论文的传播时效,具有无可比拟的优势。在可以预见的一段时间内,未来科技期刊的纸质版将与数字版并存,纸质印刷的数量会保持现有印量或逐步减少单期印量;未来另一种可能的出版模式是:科技期刊

每期论文直接制作成电子版上传至数据库平台出版,但无须每期每篇文章均印刷出版,而是精选部分下载量大、被引频次高、社会影响较大的最优内容,推出精简的双月或季度印刷版、半年或年度印刷版,使优秀科技论文获得更好的传播效果。其次是传播平台的革命,即由传统的单一纸质传播平台转为多样化平台共存的传播模式,包括纸质传播平台(含纸质转载)、综合性数据库和专业数据库平台、iPad和iPhone平台等,达到科技期刊全媒体传播的效果。最后是多媒体编辑的革命,即科技期刊需突破平面文本信息编辑的传统模式,能够编辑包含文字、图片以及音频和视频在内的多媒体文件,实现由平面编辑向多媒体编辑的转型。在大数据时代,缘于科技期刊出版实现了完整的数字化,科技论文既不受版面容量的限制,亦不受媒体符号样式的制约,预计未来科技论文发表的多媒体文本结构将可能包含三方面的信息:一是由文字和图片表述的平面媒体信息,它是论文的主体,与传统论文的表述方式类似;二是用音频和视频表述的动态性质的数字媒体信息,它是对主体论文信息的重要补充,也是对传统论文单一平面表述方式的重要突破;三是附件信息,即在论文后附带的用以描述实验过程的视频、用以证明科技论文结果的原始数据或实验过程数据等(见图3)。这种多媒体的论文结构框架,不仅便于作者更为充分地展示自身的科研过程和创新程度,而且可以有效遏制数据造假等学术不端行为,这将是科学研究史上的重大进步。但这对科技期刊编辑提出了更高的要求,即不仅要精通平面文字符号的编辑,而且还要熟悉多媒体音频及视频信息的编辑。

3. 科技期刊评价规则的多元化

在世界科技期刊发展中,评价规则的创设、应用与发展起到了风向标的作用。目前,全球科技界普遍采用基于文献计量学的定量评价规则来评判科技期刊及论文的影响力,科技期刊的影响因子及论文的被引频次是两个最受瞩目的指标[10],美国物理学家赫希和比利时著名科学计量学家埃格赫分别提出了评价个人科技论文影响力的H指数和G指数。[11]这些量化指标在评价科技期刊及论文的质量和水准方面起到了一定的积极作用,但这种一刀切的量化指标未能考量不同学科发展水平的差异,无法解读文献引用背后的具体含义(如无法区分真引与伪引、正引与反引、应引与漏引等情形),无法解释论文被引的时效滞后等问题。近年来,学术界逐渐意识到需要构建多维度的综合评价法,[12]对科技期刊及论文的质量或影响力进行更为全面的评估,但总体上未能取得根本突破。在大数据时代,科技期刊及论文影响力评价将面临一场新的革命:在评价方法上,大数据平台将为科技期刊及论文评价提供更庞大的数据样本和更多样的挖掘分析工具,不仅能够拓展定量分析的指标框架,而且能够运用文本分析和语义分析技术构建定性分析指标,实现定量与定性评估的结合;在评价时态上,大数据平台是一个实时更新的动态信息网络,运用在线数据挖掘与跟踪技术对科技论文的被引情况进行动态跟踪和科学预测,进而将静态结论性数据与动态的变化数据结合起来,实现静态评估与动态评估的结合;在反馈信息上,数据库平台可以开放科技期刊及论文评价窗口,允许受众参与意见反馈,引入论文反馈计量和统计工具,不仅可以收集专家的评价信息、同行作者的分析和引用信息、读者的推荐或批评反馈信息,还可以收集业界厂商应用推广的市场效果信息,并将这些信息纳入期刊及论文评价体系。概言之,基于大数据平台的科技期刊及论文评估是定性与定量相结

合、静态与动态相结合、主观评价与客观评价相结合的多样化、综合性评价规则,也是更为科学、更为多元化的评价机制(见图4)。

三、大数据时代科技期刊发展面临的挑战

虽然在大数据时代,科技期刊的运营主要围绕“数据”展开,科技期刊的审稿、编辑、传播渠道和阅读终端等皆可步入数字化的运行轨道,但需指出的是,基于数据的纯数字化操作并不能完全代替传统的手工编辑作业。例如,在科技期刊编辑的校对环节,经验丰富的编辑均认为,基于电子界面的数字化校对存在“视觉盲区”,最有效的校对(尤其是最后一轮校对)仍需沿用纸质文本校对的方式,因为在纸质界面上编辑的视觉敏锐性得到强化,进而提升了对差错的识别能力。与此同时,大数据环境下科技期刊的发展还面临一系列更为严峻的挑战。其一,基于大数据平台的信息透明化生态可能进一步强化科技期刊的“马太效应”。例如,在CNKI推出的2013年版期刊数据库中,所有入库期刊的复合影响力因子、综合影响力因子等均属于公开数据,这意味着起点不同、竞争力悬殊、类型各异的期刊将在同一公共平台上进行实力比拼,这势必造成“强者更强、弱者更弱”的马太效应。此外,这种数据公开机制对新创办的期刊和某些弱势学科领域的期刊是明显不利的。其二,科技期刊的赢利模式面临新的挑战。科技期刊的数字化转型使其依靠纸质发行和广告赢利的传统模式发生巨变:科技期刊在发行环节的收入可能更少,甚至可能完全失去订阅费;在数字化产品中,广告植入的难度更大,可能进一步减少广告刊载收入;由于发行和内容传播将依赖大数据平台,科技期刊的发展可能更加受制于大型数据库运营商。预计未来科技期刊将与数据库运营商建立一个利益分享机制,以期刊论文的点击量、下载量和被引量来分享发

行和广告收入,但双方的分成比例究竟如何确定,则是一个棘手的难题。其三,在大数据时代,科技期刊论文的发稿时效将大大加快,对期刊编辑和审稿专家提出了更高要求,不仅需要建立一支高素质的编辑队伍,而且需要一批乐于奉献的高水平审稿专家队伍,因而需要作者、编辑和专家协同创新,以适应新的编辑环境。其四,国家科技期刊的监管面临一系列的新问题。例如,国家是否应该放开电子科技期刊的刊号审批?电子科技期刊的常规审读和年检该如何进行?其五,在大数据时代,科技期刊的数据、数据运营商的数据乃至国外期刊及数据运营商的数据均需互通、互联和共享,但数据的公开、共享与数据的版权保护、信息安全是一对孪生矛盾,如何在数据公开和数据保护之间找到一个平衡点,进而在有效保护版权的前提下促进科技期刊之间的数据合作,这将是未来立法领域的一个亟待破解的难题。此外,在大数据平台上,中外科技期刊及数据库运营商之间的数据共享和交换将更为频繁,如何在平等互利、保障国家信息主权的基础上促进中外科技期刊及数据库运营商之间的国际合作,亦成为未来国际立法领域的紧迫课题。

参考文献

[1]冯海超.大数据时代正式到来[J].互联网周刊,2012(24):36-38. [2]杨绎.基于文献计量的“大数据”研究[J].图书馆杂志,2012(9):29-32.

[3]侯经川,方静怡.大数据时代的数据引证研究:进展与展望[J].中国图书馆学报,2013(1):1-7.

[4]本刊编辑部.拥抱大数据时代[J].数据,2012(12):8.

[5]周晓英.数据密集型科学研究范式的兴起与情报学的应对[J].情报资料工作,2012(2):5-11.

[6]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(1):146-169.

[7]李萧然.大数据成新战场 IT厂商奋勇掘金[J].IT时代周刊,2013

(1).

[8]陈明奇,姜禾,张娟,等.大数据时代的美国信息网络安全新战略分析[J].信息网络安全,2012(8):33-35.

[9]维基百科.大数据[OL],

http://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B0%E6%8D%AE,2012-10-05.

[10]刘勇敏.利用引文数据库进行科研绩效评价——河南科技大学科技论文的文献计量学研究[J].现代情报,2007(6):138-140.

[11]姜春林,刘则渊,梁永霞.H指数和G指数——期刊学术影响力评价的新指标[J].图书情报工作,2006,50(12):63-65.

[12]杨桂涛,苏博,刘鉴汶.对科技论文进行综合评价初探[J].中华医学科研管理杂志,2003,16(2):118-120.

(作者单位:江南大学数字媒体学院)

来源 :《出版发行研究》


相关文章

  • 大数据的概念.特征及其应用
  • 马建光等:大数据的概念.特征及其应用 (2013-09-05 16:15:35) 转载▼ 标签: 分类: 学习资料 杂谈 大数据的概念.特征及其应用 马建光,姜巍 (国防科技大学人文与社会科学学院,湖南长沙410074) 源自:国防科技20 ...查看


  • [研究视角]如何打造期刊学术共同体?
  • 打造期刊学术共同体的路径 核心提示 Core prompt 期刊学术共同体有其内在的学术规范和评价标准.只有尊重学术规律,强化学术创新,加强学术期刊人的自律精神,建立期刊学术共同体同行评价主导的.具有公信力的内在评价价值尺度,才能真正提升期 ...查看


  • 传统媒体发展的SWOT分析及规划策略
  • 推进创新理论探索创新实践 ONGNANCHUANBO实务探讨 --媒体与节目研究 信息化时代传统媒体发展的SWOT 分析及规划策略 宋强,刘艳 (中国地质大学(武汉)广播电视新闻系湖北武汉430074) 在信息化时代,传统媒体和新媒体不能够 ...查看


  • 新工业革命给中国带来的机遇与挑战
  • 新工业革命给中国带来的机遇与挑战 在互联网的推动下,信息化和工业化的交织日益紧密,使经济发展进入新的阶段.随着网络信息技术.大数据.云计算运用等新的信息化技术的威力初显,人工智能.数字制造.工业机器人等现代制造技术的不断突破,市场逐步成熟, ...查看


  • 世界正处在新科技革命前夜
  • 作者:白春礼 光明日报 2013年04期 党的"十八大"强调,科技创新是提高社会生产力和综合国力的战略支撑,必须摆在国家发展全局的核心位置,并明确提出了"实施创新驱动发展战略".这是党中央从全面建成小 ...查看


  • 科技惠民医行为
  • 构筑统一数据平台的挑战 信息孤岛式的基础架构是当前许多医院的现状,如何构筑统一信息基础架构,实现统一数据存储平台建设,是决定着医院信息化能否进入2.0时代的关键.是实现从以业务为核心向以患者为核心的系统架构设计的基础.数据存储架构是否合理, ...查看


  • 电子信息资源检索
  • 在信息飞速发展的知识经济时代,电子出版物的盛行以及人们对知识和信息需求的多元化和综合化令图书馆面临着严峻的挑战.图书馆数字化是未来社会的公共信息中心和枢纽,数字化图书馆的服务需求给信息管理工作带来了诸多新问题.如何对图书馆的电子资源进行信息 ...查看


  • 文献检索论文报告
  • <文献检索与利用> 课程报告 姓名: 张小超学号: 院系:电子信息工程学院班班 级: 自动化2班 课题名称(中英文): 中文: 英文: 选题简介 课题名称(中文和英文) 课题:云计算在搜索引擎中的应用 Task: Cloud c ...查看


  • 马克思主义时代化的三大基本命题
  • 辛向阳 < 人民论坛 >(2011年第14期) 马克思主义从来就没有过时,而是永远充满着时代的活力.马克思主义之所以能够时代化,是因为马克思主义是工人阶级的世界观,而且具有实践的品质.要实现马克思主义时代化,必须完整准确地掌握马 ...查看


热门内容