前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數據技術對學術期刊品牌建設的影響范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:大數據時代帶來了信息挖掘的范式革命,數據挖掘技術對學術期刊的品牌建設也起到助推作用。大數據技術通過數據資源的共享實現了“讓數據發聲”,消除不同學科領域之間的壁壘,增強了信息的預測功能,其高系統性、低誤差水平以及較強的預測效能為編輯在品牌建設實踐中把握學科研究現狀、凝練學科研究熱點提供了可能。期刊編輯可以借此分析學術論文的產出和分布情況,獲取高產作者信息,各類研究結構、基金項目資助等學科發展狀況,確定學科領域的研究熱點,準確把控學科脈絡發展,從而打造優秀的期刊品牌。
關鍵詞:大數據;品牌建設;選題策劃;信息挖掘
期刊品牌建設不斷受到期刊界和學術界的關注。研究發現,目前我國期刊品牌建設還面臨諸多問題,尤其是缺乏準確的品牌整體定位,缺乏個性和特色。期刊的品牌建設不同于其他產品,要具有高學術品位,先進的文化意蘊和與時俱進的創新發展性,這就需要通過選題策劃對學科熱點問題的深度挖掘、理性透視和動態回歸,反映學科的發展態勢。優秀的選題策劃可以提升讀者與刊物的契合度,增強刊物的影響力和生命力。目前,大數據已經滲透到各行各業,云計算、信息數據化等逐漸被受眾熟悉和接受,數據挖掘技術的應用也為學術界和期刊界帶來了革命性的影響。大數據技術有利于對學科脈絡發展和前瞻的把控,可以為當前的學術研究和期刊品牌建設起到助力作用。期刊編輯應該思考如何應用整體化的數據思維、利用關聯性的思考方式審視學科的發展。
一、大數據時代信息的范式革命
大數據時代,海量的數據蘊藏有豐富的價值。維克托·邁爾·舍恩伯格在其著作《大數據時代——生活、工作與思維的大變革》中指出,大數據時代的核心任務是數據挖掘、收集、儲存和分析。大數據時代有更好的預測能力和說明能力,大數據技術改變了人們認識世界的方法,逐漸成為新的范式呈現在科學研究者面前。大數據成為繼實驗科學范式、理論科學范式和計算機科學范式之后的第四范式“數據密集型科學范式”。大數據技術對信息的把控和挖掘能力彌補了傳統處理方法的缺陷。首先,大數據技術實現了“讓數據發聲”,通過人為干預條件的加入,對不同的指標進行數據歸類,對海量數據進行合理的挖掘,對數據樣本進行總體的分析,發現數據之間特殊的牽連性和關聯效應,從而得到更加真實有效、甚至可能超出研究者預期的結論,給人們的思維方式帶來了巨大的沖擊。其次,數據挖掘有較強的系統性。數據資源的共享,能夠消除不同學科領域之間的壁壘,實現各個學科領域的互通合作,以動態圖譜的方式呈現知識體系。最后,大數據技術能夠實現對數據進行實時收集,對非結構化和過程性的數據也能較好把控。這種整體的研究,減少了抽樣的誤差,得到的結果更加真實可信。利用大數據更能有效計算出未來的走勢,增強了信息的預測功能。
二、大數據技術對品牌建設的助力作用
學術期刊的品牌建設,要有與時俱進的創新發展性。信息化時代中,編輯如何能快速了解本學科的過去、現在和將來,學界代表人物,學科的變化歷程,重點研究領域,未來的發展趨勢?如果長期沉浸于某一個學科領域,有豐厚的知識儲備和敏銳的洞察力,那么,可能對這些問題會有獨到的見解。在信息量急劇增長的今天,文獻浩如煙海,在數據庫中輸入一個關鍵詞,就有可能得到數以萬計的研究報告。即便是在某個領域的權威專家,也達不到百科全書式的知識儲備,不可能對該學科所有的專業方向都有精準的把控能力。而大數據研究方法的高系統性、低誤差水平以及較強的預測性為編輯在打造學術品牌中把握學科研究現狀、凝練學科研究熱點提供了可能。通過大數據研究方法,可以分析學術論文的產出和分布情況,獲得高產作者、各類研究結構、基金資助項目等綜合信息,確定學科領域的研究節點和活躍點。另外,還可以通過文獻知識流動的方向的探索,了解該學科的前沿領域經歷了哪些發展階段;通過社會網絡分析方法,獲得作者與合作機構的信息,動態展示學科知識結構和知識演變過程,科研合作網絡以及發展走向。
(一)數據挖掘:信息的精準提取與過濾面對龐大的數據信息,編輯需借助可靠的研究方法,快速、精準地從中過濾、提取有利的數據。因而,數據來源與檢索策略的選擇顯得尤為重要。首先,要根據知識單元的屬性及用途呈現方式,選擇不同的數據庫。數據庫的數據收錄方式各有特點,例如中國知網(CNKI)囊括了豐富的期刊和文獻資源,數據的完整性和連續性有不可比擬的優勢;中國社會科學引文索引(CSSCI)遴選學術影響力較大的期刊作為數據來源,權威性更強。可兼選CNKI、CSSCI等數據收錄庫,以確保各知識單元的完整和準確性。其次,在檢索策略方面,應選擇業界公認的權威雜志為母刊,剔除會議通知、稿約、欄目介紹等相關性較低的類目信息,綜合全部來源文獻及被引文獻,其中來源文獻可用于共被引分析,對知識關聯性、前沿問題等進行可視化呈現;被引文獻數據集用于反映作者和機構被引頻次,可視化呈現核心作者和核心機構的基本情況。信息提取的常用的方法有詞頻與共現分析法、引文共(被)引分析法、多元統計法和社會網絡分析等。①詞頻與共現分析。詞頻和共現分析隸屬于內容分析法的范疇。詞頻分析是通過對某一學科領域核心關鍵詞的頻次統計數值揭示該領域研究的主題分布、熱點和發展走向。共現分析主要是對關鍵詞進行分析,也包括對文章主題和摘要的分析,常用的是共詞分析法。該方法直接統計文獻中關鍵詞出現的頻次,通過聚類分析構建關鍵詞貢獻矩陣,獲得聯系緊密的關鍵詞,從而厘清學科的研究熱點。②引文共(被)引分析。研究者撰寫學術論文會對以往研究進行參考和引用,引與被引之間形成引證關系。共被引(Co-citation),是指兩篇或兩篇以上的文獻同時被后來的一篇或多篇論文所引用,則稱這兩篇或多篇被引文獻就具有“共被引”的關系。引文共(被)引分析法,就是通過數理統計方法,比較歸納、抽象概括出引證關系的特征和內在規律的文獻計量學分析方法。③多元統計法。通過描述性統計的方法,對獲得的數據資料進行初步的整理和歸類,繼而通過因素分析、聚類分析、多維度尺度分析法進行數據挖掘。④社會網絡分析方法。社會網絡分析法能夠深層挖掘信息之間的聯系,可視化呈現知識點之間的關系與結構,是運用較為廣泛的知識圖譜分析方法。通過社會網絡分析不同地域、機構、作者之間的合作情況,揭示學科共同體之間的關系。
(二)可視化技術:信息圖譜的直觀呈現方式大數據分析方法對海量的文獻數據進行標準化處理,通過繪制科學知識圖譜(MappingKnowledgeDomains),更加形象地展示學科的熱點和主流研究領域的進展情況,了解相關領域的核心作者、高產機構,從而把握學科的發展動態、內在規律和發展趨勢。科學知識圖譜結合了傳統的文獻計量學與現代的數據挖掘技術,形成了一種綜合分析科學發展脈絡的知識發現方法。科學知識圖譜將抽象的數據以圖像形式直觀呈現,分別從微觀、宏觀層次揭示學科的學術生態。對海量的數據信息進行挖掘、分析并可視化處理在學科研究中顯得越發重要,而這是傳統研究方法所無法勝任的,需要借助計算機軟件技術才得以實現。信息可視化軟件將數據進行計算和轉化,最終以圖像的形式直觀呈現,繪制出可視化的信息圖譜,通過這些圖形或者圖像,將專業領域中的隱形現象外顯化呈現。目前,國內外眾多的計算機、情報學等領域的學者、公司開發出幾十種各具特色的信息可視化輔助軟件,其中CiteSpace、SATI、VOSviewer和Ucinet為學界廣泛使用,值得編輯同仁借鑒。
三、小結
大數據時代,海量的數據蘊藏有豐富的價值,大數據技術對信息的把控和挖掘能力彌補了傳統處理方法的缺陷,可以快速、精準地過濾并提取有利數據。期刊編輯可以借助大數據研究方法及技術支持,對核心作者、機構、關鍵詞時區、關鍵詞共現性等方面的圖譜呈現,凝練出該學科領域的高頻熱點關鍵詞,厘清研究的熱點領域,從而提高期刊品牌的文化內蘊,增強與時俱進的品牌發展性。CiteSpace、SATI、VOSviewer和Ucinet等信息可視化輔助軟件各具特色,可根據不同的數據庫和數據處理需要進行選擇。通過詞頻與共現分析法、引文共(被)引分析法、多元統計法和社會網絡分析等可視化科學知識圖譜呈現方法,揭示科學中潛在的學科結構、追蹤科學研究的前沿問題、探測某一時期科學研究熱點、剖析科學發展演化歷程、研究并分析科研合作網絡、評估某科學家的學術地位、構建科學發現的理論體系、輔助決策者制定科學發展方案。
參考文獻:
[1]維克托·邁爾·舍恩伯格,背尼思·庫克耶.大數據時代——生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
[3]劉啟元,葉鷹.文獻題錄信息挖掘技術方法及其軟件SATI的實現——以中外圖書情報學為例[J].信息資源管理學報,2012,(1).
作者:楊雅婕 單位:蘇州大學學報編輯部