前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數據應用科技期刊問題及策略范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:提出大數據時代我國科技期刊發展的方向,為提升科技期刊競爭力提供有益借鑒。【方法】采用文獻分析法系統分析我國科技期刊在大數據應用方面存在的問題,并結合抽象演繹法提出構建科技期刊大數據體系的方法。【結果】對科技期刊出版業來說,大數據不僅改變了出版流程,使其得到完全重構,也改變了傳統的出版模式,使科技期刊在原始積累的基礎上不斷創新,催生出全新的發展道路。【結論】建議科技期刊從資源整合優化、完善知識內容標引、提供個性化精準服務、加強融媒體出版和加強版權及數據安全5個方面與大數據應用相結合,提升自身競爭力。
關鍵詞:大數據分析;大數據體系構建;數據資源整合;知識內容信息;數字版權保護
大數據(BigData),又稱為巨量資料。2014年5月我國工信部了《大數據白皮書》,把大數據定義為大體量、結構多元并且具有強時效性的數據[1]。大數據具有體量大、速度快、樣態多、價值巨大但密度很低,以及真實可靠等特點[2-3],因此,其對眾多行業產生了顛覆式的影響。但對于出版業而言,則是挑戰與機遇并存[1]。一方面,目前國內大部分學術出版物仍采用傳統出版模式,處于以印本為主,數字化出版為輔的發展階段,在面對互聯網的沖擊時,該發展模式逐漸萎縮,甚至陷入發展困境;另一方面,大數據通過挖掘、分析和運用功能,完全滲入學術出版業的各個環節,使其進入“產業重構時代”。因此,大數據在出版流程優化,實現各種媒介資源、生產要素有效整合等方面受到了出版界的廣泛關注[4]。一些學者通過闡述大數據的主要特征及國內外大數據的發展與應用現狀,分析了大數據給出版業帶來的挑戰和發展機遇,并為我國出版業應對大數據發展提供了借鑒性建議[5-7];一些學者對大數據在出版流程再造中的價值、經驗及應用實踐進行了研究[8-13];還有一些學者圍繞大數據時代對編輯人員的挑戰和培養開展研究[14-16]。從以上分析可以發現,未來大數據技術將逐漸成為學術出版業的核心競爭力。因此,系統研究大數據技術對科技期刊發展的影響,找準科技期刊所面臨的挑戰與機遇,可以充分發揮大數據的優勢,在滿足科技期刊自身發展的前提下,為科技期刊的可持續發展提供動力。
1科技期刊在應用大數據時遇到的問題
面臨著大數據時代的深化改革,傳統的科技期刊該如何應對,這是關乎期刊未來發展的關鍵問題。那么,在如此巨大的挑戰下,中國科技期刊將面臨哪些實際問題?(1)有效數據獲取難。數據挖掘是大數據應用的重點之一,而只有使用有應用價值的數據,才能得到可靠的大數據分析結果。因此,如何獲取有效數據,是大數據實際應用中的難題。對于科技期刊而言,數據類型包括內容數據、讀者數據、市場數據和交互數據等形態,而期刊編輯一般只能獲取期刊的瀏覽量、下載量及銷售量等數據,無法獲取用戶的身份、瀏覽時間、研究興趣以及一些交互數據,這些關鍵信息均被大型商業數據庫所掌握。這對科技期刊的選題策劃、精準推送等產生了嚴重影響。(2)數據分析模式建立難。除了收集可分析的有效數據外,如何建立有效的數據分析模式?建設難點有哪些?這也是科技期刊面臨的巨大問題。第一,數據分析從“內容”到“內容+推廣”的轉型難[17]。傳統的數據分析只能針對已有作者及其論文進行分析,而不能對潛在數據、內容及知識進行深入分析,而且無法準確獲取用戶需求,并進行細分推廣。在大數據背景下,要求科技期刊針對不同用戶的多元化需求,為用戶提供基于期刊內容并超越期刊載體的增值服務,如近些年,我國部分科技期刊實現了HTML展示,但并未對其開展深度標引服務,無法滿足讀者需求。這就需要科技期刊不斷調整自身的定位和發展模式,創新自身的呈現形式與傳播模式,保持在科學交流體系中的關鍵性角色。第二,數據分析從“數據至上”到“數據分析+人工決策”的轉型難[18]。大數據的出現,使科技期刊面對的信息環境發生變化,很多科技期刊認為只要將所得到的大數據分析結果進行應用即可,但忽略了其只是一種輔助性工具的事實。在面對一些重要選題、時政熱點等內容時,不能僅依靠對以前數據的分析,還要注意數據分析的時效性,并充分發揮編輯/專家的主觀能動性。(3)平臺對接實現難。近些年,中國科技期刊取得了令人矚目的成就,但從國際環境和我國科研發展態勢來看,我國科技期刊總體處于“小、散、弱”狀態,無法實現信息共享。而國際著名科技期刊出版機構Elsevier、SpringerNature、Wiley等綜合了視頻音頻推送、文獻統計分析、個性化定制等功能,成為研究人員獲取信息的主要途徑。因此,要更好地應用大數據,就需要有功能強大的集群平臺,能夠實現各渠道信息的共享,能夠實現數據的深度挖掘與分析,能夠使結構化與非結構化數據庫進行對接,從而實現走向跨媒體的復合出版,最終為用戶提供優質服務。(4)版權與數據安全維護難。整個出版鏈的數據安全是科技期刊面臨的重大挑戰[17]。對于科技期刊而言,投審稿平臺和傳播平臺是整個出版鏈的主體,隨著網絡技術的快速發展,科技期刊主體在網頁上的所有信息均會被收集、分析,從而成為大數據的一部分,這些數據就成為不法分子的攻擊重點。這也對科技期刊出版提出了如下挑戰:①如何加強數據安全理念?②采取哪些有效的數據安全策略,可以提升自身數據恢復能力?另外,雖然目前我國現行版權法及相關法律認為,利用大數據挖掘技術形成的作品創意不產生侵權問題,但一些網絡作者通過挖掘技術創作的作品,或者超出“合理使用”的范圍使用他人作品,則會侵犯原作品作者的著作權。那么,如何制定合理的版權轉讓協議,最大限度地保護作者權益?如何限定“合理使用”的范圍?這些都是科技期刊需要解決的問題。(5)人才隊伍建設難。隨著出版模式的變化,科技期刊也面臨著巨大的可持續發展壓力。在目前編輯部人員構成中,缺少數據開發與分析的人才,難以運用大數據分析結果去開展內容經營和服務經營相結合的多元化服務。
2科技期刊大數據體系構建
對新聞出版行業而言,大數據體系的建構是一個集數據采集、標引、計算統計、建模、服務于一體的數據體系[18]。具體到科技期刊,要根據期刊所在研究領域,整合該領域的各方數據資源,通過大數據計算與分析,將得到的結果應用于科技期刊的數字化、多元化及數據化服務,從而協助傳統科技期刊實現轉型升級(圖1)[18]。(1)加強資源整合優化,注重數據采集的精準性。科技期刊的核心業務是為社會提供有價值的內容,是內容的審核者與傳播者[19]。我國科技期刊的傳統出版模式在幾十年的發展中積累了大量專業權威的出版數據;在數字化出版過程中,一些內容資源通過數字化和碎片化的形式轉化為內容數據;在“互聯網+”背景下,用戶的瀏覽情況也會產生海量的內容資源。上述數據均為大數據應用提供了豐富的數據資源,均可精準地體現用戶特征與需求,是科技期刊內容傳播的導向[19]。因此,構建完善的科技期刊生態系統不僅能夠保證內容資源的來源與質量,還可以通過數字化產生專業的附加產品,從而增強用戶黏性,為用戶提供更加便捷、周到、專業的服務。對于我國科技期刊來說,若要加強資源整合優化,構建屬于自身的內容生態系統,就要構建有影響力的生態系統———領域期刊集群,這是構建科技期刊大數據體系的基礎。通過領域期刊集群可以獲取本研究領域的豐富數據資源、制定完善的營銷策略、利用互聯網技術整合優化資源,打造符合讀者“共享”需求的全新產品,探尋精準的數據挖掘及分析技術,進而提升期刊核心競爭力。具體來講,期刊集群通過與第三方數據庫、營銷商的合作,向特定用戶進行知識宣傳與推廣,利用其特有的優勢對相關內容展開深度挖掘,進而培養和拓展用戶群,從而吸引作者和讀者。(2)完善知識內容標引,實現大數據內容鏈接。知識內容標引就是對采集的海量數據按照科技期刊的知識內容及拓展內容進行標引,這是科技期刊服務于用戶的關鍵步驟。完善知識內容的標引鏈接功能,可使信息內容立體化、網絡化,提升知識服務的容量和質量,增強用戶的信息獲取能力,實現無障礙閱讀,從而提升學術成果的傳播力和影響力[20]。知識標引已經成為科技期刊多元化服務的重要環節與未來發展趨勢。目前,國內科技期刊知識標引還處于起步階段,較為顯著的標引功能是作者所屬單位和參考文獻完整信息的標引,但很多期刊也只有簡單的鏈接,并沒有可自動識別、提取相關信息的標引功能。而應用標引首先需要建立一套完整、權威、被用戶廣泛接受的應用知識體系,這不僅需要科技期刊的專業知識優勢[20],同時需要大型數據庫的支持,因此科技期刊主管主辦單位應該從源頭抓起,協助科技期刊進行深入的知識標引服務,縮短與國際知名期刊的差距。(3)發揮大數據分析優勢,提供多元化精準服務。利用大數據分析技術,對不同用戶需求進行深入分析,這是科技期刊數字化建設的重要途徑。對此,我國科技期刊要積極擁抱大數據技術,掌握不同用戶的瀏覽、閱讀記錄,通過深入分析用戶的知識需求,提供個性化的定制方案,以開展更有效的精準推送。另外,可以整合從各方獲得的數據資源,在知識服務平臺中為用戶提供檢索和閱讀、熱點分析、知識關聯分析、數據挖掘分析等服務,構建知識圖譜,為用戶提供知識化、數字化、智能化服務[21]。大數據時代,科技期刊重塑的出版流程被稱為智能化出版流程。在選題策劃方面,科技期刊可以基于海量的數據資源,采用數據挖掘與人工識別的方式,迅速定位目標讀者群體,選擇熱點研究方向及重要作者,得出更加科學的選題方案[22]。此外,科技期刊還要利用大數據技術,積極嘗試新的內容生產和傳播模式,如結合微信、微博、期刊網站等新型傳播途徑,為用戶提供可視化內容的呈現與推薦,從而實現內容與服務的全面數據化,最終提升傳播效果。這樣不僅能充分滿足讀者的多元化需求,而且能夠有效避免因不了解讀者需求而開展的無效工作,同時可以充分調動讀者使用融媒體平臺的積極性,進一步提升讀者對期刊的黏性[23]。(4)完善內容展示方式,加強融媒體出版。在大數據環境下,讀者接收到的知識越來越多,對于多媒體、跨平臺的數字內容資源的需求也越來越大。因此,便捷式、碎片化呈現的知識成為讀者的首選內容。為了滿足讀者需求,國際科技期刊選用適應碎片化閱讀的HTML展示方式,并在HTML頁面添加作者身份標識(ORCID、ResearchID)及全文鏈接網頁,使讀者全面了解作者的全部研究成果及其合作者網絡。另外,一些優秀期刊還在HTML全文頁面單獨展示與文章相關的數據集、音視頻等補充材料,以豐富和延伸文章內容,為讀者提供更全面的知識服務。因此,建議我國科技期刊完整的作者身份標識注冊說明,制定完善的論文增補材料規范,在HTML頁面設置上增加上傳補充材料的模塊;同時,加強與其他權威數據庫、期刊集群平臺等的合作,逐漸實現增強出版。(5)強化內容資源安全意識,注重數字版權保護。在全媒體時代,科技期刊數字化出版是一種以互聯網為核心載體的新興出版方式,而如何實現數字版權的合理利用和有效保護,始終是業內聚焦的關鍵點[24]。對我國科技期刊而言,首先要做好作者關鍵信息的保護工作,要求期刊平臺管理公司加強網絡安全設置,避免作者保密信息泄露;其次,積極探索國際先進的數字版權保護理念,并結合我國國情,建立詳細的數字版權政策;最后,設計詳細的版權轉讓協議,既要保護作者的合法權益,又要考慮期刊的發展模式,以此為根基謀得更大的發展空間,深入挖掘數字內容資源。
3結語
面對全新的大數據環境,我國科技期刊出版業要迅速轉變發展理念,積極探索新型發展模式。在充分利用已有數據資源的基礎上,從內容生產、多元化服務與推廣等維度入手,充分發揮大數據技術的優勢,創建全新的出版流程,從而提升期刊的核心競爭力,迅速縮短與國際知名科技期刊的距離,這也是新時代我國科技期刊的發展方向和必然趨勢。
作者:賀郝鈺 侯春梅 遲秀麗 孫力煒 葉喜艷 單位:中國科學院西北生態環境資源研究院文獻情報中心