郭全中
  【摘 要】互聯網技術與雲存儲引發了大數據,大數據作為全新的思想和手段,不僅註重“因果關係”研究,而且註重“相關關係”研究,對傳媒業帶來了革命性的影響。一方面促使傳媒業進入信息過載時代,傳統媒體的商業模式被徹底顛覆,另一方面又使信息智能匹配成為可能,為傳媒業帶來巨大的發展機遇。
  【關鍵詞】大數據;傳媒業;信息智能匹配
  【中圖分類號】G21 【文獻標識碼】A
  互聯網帶來了繼文字發明、古登堡印刷術、電報之後的第四次傳播革命,也帶來了繼蒸汽機的發明和電力的廣泛應用之後的第三次工業革命,已經成為整個社會的底層架構和標配。大數據作為互聯網的一個重要方面,必將對傳媒業帶來革命性變化,這就要求傳媒業從業人員具備大數據思維,充分利用大數據技術來幫助自身實現跨越式發展。
  一、信息的開放與雲計算帶來了大數據
  首先,傳播革命使得信息數量呈指數級增加。在文字發明之前,人類的傳播只能通過口口相傳,信息量極其有限,公元前4000年楔形文字出現之後,使得傳播可以突破時間限制而實現代際傳播,通過把信息記錄在龜甲、樹葉、泥土等介質上,信息的數量開始大幅度增加。但是由於技術的制約,信息只能通過抄書人來進行記錄和傳播,導致信息的數量和傳播範圍都受到很大的制約。1450年,古登堡印刷術的發明使得傳播突破了範圍限制,傳播開始從精英們的“權力”轉變為普羅大眾的“權利”,此後的50年間,大約有800萬本書被印刷,比之前所有的手抄本還多。此後的電報技術的發明,使得傳播突破地區和時間限制,信息的數量也快速增加。而1989年,當萬維網出現之後,實現了即時、便捷、海量和互動的傳播,人人在接受信息的同時都可能成為自媒體,信息數量極速增加。根據ZDNET的數據顯示,2013年中國產生的數據總量超過0.8ZB,2倍於2012年,相當於2009年全球的數據總量。
  其次,摩爾定律使得大數據成為可能。摩爾定律以英特爾創始人之一的戈登•摩爾命名,該定律認為,同一個面積集成電路上可容納的晶體管數量,一到兩年將增加一倍。即計算機硬件的處理速度和存儲能力一到兩年將提升一倍。從1965年摩爾定律提出以來,硬件技術的發展基本符合摩爾定律,尤其是當存儲器的性能提高的同時,硬盤價格以更快的速度下降,即大約每9個月存儲容量的價格就下降一半,1955年每兆字節存儲量需要6000多美元,而到2010年,這個價格下降到不足1美分。硬件性能的快速增加和單位存儲成本的大幅度下降,一方面使得數據處理速度更快、更方便,雲計算技術被開發出來;另一方面,數據處理更為便宜,使得海量的數據積累成為可能,這兩方面原因使得大數據具有了可能性。
  第三,政府數據公開助推大數據發展。數據分為政府數據和企業數據,並且政府數據在數據中居於關鍵性地位,大數據要真正發揮作用,政府的信息必須公開。美國等西方發達國家大力推進數據開放運動,並於2011年9月20日,美國等8個國家在紐約發起“開放政府聯盟”,以向本國社會開放更多的信息。目前,該聯盟已經有50多個會員,30多個國家建立了公共數據的開放網站。2012 年3 月,奧巴馬政府公佈“大數據研發計劃”,以提高和改進人們從海量、複雜的數據中獲取知識的能力,發展收集、儲存、保留、管理、分析和共享海量數據所需要的核心技術,大數據成為全世界關註的焦點。
  因此,可以看出,互聯網技術的發展與政府信息的公開是大數據發展的前提,而雲計算則是大數據的基礎。
  二、大數據面面觀
  首先,何為大數據。大數據是指服務於決策,需要新型數據處理模式才能對其內容進行採集、存儲、管理和分析的海量、高增長率和多樣化的信息資產。大數據絕不僅僅是指規模大,其定義包括如下四層含義:一是大數據的目的是服務於決策,能夠提升決策能力;二是現有的處理模式不能有效處理大數據;三是大數據是一種信息資產,而不僅僅是一堆數據和成本,所謂信息資產是指其能夠為政府和企業帶來未來經濟利益的信息資源;四是大數據比海量數據更為複雜,海量數據包括結構化和半結構化的交易數據,而大數據除此以外還包括非結構化數據和交互數據。
  其次,大數據具有在線性、海量性、全體性、非結構化、實時性等特點。一是在線性,即大數據是永遠在線的,能夠隨時被調用的;二是海量性,即大數據規模巨大,當前通常指10TB規模以上的數據量;三是全體性,即大數據採取的是全體思維,而不是樣本思維;四是非結構化,即大數據的種類繁多,不僅包括傳統的關係數據,而且包括以網頁、視頻、音頻、e-mail、文檔等形式存在的未加工的、半結構化的和非結構化的數據;五是實時性,即大數據能夠實時反應。例如,在Google搜索框輸入一個關鍵詞,能夠瞬間呈現。
  第三,大數據代表著新的思想和思維。大數據既能處理“因果關係”又能處理“相關關係”,即不僅能夠回答“為什麼”又能回答“是什麼”。在小數據時代,只能通過抽樣調查的方式來回答“為什麼”,而大數據則能通過全樣本的方式來回答“是什麼”,即發現相關關係,這能夠幫助我們更好地認識和瞭解世界。
  第四,大數據的關鍵在於智能化,即能利用有效的工具對數據進行有效的挖掘和專業化處理,進而通過“加工”實現數據的“增值”,進而實現盈利。目前,所用的方法主要有數據挖掘和對比分析,主流的相關技術主要有MapReduce(一種編程模型)和Hadoop(一個分佈式系統基礎架構)為代表的非關係數據分析技術。
  第五,大數據分析相對於傳統辦法具有顯著的優勢。一是大數據能夠實現分析的高度智能化,即一方面實現信息收集和分析的智能化,另一方面實現數據與用戶需求的有效匹配;二是大數據分析改變之前的市場調研和數據分析相對滯後的模式和方式,能夠及時、迅速地進行分析;三是由於可以大量使用技術手段,其成本相對較低。
  第六,大數據的實施依賴於數據的可獲得度、模型是否科學和觀點的提煉。其一,在數據的可獲得度方面,目前在國內,大數據的發展受制於一些政府信息的公開性不夠,很多數據難以獲得,導致難以實現真正的大數據挖掘和分析;其二,在模型建構方面,模型的科學性直接決定著數據分析的質量,這就要求有高超的建模水平;其三,在觀點提煉方面,為決策提供依據的基於數據挖掘的獨到、高質量的觀點,高度依賴於高質量的數據解釋,這就體現了行業專家的價值。
  第七,大數據與雲計算有機深度融合。由於大數據需要處理大量的非結構化數據,為雲計算大規模和分佈式的計算能力提供了廣闊的應用空間,雲計算已經實現了數據分析即服務,二者相伴而生。此外,當未來基於數據的語義網取代基於網頁的互聯網時,大數據必將成為我們獲取信息的主流。
  三、大數據給傳統媒體業帶來的機遇與挑戰
  1.大數據帶來巨大機遇
  首先,大數據顛覆傳媒業。當前,我們已經進入大數據時代,主要標誌就是已經從內容稀缺時代轉變為信息過載時代,這對傳媒業帶來了革命性影響。一是信息量指數式增長。相關研究表明,從2007年到2013年,人類存儲的數據量從300艾字節快速增加到1.2澤字節,增長了數倍,而其中非數字數據只占不到2%。二是信息內容更加豐富。除了傳統媒體生產的原創內容之外,一方面由於博客、微博、微信等很多自媒體平臺的出現,大量的、高質量的自媒體內容層出不窮;另一方面由於互聯網的海量空間使得以往不可能獲得版面的生活服務類信息可以傳遞給用戶,而且對於廣大用戶來講,這些資訊比新聞的用戶黏度更高。因此,新聞和內容的稀缺性進一步被稀釋,其價值也必然被降低,也越來越難以收費。三是基於大數據的互聯網媒體正在快速顛覆傳媒業舊格局。一方面,在廣告市場方面。根據國家工商總局的數據,2013年,所有媒體的發佈費用為2144.13億元,其中電視為1101.10億元,同比下滑2.75%;報社為504.70億元,同比下滑9.17%。可以看出,我國互聯網廣告已經成為僅次於廣電的第二大廣告市場,而2014年會超過廣電,成為我國第一大廣告行業。並且由於互聯網依然保持著40%左右的增長速度,而傳統媒體卻呈現下滑趨勢,可以預測在未來5年內,互聯網廣告會占據絕大多數媒體發佈費用。另一方面,互聯網媒體正在大量分流傳統媒體的用戶和人才。
上一頁12下一頁
(編輯:SN009)
創作者介紹

mansion

re61reeqzh 發表在 痞客邦 PIXNET 留言(0) 人氣()