新聞傳播與大數據時代
第一,介紹大數據的發展的動態。因為大數據是這兩年學科和科學界比較時髦的一個詞。
第二,大數據和新聞傳播的相關發展。我知道吉林動畫學院有媒體學院,也有新聞傳播,所以,首要希望學習新聞傳播的同學對大數據有一個敏銳的認識和把握。
大數據的源起簡單的介紹一下,主要是從2012年開始,大數據這么一個名詞到現在才三年多,但是幾乎已經成為這個時代的一個最流行的詞匯。大數據帶來的理念和發展變化,將帶來一些革命性的變革。所以,喜歡也好,不喜歡也好,必須面對大數據的這一事實。
這是大數據的先河之作,比較關鍵的就是一個學者,就是寫大數據的作者說,大數據時代最大的轉變就是我們要放棄對因果關系的可求,轉而關注相關關系。也就是說只要知道是什么,而不需要知道為什么。這個是在學術界引起極大的爭論的一個命題,也就是說,有了大數據以后,我們以往對事物追求的一種因果關系是要轉換為相關的關系。這個話怎么說?因為大數據的結果和大量的數據的推導讓我們很容易知道一個結果。
這對過去幾千年來社會科學的一些的認知方法有沖擊。以前社會科學知道A,通過一定的數據的收集找到證據,然后通過邏輯和其他的社會科學的方法知道它的結果B。但是,大數據告訴我們,你直接有了結果以后就不需要進行推導了。
這個是提出一個比較重要的對社會科學的挑戰和思考。大數據因為現在世界上變化很大,什么叫“大”字本身就不斷地挑戰人類的認知。以前對“大”來說,一個圖書館比如有10萬冊就不得了,包含的信息,有一套百科全書的信息量大得不得了,但是現在在信息和大數據時代來看,是小得不得了。所以,大數據重新定義的衡量大和小的基本單位。
同學們和老師們,我們可以看到全世界一天生產的數據量大概有1.5EB,全球的所有的數據有90%都是在過去兩年以內生成的,而且每兩年這個數據就會翻倍的增長。1.5EB是什么概念?同學們知道,這是一個演算的單位。全世界最大的圖書館是美國的國會圖書館和中國的北京圖書館,北京的圖書館有很多的古跡。即使拿公認的標準,美國的國會圖書館有3700萬藏書量,3700萬冊,大概也就是10個TB,10個TB來看,現在在大數據來說就顯得很小。這是整個的說大數據怎么大,生產的速度怎么快的一個演算的濃縮。
第二,“大”是一個相對的。它的相對不完全是規模的大,而是它的復雜性。也就是說,如果簡單地把數據的疊加,那還不是大數據時代,而是說它呈現的數據的深層的復雜性和多樣性、多層次性。
這引述到大數據的四個特點:
1.規模巨大。一般用的中文詞叫海量。
2.多樣性。人類三維、四維空間所想到的它都有。
3.是速度極快,價值很高。
4.需要準確性和真實性。也就是說,它的數據是帶有很多原始的,比如說你打了一個電話,電話就會有一個記錄,這個記錄是千百萬人數據的記錄是非常真實的,而且是很準確的。
這是大數據介紹的一些不同的維度。你們可以看出來,我們現在講的大數據,一個“大”字其實遠遠不能指出數據背后所隱含的復雜、多層次、深度的意義。
這是大數據現在為止的一些相關的技術,這些技術主要有科學家、工程技術人員,他們通過辛勤的努力研發出來的,正在不停地進行改變和革命的變化之中。所以,過幾年這些相關的技術又會淘汰一批,然后又被更大的所包容。
大數據的可怕和威力之處是無處不在。全社會的發言、網絡用戶、管理者、商業機構、健康、衛星等等,四面八方對人類社會構成一個網絡狀的收集的途徑和網絡狀的收集的方法。
大數據其實對我們人類至少是啟蒙運動以來知識發現提供了一個很大的機遇。但是,也有一個很大的挑戰。我們這是基于大數據的一些知識發現的一個邏輯,同學們知道,現在在課堂上學的課堂知識和老師們教授給你們的,或者是你們到外面實習的,一般教授給你們的知識都是人類在前幾輩人努力通過收集資料,實驗室的試驗,還有社會科學的驗證、邏輯等等方法,或者是推導出來,或者是歸納出來等等,