敘事是一種講述事件發(fā)展過程和情節(jié)的文學(xué)方式,通過編排故事結(jié)構(gòu)、塑造人物形象等來展現(xiàn)情節(jié)的起承轉(zhuǎn)合。了解讀者的需求和背景,可以更好地選擇合適的寫作方式和表達(dá)方式。下面是我為大家準(zhǔn)備的一些總結(jié)范文,供大家參考。
大數(shù)據(jù)時代讀書心得篇一
讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
本書從思維、商業(yè)、管理三個方面闡述了在大數(shù)據(jù)時代在下的變革,這些變革涉及到我們生活的方方面面,幾乎其影響程度可以與兩次工業(yè)革命相媲美。作者在第一部分提出了三個比較令人震驚的觀點,也就是大數(shù)據(jù)的精髓在于我們分析信息時的三個轉(zhuǎn)變,這三個轉(zhuǎn)變將改變我們的理解和組建社會的方法。并且作者將生活,工作思維的大變革和這幾個方面緊緊聯(lián)系在一起。
第三個改變是不是因果關(guān)系而是相關(guān)關(guān)系,在大數(shù)據(jù)時代,我們更需要了解一個東西是什么,而不是為什么,要找到關(guān)聯(lián)無,通過一個良好的關(guān)聯(lián)物的相關(guān)關(guān)系可以幫助我們捕捉預(yù)測未來。
這三個方面是大數(shù)據(jù)時代所給我們帶來的思維上的改變,所謂思路決定出路,思路有了創(chuàng)新,有了拓展,相應(yīng)的社會也就會有很大的變化。緊接著第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價值兩個方面,講述驅(qū)動大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動的最根本動力。第三部分則是闡述了大數(shù)據(jù)時代下的弊端以及在管理上的措施。個人認(rèn)為本書的精髓部分是第一部分,第一部分的三個觀點涉及的面很廣,包括統(tǒng)計學(xué)、邏輯學(xué)、哲學(xué)等。后兩個部分都是以第一部分這三個觀點為基礎(chǔ)展開闡述的。
這本書給我感觸最深的.就是這三個轉(zhuǎn)變,或者說是三個觀點,可以說是哲學(xué)上說的世界觀,因為世界觀決定方法論,所以這三個觀點對傳統(tǒng)看法的顛覆,就會導(dǎo)致各種變革的發(fā)生。
首先是第一個,作者認(rèn)為在抽樣研究時期,由于研究條件的欠缺,只能以少量的數(shù)據(jù)獲取最大的信息,而在大數(shù)據(jù)時代,我們可以獲得海量的數(shù)據(jù),抽樣自然就失去它的意義了。放棄了隨機分析法這種捷徑,采用所有的數(shù)據(jù)。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義,列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。
這個觀點足以引起統(tǒng)計學(xué)乃至社會文明的變革,因為統(tǒng)計抽樣和幾何學(xué)定理、萬有引力一樣被看做文明得以建立牢固的基石。我對這個觀點還是比較認(rèn)同的,如果真能收集到整體的數(shù)據(jù)而且分析數(shù)據(jù)的工具也足夠先進(jìn),自然是全體數(shù)據(jù)研究得出的結(jié)果更令人信服。但是這個觀點也過于絕對,就算是在大數(shù)據(jù)時代要想收集到全體數(shù)據(jù)還是不太可能實現(xiàn)的,因為收集全體數(shù)據(jù)要付出的代價有時會很大。比如說,你要檢測食品中致癌物質(zhì)是否超標(biāo),你不可能每一件食品你都檢測一遍吧。
第二,要效率不要絕對的精確。作者說,執(zhí)迷于精確性是信息缺乏時代和模擬時代的產(chǎn)物,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫的。如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無法被利用。作者是基于數(shù)據(jù)不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數(shù)據(jù)一個數(shù)據(jù)的錯誤就會導(dǎo)致結(jié)果的誤差很大,但是如果數(shù)據(jù)足夠多、數(shù)據(jù)足夠雜那得出的結(jié)果就越靠近正確答案。大數(shù)據(jù)時代要求我們重新審視精確性的優(yōu)劣,甚至還說到大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無法實現(xiàn)精確性。谷歌翻譯的成功很好地證明了這一點,谷歌的翻譯系統(tǒng)不像candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優(yōu)于ibm的candide系統(tǒng)并不是因為它擁有更好的算法機制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯誤的數(shù)據(jù)。
而在閱讀這本書時,發(fā)現(xiàn)這本書中爭議最大的一個觀點,不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認(rèn)同“相關(guān)關(guān)系比因果關(guān)系更重要”的觀點。作者覺得相關(guān)關(guān)系對于預(yù)測一些事情已經(jīng)足夠了,不用花大力氣去研究他們的因果關(guān)系。作者用林登的亞馬遜推薦系統(tǒng)的成功,證實了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的代表,從啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣的案例,都說明了掌握了相關(guān)關(guān)系對于他們策略的幫助。
一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業(yè)領(lǐng)域的,但是對于其他領(lǐng)域來說這個觀點就值得商榷了。比如說,在科學(xué)研究領(lǐng)域,你需要知其然也需要知道其所以然,找到事件發(fā)生的原理。用文中的一個例子說明,喬布斯測出整個基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發(fā)病的原理,知道哪一段基因?qū)е铝诉@種疾病,不可能只是說收集各種數(shù)據(jù),然后利用其相關(guān)性來判斷哪里出現(xiàn)了問題。
過度依賴所帶來的后果。也用《少數(shù)派的報告》這部電影來說明如果癡迷于數(shù)據(jù)會導(dǎo)致我們將生活在一個沒有獨立選擇和自由意志的社會,如果一切變?yōu)楝F(xiàn)實,我們將被禁錮在大數(shù)據(jù)的可能性之中。所以書中提出了幾種解決方法,一種是使用數(shù)據(jù)時征詢數(shù)據(jù)所有個人的知曉和授權(quán)。第二個技術(shù)途徑就是匿名化。毫無疑問,大數(shù)據(jù)將會給社會管理帶來巨大的變革。
在這個信息爆炸的時代,大數(shù)據(jù)給人類社會的方方面面帶來了巨大的變革,這是社會發(fā)展的潮流,不可逆轉(zhuǎn),我們只有順應(yīng)這種潮流,把握住大數(shù)據(jù)時代變革的思想,才能在時代潮流中成為佼佼者,在思維上思路上略高一籌,才能在行動中占得先機!
大數(shù)據(jù)時代讀書心得篇二
對于暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的。話題,鐘情于務(wù)虛的觀點。新奇的產(chǎn)品于我無緣,習(xí)慣使用成熟的科技產(chǎn)品。既不清高,也非冷漠,就是要與現(xiàn)實保持一定的距離,給自己留一點思考的空間。這一習(xí)慣最近破了例。由于工作的原因,耳濡目染,“大數(shù)據(jù)”這個新興概念開始頻繁步入我的視野。按捺不住內(nèi)心的好奇,網(wǎng)購《大數(shù)據(jù)時代》,手不釋卷,三天讀完,頗有收獲。此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數(shù)據(jù)對人類的工作、生活、思維帶來的革新,大數(shù)據(jù)時代的三種典型的商業(yè)模式,以及大數(shù)據(jù)時代對于個人隱私保護(hù)、公共安全提出的挑戰(zhàn)。其次,文中的事例貼近現(xiàn)實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業(yè)術(shù)語,沒有假裝一副專業(yè)的面孔??v觀全書,遣詞造句,均通俗易懂。
作者認(rèn)為大數(shù)據(jù)時代具有三個顯著特點。
一、人們研究與分析某個現(xiàn)象時,將使用全部數(shù)據(jù)而非抽樣數(shù)據(jù)。
二、在大數(shù)據(jù)時代,不能一味地追求數(shù)據(jù)的精確性,而要適應(yīng)數(shù)據(jù)的多樣性、豐富性、甚至要接受錯誤的數(shù)據(jù)。
三、了解數(shù)據(jù)之間的相關(guān)性,勝于對因果關(guān)系的探索?!笆鞘裁础北取盀槭裁础敝匾?/p>
作者指出,隨著技術(shù)的發(fā)展,數(shù)據(jù)的存儲與處理成本顯著降低,人們現(xiàn)在有能力從支離破碎的、看似毫不相干的數(shù)據(jù)礦渣中抽煉出真知爍見。在大數(shù)據(jù)時代,三類公司將成為時代的寵兒。一是擁有大數(shù)據(jù)的公司與組織。如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公司(阿里巴巴、淘寶網(wǎng))。二是擁有數(shù)據(jù)分析與處理技術(shù)的專業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng)新思維的公司,他們可能既不掌握大數(shù)據(jù),也沒有專業(yè)技術(shù),但卻擅長使用大數(shù)據(jù),從大數(shù)據(jù)中找到自己的理想天地。
面對即將來臨的大數(shù)據(jù)時代,個人將如何應(yīng)對自如?這是個嚴(yán)肅的問題。
大數(shù)據(jù)時代讀書心得篇三
《大數(shù)據(jù)時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數(shù)據(jù)研究的先河之作。這本書最大的優(yōu)點就在于作者利用上百個例子來對大數(shù)據(jù)的方方面面做了詳細(xì)解說,讓外行也很容易理解。結(jié)構(gòu)上,作者通過大數(shù)據(jù)時代的思維變革、商業(yè)變革和管理變革三個角度依次闡述,條理清晰。
所謂"大數(shù)據(jù)",按作者的說法,就是"所有數(shù)據(jù)"。隨著計算機運算速度和存儲能力的發(fā)展,收集數(shù)據(jù)變得越來越簡單,儲存數(shù)據(jù)的成本越來越低。在過去,由于技術(shù)限制,人們做統(tǒng)計時只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計結(jié)果往往不能重復(fù)使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來不可避免的精確性問題。"小數(shù)據(jù)"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大數(shù)據(jù)"時代對精確性不再那么要求苛刻——也無法要求太嚴(yán)格——數(shù)據(jù)的數(shù)量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數(shù)據(jù)時代,我們應(yīng)該從追求"因果關(guān)系"的舊思維方式向追求"相關(guān)關(guān)系"轉(zhuǎn)變。在我看來,這實際上是通過大數(shù)據(jù)來透視一種事物的發(fā)展趨勢,而很多精確學(xué)科領(lǐng)域依然需要探尋"因果關(guān)系"解決更有針對性的問題,所以,這局限了這一轉(zhuǎn)變只能在特定的領(lǐng)域發(fā)生。作者自己也說,"大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。"。
大數(shù)據(jù)時代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬物都可以被數(shù)據(jù)化后用來分析。對這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數(shù)據(jù)的利用率。當(dāng)然數(shù)據(jù)并不是無限使用,時效、環(huán)境的變化肯定會對數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應(yīng)當(dāng)考慮的。這又引出了對數(shù)據(jù)這一無形資產(chǎn)的估值可能性。對于facebook,twitter這樣的公司來說,數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負(fù)債表上給他們一個公正的體現(xiàn)正是我們需要考慮的。
大數(shù)據(jù)時代的價值鏈由三部分構(gòu)成,我把它們簡化為"生產(chǎn)—分析—使用"三個環(huán)節(jié),這對應(yīng)書中的三種類型公司:第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價值,但作者認(rèn)為,最終,大部分的價值還是必須從數(shù)據(jù)本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數(shù)據(jù)的用途。
對于普通人來說,大數(shù)據(jù)時代最關(guān)心的還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風(fēng)險。對此,作者提出了使用者承擔(dān)責(zé)任的解決辦法,而不是過去那種流于形式的使用授權(quán)。大數(shù)據(jù)甚至能預(yù)測一個人的犯罪動機,這給監(jiān)管者帶來的難題是,預(yù)測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達(dá)成"個人僅需對行為而非動機負(fù)責(zé)"的共識非常重要。
大數(shù)據(jù)時代的風(fēng)險控制靠的是"算法師",類似會計師一樣的職業(yè),對大數(shù)據(jù)的準(zhǔn)確度或有效性進(jìn)行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨裁。當(dāng)今的法律亦需對大數(shù)據(jù)監(jiān)管進(jìn)行修訂補充。
當(dāng)代大數(shù)據(jù)發(fā)展主要由科技公司推動,相信在不久的將來更多的傳統(tǒng)領(lǐng)域會意識到大數(shù)據(jù)的重要性。但我們也應(yīng)該保持清醒,大數(shù)據(jù)并不是萬能藥,對某些領(lǐng)域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡單且實用的選擇;但對某些領(lǐng)域,盲目使用大數(shù)據(jù)只會適得其反。
大數(shù)據(jù)時代讀書心得篇四
如今,大數(shù)據(jù)時代成為炙手可熱的話題。你知道讀大數(shù)據(jù)時代。
在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預(yù)測未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應(yīng)用,以及它對現(xiàn)代商業(yè)運作的影響。
《大數(shù)據(jù)時代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進(jìn)行預(yù)測,并對未來可能出現(xiàn)的問題提出自己看法與對策。
下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時代》開篇就講了google通過人們在搜索引擎上搜索關(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預(yù)測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關(guān)的數(shù)據(jù)。同時google的預(yù)測與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著google預(yù)測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計學(xué)上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預(yù)測結(jié)果的相對準(zhǔn)確性與事件的可預(yù)測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準(zhǔn)確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎(chǔ)之上的。
接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準(zhǔn)確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。
之后,維克托又預(yù)測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。
無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!
我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預(yù)測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。
讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想?!薄半S著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認(rèn)為我們不在需要理論了。”書中幾乎肯定要顛覆統(tǒng)計學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實際”來“終結(jié)”量子力學(xué)。對此我很高興,因為統(tǒng)計學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時學(xué)到抽筋都不能及格的課目。但這兩個理論實在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會它們。
當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計學(xué)了。但是由統(tǒng)計學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預(yù)測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有?!洞髷?shù)據(jù)時代》也擔(dān)心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。
大數(shù)據(jù)時代讀書心得篇五
文中清晰的闡述了大數(shù)據(jù)的基本概念和特點,并列出明確的觀點。不管對于產(chǎn)業(yè)實踐者,還是對于政府和公眾機構(gòu),都非常具有價值。作者將本書分為3個部分。第一部分提出了大數(shù)據(jù)時代處理數(shù)據(jù)理念上的三大轉(zhuǎn)變:抽樣等于全體;要效率不要絕對精確;要相關(guān)不要因果;第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復(fù)用的巨大價值兩個方面,講述驅(qū)動大數(shù)據(jù)戰(zhàn)車在材質(zhì)和智力方面向前滾動的最根本動力;最后一部分,作者描繪了大數(shù)據(jù)帝國前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開等問題。
本書觀點擲地有聲,作者觀念高屋建瓴,從很多實例和經(jīng)驗中萃取普適性觀念。例子詳實豐富,囊括了進(jìn)百個學(xué)術(shù)和商業(yè)實例。
引言提出了大數(shù)據(jù)將給生活、工作于思維帶來重大的變革。一個例子是20__年h1n1流行病毒背景下谷歌通過檢測檢索詞條,處理了4.5億個不同的數(shù)據(jù)模型,通過預(yù)測并與20__年、20__年美國疾控中心記錄的實際流感病例進(jìn)行對比后,確定了45條檢索詞條組合,并將其用于一個特定的數(shù)學(xué)模型后,預(yù)測的結(jié)果與官方數(shù)據(jù)的相關(guān)系數(shù)高達(dá)97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運用大數(shù)據(jù)技術(shù),以前所未有的方式,通過海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預(yù)測流感提供了一種更快捷的預(yù)測工具。此外,我聯(lián)想到原淘寶董事長馬云通過大量數(shù)據(jù)分析得出20__年經(jīng)濟(jì)疲弱,為其商家提前做好迎接經(jīng)濟(jì)危機提供了時間緩沖。(補充并清晰描述詳細(xì))關(guān)于大數(shù)據(jù)在商業(yè)領(lǐng)域的應(yīng)用,farecast公司是一個成功的典型范例。該公司由奧倫·埃齊奧尼創(chuàng)辦,利用機票的銷售數(shù)據(jù)來預(yù)測未來的機票價格,旨在幫助用戶在購買機票方面做出預(yù)測,并對機票價格走勢預(yù)測的可信度標(biāo)示出來供消費者查考。farecast系統(tǒng)利用近十萬億條價格記錄預(yù)測的準(zhǔn)確度達(dá)75%,使得使用farecast票價預(yù)測工具購買機票的旅客,平均每張機票節(jié)約50美元。而處理如此多的數(shù)據(jù)離開了大數(shù)據(jù)技術(shù)將無法進(jìn)行。
也正是由于我們進(jìn)入了一個前所未有的信息化時代,人們擁有了如此多的數(shù)據(jù),才提供給我們利用大數(shù)據(jù)的分析處理手段,創(chuàng)造新的價值。也許有人以為我們大數(shù)據(jù)時代的還未來臨。其實大數(shù)據(jù)技術(shù)早已滲透到我們中間,它被應(yīng)用在垃圾郵件的過濾,新浪微博技術(shù)平臺,谷歌翻譯以及輸入文字的自動糾錯等。
文中提出的一個觀點是,預(yù)測是大數(shù)據(jù)的核心。其實從過去的時代人們就利用掌握的數(shù)據(jù)進(jìn)行各種分析,從而對經(jīng)濟(jì)等各方面進(jìn)行預(yù)測、矯正。只是進(jìn)入了大數(shù)據(jù)時代人們掌握的數(shù)據(jù)爆炸性的速度在增長,從而數(shù)據(jù)的存儲和分析數(shù)據(jù)分方法成了釋放大數(shù)據(jù)能量的關(guān)鍵。
關(guān)于不是隨機樣本而是整體數(shù)據(jù)中。作者指出了隨機取樣是小數(shù)據(jù)時代用最少的數(shù)據(jù)獲取最大價值的做法。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義。喬布斯成為世界上第一個對自身所有dna和腫瘤dna進(jìn)行排序的人。喬布斯曾開玩笑說“我要么是第一個通過這種方式戰(zhàn)勝癌癥的人,要么就是最后一個因為這種方式死于癌癥的人”。雖然最后難免死于癌癥但這種獲得所有數(shù)據(jù)而不是僅樣本的方法將他的生命延長了幾年。同樣,從事跨境匯款業(yè)務(wù)的xoom公司偵破一起犯罪集團(tuán)的詐騙也是由于使用了整體數(shù)據(jù)。初此之外,他還列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。
作者同時也指出隨著數(shù)據(jù)使用的越來越多,其得出的結(jié)果并一定能越來越精確,畢竟數(shù)據(jù)不能保證百分之百的正確,特別是大數(shù)據(jù)時代各種結(jié)構(gòu)化與非結(jié)構(gòu)化類型的數(shù)據(jù)聚集在一起難免導(dǎo)致結(jié)果的不太精確。大數(shù)據(jù)時代要求我們重新審視精確性的優(yōu)劣。作者特別舉了谷歌翻譯成功的例子。谷歌翻譯之所以優(yōu)于ibm的candide系統(tǒng)并不是因為它擁有更好的算法機制。和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯誤的數(shù)據(jù)。(其語庫來自于未經(jīng)過濾的網(wǎng)頁內(nèi)容,會包含一些不完整的句子、拼寫錯誤、語法錯誤以及其他各種錯誤)。
在不是因果關(guān)系,而是相關(guān)關(guān)系的篇章中。作者指出在大數(shù)據(jù)時代往往知道是什么要比知道為什么來的更實在。作者列舉了林登的亞馬遜推薦系統(tǒng)的成功,證實了大數(shù)據(jù)在分析相關(guān)性方面的優(yōu)勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的先鋒和代表,從以前廣為人事的啤酒和尿布的案例,以及作者舉的有關(guān)蛋撻和颶風(fēng)天氣的案例,都說明了掌握了相關(guān)關(guān)系對于其策略的幫助。建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測是大數(shù)據(jù)的核心。aviva保險公司利用幾百種生活方式的數(shù)據(jù),如愛好、長瀏覽網(wǎng)頁等間接的預(yù)測出哪些人更可能患高血壓、糖尿病和抑郁癥。ups國家快遞公司通過使用預(yù)測性分析檢測其全美6萬輛車隊。進(jìn)行防御性的修理,節(jié)約巨大得的成本。這些都充分顯示了大數(shù)據(jù)在預(yù)測方面的優(yōu)勢。
本書第二部分講的是大數(shù)據(jù)時代的商業(yè)變革。
作者用莫里繪制導(dǎo)航圖的例子告訴我們,遠(yuǎn)在信息數(shù)字化之前,對數(shù)據(jù)的運用就已經(jīng)開始了。莫里利用大量的人力去分析多年保存的航海記錄,他從這些大量的數(shù)據(jù)中獲取到新的利用價值。繪制的圖表幫助商人節(jié)約一大筆錢,使年輕的海員們間接獲取了成千上萬名經(jīng)驗豐富的航海家的指導(dǎo)。日本先進(jìn)工業(yè)技術(shù)研究所越水重臣教授通過安裝壓力傳感器將人屁股特征數(shù)據(jù)化,進(jìn)而形成對乘客身份的特征識別。這項技術(shù)為汽車防盜系統(tǒng)提供了方案。公司,致力于為顧客預(yù)測商品的價格,通過收集處理海量的價格信息,預(yù)測準(zhǔn)確率高達(dá)77%,幫助顧客在購買一個產(chǎn)品時節(jié)約了大約100美元。r部門通過分析來自210個國家的15億信用卡用戶的650億條交易記錄,分析得出商業(yè)發(fā)展和客戶消費趨勢,如通過分析發(fā)現(xiàn)如果一個人下午四點左右給汽車加油的話,他很可能在接下來的一個小時內(nèi)去購物或者去餐館吃飯,且在這一小時里大約花費35到40美元。商家正可以利用這個分析結(jié)果,在加油的小票背面附加上附近商店的優(yōu)惠券。
這些例子都證明了大數(shù)據(jù)蘊藏著巨大的商業(yè)價值。根據(jù)提供價值的不同來源,大數(shù)據(jù)價值鏈包括三大構(gòu)成部分。包括第一種是基于數(shù)據(jù)本身的公司。這些公司擁有大量數(shù)據(jù)或者至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。第二種是基于技能的公司。它們通常是咨詢公司、技術(shù)供應(yīng)商或者分析公司。它們掌握了專業(yè)技能但并不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)性用途的才能。比如說,沃爾瑪和pop-tarts這兩個零售商就是借助天睿公司的分析來獲得營銷點子,天睿就是一家大數(shù)據(jù)分析公司。第三種是基于思維的公司。皮特.華登,jetpac的聯(lián)合創(chuàng)始人,就是通過想法獲得價值的一個例子,他通過用戶分享到網(wǎng)上的旅行照片來為人們推薦下一次旅行目的地。對于某些公司來說,數(shù)據(jù)和技能并不是成功的關(guān)鍵。挖掘數(shù)據(jù)的新價值的創(chuàng)新思維才是這些公司脫穎而出的優(yōu)勢所在。
大數(shù)據(jù)成為許多公司競爭力的來源,未來可能整個行業(yè)的結(jié)構(gòu)會發(fā)生改變,大公司和小公司最有可能成為贏家。如今的核心競爭力在于快速而廉價地進(jìn)行大量的數(shù)據(jù)存儲和處理。當(dāng)然公司要根據(jù)自己的情況進(jìn)行調(diào)整。大數(shù)據(jù)向小數(shù)據(jù)時代的贏家以及那些線下大公司(如沃爾瑪、聯(lián)邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰(zhàn)。同時,大數(shù)據(jù)也為小公司帶來了機遇。大數(shù)據(jù)也將會影響國家競爭力。當(dāng)制造業(yè)已經(jīng)大幅轉(zhuǎn)向發(fā)展中國家,而大家都爭相發(fā)展創(chuàng)新行業(yè)的時候,工業(yè)化國家因為掌握了數(shù)據(jù)以及大數(shù)據(jù)技術(shù),所以仍然在全球競爭中占據(jù)優(yōu)勢,但這個優(yōu)勢很難持續(xù)。隨著技術(shù)的發(fā)展,西方世界在大數(shù)據(jù)技術(shù)的優(yōu)勢將會慢慢消失。對于大公司而言,好消息是大數(shù)據(jù)技術(shù)可以加劇優(yōu)勝劣汰。一旦公司掌握了大數(shù)據(jù),它不但可能超過對手還可能遙遙領(lǐng)先。
文章第三部分講了大數(shù)據(jù)帶來無數(shù)好處的同時帶來的不良影響以及如何面對這些影響。包括如數(shù)據(jù)的收益的處理問題以及數(shù)據(jù)中用戶資料的隱私和決策過程帶來的影響。作者在保護(hù)個人隱私方面提出了幾種想法。一種是使用數(shù)據(jù)時征詢數(shù)據(jù)所有個人的知曉和授權(quán)。第二個技術(shù)途徑就是匿名化。作者同時也指出了這兩種方式的難度。一方面收集到的數(shù)據(jù)可能會被后續(xù)的多次利用。另一方面,匿名化會在數(shù)據(jù)收集越來越多和數(shù)據(jù)的相互結(jié)合關(guān)聯(lián)使用時變得無效。作者列列舉電影《少數(shù)派報告》的情節(jié)說明越來越依賴數(shù)據(jù)時,大數(shù)據(jù)可能將我們禁錮在可能性之中。當(dāng)然通過分析犯罪的常發(fā)地與常發(fā)時間,合理安排警力會對治安防范提供不小的幫助。作者還指出不能盡信數(shù)據(jù)的分析結(jié)果,因為不能保證獲取分析結(jié)果來源的數(shù)據(jù)準(zhǔn)確性。大數(shù)據(jù)在給我們生活提供便利的同時,也讓隱私保護(hù)的法律手段失去了作用。我們必須杜絕對數(shù)據(jù)的過分依賴。
在高速邁進(jìn)大數(shù)據(jù)時代的同時,人類信息管理準(zhǔn)則需要重新定位,這將帶動社會核心價值觀的轉(zhuǎn)變。大數(shù)據(jù)時代,對原有規(guī)范的修修補補已經(jīng)不足以抑制大數(shù)據(jù)帶來的風(fēng)險。保護(hù)個人隱私就需要對個人數(shù)據(jù)處理器對其政策和行為承擔(dān)更多責(zé)任。同時必須重新定義公正的概念,以確保人類行為的自由。作者提出了解決這些問題的方向。如個人隱私保護(hù)方面,可以讓使用者承擔(dān)更多的社會責(zé)任。將責(zé)任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者有很多意義,也有充分的理由。因為他們更清楚將如何使用數(shù)據(jù)且是數(shù)據(jù)應(yīng)用最大的受益者。關(guān)于公正方面簡單的講就是個人可以并應(yīng)為他們的行為而非傾向負(fù)責(zé)。就像公司有內(nèi)部會計和外部審計人員一樣,大數(shù)據(jù)時代,公司將設(shè)置專門的人員--內(nèi)部和外部算法師對大數(shù)據(jù)活動進(jìn)行監(jiān)督。還有可能出現(xiàn)第三方的機構(gòu)對大數(shù)據(jù)行為進(jìn)行監(jiān)督和衡量。作者甚至考慮到對大數(shù)據(jù)存在的壟斷情況進(jìn)行分析并在反壟斷反面給了建議。最后結(jié)語中作者提出大數(shù)據(jù)提供給人們的只是參考答案,提醒我們在利用這個工具時要銘記人類的作用是無法完全替代的。
大數(shù)據(jù)時代是信息化社會發(fā)展必然趨勢,我們只有緊緊跟隨時代發(fā)展的潮流,在技術(shù)上、制度上、價值觀念上做出迅速調(diào)整并牢牢跟進(jìn),才能在接下來新一輪的國際競爭中擺脫受制于人的弱勢境地,才能把握發(fā)展的方向,沖破與西方國家的差距。對于一個國家如此,對于一個企業(yè)亦是如此。在如此快速的到來的大數(shù)據(jù)時代,我們還有很多知識需要學(xué)習(xí),許多思維需要轉(zhuǎn)變,許多技術(shù)需要研究。公司的規(guī)劃中,也需充分考慮到大數(shù)據(jù)對于公司的未來發(fā)展所帶來的機遇和挑戰(zhàn)。對于掌握大量數(shù)據(jù)的公司,需要考慮有多少數(shù)字化的數(shù)據(jù),又有哪些可以通過大數(shù)據(jù)的分析處理而帶來有價值的用途?比如國內(nèi)目前的社交網(wǎng)站,購物網(wǎng)站等都掌握了用戶的大量的數(shù)據(jù)信息。在大數(shù)據(jù)時代制勝的良藥也許是創(chuàng)新的點子,也許可以利用外部的數(shù)據(jù),通過多維化、多層面的分析給其他企業(yè)或個人帶來價值。
大數(shù)據(jù)時代讀書心得篇六
讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想?!薄半S著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認(rèn)為我們不在需要理論了。”書中幾乎肯定要顛覆統(tǒng)計學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實際”來“終結(jié)”量子力學(xué)。對此我很高興,因為統(tǒng)計學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時學(xué)到抽筋都不能及格的課目。但這兩個理論實在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會它們。
當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計學(xué)了。但是由統(tǒng)計學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預(yù)測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有。《大數(shù)據(jù)時代》也擔(dān)心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。
大數(shù)據(jù)時代讀書心得篇七
未來的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時代。不管你是否意識到它的存在,大數(shù)據(jù)都將越來越快地改變我們這個時代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見大數(shù)據(jù)時代發(fā)展趨勢的數(shù)據(jù)科學(xué)家之一。他通過一個大家熟知的事例,來幫助我們理解“大數(shù)據(jù)”的潛在影響力,那就是四個世紀(jì)之前望遠(yuǎn)鏡和顯微鏡的發(fā)明。望遠(yuǎn)鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數(shù)據(jù)的新工具,因為這種工具的發(fā)明,人們同步更新了分析數(shù)據(jù)的技術(shù)和方法,促進(jìn)了人們對世界更好的理解。如果說望遠(yuǎn)鏡和顯微鏡是測量領(lǐng)域中的一場革命,那么今天的數(shù)據(jù)測量就相當(dāng)于是現(xiàn)代版的望遠(yuǎn)鏡、顯微鏡。隨著社交網(wǎng)絡(luò)的逐漸成熟,移動帶寬迅速提升,云計算、物聯(lián)網(wǎng)應(yīng)用更加豐富,以及更多的傳感設(shè)備、移動終端接入到網(wǎng)絡(luò),由此產(chǎn)生的數(shù)據(jù)及數(shù)據(jù)的增長速度比歷史上的任何時期都要多、都要快。一個大數(shù)據(jù)的時代,不經(jīng)意間順理成章地翩然而至。
一、什么是大數(shù)據(jù)?
大數(shù)據(jù)是當(dāng)前最熱門的話題之一。但什么是大數(shù)據(jù),人們尚未給出確切的定義。首先,“大數(shù)據(jù)”是相對過去小的、局部性的數(shù)據(jù)而言的;其次,利用大數(shù)據(jù)進(jìn)行分析和工作時,所依據(jù)的關(guān)于此事盡可能完整的數(shù)據(jù),從而“一覽眾山小”,而不是采用局部的小數(shù)據(jù),從局部推斷整體。
維克托也并未直接給出大數(shù)據(jù)的定義。不過,他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性:
轉(zhuǎn)變之一:在大數(shù)據(jù)時代,我們可以分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機采樣。例如一項針對相撲比賽中非法操縱比賽結(jié)果的研究對64000場比賽進(jìn)行了分析,這算不上一個很大的數(shù)字,但由于這是過去十年所有的比賽,所以它是大數(shù)據(jù)。
轉(zhuǎn)變之二:由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對于一個事物只有50個數(shù)據(jù)點,那么每一個數(shù)據(jù)點都必須非常精確,因為每個數(shù)據(jù)點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。
轉(zhuǎn)變之三:不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。分析大數(shù)據(jù)主要為了預(yù)測未來“是什么”,而不是“為什么”。因為很多時候我們以為我們找到了事情背后的原因,實際上卻沒有找到。更多時候知道了“是什么”就足夠了。例如知道流感將會擴(kuò)散到哪里就足夠了,我不需要知道為什么;知道什么時候在網(wǎng)上購買機票能夠獲得最優(yōu)惠的價格就足夠了,我不需要知道為什么此時價格最低。
二、大數(shù)據(jù)帶來的變化。
大數(shù)據(jù)從根本上改變我們認(rèn)識世界和改變世界的方式。很多傳統(tǒng)的習(xí)慣將被顛覆,很多舊的制度將面臨挑戰(zhàn)。舉例來說:
第一,科學(xué)探究的思路和方式受到挑戰(zhàn)。
探究是新課程改革中的一個熱詞,是促進(jìn)學(xué)校教學(xué)與科學(xué)研究相融合的實踐舉措??茖W(xué)探究的基本路徑是:發(fā)現(xiàn)問題,提出假設(shè),制定方案,實踐探究,分析數(shù)據(jù),得出結(jié)論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關(guān)。換句話說,對所要研究的事物,我們知道的數(shù)據(jù)很少,需要從這些很小的數(shù)據(jù)出發(fā),通過猜想和假設(shè),進(jìn)行試探性的研究,如果研究得出的結(jié)果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數(shù)據(jù)也隨之增加。
利用測量所獲得的點滴數(shù)據(jù),從一個局部來推測世界是怎樣的,這是科學(xué)探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認(rèn)識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設(shè)。如果決策者自身對所研究的事情存在著偏見,所提出的假設(shè)就很難得到實證的支持,這往往會導(dǎo)致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學(xué)研究者還是堅定不移地沿著這條道路前行,學(xué)校在教學(xué)中也將其作為科學(xué)研究的基本規(guī)范來傳授。
在大數(shù)據(jù)時代,這樣的研究方式收到了極大的挑戰(zhàn)。先舉個事例來說吧。手機輻射是否能夠致癌?關(guān)于這個問題,無論我們的假設(shè)如何,實驗的設(shè)計都很難進(jìn)行。首先,樣本選擇過少,沒有統(tǒng)計學(xué)上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數(shù)據(jù)之后,這樣的難題就可以迎刃而解了。前段時間,丹麥就進(jìn)行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數(shù)據(jù)庫。他們從這個數(shù)據(jù)庫中分析了1990年至20xx年擁有手機的所用用戶的數(shù)據(jù),同時,他們還收集了這一期間醫(yī)院收集的所有癌癥患者的數(shù)據(jù),然后分析手機用戶是否比非手機用戶有更高的癌癥發(fā)病率。這兩個數(shù)據(jù)庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結(jié)果表明,使用移動用戶和癌癥風(fēng)險增加之間不存在任何關(guān)系。20xx年10月,這一研究的結(jié)果發(fā)表在《英國醫(yī)學(xué)雜志》上。
上述的案例告訴我們,在獲得了大量的數(shù)據(jù),能夠?qū)κ挛锏恼w進(jìn)行全面的認(rèn)識之后,假想就沒有意義了,我們可以直接根據(jù)全面的數(shù)據(jù)做出結(jié)論。
大數(shù)據(jù)時代讀書心得篇八
去年的“云計算”炒得熱火朝天的,今年的“大數(shù)據(jù)”又突襲而來。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數(shù)據(jù)”來了。于是乎,各企業(yè)的cio也將熱度紛紛轉(zhuǎn)向關(guān)注“大數(shù)據(jù)”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現(xiàn)實中小企業(yè)云計算,大數(shù)據(jù)的現(xiàn)狀。
不過話又還得說回來,《大數(shù)據(jù)時代》是本好書。
當(dāng)然,很多it知名人士也大力推薦,寫了好多讀后感來表述對這本書的喜歡沒看此書之前,對所謂大數(shù)據(jù)的概念基本上是一頭霧水,雖則有了解關(guān)注過現(xiàn)在也比較火熱的bi,覺得也差不多,可能就是更多的數(shù)據(jù),更細(xì)致的數(shù)據(jù)分析與數(shù)據(jù)挖掘。看過此書后,感覺到之前的想法,只能算是中了一小半吧---巨量的數(shù)據(jù),而另一前:著眼于數(shù)據(jù)關(guān)聯(lián)性,而非數(shù)據(jù)精確性,或許才是大數(shù)據(jù)與現(xiàn)時bi最大的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數(shù)據(jù)的關(guān)聯(lián)性重佳,還是數(shù)據(jù)的精確性更好,還真的需要時間來檢驗一下,至少從現(xiàn)在的數(shù)據(jù)分析方法來論,更多的傾向于數(shù)據(jù)的精確性。看完此書,我心中的一些問題:
1.什么是大數(shù)據(jù)?
查了查百度百科,是這樣定義的:大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。大數(shù)據(jù)的4v特點:volume、velocity、variety、veracity--這個好像是ibm的定義吧。
以個人的觀點來看:數(shù)據(jù)海量,存儲海量都是大數(shù)據(jù)的基本原型吧。
2.大數(shù)據(jù)適合什么樣的企業(yè)?
3.大數(shù)據(jù)帶來的影響。
1)預(yù)測未來書中以google成功預(yù)測了未來可能發(fā)生流感的案例來開篇,表明通過大數(shù)據(jù)的應(yīng)用,可以為我們的生活起一個保駕護(hù)航的指向標(biāo)。實質(zhì)很簡單,技術(shù)改變世界。
3)變革思維書中所說:因為有海量的數(shù)據(jù)作基礎(chǔ),未來,我們可能更關(guān)注數(shù)據(jù)的相關(guān),而非精細(xì)度。對這條,本人還是持保留意見的。
大數(shù)據(jù)時代讀書心得篇九
在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預(yù)測未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
大數(shù)據(jù)時代讀書心得篇十
4月13日下午,在湖南大學(xué)東樓205參加了關(guān)于《大數(shù)據(jù)時代》的讀書交流活動。通過相互交流學(xué)習(xí),使我更深層次的理解了大數(shù)據(jù)時代的利與弊,機遇和挑戰(zhàn)。在寫心得體會前,我想再重新審視一下關(guān)于大數(shù)據(jù)的歷史沿革和現(xiàn)實意義。
首先,最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來?!薄按髷?shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計算、物聯(lián)網(wǎng)之后又it行業(yè)又一大顛覆性的技術(shù)革命。云計算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場所和渠道,而數(shù)據(jù)才是真正有價值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)it架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實時性要求也將大大超越現(xiàn)有的計算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國家治理、企業(yè)決策乃至個人生活服務(wù),是大數(shù)據(jù)的核心議題,也是云計算內(nèi)在的靈魂和必然的升級方向。
其次,進(jìn)入20xx年,大數(shù)據(jù)(bigdata)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時報》《華爾街日報》的專欄封面,進(jìn)入美國白宮官網(wǎng)的新聞,現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進(jìn)了投資推薦報告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數(shù)據(jù)對企業(yè)的重要性。正如《紐約時報》20xx年2月的一篇專欄中所稱,“大數(shù)據(jù)”時代已經(jīng)降臨,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺。哈佛大學(xué)社會學(xué)教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程?!?/p>
最后,隨著云時代的來臨,大數(shù)據(jù)(bigdata)也吸引了越來越多的關(guān)注。著云臺的分析師團(tuán)隊認(rèn)為,大數(shù)據(jù)(bigdata)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像mapreduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作?!按髷?shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運營中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用g或t來衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張dvd;發(fā)出的郵件有2940億封之多(相當(dāng)于美國兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬個(相當(dāng)于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數(shù)量37.1萬……,截止到20xx年,數(shù)據(jù)量已經(jīng)從tb(1024gb=1tb)級別躍升到pb(1024tb=1pb)、eb(1024pb=1eb)乃至zb(1024eb=1zb)級別。國際數(shù)據(jù)公司(idc)的研究結(jié)果表明,20xx年全球產(chǎn)生的數(shù)據(jù)量為0.49zb,20xx年的數(shù)據(jù)量為0.8zb,20xx年增長為1.2zb,20xx年的數(shù)量更是高達(dá)1.82zb,相當(dāng)于全球每人產(chǎn)生200gb以上的數(shù)據(jù)。而到20xx年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200pb,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5eb。ibm的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了20xx年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
首先,談?wù)劥髷?shù)據(jù)帶給生活的轉(zhuǎn)變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢,可以說,大數(shù)據(jù)現(xiàn)在已經(jīng)開始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來優(yōu)化規(guī)模和實現(xiàn)利益最大化。而我們很多人對大數(shù)據(jù)還很陌生,只是被動的適應(yīng)著大數(shù)據(jù)給生活帶來的改變。大數(shù)據(jù)時代是以云計算為基礎(chǔ)的,所以,要實現(xiàn)大數(shù)據(jù),相關(guān)的很多的硬件設(shè)備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關(guān)產(chǎn)業(yè)都要重新調(diào)整產(chǎn)業(yè)結(jié)構(gòu),在那時,可以夸張的說,信息就是黃金,信息就是石油。大數(shù)據(jù)時代的到來會解放更多的勞動生產(chǎn)力,勢必將會更加加劇生產(chǎn)力過剩的現(xiàn)狀,社會兩極分化現(xiàn)象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數(shù)據(jù)時代的到來會使人們的生活節(jié)奏急速加快,信息的時效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會越來越忙,到那時,就像現(xiàn)在的日本,可能想找個人聽你說說話,真的是一件很難的事。
第二,關(guān)于數(shù)據(jù)管理的看法。大數(shù)據(jù)時代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動泄露信息,要管理好自己身邊的信息設(shè)備;技防,就是要運用軟件來管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應(yīng)當(dāng)做到備份與原始文件是物理隔離,無關(guān)的信息應(yīng)當(dāng)及時刪除,減輕硬盤的壓力。
三、怎么保護(hù)自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠(yuǎn)離網(wǎng)絡(luò),不要再公開的社交網(wǎng)絡(luò)儲存和展示個人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質(zhì)的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機碼來保護(hù)自己真實ip地址,提高網(wǎng)絡(luò)安全的可靠性,加強對聯(lián)網(wǎng)信息的管理和保護(hù)。
不論我們情不情愿,大數(shù)據(jù)時代都會到來,現(xiàn)實社會是我們高喊著走向大數(shù)據(jù)時代,其實大數(shù)據(jù)時代已經(jīng)向我們走來,所以與其被動接受,不如主動學(xué)習(xí),從中找到自己的出路,成為大數(shù)據(jù)時代的建設(shè)者和受益者。
大數(shù)據(jù)時代讀書心得篇十一
大數(shù)據(jù)時代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關(guān)系和不同,也試圖說明,為什么信息時代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時代?大數(shù)據(jù)時代帶給了我們什么?下面是本站小編為大家收集整理的大數(shù)據(jù)時代。
歡迎大家閱讀。
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應(yīng)用,以及它對現(xiàn)代商業(yè)運作的影響。
《大數(shù)據(jù)時代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進(jìn)行預(yù)測,并對未來可能出現(xiàn)的問題提出自己看法與對策。
下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時代》開篇就講了google通過人們在搜索引擎上搜索關(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預(yù)測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關(guān)的數(shù)據(jù)。同時google的預(yù)測與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著google預(yù)測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計學(xué)上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預(yù)測結(jié)果的相對準(zhǔn)確性與事件的可預(yù)測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準(zhǔn)確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎(chǔ)之上的。
接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準(zhǔn)確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。
之后,維克托又預(yù)測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。
無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!
我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預(yù)測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。
讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想?!薄半S著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實際”來“終結(jié)”量子力學(xué)。對此我很高興,因為統(tǒng)計學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時學(xué)到抽筋都不能及格的課目。但這兩個理論實在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會它們。
當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計學(xué)了。但是由統(tǒng)計學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預(yù)測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有?!洞髷?shù)據(jù)時代》也擔(dān)心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。
在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預(yù)測未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
大數(shù)據(jù)時代讀書心得篇十二
“大數(shù)據(jù)”概念早在1980年就有國外的學(xué)者提出,可是最近幾年才廣泛受到大家的關(guān)注。當(dāng)“大數(shù)據(jù)”這個概念傳到中國的時候,瞬間引起了轟動。隨即,各種有關(guān)“大數(shù)據(jù)”的資料和書籍充斥的我們的視野。隨意打開某個電子商務(wù)平臺圖書類頁面,在搜索框中搜索“大數(shù)據(jù)”三個字,就會出現(xiàn)好多本有關(guān)“大數(shù)據(jù)”的書籍??墒牵幸粋€很有趣的現(xiàn)象就是:幾乎所有的平臺上,出現(xiàn)的第一本關(guān)于“大數(shù)據(jù)”的書籍一定是《大數(shù)據(jù)時代》。一點進(jìn)去,這本書推薦欄里的第一句話就是:迄今為止全世界最好的一本大數(shù)據(jù)專著。同時,為這本書做推薦的都是各行業(yè)的精英領(lǐng)袖。所有“大數(shù)據(jù)”方面的書籍也是這本書銷量最高,評價最好。
我從來不會因為哪本書暢銷和很多人推薦就盲目跟風(fēng)的去看一本書。因為我知道通常在這種情況下選擇一本書,整個閱讀的體會和感受是無法遵從自己的內(nèi)心的,整個過程都很容易夾雜著別人對這本書的感受。所以通常我讀書的節(jié)奏大多都是跟不上“潮流”的,但往往經(jīng)過風(fēng)雨洗禮之后沉淀下來的都是精華。坦白講,閱讀這本書的初衷并不是因為我想從書中獲取到多少大數(shù)據(jù)方面的精華,只是很想知道對于這么一個很直白的名詞,作者是怎么寫出這么厚的一本書的。這種初衷或許很無知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書中的精華。
在看《大數(shù)據(jù)時代》這本書之前,我的所有讀后感都是集中在書籍給了我什么思考。對于這本書的讀后感,除了觀點碰撞之外,我還會加上大部分個人看這本書的體會。因為這本書,已經(jīng)完全讓我模糊了大多數(shù)人口中的“全世界最好的書”是一種什么標(biāo)準(zhǔn)。也許《大數(shù)據(jù)時代》真的無法承載那么高的贊美!
大數(shù)據(jù)時代的入門書。
看完這本書,我隨意調(diào)查了一些閱讀過這本書并且給這本書絕對好評的朋友。詢問他們這本書好在哪里?大多數(shù)的回答是說《大數(shù)據(jù)時代》這本書讓對大數(shù)據(jù)一無所知的他們了解了大數(shù)據(jù)這個概念,同時通過很多案例說明原來大數(shù)據(jù)能有這么大的用處,影響會有這么大!僅此而已。我看完這本書最大的感受是這本書分為上、下兩部分。前120多頁為上部分,后120多頁為下部分。之所以說《大數(shù)據(jù)時代》是一本關(guān)于大數(shù)據(jù)的入門書,是因為這本書用了前面120多頁的篇幅反復(fù)的強調(diào)大數(shù)據(jù)的出現(xiàn)對社會發(fā)展影響很大,并且要人們轉(zhuǎn)變小數(shù)據(jù)時代慣有的思想。所以整本書的前半部分就強調(diào)大數(shù)據(jù)時代的三個轉(zhuǎn)變:1、大數(shù)據(jù)利用所有的數(shù)據(jù),而不再僅僅依靠一小部分?jǐn)?shù)據(jù),不再依賴于隨機采樣。2、大數(shù)據(jù)數(shù)據(jù)多,不再熱衷于追求精確性,也不再期待精確性。3、大數(shù)據(jù)時代不再熱衷于尋找因果關(guān)系,而是追求相關(guān)關(guān)系。所以整個上半部分沒什么可詳說的。我們重點聊聊本書的后半部分。
既然一直都在強調(diào)大數(shù)據(jù)對我們的意義,總要有具體體現(xiàn)。整本書中,我感觸最大的一個案例就是某公司通過分析大數(shù)據(jù)發(fā)現(xiàn):新品發(fā)布的時候,舊一代的產(chǎn)品可能會出現(xiàn)短暫的價格上漲。因為人們在心理上就認(rèn)為新產(chǎn)品的推出,舊產(chǎn)品就會便宜,從而就會提高購買量。這個發(fā)現(xiàn)和我們平常的心理是完全違背的,而且如果不用數(shù)據(jù)來證明,直接講道理給大家可能還是無法相信。這就是大數(shù)據(jù)對我們很多傳統(tǒng)思維的顛覆。一旦涉及到思維的改變,往往就會引起整個社會的大變動。
大數(shù)據(jù)這個概念的出現(xiàn),讓大數(shù)據(jù)逐漸發(fā)展形成一條價值鏈。在這條價值鏈上,數(shù)據(jù)本身、技能和思維是最重要的環(huán)節(jié)。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,越來越多的公司都能收集到大量的數(shù)據(jù),這些數(shù)據(jù)也會越來越公開??墒窃谶@些公司中,不是所有的公司都有從數(shù)據(jù)中提取價值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。于是就會出現(xiàn)以下兩種公司,一種是掌握了專業(yè)技能但不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數(shù)據(jù)的新價值的創(chuàng)新公司。短時間內(nèi),我們可能會感覺擁有創(chuàng)新思維,懂得挖掘出數(shù)據(jù)新價值的大數(shù)據(jù)思維是最重要的。可是等到產(chǎn)業(yè)成熟之后,所有人都知曉了大數(shù)據(jù)的意義,所有人便開始挖掘自己的大數(shù)據(jù)思維。同時,隨著科技的進(jìn)步,掌握大數(shù)據(jù)技術(shù)的也將成為常態(tài)。所以到后來,整個價值鏈的核心環(huán)節(jié)還是回到了數(shù)據(jù)本身。而到那時候,大數(shù)據(jù)的公開性也就越來越小。
在大談完大數(shù)據(jù)對人類發(fā)展的積極意義之后,作者也考慮到大數(shù)據(jù)時代的風(fēng)險。這一部分是作者腦洞大開的精彩之處,同時也是最荒謬的一部分。書中說大數(shù)據(jù)時代將要懲罰未來犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行為給防止。這樣的社會,大數(shù)據(jù)儼然已經(jīng)延伸到了我們每個人生活的點滴。幾乎我們在生活中所做的一切都在大數(shù)據(jù)的“監(jiān)控”之下,我想到那時候,別說我們每個人的隱私已經(jīng)沒有的了,嚴(yán)重一點可以說是我們可能連人都不算了。在我們?nèi)说纳鐣傩灾?,自由?quán)利是一項很重要的指標(biāo)。通過大數(shù)據(jù)懲罰人的未來犯罪已經(jīng)否定了人的自由選擇能力和人的行為責(zé)任自負(fù)。同時,由于數(shù)據(jù)是永久保存,大數(shù)據(jù)預(yù)測也是通過每個人之前的數(shù)據(jù)來判斷,所以大數(shù)據(jù)同樣也否定了人的求善心理。還有,從現(xiàn)在各種大數(shù)據(jù)預(yù)測的結(jié)果來看,很多發(fā)言人都說大數(shù)據(jù)不是百分百的準(zhǔn)確。所以利用大數(shù)據(jù)來判斷人的行為發(fā)展已經(jīng)違背了大數(shù)據(jù)不追求精確性的特征,這也是書中自相矛盾的地方。
對于一個新事物,如果能讓大家了解這個事物并且對此產(chǎn)生興趣,這已經(jīng)算是一本不錯的入門書了。
從小到大,雞湯對于我們來說一直都挺珍貴的。身體虛弱了,喝點雞湯能夠補充營養(yǎng)。心靈受傷了,看點心靈雞湯可以鼓舞人心??墒墙鼛啄辏藗兩钏教岣吡?,營養(yǎng)富余,雞湯已經(jīng)不是人們補營養(yǎng)的期待了。同樣,心靈雞湯也是如此。
心靈雞湯其實是一個很虛偽的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來,心靈雞湯很大的一個特征就是:立人的志,但是就不告訴你實現(xiàn)志的方法。很多人每次在失意的時候就喜歡看心靈雞湯,希望能得到慰藉。看完后也覺得醍醐灌頂,感覺整個世界都亮了。但又有幾個人想過喝完這些雞湯之后你除了看似重拾夢想,你還獲得了什么?你知道怎么去做嗎?《大數(shù)據(jù)時代》就是這樣一本書。整本書從頭到尾都在向讀者講述大數(shù)據(jù)的意義,當(dāng)然期間也會用相應(yīng)的案例來證明大數(shù)據(jù)確實有這樣的能力。但是,整本書從沒有涉及到技術(shù)層面的問題?;蛟S對于大數(shù)據(jù)這種依靠互聯(lián)網(wǎng)技術(shù)的新事物,即使向讀者講技術(shù),也沒有幾個人看得懂,可是整本書沒有一點關(guān)于大數(shù)據(jù)思維的技能引導(dǎo)。給出的案例中只有少數(shù)案例向讀者講述了這個公司為什么要利用大數(shù)據(jù)來解決這種問題,大多數(shù)都只是告訴讀者國外某家公司運用大數(shù)據(jù)得出了某種結(jié)論。同時,在本書中文譯作者寫的序里,強調(diào)自己翻譯這本著作的一大優(yōu)點是可以結(jié)合國內(nèi)的案例來分析書中的理論,結(jié)果,看到最后一頁都沒有看到一個國內(nèi)企業(yè)關(guān)于大數(shù)據(jù)運用的案例。
之所以我稱之為“心靈雞湯”,還有一個原因就是作者在書中大講特講的大數(shù)據(jù)的作用,事實上按照現(xiàn)在的經(jīng)濟(jì)發(fā)展水平和社會文明發(fā)展程度是很難實現(xiàn)的。書中很多時候的理論都是要建立在社會各項文明都發(fā)展健全的基礎(chǔ)上才能實現(xiàn)。
大數(shù)據(jù)的“傳銷手冊”
看到這個標(biāo)題,大家可能會覺得我夸大其詞,受到如此多人好評的書怎么是“傳銷手冊”呢?對于這個表達(dá),我只想說兩點:1、此說法僅代表我個人觀點,是否認(rèn)同是個人問題。2、此說法主要針對本書的上部分。
我們都知道傳銷組織在發(fā)展下線的前期是要花大力氣去培訓(xùn)的,也就是洗腦。而對于一個陌生又很難以理解的事物,最好的“洗腦”方式就是重復(fù)?!洞髷?shù)據(jù)時代》這本書就是運用這種方式,前半部分為了讓讀者能夠接受“大數(shù)據(jù)”這個概念,作者反反復(fù)復(fù)提醒讀者大數(shù)據(jù)不是隨機采樣、不追求精確和不尋找因果關(guān)系。同時用很多看似很通俗易懂其實看完后還是不知道說了什么的案例來讓人信服大數(shù)據(jù)的作用。書中的后半部分雖然也是用這種方式來感染讀者,可后半部分中作者的暢想和對大數(shù)據(jù)的威脅分析還是對讀者有一些實質(zhì)意義的,所以后半部分的“傳銷”影響就不是很重要。
大數(shù)據(jù)時代是未來的趨勢,這誰都不會否認(rèn)。大數(shù)據(jù)改造了我們的生活,改變著我們的世界。不管它是以一種什么樣的姿態(tài)面向世界,它都沒有錯,因為大數(shù)據(jù)只是一種工具。但當(dāng)人類開始質(zhì)疑甚至恐懼大數(shù)據(jù)的時候,人類就該思考自己是否利用好這個好工具了。
大數(shù)據(jù)時代讀書心得篇十三
當(dāng)恐龍消失,人類慢慢成為了動物界的主人。
數(shù)據(jù)是我們工作、生活中的點滴記錄,它真實、樸實無華,它們也會有聲音,只是需要有慧眼和思維才能駕馭。
我們只有跨過數(shù)據(jù)化、數(shù)字化的長河,才能開啟ai時代,路途遙遠(yuǎn),主人!
大數(shù)據(jù)時代讀書心得篇十四
小數(shù)據(jù)時代,我們在數(shù)據(jù)的精準(zhǔn)性上花費很多,包括規(guī)則和準(zhǔn)則、復(fù)式記賬的平衡規(guī)則、信息系統(tǒng)等等,數(shù)據(jù)閉環(huán),所以數(shù)據(jù)具有結(jié)構(gòu)性,所以可以找根尋蹤,找尋問題的根源,尋求解決方案。
大數(shù)據(jù)時代來臨,因為數(shù)據(jù)量的龐大,以及數(shù)據(jù)背后的繁雜性,以及處理數(shù)據(jù)的知識it工程師和計算者,別忘了,擁有數(shù)據(jù)的是政府和獨角獸商人,所以,他們很難對數(shù)據(jù)進(jìn)行深度分析,這樣也會催生各個領(lǐng)域的數(shù)據(jù)分析業(yè)務(wù),數(shù)據(jù)生態(tài)鏈核心就清晰了起來。
大數(shù)據(jù)會取代小數(shù)據(jù)嗎?這是不可能的事,大數(shù)據(jù)和中小數(shù)據(jù)之間的防火墻更會高筑!
大數(shù)據(jù)都是基于樣本的非結(jié)構(gòu)性數(shù)據(jù),推送到我們面前的數(shù)據(jù)指引,都已經(jīng)經(jīng)過了各種算法的粗加工,融入了計算者的各種算法,算法會因人而異,利用我們過去的電子痕跡,預(yù)測我們的現(xiàn)在和未來,一花一世界。
初期的一大一小,數(shù)據(jù)的交融,像極了海上的漁網(wǎng),具有強關(guān)聯(lián)性。
數(shù)據(jù)就像是一個神奇的鉆石礦,在其首要價值被發(fā)覺后,仍能不斷創(chuàng)造價值。大數(shù)據(jù)擁有者依賴技術(shù)專家挖掘數(shù)據(jù)的價值,但技術(shù)專家(數(shù)據(jù)武士)并沒有想象中那么耀眼,他們在大數(shù)據(jù)中淘金,發(fā)現(xiàn)了金銀珠寶,可最后卻要把這些財富拱手讓給大數(shù)據(jù)擁有者。
大數(shù)據(jù)時代讀書心得篇十五
隨著信息技術(shù)的迅猛發(fā)展,大數(shù)據(jù)時代已經(jīng)到來,對于個人、企業(yè)乃至全社會來說,如何正確處理和善用大數(shù)據(jù)成為了一個亟待解決的問題。近日,我觀看了一期名為《大數(shù)據(jù)時代》的紀(jì)錄片,這部紀(jì)錄片使我對大數(shù)據(jù)時代有了更深入的認(rèn)識。下面我將圍繞這一主題,簡要分享我在觀看該紀(jì)錄片后的心得體會。
首先,大數(shù)據(jù)時代無處不在。紀(jì)錄片中介紹了大數(shù)據(jù)的應(yīng)用場景:從智能手機的流量統(tǒng)計,到醫(yī)療行業(yè)的患者數(shù)據(jù)分析,再到政府的公共安全預(yù)警系統(tǒng),大數(shù)據(jù)無時無刻不在為我們提供支持和幫助。通過充分利用大數(shù)據(jù),我們可以更好地了解用戶需求,優(yōu)化產(chǎn)品和服務(wù),提高社會效益。
其次,大數(shù)據(jù)的挖掘和分析需要強大的算法和技術(shù)支持。在紀(jì)錄片中,我看到了各種各樣復(fù)雜的算法和技術(shù)在背后默默支撐著大數(shù)據(jù)的應(yīng)用。例如,通過數(shù)據(jù)挖掘和機器學(xué)習(xí),我們可以從海量數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式和規(guī)律,為企業(yè)和政府提供有力的決策依據(jù)。這也提醒著我,作為從業(yè)者或?qū)W習(xí)者,在大數(shù)據(jù)時代,我們需要不斷學(xué)習(xí)和掌握最新的數(shù)據(jù)分析技術(shù),才能跟得上時代的步伐。
第三,大數(shù)據(jù)時代帶來了信息安全的挑戰(zhàn)。紀(jì)錄片中提到了大數(shù)據(jù)泄露和侵犯隱私的問題。隨著大數(shù)據(jù)的積累和應(yīng)用,個人的隱私信息面臨著越來越大的風(fēng)險。例如,我們在使用互聯(lián)網(wǎng)服務(wù)時,可能會泄露出我們的生活習(xí)慣、個人愛好等隱私信息。這些信息的泄露可能導(dǎo)致用戶被定向廣告和信息定制,進(jìn)而影響到個人的自由和隱私權(quán)。因此,我們需要加強對信息安全的保護(hù),通過加密和權(quán)限管理等措施,確保個人隱私得到有效保護(hù)。
第四,大數(shù)據(jù)時代需要有正確的倫理和價值觀。在紀(jì)錄片的最后,提到了大數(shù)據(jù)應(yīng)用背后的倫理問題。例如,政府可能根據(jù)個人的社交網(wǎng)絡(luò)和行為習(xí)慣來判斷其信用,可能導(dǎo)致不公平和歧視。因此,我們需要建立起公正、透明的大數(shù)據(jù)應(yīng)用體系,確保大數(shù)據(jù)不會被濫用和扭曲,保障每個人的權(quán)益和尊嚴(yán)。
最后,大數(shù)據(jù)時代需要強調(diào)數(shù)據(jù)的質(zhì)量而非數(shù)量。雖然大數(shù)據(jù)給我們提供了更多的數(shù)據(jù),但數(shù)據(jù)本身并不是萬能的。我們不能簡單地認(rèn)為數(shù)據(jù)越多越好,而忽視數(shù)據(jù)質(zhì)量的問題。在紀(jì)錄片中,許多專家強調(diào)了數(shù)據(jù)的正確性、準(zhǔn)確性和可靠性的重要性。只有在數(shù)據(jù)質(zhì)量有保障的前提下,我們才能正確地分析和利用大數(shù)據(jù)。
總之,大數(shù)據(jù)時代已經(jīng)來臨,我們面臨著許多機遇和挑戰(zhàn)。通過觀看《大數(shù)據(jù)時代》這部紀(jì)錄片,我對大數(shù)據(jù)的潛力和應(yīng)用有了更加深刻的認(rèn)識。我們需要關(guān)注信息安全、倫理和價值觀等問題,才能在大數(shù)據(jù)時代取得更好的發(fā)展。只有通過正確和負(fù)責(zé)任的使用大數(shù)據(jù),我們才能實現(xiàn)更好的社會效益和個人發(fā)展。
大數(shù)據(jù)時代讀書心得篇十六
這兩年,大數(shù)據(jù),云計算的思想就像小蘋果的音樂一樣,傳的到處都是,每一個公司不管是互聯(lián)網(wǎng)公司還是傳統(tǒng)企業(yè),都標(biāo)榜自己的大數(shù)據(jù)。
1、實體物聯(lián)網(wǎng)與虛擬物聯(lián)網(wǎng)。
曾幾何時,物聯(lián)網(wǎng)的概念鬧得風(fēng)生水起,龐大的物聯(lián)網(wǎng)能夠讓世間大量的物體,都能夠被檢測并聯(lián)網(wǎng),包括了人、車、房等一切能夠被聯(lián)網(wǎng)的物體,這些物體都能夠以種方式被感知他的存在,并對其信息記錄在案,以供使用。在若干年前,這還是一種看似遙不可及的事物,要對每個物體都貼上一個所謂的rfid的標(biāo)簽,顯得不切實際。如今,隨著手機的大量使用,人類本身也被加入了物聯(lián)網(wǎng)中。為什么要物聯(lián)網(wǎng)?是為了獲取什么?要知道物聯(lián)網(wǎng)獲取了什么,只需要看看在一個物體在沒有加入物聯(lián)網(wǎng)與加入物聯(lián)網(wǎng)之后,我們多出了哪些東西便能夠知曉。那么,很明顯,我們需要通過某種方式來獲取該物體的信息,這種存儲下來的信息,就叫做——數(shù)據(jù)。
物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)是實體的物品之間的信息,而現(xiàn)在的互聯(lián)網(wǎng)上,占最大數(shù)據(jù)量的,是虛擬物品,或者叫做網(wǎng)絡(luò)虛擬物品。由于網(wǎng)絡(luò)物體是直接寄生于網(wǎng)絡(luò),具有能夠方便的接入網(wǎng)絡(luò)的特征,因此,在獲取實體物體信息還有一定難度的時期,占有很大優(yōu)勢。但今后實體的物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)量一定會不斷增加,或許,能夠超越網(wǎng)絡(luò)上的物物相連數(shù)據(jù)量。
網(wǎng)絡(luò)的廣泛使用,使得信息的產(chǎn)生于傳遍變得容易,每個接入網(wǎng)絡(luò)的人都以一定的角色存在,都是網(wǎng)絡(luò)的信息的創(chuàng)造者。對于所產(chǎn)生的信息而言,每個接入網(wǎng)絡(luò)的人又身兼多角,對于網(wǎng)絡(luò)服務(wù)商,他是網(wǎng)絡(luò)使用者的角色;對于門戶網(wǎng)站而言,他是使用的用戶;對于社交網(wǎng)站而言,我們則扮演一個虛擬或者真實的網(wǎng)絡(luò)角色;對于瀏覽器而言,他是一系列的瀏覽網(wǎng)頁、一些列鼠標(biāo)動作的角色…不同的角色取決于對方需要從我們的行為中獲取哪些信息。將網(wǎng)絡(luò)上各種角色看成是虛擬的物體,那么,這種虛擬物體構(gòu)成的虛擬物聯(lián)網(wǎng)便產(chǎn)生了巨大的數(shù)據(jù)量。經(jīng)歷過一直以來缺乏信息獲取渠道的日子,現(xiàn)在,既然信息獲取變得如此容易,那么,必然迎來信息量暴增的時代——大數(shù)據(jù)時代。
2、思維的轉(zhuǎn)變。
技術(shù)的改變,使得我們思維方式也要隨之發(fā)生變化。在過去的小數(shù)據(jù)時代,由于獲取信息、存儲信息、整理信息都是費時費力的活,我們只能精打細(xì)算,捉摸著如何以最小的代價、最快的方式來收集盡可能準(zhǔn)確的信息。之所以會有抽樣統(tǒng)計的方式,是受技術(shù)所限,無法獲得全體的樣本,或者就算獲取了也無法在合理的時間內(nèi)進(jìn)行處理。由于信息獲取代價大,使得我們不得不在獲取信息前,就把一切都想清楚,才能夠著手處理。這就像在計算機出現(xiàn)的初期,使用紙袋來編碼的時期,一次出錯的代價太大,所以人們不得不在輸入前將代碼驗證過無數(shù)遍之后才敢輸入到機器中。而現(xiàn)代計算機讓編碼的效率大大提升,這才使得人們能夠創(chuàng)造出更加強大的軟件。人們不需要在著手編碼前就對代碼過分深思熟慮,因為機器會幫助你解決一些問題。因此,那些擔(dān)心由于獲取數(shù)據(jù)太方便,進(jìn)行數(shù)據(jù)處理、分析代價太小而使人們變得懶惰或者做事欠考慮的家伙,真是杞人憂天。歷史上,技術(shù)的進(jìn)步都會提升人類的生產(chǎn)力,但卻沒有讓人們變得懶惰,因為與此同時,欲望也隨之增長。人類只會變得更偉大。
因此,大數(shù)據(jù)時代,這個數(shù)據(jù)更加全面的時代,我們可以涉足一些之前由于缺乏數(shù)據(jù)而無法涉及的領(lǐng)域,例如——預(yù)測。這是一個令人興奮的領(lǐng)域,但其實這個領(lǐng)域早有苗頭,而且大家都是受益者。我們平時使用的輸入法中的智能聯(lián)想功能,能夠根據(jù)我們之前輸入的文字,來預(yù)測我們接下來有可能輸入的文字,以節(jié)省我們的輸入時間。這種算法里,沒有人工智能,而只有人們大量的輸入習(xí)慣的統(tǒng)計,通過大量數(shù)據(jù)的統(tǒng)計來預(yù)測,是一個統(tǒng)計學(xué)的方式而非加入了特有的規(guī)則或者邏輯。這便引出了在大數(shù)據(jù)時代,對于信息處理的一種重要方式,基于統(tǒng)計,得出不同個體的相關(guān)關(guān)系,卻無需了解其因果關(guān)系,而我們則受益于相關(guān)關(guān)系。這種方式,看似有些投機取巧,卻能夠在關(guān)鍵時刻令我們處于優(yōu)勢地位。我們已經(jīng)習(xí)慣了先知道某些事物的因果邏輯,繼而推斷出相應(yīng)的結(jié)果。但世間總會有一些令人無法用合理的邏輯進(jìn)行解釋的現(xiàn)象,若通過大數(shù)據(jù)分析,我們能夠跳過邏輯階段直接享用某些一些結(jié)果(沃爾瑪?shù)钠【萍幽虿及咐?,豈不樂哉。當(dāng)然,嚴(yán)密的邏輯永遠(yuǎn)是值得尊敬的。
3、互聯(lián)網(wǎng)的黏性。
在經(jīng)歷過了從廣度上通過新花樣來吸引用戶的時代,由于技術(shù)的提高,一個創(chuàng)業(yè)者在一個新的領(lǐng)域開辟的東西很容易被其他人所復(fù)制。在這個時候,深度很重要。特別是購物網(wǎng)站、微薄、門戶網(wǎng)站這類信息量大的網(wǎng)站,越是了解一個用戶,優(yōu)勢就越大。所以,在技術(shù)已經(jīng)不是最重要的因素的時代,如何增加用戶的黏性、忠誠度便是首要的。通過用戶之前的信息,來推測用戶的喜好,給用戶推薦相應(yīng)的信息或物品。當(dāng)你越了解一個用戶,而別人卻不了解時,這個用戶就越離不開你。微薄中有他的智能排序功能、新聞門戶中有“今日頭條”應(yīng)用,各類購物網(wǎng)站有他的推薦算法(但這個純粹為了增加消費而非增加用戶黏性),都能夠根據(jù)用戶之前的瀏覽、偏好來給出相應(yīng)的推薦。這些的基礎(chǔ),都是擁有用戶的行為記錄,否則,都無從談起。
在手機這個拼硬件的時代,單純靠硬件來取勝已經(jīng)很難了。硬件靠組裝、軟件靠安卓,手機廠商已經(jīng)變得沒有核心競爭力。而三星為了增加用戶黏性,所做的便是為用戶提供更加貼心的服務(wù),不僅做手機,還做平臺,將用戶的各類數(shù)據(jù)記錄在他的平臺中,而這數(shù)據(jù),必將大有作為。然后,如果哪天,三星也出智能體重計、智能手表這類產(chǎn)品,那么也不稀奇了。各類數(shù)據(jù)同步、整合,為使用者提供各方面貼心的服務(wù),很酷吧。
各行各業(yè),都在瘋狂的抓緊時機,獲取數(shù)據(jù),擁有足量的數(shù)據(jù),那一切就變得皆有可能。
大數(shù)據(jù)時代讀書心得篇十七
隨著信息技術(shù)的快速發(fā)展,大數(shù)據(jù)教育正成為教育領(lǐng)域的新熱點。在大數(shù)據(jù)背景下的教育,為教育提供了更全面、更準(zhǔn)確的數(shù)據(jù)支持,同時也給教師和學(xué)生帶來了更廣闊的教學(xué)和學(xué)習(xí)空間。在實踐的過程中,我深刻地體會到了大數(shù)據(jù)教育這一新時代的優(yōu)勢與挑戰(zhàn)。下面我將從教學(xué)設(shè)計、學(xué)習(xí)評估、個性化教育、教育研究和信息安全五個方面,談一談自己對大數(shù)據(jù)教育的心得體會。
首先,大數(shù)據(jù)教育為教學(xué)設(shè)計提供了更有力的支持。傳統(tǒng)教育往往根據(jù)教師的經(jīng)驗和直覺進(jìn)行教學(xué)設(shè)計,難以做到針對每個學(xué)生的個性化需求。而有了大數(shù)據(jù)的介入,教師可以更準(zhǔn)確地了解學(xué)生的學(xué)習(xí)情況和表現(xiàn),從而有針對性地進(jìn)行教學(xué)設(shè)計。例如,通過分析學(xué)生在課堂上的表現(xiàn),教師可以了解到學(xué)生的薄弱環(huán)節(jié),并據(jù)此調(diào)整教學(xué)內(nèi)容和方法,幫助學(xué)生更好地掌握知識。此外,教師還可以通過數(shù)據(jù)分析來發(fā)現(xiàn)學(xué)生的學(xué)習(xí)興趣和潛能,為學(xué)生提供個性化的學(xué)習(xí)資源和指導(dǎo),提高教學(xué)效果。
其次,大數(shù)據(jù)教育改變了傳統(tǒng)的學(xué)習(xí)評估方式。在傳統(tǒng)教育中,評估往往依賴于考試和作業(yè),對學(xué)生的全面能力評估有所欠缺。而大數(shù)據(jù)教育可以幫助實現(xiàn)全方位的學(xué)習(xí)評估。通過收集和分析學(xué)生的學(xué)習(xí)數(shù)據(jù),可以對學(xué)生的學(xué)習(xí)進(jìn)程、學(xué)習(xí)過程和學(xué)習(xí)結(jié)果進(jìn)行實時監(jiān)測和評估。例如,通過分析學(xué)生在學(xué)習(xí)過程中的行為數(shù)據(jù)和學(xué)習(xí)輸出數(shù)據(jù),可以了解到學(xué)生的學(xué)習(xí)態(tài)度、學(xué)習(xí)策略和學(xué)習(xí)效果,并及時進(jìn)行反饋和調(diào)整。這種全方位的評估方式更能真實地反映學(xué)生的學(xué)習(xí)情況,有助于引導(dǎo)學(xué)生更好地提高學(xué)習(xí)效果。
第三,大數(shù)據(jù)教育推動了個性化教育的發(fā)展。大數(shù)據(jù)的應(yīng)用使教育走出了一刀切的教學(xué)方式,實現(xiàn)了因材施教。通過分析學(xué)生的學(xué)習(xí)數(shù)據(jù),可以獲得學(xué)生的學(xué)習(xí)特點、習(xí)慣、喜好等信息,使教師能夠更準(zhǔn)確地把握學(xué)生的個性化需求,采用針對性更強的教學(xué)方法和手段。同時,學(xué)生也可以根據(jù)自身的需要和興趣進(jìn)行學(xué)習(xí),選擇適合自己的學(xué)習(xí)路徑和資源。個性化教育以學(xué)生為中心,讓每個學(xué)生都能在適合自己的學(xué)習(xí)環(huán)境中得到最大程度的發(fā)展,提高教育的質(zhì)量和效果。
第四,大數(shù)據(jù)教育為教育研究提供了更多可能。教育研究一直致力于探索教育規(guī)律和提高教育效果,而大數(shù)據(jù)的應(yīng)用為教育研究提供了更多的研究對象和研究方法。通過分析大數(shù)據(jù),可以揭示學(xué)生學(xué)習(xí)行為、學(xué)習(xí)難點、學(xué)習(xí)效果等方面的規(guī)律,發(fā)現(xiàn)教育領(lǐng)域的問題和挑戰(zhàn),并為教育改革和教育政策提供參考和支持。此外,大數(shù)據(jù)還可以用于教師培訓(xùn)和教學(xué)團(tuán)隊建設(shè),幫助教師和學(xué)校提高教學(xué)效果和管理水平。
最后,大數(shù)據(jù)教育也面臨著信息安全的挑戰(zhàn)。大數(shù)據(jù)的應(yīng)用涉及到大量的個人隱私數(shù)據(jù),保護(hù)學(xué)生和教師的個人隱私和信息安全成為一項重要任務(wù)。在大數(shù)據(jù)教育中,不僅需要加強對學(xué)生和教師的隱私保護(hù),還需要建立健全的數(shù)據(jù)安全管理體系,加強數(shù)據(jù)權(quán)限控制和訪問控制,保證數(shù)據(jù)的安全性和可靠性。
綜上所述,大數(shù)據(jù)教育為教學(xué)設(shè)計、學(xué)習(xí)評估、個性化教育、教育研究和信息安全提供了新的可能和挑戰(zhàn)。這一新時代的到來,使教育變得更加科學(xué)、智能和人性化。但同時也需要我們不斷探索和創(chuàng)新,解決其中的問題和挑戰(zhàn),使大數(shù)據(jù)教育更好地發(fā)揮其優(yōu)勢,推動教育的深入發(fā)展。
大數(shù)據(jù)時代讀書心得篇十八
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應(yīng)用,以及它對現(xiàn)代商業(yè)運作的影響。
《大數(shù)據(jù)時代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進(jìn)行預(yù)測,并對未來可能出現(xiàn)的問題提出自己看法與對策。
下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時代》開篇就講了google通過人們在搜索引擎上搜索關(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預(yù)測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關(guān)的數(shù)據(jù)。同時google的預(yù)測與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著google預(yù)測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計學(xué)上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預(yù)測結(jié)果的相對準(zhǔn)確性與事件的可預(yù)測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準(zhǔn)確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎(chǔ)之上的。
接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準(zhǔn)確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。
之后,維克托又預(yù)測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。
無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!
我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預(yù)測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。
【本文地址:http://www.mlvmservice.com/zuowen/18971596.html】