發(fā)布時間:2019-9-22 分類: 電商動態(tài)
要查看大數(shù)據(jù),最好查看大數(shù)據(jù)背后的技術(shù),業(yè)務(wù)和社交方面。從發(fā)展成熟的角度來看,技術(shù)維度走得最遠,業(yè)務(wù)維度發(fā)展但不全面和成熟,社會維度發(fā)展最差。因此,盡管我已經(jīng)討論了大數(shù)據(jù)很長一段時間,但除了產(chǎn)生大數(shù)據(jù)本身的領(lǐng)域(如搜索)之外,其他領(lǐng)域還沒有從大數(shù)據(jù)中獲得明顯的好處。大多數(shù)時候人們?nèi)匀徽J為這里必須有金子,但他們需要更多的耐心。本文試圖挖掘大數(shù)據(jù)本身的特征,并對未來趨勢做出一些預(yù)測。
大數(shù)據(jù)上的深度和廣度
如果大數(shù)據(jù)與海量數(shù)據(jù)相匹配,那么這是一個非常模糊的概念,相當于成為信息的同義詞。顯然,很難回答什么信息可以做的問題。
此時,為了提前思考,通常需要先進行分類。如果時間空間是最基本的視角,首先要區(qū)分的是大數(shù)據(jù)的深度和廣度。從時間的角度來看,大數(shù)據(jù)是一個完整的歷史。從空間角度來看,大數(shù)據(jù)是全球活動的痕跡。前者可以看作是一種深度,后者可以看作是一種廣度,不同的場景對深度和廣度有不同的側(cè)重。
對于一些垂直行業(yè),如醫(yī)療保健,大數(shù)據(jù)的深度更為重要。畢竟可以在數(shù)據(jù)上找到歷史記錄,人們可以更好地了解和優(yōu)化相應(yīng)的行業(yè)。
對于社會而言,在許多情況下,廣度更為重要。在某個場景中我們只有一個刻度和半爪,但是當這個信息足夠且范圍足夠?qū)挄r,可以描述相對及時和完整的圖像。經(jīng)常被引用的谷歌預(yù)測傳染病的例子依賴于這種廣度。
這決定了大數(shù)據(jù)的應(yīng)用趨勢。在深度重要的地方,公司等組織需要成為主體。困難在于如何跨越數(shù)據(jù)所有權(quán)的界限。對于醫(yī)院而言,將所有治療病例數(shù)字化和共享是有益的,但如果只有一家醫(yī)院這樣做,則可能對醫(yī)院的隱私更不利。
在廣度很重要的領(lǐng)域,盡管公司可以從搜索這些領(lǐng)域中受益,但真正受益于大數(shù)據(jù)的機構(gòu)實際上是政府。數(shù)據(jù)越廣泛,它描述的身體就越大,如果它是整個社會,它顯然應(yīng)該是社會的主要負責人。這是一個常識性問題。就像在看醫(yī)生時為別人吃藥一樣。在某些情況下,CCTV將在春節(jié)期間播放百度的流程圖。這個問題也可以從側(cè)面解釋這個問題——這種移動地圖有助于可以制作地圖的公司,遠離政府。幫助大。
簡而言之,數(shù)據(jù)的要求在深度和廣度上都有所不同。前者需要更詳細和更高質(zhì)量的數(shù)據(jù)源,而后者需要更少,但兩者在應(yīng)用時都將面臨支付和返回。不相等。大數(shù)據(jù)傾向于描述整體,有能力收集或處理大數(shù)據(jù)的個人通常是個人,而個人的回報并不容易反映在整體改進中。
因此,大數(shù)據(jù)開發(fā)的瓶頸不是技術(shù),而是建立它背后的分銷關(guān)系。這種關(guān)系不合理,數(shù)據(jù)將保持在島級,每個組織都有自己的東西,并將其命名為“大數(shù)據(jù)”。為了理順這種關(guān)系,我們必須回到一個非常經(jīng)典的問題,即可以建立“公共土地”。
數(shù)據(jù)公地的設(shè)想
大數(shù)據(jù)有點像普通的土地。經(jīng)濟學(xué)中最著名的一個論點是公地的悲劇。《美國經(jīng)濟史》一個非常容易理解的例子中的常見悲劇是什么:
……這些經(jīng)濟推理命題有助于解釋集體所有權(quán)和產(chǎn)出(一半或固定份額)的共享如何導(dǎo)致“搭便車”問題。為了說明這一點,考慮10名分享土地所有權(quán)并共同生產(chǎn)100蒲式耳玉米的工人,每人平均消費10蒲式耳玉米。假設(shè)一個工人開始懶惰并將他的勞動力減半,導(dǎo)致產(chǎn)量減少5蒲式耳。由于輸出共享系統(tǒng)的安排,懶人的消費與其他工人的消費相同,現(xiàn)在是9.5蒲式耳。雖然他的努力下降了50%,但他的消費僅下降了5%。一個懶惰的人是一個在別人身上工作的自由騎手……
這背后有一個非常深刻的人類問題。即使我們可以共同努力創(chuàng)造更多財富,個人也可以從中分享更多財富,但群體中明顯的個人傾向是減少工作但分享更多。事實上,這與囚犯的困境有關(guān)。
在現(xiàn)實世界中,沒有辦法徹底解決這個問題。它只能依賴于每個人基本認可的特定分配順序。例如,以前的血統(tǒng)現(xiàn)在是一個自然的選擇,但現(xiàn)在基于比特的數(shù)字財富有可能解決這個問題。
基于位的數(shù)據(jù)與真實數(shù)據(jù)之間的最大區(qū)別在于,數(shù)據(jù)不是“當你接受它時,我沒有任何東西”,并且硬件的價格正在快速下降。開源使數(shù)據(jù)訪問工具基本免費。這些是疊加的,以使數(shù)據(jù)變得普通。
這里有趣的問題是,如果每個人都更關(guān)心我得到的東西是否變大,那么數(shù)據(jù)公共土地形成的可能性就更大,因為如果有數(shù)據(jù)公共土地,那么每個人(企業(yè))必須有更多的收益,但如果你更關(guān)心我是否比你更重要,那么數(shù)據(jù)公共土地的建設(shè)會有很多障礙,因為公共土地實際上是讓相關(guān)人員站在競爭的起點。
大數(shù)據(jù)的問題是數(shù)據(jù)使用中的技術(shù)問題,但它實際上是數(shù)據(jù)源中的社會經(jīng)濟問題,后者更難,因此大數(shù)據(jù)應(yīng)用的開發(fā)不依賴于技術(shù)的發(fā)展,但取決于社會經(jīng)濟的變化速度。在一個有限的領(lǐng)域,如搜索,電子商務(wù),云計算,技術(shù)已經(jīng)得到充分發(fā)展,現(xiàn)在誰支付誰的利益的問題是將小數(shù)據(jù)轉(zhuǎn)化為大數(shù)據(jù)的過程中最重要的問題。
大數(shù)據(jù)的路往那里走?
數(shù)據(jù)的內(nèi)在發(fā)展是數(shù)據(jù)的價值越全面,這也是一種網(wǎng)絡(luò)效應(yīng)。這種內(nèi)在動機導(dǎo)致在宏觀視圖中數(shù)據(jù)所有權(quán)的發(fā)展只有兩個趨勢:
一個是像移動方面一樣,每個人都有自己的私人數(shù)據(jù)源,然后你開始生死競爭,最后一個幸存下來,這也可以實現(xiàn)數(shù)據(jù)統(tǒng)一的最終目標;
另一種是開始聯(lián)合競爭并建立上述數(shù)據(jù)公共土地。
如上所述,行業(yè)數(shù)據(jù)和整個社會的數(shù)據(jù)性質(zhì)差異很大,因此應(yīng)分別討論。
對于行業(yè)數(shù)據(jù),除非有非常特殊的人,否則競爭者之間的坦誠合作是不可能的。最簡單的方法是引入第三方。例如,每個運營商都掌握著幾乎所有網(wǎng)民的行為數(shù)據(jù),但很難將數(shù)據(jù)整合在一起,為運營商公開誠實地合作創(chuàng)造一定的價值。此時,如果涉及第三方,則可以制定福利分配計劃。
如果能夠?qū)崿F(xiàn)這一點,唯一的關(guān)鍵點是相應(yīng)的業(yè)務(wù)模型是否可以超過數(shù)據(jù)處理的成本。必須強調(diào)的一點是,大數(shù)據(jù)的價值密度非常稀少。很多東西都很有價值,但不一定值得做。視頻網(wǎng)站無法賺錢的關(guān)鍵原因是帶寬和存儲成本相對較高。商業(yè)模式不適合大數(shù)據(jù),而且情況可能比視頻網(wǎng)站更糟糕。采礦成本也低于采礦收入,采礦業(yè)也很有價值。
上述問題在行業(yè)數(shù)據(jù)中可能不會太大。一般來說,行業(yè)數(shù)據(jù)的價值密度會更大,而且由于它相對垂直,總量是有限的。因此,大數(shù)據(jù)產(chǎn)業(yè)的應(yīng)用相對容易發(fā)展。
但對于社交數(shù)據(jù),在許多情況下這是一個問題。我們都知道樣本的全面性比數(shù)據(jù)量更有價值,但如果它是確保樣本全面性的唯一方法,那就意味著讓所有數(shù)據(jù)做一件事就必須有意義。
社交數(shù)據(jù)有兩個應(yīng)用方向。一個是公司可以處理谷歌,另一個是社交數(shù)據(jù)。很難屬于公司的活動數(shù)據(jù),如智能城市相關(guān)人員。后者需要上面提到的數(shù)據(jù)共同點來支持。
從數(shù)據(jù)的角度來看,現(xiàn)在有兩種形式的數(shù)據(jù)存儲:一種是像谷歌這樣的公司在整個社會的一個橫截面上擁有所有數(shù)據(jù),這應(yīng)該是一個特例,數(shù)據(jù)僅限于公共信息;它是與人類行為有關(guān)的各種數(shù)據(jù),例如與電子商務(wù)相關(guān)的購物,與社交網(wǎng)絡(luò)和IM中的人相關(guān)的,與O2O企業(yè)相關(guān)的離線服務(wù),與鐵路相關(guān)的12306等。谷歌擁有所有數(shù)據(jù),但它沒有人類行為,因此谷歌相當于擁有整個社會的橫截面數(shù)據(jù),而所有其他公司只擁有垂直領(lǐng)域的數(shù)據(jù)。
如果依靠企業(yè)做這種數(shù)據(jù)統(tǒng)一的嘗試,前者將有20億投資做O2O級,因為這將完成數(shù)據(jù),后者會有一個想要社交的電子商務(wù),社交我想做電子商務(wù)這樣的事情。類似的故事可能發(fā)生在終端上。所有這些行為的最終目標是讓公司完成所有這些,但這是不可能的。這不僅僅是一個經(jīng)濟原因。并且數(shù)據(jù)無法打開,那么您只能對碎片數(shù)據(jù)執(zhí)行自以為是的大數(shù)據(jù)。
因此,這是關(guān)于是否可以建立數(shù)據(jù)公共土地的問題。如果你想建立一個數(shù)據(jù)公共土地,至少你必須解決誰將要做的問題。開源給予的啟示非常重要:
首先,這不是一個盈利組織;
其次,這必須得到許多公司的支持。
由于數(shù)據(jù)與隱私相關(guān),因此與開源相比,必須有更清晰的數(shù)據(jù)使用規(guī)則定義。
小結(jié)
在有一種解決所有數(shù)據(jù)和使用權(quán)的實用方法之前,大數(shù)據(jù)的應(yīng)用應(yīng)該是部分的。由于其深層應(yīng)用涉及社會許多部分的協(xié)調(diào),因此這個過程可能非常漫長。有趣的是,大數(shù)據(jù)的出現(xiàn)直接推動了機器智能的發(fā)展,機器智能可以比大數(shù)據(jù)本身更快地影響影響。
作者訂閱號:zuomoshi(琢磨事)
周一周五 8:30 - 18:00
客服QQ