天堂网在线最新版WWW中文网-肉色超薄丝袜脚交一区二区-亚洲国产AV一区二区三区-丰满少妇弄高潮了www

設為首頁|加入收藏
用戶名:   密碼:   立即注冊

數據+大價值 ——真正的“大”數據

日期:2017/09/20   來源:機電商報   
  摘要:當下的大數據產業普遍存在一個誤區:許多人認為大數據就是數據越大就越好,于是盲目追求數據之大,但是往往產生不了“有用的結果”,反而容易被“自我迷惑”,也因此忽視了“從數據中發掘更多價值”這一重點。

“多大的數據才能說是大數據?在我看來,數據本身的大小并不是關鍵所在。挖掘數據價值,創造更高的應用價值回報,才是最值得關注和探索的。”近日,在第十三屆中國(南京)國際軟件產品和信息服務交易博覽會期間舉辦的“大數據產業互聯網融合創新發展高峰論壇”上,加拿大工程院院士凌曉峰表達了如是觀點。

他指出,當下的大數據產業普遍存在一個誤區:許多人認為大數據就是數據越大就越好,于是盲目追求數據之大,但是往往產生不了“有用的結果”,反而容易被“自我迷惑”,也因此忽視了“從數據中發掘更多價值”這一重點。

有效的數據才有價值

那么,如何才能只需要收集有限的數據,便可實現更大的價值呢?

凌曉峰認為,從開展大數據分析伊始就明確目標至關重要。在他看來,為什么收集數據?這應該是每一次進行大數據的采集分析前都必須考慮的問題。在明確目標之后,針對性地采集相關的數據,利用這些數據建立數據模型,通過模型來預測目標的變量值,如此,既減少了某些方面的不必要投入,又能提高數據挖掘的效率,而且預測的準確性也能有所提高。

大數據分析在醫學領域的應用便是一個典型的例子。假設醫生要治療一個高血壓病人,在這個病人每天都能產生海量健康狀況數據的前提下,醫生若是能夠有目的性的只收集病人的飲食規律、出行記錄、用藥頻次等相關數據,然后基于這些數據,對病人的血壓情況做分析預測,就能有效地為病人提供針對性的降低血壓辦法。如此,醫生避免了在與病人病理無關的數據分析上花費時間,病人也能夠得到及時的治療。

“采集數據時,還需確保采集到的數據有效精準。”凌曉峰表示,當下,不少制造企業言必稱“大數據”,無論研發何種產品,都一股腦兒地為產品接入光纖,配備傳感器,以求采集每時每刻產生的海量數據。于是,問題也就來了,數據有了,但哪些有效哪些無效,無從辨別。這不但造成硬件設備和統計計算資源的浪費,還可能因“數據噪音”的干擾得出錯誤結論,削弱產品的市場競爭力。

對此,凌曉峰強調,“數據不是量大便能產生結果的,只有最新最具時效性的準確數據才是最有用的,所以收集數據不僅要準確有效,還需與新的數據對比,保證其時效性,才能在未來的數據分析中發揮價值。”

大數據分析離不開場景的應用,如此來看,數據間的關聯度也是需要著重關注的。目前,大多數的企業在推進信息化,在生產現場,普遍引進了生產管理軟件,軟件的種類多達上百。然而,不同軟件產生的數據還沒有實現共享。顯然,企業是無法對這些數據進行關聯化的分析,也就無法從中實現更多的價值增值。

需在“知其所以然”上下功夫

隨著大數據環境不斷優化,以及數據資源的大量積累,大數據產業勢頭一片向好,但是凌曉峰表示,仍有許多不足亟待去研究解決。

首先是大數據的預測結果是沒有原因分析的。對于這樣的預測,你敢相信嗎?想必不少人是抱有懷疑態度的。

事實上,目前絕大多數數據挖掘產生的系統,特別是設計神經網絡和深度學習的系統,都是處于黑箱狀態,對于預測結果,普遍情況是知其然而不知其所以然。據凌曉峰透露,“雖然有諸多黑箱狀態的系統精度高達96%,但是這些系統沒有辦法解釋為何做出如此‘精確的’決策。而且,對于如何消除那4%的失誤率,專家還沒有找到行之有效的解決方案,這樣的系統在實際運行中會有很大的風險。”

其次,當下的機器學習或者是大數據分析只能單一的從原始數據中獲取規律,不能很好的利用已有的成熟知識,還沒有足夠的靈活性。凌曉峰表示,若是能夠將已知的知識資源更好地應用到大數據分析當中,其分析效率將會有顯著提升。“譬如制作一個用于診斷心臟病的機器系統。若是能夠將已有的成熟診斷病書輸入到機器系統的神經網路中,再通過實例更加精密的提高系統分析的準確度,那么這個數據分析的效率必然會大大提升。”

此外,凌曉峰還提到了應用導向下的大數據“個性化”問題。他說,數據模型越大,越能得到個性化的特征。因此,在市場需求的影響下,如何利用大數據不斷的過濾,將客戶模糊的個性化需求通過數據轉化實際制造產品的精確的技術指標,把客戶的真正精確需求提取出來,轉變成想要達到的指標,將是大數據應用的下一個風口。(陸   梨

文件閱讀
    相關思考
      ?