科技

兩則數據故事:問對的「問題」,收集對的「數據」/徐少驊

 2016年開始沒多久,由Google設計及開發的Alpha Go五盤四勝赢了南韓圍棋棋王李世乭,大家都說,「人工智能」、「演算法」、「大數據」這些由電腦運算的應用程式「全面取代」人腦已經是無可避免的現實,在不久的將來,大量的工作將由擁有人工智能的機械人所承擔,演變下去,甚至最後可能由發展出意識的電腦統治人類世界。

這個噩夢會否成真?!老實說,我不曉得!不過,科技的發展一直都是在取代人原本負責的工作,人就轉向更高價值產出的工作,這是任何一本科技史書籍都會告訴你的。當然,這一次來自數據科技的替代風潮,極可能是規模最大的一次,但人是否就真的會被「全面取代」呢?我對這樣的結論仍然是抱有懷疑的。

最近我讀到一則有關「數據」的故事,覺得頗有趣,跟大家在此分享一下:

戰機身上的彈孔能告訴我們什麼?
話說第二次世界大戰期間,同盟國和軸心國由陸地打到海上再打到上天,制空是任何戰役中非常重要的關鍵。

戰爭期間,一群科學家提出可憑戰機身上的彈孔數據分析來增強戰機和機師的安全。如何做到呢?就是將所有完成任務回來的飛機進行彈孔數據收集及統計,一張一張的圖表就這樣出來了。

科學家和工程師圍著數據討論,各抒己見。有人主張應該鞏固戰機受到攻擊密度最強的位置,也有人提議該從油箱和駕駛員所坐的位置著手改善戰機的設計。

大家都在引用著數據來闡述觀點。

沒有參考價值的數據
在大家彼此爭論不休的時候,有一個人緩緩的站起來,清一清喉嚨,以示他要發言,當大家都靜下來,看一看這名一直只是沉默不語、隔岸觀火的人要說些什麼,他劈頭第一句竟然是:

「這些數據都沒有參考價值!」

大家瞪大眼睛等待這個人對自己力排眾議的言論進一步的解釋。

「這些能夠安全飛回來停在停機坪等待維修的戰機,正說明了在它們機身上的彈孔落點都不是致命的,真正致命的彈孔數據已經隨著被打下的飛機沉在大海裡了!」

沒有問題,哪有答案?
這個故事孰真孰假我不得而知。説這個故事的作者陳傑豪認為,這個故事的教訓是要「問對問題,才能找到答案」。

我不反對有關「問對問題」的主張,不過這則故事似乎是説收錯或是用錯「數據」的問題,數據無處不在,今天很多企業的系統内都儲存著一定數量的數據,有些是任由其存在而不作任何經營,有些則胡亂引用數據,浪費了大量人力物力,但得到的卻是沒有價值的甚至是錯誤的答案。

問對問題,確實是經營數據的起點,引用對的數據才可以得出正確並有用的答案,再進一步,就是如何詮釋這些「答案」對這盤生意的意義了。

所有這些都是「人」的工作,是電腦或什麽演算法取代不了的!

美國股市「閃電崩盤」告訴了我們什麼?  

在這裡,讓我引用另一個數據故事來進一步闡述我的觀點:

或許大家不會記得這個尋常的一天:2010年5月6日。這一天,發生了什麼事?

這一天踏入下午兩點四十七分,美國道瓊斯指數突然狂瀉九百九十八點五點,創下史上單日最大跌幅,不過下跌幅度不是最叫人吃驚的,而是下跌的速度,在短短的五分鐘之內,美國這個股票市場呈現了像跳樓般的自由下墜,近一兆美元的財富瞬間蒸發。沒有一個財金界的人知道發生了什麼事,有人甚至懷疑這是電視台搞出來的惡作劇。

沒有人知道發生什麼事,但是有專業投資人感覺到不對勁,開始大手買貨,他們衝出自己的辦公室,向著員工大喊:「買!買!買!」不用理會買什麼,總之就是買!股市反彈的速度比之前下跌的速度更快,平常一整天的漲跌幅度只有三百多點的道瓊斯工業指數,這一天在一分鐘之內就發生了!有些狂瀉至每股幾美分的股票,幾秒鐘之内又反彈至三十甚至四十美元,蘋果電腦就曾經一度從每股兩百五十美元暴漲至十萬美元!一些交易員或是投資者去一次厠所或是呷一口咖啡就隨時錯過了這次的發財機會。

演算法下的拋售與買進
究竟這一次「閃電崩盤」是如何造成?至今仍然未有定論。不過,最多人估計是目前在基金市場流行的「演算法」闖下的禍。什麼是演算法?即是由電腦程式決定股票買賣。有説這次的「閃電崩盤」是由於一名堪蕯斯市的貨幤經理用演算法太早地將價值四十億美元的股票期貨抛售而引爆其他演算法紛紛跟進。

再説一遍,沒有人知道這一次「閃電崩盤」是如何造成的,因為演算法的運作是按著程式設計無聲無色地進行買賣,當中無人監管,導致問題發生之後難以追究到底「誰」才是禍事之源頭。

人始終是最有效率的數據詮釋者
是的,有人會說,演算法是會不斷地演化和進步的,這種「禍事」會得到監控、限制和修正。我要說的其實也不是演算法的弊病,我真正要說的是,「人」才是數據最準確、最有效也是最有效率的詮釋者。我們既可以最快地從異常數據發現問題,不會被異常數據所愚弄,也可以用跟進的數據發挖找出表層數據無法表達出的訊息。

有「中國大數據教父」之稱的阿里巴巴集團副總裁車品覺在他的《勝算 大數據密碼》曾經這樣說:

「在大數據的商業環境裡,既要懂數據,又要懂商業,還要擁有一套好的思維方法,……我認為,人的思考方式在大數據充斥的商業時代尤為重要。」

返回基本,懂得問問題
我十分同意這個說法,今天數據比以前確實是容易獲取得到,以前我們的問題是欠缺數據,今天企業面對的問題明顯地是不一樣了,我們擁有很多數據,卻不曉得哪些數據才是真正有用。

不論是何種處境,其實基本還是「人」的問題,企業需要的是懂得問基本商業問題的管理人,而在這個所謂的大數據時代,這個管理人必須兼具數據科學的知識,懂得在數據的大海中暢泳,透過反覆的提問與數據發挖,為企業作出最佳決策。

所以,在大數據的時代,人,不但不會被取代,他們提出關鍵問題的功能更顯重要!

1 reply »

  1. 你仲走去講足兩次"沒有人知道這一次「閃電崩盤」是如何造成的". 點會冇人知吖? 講唔講你聽發生乜事之嘛. 既然都講得出堪蕯斯市的貨幤經理, 即係美帝既証監已經用市場交易記錄追番轉頭啦. 問題係個動機啫. 差不多可以肯定. 果條壽味只係稻草人. 只係一個唔知係咪得罪咗人定係用公司機上鹹網既茂四.

    今日香港個市都黎一劑吖, 算你好彩, 我叫做估到班人做乜. 首先當然係病毒先行啦.https://www.hkcert.org/my_url/en/alert/16040701. 通常唔係呢間泥屋仔就係爪哇. 冇第三樣乜滯. 因為全香港報價都係用呢兩樣. 包括股票行專用買賣軟件同鳩液所. 通通死過臘肉, 今朝出警告即係大約噚日放病毒架啦. 夜期插定等, 今朝一早跟隊插. 然後街外既電腦盤, 盲毛盤, 止蝕盤跟插. 連HACK都唔駛HACK. 人地部電腦自已幫佢殺落去. 淨係唔俾你睇價同買, 就係唔做低你部機. 就係要你得個睇字. 就係要你越手痕, 就係要你爆粗, 你越滾越啱佢心水. 插到放飯佢停機. 轉買盤. 正正因為冇做低你同我部電腦. 一放完飯見部機順番. 班老散就餓狗搶屎咁搶到收市升凸. 呢班人既買盤同其他街盤撈埋一堆. 你揾條毛咩. 呢個先係重點. 如果隊冧晒全香港既機, 淨係得佢沽同買. 警犬再白痴都識搵佢地啦.

    轉新機新OS係咪就防到俾人做世界呢? 話之你升到上WIN11吖! 你今朝睇唔睇到價, 買唔買到吖? 答案你自己知. 反正唔係第一次見啦. 出名多少既有大笨象秒殺33蚊. 乜保直插事件. 有印象卦? 倒番轉頭問一句, 做乜政府唔做野當睇唔到?

    定係明知乜人做又唔敢做野?

    喜歡

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s