社會

DIY特首零蛋指數/余大千

近年網上課程(MOOC Massive Open Online Course)大行其道,知識可謂垂手可得。趁住大數據年代,我最近報讀了Coursera的R Programming ,攞埋證書都係400塊有找,超值!學了一些處理數據程式的ABC,技癢之下,拿港大民研的數據來實習一下。

各位可有印象,行政會議成員張志剛年初曾狠批港大民研及鍾庭耀,指不少人在港大民研的支持度調查中,給予梁振英零分,認為是問卷設計有問題,又指那些是outliers,不應予以計算。我用專門分析數據的電腦語言R,寫了一個小程式,發現給予CY零分的群組近期迭創新高,以任何分類計算,都幾乎是最重要的意見表達。

港大民研的特首民望梁振英評分調查,是罕有提供原始數據的民意調查,不記名地提供每個被訪對象的意見、年齡及性別,大家只要到這個網址,便可以下載原始檔案。調查過去公布的主要是支持度評分,但卻沒有進一步披露細節。要制訂CY的零分指數,便要自行挖掘原始數據。

我的小程式,是自動到該網站下載過去兩年多來的五十多次支持度評分調查原始檔,再統計每次給予CY零分的被訪者數目,並除以總體有效樣本,計出比例,再連點成線,看看零分的走勢。另外,我又對100分作同樣處理。若兩者比例都越來越高,意味意見兩極化,支持與不支持各走極端。(見下圖)

zeroscoretrend

結果發現,CY支持度評分的零分比例越來越高,最近一次更創新高,高達18%的受訪者非常dislike,相反,滿分比例不但較低,近來則未見有大變動,意味極度支持CY的比例沒有上升,反而極度不滿的比例有增無減。民意看來沒有撕裂,也不算兩極化,只是趨向負面,零分大增,未知是否因為政改拖累之故。

至於年齡層面方面,過去總有一個說法,指年輕人對CY觀感較差,但年長的傾向支持,我分析最近一次民調結果,發現確實有輕微這種情況,年紀越大,給予CY的平均分較高,但其實所有組別均有給予零分,有趣的是,70歲以上的受訪者,給負評的傾向又較40至70歲者為大。

agegp

不能不說,現今的程式功能強大,寥寥幾行程式已可處理複雜的工序,比以前讀大學時速度快了不知多少倍。五十多個民調,每個訪問約一千人計,都有成五萬多個樣本,都叫做有一定代表性。今次只是牛刀小試,希望日後有能力進行更深度的數據分析。

如果對這程式有興趣,歡迎留言要求提供。

 

分類:社會, 科技, 政治

1 reply »

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s