返回網站

名嘴化的大數據和金融科技 - 古人聞雞起舞

何宗武 世新大學財務金融學系教授

四畢業那年在台大文學院選修一門哈佛杜維明教授客座時的東西哲學對話課,課程主要是批判哲學和新儒家。課堂上杜老師講到一個很生動的同心圓比喻,迄今受用不少:成熟的社會發展,核心是學術圈的教學研究方向,向外擴散到知識圈的討論,最後是文化圈的熱門話題;然而,像巨蛋麵包一樣,台灣則是文化圈膚淺無聊的話題,影響了知識圈的討論,再影響了學術圈的教學研究方向。大數據和金融科技不知不覺席捲了台灣文化圈,知識名嘴紛紛出籠,FinTech/大數據的媒體熱度,驅使著學術單位隨後追趕。

像極了金融市場:熱錢流進來,分析師紛紛談股市上萬點;一旦熱錢撤離,匯率貶值,股市跌到底,再來找題材。大數據三個字幾乎浮濫到無以復加,從前一陣子「成績不好的學生,未來捐款比較多」,到最近媒體一則「大數據分析打破迷思,繁星生課業表現優」,一再出現這種現象。 

學術單位聞雞起舞,奔相走告大數據好偉大。以前有奈米、雲端和 .com,近年大數據充斥一堆「冬蟲夏草/經紀人/月下老人」之類的事務,只是ㄧ個樞紐分析就要冠上大數據吸引閱讀效果。 

社媒行銷則善用很多這類句型:「因為她做了這三件事,所以30歲賺進人生第一個一千萬。」社會科學有許多學術論文,使用大量跨國百年資料庫,深入探索的些許發現,都沒有宣稱大數據研究了。 

現在一個簡單的資料樞紐比對,再計算平均數就醉醺醺不知所云。金融科技呢?數十年前的「販賣債務的銀行」和「卡奴事件」,莊家將換成金融科技公司。科技型剝削,儼然成形。 

極小化交易成本,不一定是效率。唯快不破嗎?貨幣幻覺沒消失前,就完成支付,這樣的經濟活動,泡沫連連。時髦的字眼紛紛出籠,區塊鏈,深層學習,人工智慧排名居首。只要在特定場合講話,嘴角不帶到這些字眼,就不是現代人。甚至許多人把區塊鏈等同於金融科技,認為區塊鏈是一個神奇的鏈加上奇妙的區塊,這和經過某某開山法師加持過的項鍊手環一模一樣。教育單位的大數據和金融科技相關的學習必須要紮實,不能名嘴化

以大數據而論,不是多大量的數據。大數據分析的特點有下列幾點:第一.目前手上的資料庫,即便容量不大,但是分析者串連「多樣」的資料,讓數據維度(Dimension)變大了。以繁星為例,資料庫不論多大,若只是Excel式的樞紐分析,並構不成大數據分析;舉例說明,大數據分析的例子可以是這樣:以繁星資料庫為基礎,串接了學生的社交網路或中小學資料,在「多樣」這一面,擴大了數據維度,再探索出新發現。 

也就是說,資料科學家面對手上的繁星資料,有兩條思路:一個是傳統的資料庫樞紐分析,一個是大數據分析。另一個例子是中央銀行的匯率升值貶值的預測,傳統計量模型會建構一個匯率方程式,以大量數據估計大模型之後,產生統計預測點和信賴區間。這是傳統的既定工作,下一步走大數據可以思考如何引用多樣資料擴大維度,一個方向就是透過文字的情緒分析,將社會的樂觀悲觀資訊建立指標,綜合研判。

今年3月10日星期五因熱錢撤離導致的新台幣貶值,並無法從數量方程式的歷史數據預測出來;但是,散佈於社群網站的文字,或許有重要資訊。第二.大數據要有大思維,大數據分析不是一個SOP的事情。科學家和工程師差別何在?資料科學之稱為科學,就不只是資料挖掘工程。大數據分析需要分析者面資料時,跳脫SOP框架,以創意的設計方法去透析。 

檢而言之,不是一個把資料丟進軟體的遊戲。舉例而言,透過金融市場的毫秒資料,我們發現股市巨幅漲跌前1分鐘,會有一個交叉的重要訊號。這種發現,就是面對一大堆沒頭沒腦的資料時,研究人員必須有創意和巧思,設計研究方法,從不同的頻寬中萃取有價值的訊號。 

所以,只要遇到一個號稱大數據分析的成果,可以這樣檢視:這種結果,事先需要什麼特殊的想法嗎?這樣的成果,何大之有?挖出「繁星生課業表現優」這樣的結論,何大之有?金融科技端也是這樣,大眾媒體報導可以幼稚膚淺,學術機構要深層耕耘。沒有紮實的學術研究成果當基礎,聞雞起舞,隨機起鬨只會造就淺碟的社會。大學是有社會責任的,世新大學的「媒體識讀」依然任重道遠,要繼續耕耘奮鬥,框正視聽。