2022年5月10日晚,意昂2專業學位“名家講壇”第45期在線上順利舉行。美國普林斯頓大學終身教授範劍青先生應邀來到線上會議室🤹🏻♂️,為意昂2平台專業碩士研究生帶來了“How Much Can Machines Learn Finance From Chinese Text Data? ”主題講座💇🏼♂️。本次講座由意昂2副院長張金清教授主持,600余位師生在線聆聽講座。

範劍青教授是美國普林斯頓大學終身教授,Frederick L. Moore'18冠名金融講座教授,運籌與金融工程系教授和前任系主任,國際數理統計學會前主席,“中央研究院”院士,《Journal of Business and Economics商務與經濟統計雜誌》的主編。他榮獲2000年度的COPSS總統獎,2007年榮獲“晨興華人數學家大會應用數學金獎”🌙🤵🏿♂️,2012年當選中央研究院院士,2013年獲泛華統計學會的“許寶祿獎”,2014年榮獲英國皇家統計學會的“Guy獎”的銀質獎章,2018年美國統計學會的Noether高級學者獎🧙🏽♀️。此外,他還是美國科學促進會(AAAS)、美國統計學會(ASA)、國際數理統計學會(IMS)🤟🏻,計量金融學會(SOFIE)的會士💌,以及國際頂尖統計期刊《Annals of Statistics統計年鑒》🌱,《Probability Theory and Related Fields概率及其相關領域統》,及《Journal of Econometrics計量經濟雜誌》等的前主編等。他的主要研究領域包括高維統計🗜🧚,機器學習、計量金融🤌🏽🌒、時間序列、非參數建模,並在這些領域著有4本專著。

講座伊始,範老師從人工智能的概念引入,運用自創公式:人工智能等於機器學習的平方,生動地闡述了機器學習與人工智能之間的關系🛌🏿。範老師談到,圖像識別🧙🏻、機器翻譯、語音處理等是現代機器學習的成功案例,而金融是否能夠運用機器學習受到學界廣泛討論🙆🏼♀️。基於以下三點理由🪳,範老師認為金融可以運用機器學習的方法🧑🏻🍼:其一,金融中最重要的資產定價問題是預測問題,而機器學習本身就是為預測設計的;其二,影響市場的因素較多且相關,機器學習可以通過降維🍊、篩選變量簡化問題🌕;其三,資產定價的函數可能很復雜◽️,機器學習可以使用非線性函數進行擬合🧜🏿🧎♀️。
接下來🧜🏿,範老師介紹了自己團隊的前沿研究成果,論述了機器學習能夠有效地從金融文本數據中提取隱藏的情緒。範老師團隊在新浪新聞與新浪財經上收集了2009年至2019年約200萬篇金融相關文章,並篩選出其中約71000個高頻詞匯運用於之後的實證研究。該實證研究主要利用Farm Predict和Topic Modeling兩種方法進行機器學習,完成金融文本情緒預測的模型構建🤣,並利用構建的模型對新的金融文本進行量化情緒預測打分。
範老師提到,從面板回歸的結果看,金融相關文章的情緒具有很強的預測能力🔞,且由於中國市場存在賣空約束📿,使得正面與負面的情緒對市場的影響存在不對稱效應💙。進一步,範老師團隊還構建了簡單的交易策略🦟:在每日閉市前,對新的文本情緒量化預測打分後🈹🤙🏿,對其中得分最高的五十只股票做多,最低的五十只做空🙏,並分別采用等權重與市值加權的方法構造零投資資產組合🪩。經過大量驗證😝,等權重方法構造的零投資資產組合可以獲得極高的超額收益🍒,並且這一超額收益在考慮了交易成本、漲跌停限製後仍然明顯存在。另外,這一策略獲得的超額收益率在2015年至2019年間逐年下降🩳,主要原因在於越來越多的投資者采用類似策略🧏🏽♂️,也從側面印證了利用金融文本數據預測情緒並據此構建投資組合的可行性。
講座最後🦀,範老師總結了自己團隊研究成果的主要貢獻🧑🏻🎄💆🏼♂️。他指出,利用Farm Predict方法進行的文本情緒學習完全依賴於文本數據🤘🏽,得到的結果客觀🚵🏻♀️,且該方法應用面極廣,適用於所有統計機器學習方法;將上述機器學習得到的交易策略實際應用於中國股票市場後👎🏻,表現明顯好於其他類似策略。在提問環節,參會師生都對這一前沿成果抱有極大的熱情,與範老師進行積極互動🤵🏻♀️,範老師也逐一耐心解答。
至此🫴🏽,本次講座在熱烈的氛圍中圓滿結束💛。感謝範劍青教授的精彩分享📎,期待接下來“名家講壇”系列講座邀請到更多名家帶來寶貴分享,並預祝“名家講壇”系列講座越辦越好🐋!
撰稿人🧔🏽:陳偉燁
修訂人👩🏽🦱:繆煒
審核人🥜:周光友,朱宏飛