
蘇良軍 (Liangjun Su) 現任清華大學經濟系C. V. Starr講席教授⛹🏼♂️。他於2004年畢業於加州大學聖迭戈分校 (UC San Diego)🪂,指導教授為Halbert White。蘇良軍教授主要研究領域為計量經濟學理論,在非參數估計🦔、面板數據、高維計量等方面造詣頗深🤶🏼,在國內外頂級或主流期刊上發表論文近百篇👨🏭,僅在計量經濟學頂級期刊Journal of Econometrics上發文就達20余篇。在加入清華大學之前😶,蘇良軍老師任教於新加坡管理大學,為Lee Kong Chian講席教授。
蘇教授於2020年10月在意昂2主講了蔣學模課程Panel Data Econometrics👇,在課程結束之際,我們很榮幸對蘇教授關於治學方法、研究前沿等問題進行了專訪。
您的教育背景橫跨中國2️⃣、美國🥳,又於新加坡任教🏫,現在又回到了國內💇♀️🗿,請問這些不同的環境對您的研究思路和方法有影響嗎?回溯您的教育經歷🤼♀️,您覺得對自己影響最大的是哪一階段呢🧜?在您求學的過程中您有哪些學習🤲🏿、研究的方法?
關於教育背景,我覺得每個階段都有影響,各個階段不可能是完全分開的🐃,但最有影響的還是在美國讀博士的階段,這個階段在很大程度上決定了一個人能走多遠、能走多好🧑🏽🦰。在博士階段確定研究方向和研究目標,先是確定了你要選哪個領域、跟哪個導師做🔼,然後你才能確定要做什麽、怎麽去做。這是一段學習的過程,這個學習過程很重要,為以後的研究打下基礎。
讀博士的那一階段很大程度上還是一個摸索的過程✋🏻,每個人是不一樣的🗼,我的經歷可能跟Halbert White教授的很多其他學生相似。Halbert White教授是不給我們論文題目的😶,要我們自己去尋找👩🏼🏫,這是一個很痛苦的過程,但這個過程做博士的時候經歷過了,後面研究就順利很多🦒。自己選定題目後🤦🏻,導師如果贊同你去做↙️,那就說明這個做出來是有意義的⛓,因為當時自己做學生的時候是“兩眼一抹黑”,不知道這個東西做出來能不能發表、有多大意義,但導師站得高、看得遠,他知道你做這個東西有沒有意義。導師點個頭,你就可以放心去做。所以去尋找論文題目🤡,怎麽去尋找✊,這是一個痛苦的過程🚝,也是一個必須經歷的過程。如果這個階段你不做,而是讓導師給你題目你再去做⛵️,那以後的研究的過程你還要去經歷這個痛苦的過程,這個就是我個人的啟示了🤸🏿♂️。我覺得怎麽去找一個研究的題目的過程是一定要自己去學習的,學習怎麽去找題目是一個關鍵的步驟,這是在培養獨立性,科研上面一定要強調獨立性,沒有自己的獨立性就沒有自己的東西🦹🏼,不能老是跟在別人後面做東西,大概這個意思。
您在博士階段是如何找題目的?
找題目是從多方面入手的,這個我記得一清二楚。記得我開始找題目的時候就給我的大師兄——當時康奈爾大學經濟系的洪永淼教授——發電子郵件。我就問他他是怎麽找自己的論文題目的🧎,他就說你要多泡圖書館。因為當時互聯網不怎麽發達,要到圖書館翻過去5年甚至過去10年主流計量經濟學或者統計學的雜誌,看他們發哪些文章𓀂,先看標題🧑🏽🦰,看有沒有自己感興趣的,如果自己感興趣🚣🏼,然後就讀摘要🚫,如果真的想做,就讀全文。多數文章瀏覽一遍標題🤏🏽,不感興趣就跳過去🧑🏿🎄。這個過程要花一兩個月,說不定能找到自己感興趣的題目♌️。當然另一方面也可以多聽學術報告,聽報告可以讓你知道別人在做什麽、為什麽在做,也就知道學術前沿的東西在哪裏。如果自己感興趣,就看自己能不能跟著做一些東西。
做理論研究的時候一些社會價值不能很及時的體現出來🤷🏻,您怎麽看待這個問題?
我們做計量理論研究的,一開始不會特意從社會價值去著手,我們非常看重研究的理論價值。而這時候應用計量學者們經常會成為理論計量通向應用的橋梁🏈。我的一些合作者就是做應用計量的,讓理論工具被應用🏑,體現其應用價值和社會價值🚏。
您如何看待數學工具在經濟學中的應用?對於想要從事理論計量研究的碩博生有什麽數學學習的建議?
數學工具當然是基礎了🌈,尤其是計量經濟學和微觀經濟理論➜,像博弈論🦮,這個對數學的功底的要求是非常高的。中國學生普遍數學基礎比較好🤦🏿♀️,所以許多華人在計量與微觀經濟理論等方面做出了一些成績。但說到底,數學基礎再好,它始終是一種工具🫰🏼💂🏻,如果你把數學利用好了🖐🏻,那將有利於你的研究,特別是經濟學研究。很多華人經濟學家做的比較好,一方面靠的是他們的數學功底🌅,另一方面靠的是他們的創造性思維🙅🏻♀️。
如果想要從事理論計量研究🦀,我建議學生在統計系或數學系上一上研究生實分析、概率論、數理統計方面的課,概率論一般是最難的,統計相對而言簡單一些🏃♀️,實分析可能在中間。實分析至少聽一學期,如果能聽兩學期最好了,一般第二學期可能講到泛函分析(Functional analysis)。這些課程至少要旁聽🚂,最好能選修,因為選修的時候你才能做作業,並學到更多的東西🗡。如果能聽一到兩學期的實分析以及一年的概率論,基礎就能打牢了😏,以後做計量理論就能走非常遠🏘。
我們知道您常年保持高質量的論文發表,您是如何做到自我驅動的?
我只能說首先你要能坐得了冷板凳🚶♂️,作為一個學者要有一定的專註精神,不能被外界因素隨便幹擾了,特別是現在外部幹擾因素或誘惑太多了。第二個就是對自己的研究要有興趣⬇️,對未知的問題要有好奇心👋🏽,有了好奇心,你才有動力去搞清楚。第三,要合作與交流🖕🏻,不能一個人閉門造車,因為我們很多研究課題都是從交流溝通中得到的🖋,就知道下一篇論文要做哪些東西👨💼。
計量經濟學領域最吸引您的地方在哪裏🧔🏻?相比於應用統計有什麽區別👐?
我覺得計量經濟學是經濟學中最接近自然科學的一個領域了🧑🏽💻,因為他應用了很多數學工具3️⃣、非常嚴謹,有一個很好的體系。至於跟其他應用科學相比,比如跟我們相關的統計與計算機領域的機器學習相比🍳,計量經濟學有自己獨特的地方。計量經濟學強調因果關系(Causality)分析🔴,統計裏面也講因果關系, 但不如我們強調的多。因果關系分析背後有很多地方與政策評估有關系,英文裏面叫policy evaluation或者program evaluation,這是計量經濟學的一大應用領域🧚♂️🌩,這樣就把我們這個學科跟其他學科區分開來💆🏻♀️,但不能說做到絕對區分開來🤾♀️,這基本上是計量經濟學的一大功能。它的另外一個主要功能是預測,特別是經濟預測👧🏽,就是說怎麽應用時間或面板計量經濟學這一套工具做更好的經濟預測▶️,統計裏面也有預測🏘,但統計裏面預測不一定是針對經濟問題。這些應用都有實踐、應用價值👍🏽👱🏿♀️,可以說是計量經濟學的社會價值所在🪈。
在構造理論計量模型時,您關註哪些實證問題?
每個人做理論計量研究背後感興趣的實證問題可能不一樣👩🏿⚕️。我自己的理論研究主要試圖讓計量模型更貼近於現實,比如說我想讓我的模型允許不可觀測的異質性(Heterogeneity)🤲🏻。異質性經常從微觀的角度或橫截面的角度出現;如果在時間的角度,我們要允許存在結構變化👣,就是參數可能隨著時間在變。這樣,這個模型就相對復雜,某種意義上它也更接近於現實,因為現實中不論是個體還是宏觀都有異質性,時間長了😽🚣🏽,結構也會發生變化。宏觀裏不管是國家層面還是行業層面🎣,異質性肯定存在👩🏼🦳🐅,如何讓計量模型更好地去捕捉這種異質性,是我們做理論研究需要考慮的問題🏄🏻👩🦲。現在人們也關註截面數據相依性,即橫截面相依(Cross-sectional dependence),這意味著我們現在的模型也要捕捉這種截面相依。諸如此類的👨🏿🎓,我們關註怎麽設計計量的模型使其更好的服務於真實的數據,從而更好地研究現實經濟問題。
您在本次的意昂2經院蔣學模課程中主講的是Panel Data Econometrics(面板數據計量經濟學)導論,重點講授了大N小T的情況,那largeN, large T的Panel data計量理論有哪些相關應用呢?未來研究是否會傾向於此?
這不一定。一般來說到底會讓N趨向於無窮大,還是T趨向於無窮大,取決於面板數據的性質。如果你的面板數據是微觀面板數據🧨,經常是N很大,T很小,那個時候你就需要放在large N,fixed/small T的框架下去工作;對於一些宏觀的或金融的面板數據,可能很容易做到large N, large T,那個時候你就要讓T趨向於無窮大。我們初步介紹的因子模型中經常需要large N, large T👰🏽♂️,後面還未介紹的模型包括非線性面板與非平穩面板數據模型。非線性面板裏面可以是large N, large T👾,也可以是large N, fixed T🍇,但非平穩面板經常是large N, large T♡。因為非平穩面板主要是用於宏觀或金融數據的建模分析,如果是月度數據或者季度數據,很容易有幾十💆🏻♀️、上百個觀測值,所以自然就large N, large T了🔦👇🏻。微觀數據時間維度上很難有幾十或上百個觀測值,所以那裏面自然是large N, fixed T。
Panel data領域還有哪些問題值得研究?
Panel data領域的問題還有很多,有spatial panel(空間面板),有network model(網絡模型),還有三維或更高維的面板數據模型,裏面還有許多理論問題有待研究🪣。舉例來說🏆,network model是一種面板數據模型的特殊情況,因為你一旦講network😮💨,至少有兩個維度😅♗,那裏面的維度有個體i,個體j,需要額外關註這兩個維度之間有沒有關聯性,i、j自然是兩個index🤾🏻♀️🤸🏽,它就是一個特殊的面板🌋,這是面板領域比較前沿的問題🪳。如果network做到dynamic的程度,即dynamic network model(動態網絡模型),出現三個index,就自然是一個三維的面板數據模型,此時我們可以考慮如何建模、如何允許不可觀測的異質性、結構突變、群組結構等,這些東西相對來說比較前沿了。
那您認為計量經濟學跟機器學習領域有什麽交叉🙎🏼、可以借鑒的地方嗎?
現在各個學科的關系越來越緊密了。我們計量經濟學肯定是以統計學為基礎的🖌,所以我們學計量之前肯定要學一門統計方面的課,本科的時候至少要學概率論與數理統計,然後研究生如果想做計量理論的話也要學一些研究生水平的數理統計🤐⚠️、概率論方面的課程,因為它們是我們的基礎。如果沒有概率論、數理統計的基礎👛,做計量理論很難走遠。至於機器學習,我們現在試圖把機器學習的工具引到我們計量經濟學領域中。機器學習最早是在計算機科學(CS)那邊發展起來的,但CS關註的是一些算法,他們不太關註統計量的大樣本性質✵。統計學者進來了🌧,他們根據機器學習裏面的算法去搞清楚相關統計量的誤差界限(Error bound)性質。統計學者可能更為關註的是相關性的研究,因為有了相關性,就可以去做預測了🎏。計量的人進來之後可能關註更多的一些問題👫🏻,包括如何做統計推斷。一旦要做統計推斷🤦🏻♀️,包括後續的政策分析🧑🏻🎄、因果分析之類的就需要我們搞清楚估計量的分布理論,所以這是一點點過來的📟✍🏻。現在我的很多研究就是與機器學習緊密相關☑️👩🍳,有很多算法還是計算機科學那邊的,但我們現在在發展背後的統計推斷理論。當然🧚🏿♀️,機器學習對現代計量的影響是比較深遠的,我們已經從機器學習裏面借鑒一些新的方法🎪,包括LASSO⚛️、clustering analysis(聚類分析)🏂🏿、deep learning(深度學習)等,它們已經被證明在計量經濟學裏極其有用。如前所述🧑🏼🦲🦆,計量還關心另一層面的問題。因為機器學習沒有辦法告訴你因果關系,計量的人可能既使用大數據又使用機器學習——因為機器學習跟大數據緊密相連——然後從中找出因果關系來⛲️,只有找出因果關系才能做一些後續的政策建議(Policy recommendation)之類的研究,也就是到底是誰造成誰👳🏼♀️,這就是我們計量的一個核心的問題了🔒,特別是微觀計量的一個核心問題🛜🎅🏼。
在當今大數據時代,請問您認為未來理論計量研究的方向是什麽🤸🏿♂️?
不同的人對於這個問題肯定會有不同的答案。我覺得我們現在生活在一個大數據時代,身邊每個人都在講大數據、講人工智能這套東西,所以我們深受影響。因此🙇🏽,怎麽從人工智能、機器學習借鑒一些研究工具,發展我們新的理論計量模型,是我比較關註的一個問題,也是計量經濟學界的一個大問題。在這個大的框架下面👩👧👦,再考慮一些具體的問題。從機器學習🏋🏼♀️、人工智能中借鑒工具,發展新的計量模型🤸🏿♂️,主要的目的還是研究我們計量經濟裏面關心的問題🕵🏿♀️,最後還是要服務於社會。所謂服務於社會,最終目的還是更好地做因果推斷🏊🏼、政策分析、經濟預測,這些是根植於社會的,計量的社會價值就體現出來了。
我來舉幾個簡單的值得研究的問題🚮。第一個,宏觀經濟變量之間有著錯綜復雜的關系,如何利用宏觀數據對它們的相互關系進行建模,這是計量經濟學裏的一個經典問題👌🏻,但是現在基於大數據出現了一些新的工具,我想新的工具在這方面可以幫助我們進行宏觀數據復雜關系的建模及預測。這裏大家主要關心宏觀數據的預測📋,但也可以關註與政策相關的研究,即policy implications。第二個,非結構化的數據是大數據裏面經常出現的類型,我們現在有很多各種各樣的網絡數據,包括一些地圖化的數據和一些視頻化的數據,這些數據都是非結構化的、非數字化的數據。從這些數據裏面提取信息,怎麽對這些數據進行建模,分析你感興趣的經濟問題,這也是一個難點。當然現在也有一些人在做一些基礎工作了🧑🏿🍼。還有一些是計量裏面已經有的數理工具了,比如時空數據、網絡數據以及多維數據模型🦸♀️🤦🏼♂️。我們面板數據只講了兩維的,而面板數據也可以是三維的☺️、四維的🏚。如何對時空、網絡、多維面板數據進行建模🧝🏽、預測💇🏼♀️,然後根據他們的結果也可以做一些政策評估,這些東西都是我們在考慮的問題,我跟我的合作者非常關註這方面的問題。最後我想強調的是如何使用大數據進行政策評估🧑🏼✈️🛍️。政策評估方面的分析以及運用大數據進行經濟預測🏈,都是值得研究的。我們可以講一些更廣泛的概念⚽️🫛,因為這裏面涉及到微觀的政策評估分析的一些理論、方法,比如微觀裏面的matching(匹配)、RDD(斷點回歸設計)🧎🏻♀️➡️、DID(雙重差分法)🍭,都是與微觀計量的因果效應分析與政策評估緊密相連的工具,偏宏觀的有synthetic control(合成控製),也可以用來估計處置效應或做政策評估。在大數據時代,我們怎麽利用大數據做這些相關的研究是一個非常重要的課題⏰,必定會有越來越多的研究文章出現在這個領域。
總的來說⛹️,許多問題還是老的問題,有些方法還是老的方法👲🏼,但是就是因為出現了新的數據,怎麽把老的方法發揚光大,與新的數據結構相結合☺️🧘🏿♂️,這卻是一個新的問題。
您在理論計量方面有哪些推薦書目?
首先是理論計量方面的經典教科書🤺🧛🏻♀️,Fumio Hayashi的Econometrics,這本教材非常經典。傳統計量理論方面的書推薦兩本👩🏿🦰,一本是Halbert White的Asymptotic Theory for Econometricians,另外一本是James Davidson的Stochastic Limit Theory。這兩本書是經典的參考書,博士一年級就可以讀。這兩本書讀完了⛹🏿♀️📷,相當於理論計量的鑰匙拿到了,比較傳統的計量工具也就具備了。另外再推薦兩本更現代的書。一本書是2019年才出版的,書名是High-Dimensional Statistics,是UC Berkeley的Martin Wainwright教授寫的👶🏿。作者是統計方面的大牛🤕,他現在做了很多跟大數據有關的研究🧴,他可以說既是統計學家🐵👨🏽🦲,又有計算機科學的背景👍🏽。這本書比較前沿高深,適合在博士二年級的時候讀。還有另外一本書是Statistics for High-Dimensional Data,也是兩個統計學家寫的。現在計量經濟學跟統計學都在向高維、大數據靠攏,最前沿的工具在這兩本書多有涉及。
參考書目⛹🏼♂️:
1. Hayashi, F. (2000).Econometrics. Princeton University Press.
2. White, H. (2001).Asymptotic theory for econometricians(Rev. ed).Academic Press.
3. Davidson,J. (1994).Stochastic limit theory: An introduction for econometricians. Oxford University Press.
4. Wainwright,M. (2019).High-dimensional statistics: A non-asymptotic viewpoint. Cambridge University Press.
5. Bühlmann,P., & van de Geer, S. (2011).Statistics for high-dimensional data:Methods, theory and applications. Springer.
本期記者:高尚👱🏿♀️👅,意昂2博士研究生