Redefining Open Minds: 有效率地閱讀論文 (Efficient Reading of Papers)

Tuesday, August 10, 2010

有效率地閱讀論文 (Efficient Reading of Papers)

前陣子有位朋友問到，剛進入一個新領域時，每次要看懂一篇論文都得花上很大的功夫，而且看完之後對於自己的研究往往還是沒有甚麼頭緒，要怎麼樣才可以大量且有效地閱讀科學論文？

以前並沒有仔細想過這個問題，於是搜尋網路上許多關於這方面主題的探討，但是大多數強調的是如何分析一篇論文 [1]。然而在某些領域，論文數量以及成長速度非常地驚人，使得剛進入研究領域的研究生們常常在面對一大片論文海時，會覺得不知所措而走了很多冤枉路。所以我想分享這一兩年自己慢慢摸索出來的尋找論文與閱讀論文兩點簡單的經驗：1) 選擇要閱讀的論文, 2) 善用其他資源，提供給剛開始研究之路的朋友參考。

選擇要閱讀的論文

有些領域的論文數量相當龐大，每一年可能都有好幾千篇新的論文發表，進展速度非常快，所以我覺得如何選擇要閱讀的論文，有時候和閱讀論文本身幾乎是同等重要。

我個人選擇論文的偏好，大致上有四個要素

發表在哪裡?
作者是誰?
和研究題目的相關性?
新穎或是回顧性的題目?

第一個要素是論文發表的地方，也是新手最容易大略判斷論文品質的方法。每一個領域往往都會有公認的最好的論文發表期刊或是會議。這些期刊和會議論文長年經營下來對於審核論文都有一定的水準，所以比較不容易遇到品質不佳的論文。關於個別領域中的公認的優良期刊和會議，可以請教指導老師或是有經驗的學長姐，或是藉由期刊影響力指標(impact factor)或是會議的排名來做判斷。當然論文的發表處並不是唯一判斷論文好壞的因素，頂尖的期刊或會議同樣會有品質不佳的論文出現，而沒那麼有名的期刊或會議也有可能有能啟發你/妳的好論文，沒有絕對的好壞。

第二點是論文的作者，我常看到很多人會忽略論文作者的重要性。論文的主要作者是誰其實傳達了很多重要的訊息，比如說論文的品質、看待問題的哲學、研究的題目、和常使用的方法等等。論文中的作者排序同樣也有很多訊息，比如說，誰是誰的博士班學生和博士後、論文是那位學生實習時的作品、博士論文的精華、那些人正同在一個大計畫裡。

這一些隱藏在作者名字背後的訊息提供了非常有用的資訊，來幫助你/妳選擇要閱讀的論文。舉例來說，我在心裡有一份口袋名單，時常會到作者的網頁看看有沒有新的作品，由此對於研究領域脈動的掌握更加即時。(當你/妳看到一篇論文新發表在某某期刊時，那其實可能是兩、三年前的想法了，這中間已經不曉得又經過了多少演進。) 而有些我覺得很好的研究學者，甚至只要有新的作品，不管題目是甚麼我都會閱讀，因為每一篇作品都表現了這些優秀的研究學者對於領域的發展看法和遠景。

了解這些研究學者間的師承關係 [2] 除了茶餘飯後八卦說說嘴之外，其實可以從中得知很多關於研究的資訊。同一個實驗室往往有類似的研究風格、常使用的數學解題工具等等。有時候一看到論文標題和實驗室的名字大概就可以猜到他們的作法。個人的經驗是這些背景知識對於理解論文有很大的幫助。

至於領域中那些作者是值得注意的，如果指導老師對於領域的發展很有概念，學生很快就可以掌握到名單。沒辦法仰賴指導老師的話，可以自己學著從論文閱讀中去評判論文的品質 (從論文本身的貢獻、引用次數、別人引用這篇文章時介紹的口氣等等)，慢慢地瞭解該領域的指標人物是那幾位。注意這些優秀研究學者不見得擁有很高的職位頭銜，或一定是資深的大老級教授，有時候可能只是一位正在唸博士班的學生。

第三點為是和題目的相關性。選擇直接相關的論文(i.e., 處理同一個題目)很簡單，只要依照前兩個因素來做判斷其重要性就可以。選擇該閱讀那些和題目間接相關的論文，則需要一些研究上的經驗，有很大一部分的論文就是藉由連結這些間接相關的論文而產生的 (對相關例子有興趣的朋友請參考如何找研究題目(二)) [3]。

第四點是藉由訂閱網路上的關於學術的新聞頻道 [4]，了解到現在大家正關心的研究題目或是有那位知名的學者在做回顧性的演講，才不容易跟領域的脈動脫節。

這裡所謂的研究新聞頻道並不是像一般的社會新聞一樣有個統一的版面，每個領域都會有各式各樣不同的管道。

舉例來說，如果你/妳是數學系的學生，學習分析相關的領域，那麼關於這領域的研究進展可以訂閱Terence Tao的What's new 部落格，還有他的Google Buzz feed。大約每隔一兩天就會有新的長篇文章，我都不曉得他那裡來這麼多美國時間　= =

另外像是最近幾天數學界熱烈討論的P<>NP的問題，主要的討論區也在一位教授Dick Lipton的Gödel’s Lost Letter and P=NP 部落格上，頂尖的數學家們如Timothy Gowers, Ken Regan, Gil Kalai, Terence Tao, Suresh Venkatasubramanian都在這個平台上即時地討論，而不是透過正式的論文發表和評論，所以了解這種管道對於掌握研究進展有很幫助。

而數學界比較傳統一些的新聞管道則是藉由網站上的Preprint來獲得，比如說　arXiv 和 Front for the arXiv

再舉訊號處理界現在最熱門的題目Compressive sensing為例，資訊的集散地在Nuit Blanche這個部落格，你可以藉由電子郵件訂閱來取得這個題目最新的研究進展。

在影像處理、電腦視覺、醫學影像這領域，你/妳可以訂閱Imageworld文摘，從中不只可以得知該領域哪些會議在徵求論文，還可以知道哪裡有相關的實習工作機會或是Ph.D.獎學金。除了被動接受資訊外，也可以主動和這個Community互動，比如說之前和朋友合作的Computer Vision Genealogy Project 就是藉由這個管道通知全世界的研究學者。

如果你/妳對於你/妳所在的研究領域有足夠的了解，就會曉得那幾間實驗室是重點實驗室，時常會邀請知名學者去演講領域上新的突破或是回顧，這些都是非常值得了解的資訊。舉我自己所在的資訊領域(電腦視覺)為例，我加入了兩份Mailing list。第一份是MIT CSAIL的研討會通告，另一份則是UC Berkely的computer vision mailing list。從MIT CSAIL的研討會通告常常可以得知資訊領域上的重大進展，剛畢業的Ph.D.的博士論文題目，看到有興趣的演講再去作者的網頁找相關資源進行了解。而UC Berkely的computer vision mailing list則可以提供電腦視覺最新的研究進展 (因為如果有學者有夠好的研究成果，通常會被邀請到該實驗室演講)。

上面這些新聞管道，大部分都可以藉由電子郵件來訂閱，也就是每當一有更新時，你/妳只需要看看信就可以了，不用到各網站跑來跑去。不管是哪一種新聞管道，都比最傳統的紙本期刊訂閱快將近1-3年 (各領域不同)。

至於如何掌握自己領域的動態，這部分就要請教自己的指導老師或是經驗豐富的學長姐。

善用其他資源

前頭花了這麼大的功夫選擇了要閱讀的論文，是不是接下來就要把論文從頭到尾了呢？

答案通常不是。

也許是我很懶惰的關係，印象中我幾乎沒有把一篇論文從頭到尾仔細地看過…Orz

但也因為這懶惰的個性，讓我懂得善用論文其他相關的學術資源。要記得論文發表有些時候只是研究的一種形式。論文的相關演講、口頭報告的投影片、海報、計畫網頁等等都是研究的發表形態。

當我看到一篇想要閱讀的論文時，大概會有三個偷懶的步驟　XD

第一步會試著去找找看網路上有沒有相關的演講或課程 [4]。因為演講時往往是作者重新審視過他寫過的論文，經過消化沉澱之後再進行報告，所以大部分都比直接閱讀論文來得更容易理解，有時聽個三分鐘的演講對於論文的理解更勝埋首苦讀論文三小時。

第二步拜訪作者或實驗室的網頁去尋找相關資源：報告投影片、海報、Demo video等等。這些資料都是作者將論文的內容濃縮之後取其精髓後的成果，所以看這些資料不用擔心自己會陷入太過細節的內容。

最後一步才真正接觸到論文本身，通常會採取漸進式地閱讀。先瞄一下標題和作者，猜猜看論文的內容，接著仔細看摘要，了解論文大致的全貌。如果有興趣的話，再從簡介開始閱讀，從簡介章節中可以徹底了解論文要處理的問題、困難點、主要貢獻、方法、和主要結果。如果論文寫得好的話，看到這裡應該就幾乎把論文的內容看得差不多了。因為了解論文的想法和貢獻才是閱讀論文的本質。關於剩下的細節實現，包含使用了那些方法解題、公式的推導、參數的調整、實驗的設定等等，每個人都可以有不一樣的實現方式。這些細節當你/妳真正需要實現時再回頭來參考就可以了，只有在論文和題目高度相關時，完整的閱讀才是必要的。

至於看不懂論文時該怎麼辦呢？體醒自己並不是所有的論文都寫得清楚易懂，有時候不見得是你/妳個人閱讀能力的問題，遇到這種情況時，我也有個偷懶三步驟 XD：

第一、回頭尋找相關資源，看有沒有相關投影片，如果不了解的關鍵點在於某個已知的方法，也許Wikipedia就會有很完整又簡單的介紹，或是搜尋網路上相關的Tutorial等等。做法很簡單，就是蒐尋一下不了解的Keywords + wiki 或是Keywords + tutorial。