如何找研究題目?
(How to come up with new research ideas?)
Jia-Bin Huang
jbhuang0604@gmail.com
Latest update: April 3rd, 2010
To steal ideas from one person is plagiarism. To steal from many is research. - Wilson Mizner
二、結合兩種以上不同的主題 neXt = X+Y
C. 當X,Y為領域
在古早的年代,領域跟領域之間的界線其實是相當不明顯的,所以一個學者可能身兼數學家、物理學家、化學家等等身分(也許還是個神學家)。然而領域的專精和演進漸漸使得學門之間隔閡加深,各自開始發展各自的方法來處理各自的問題。所以將各個領域的問題或方法做有創意的整合是相當有影響力的,常常會因此而產生新的領域。
較熟為人知的領域結合像是黎曼創立的近代微分幾何(後來成為廣義相對論的基礎),或是李遠哲利用交叉分子束(Crossed molecular beam)在反應動力學(Reaction Dynamics)上的研究。工程方面則像是攝影和計算機科學的發展而產生了Computational Photography這個新興領域。計算機視覺也可看成是許多領域的結合(Machine Learning, Machine vision, Signal processing, Neuroscience, etc.)
雖然在電腦視覺中有非常多領域結合的範例(e.g., Language, Cognitive science, Machine Learning等等),不過再繼續介紹學術論文可能大部分人都會睡著了,所以在這裡只舉三個在人機互動(Human-Computer Interaction)上的創新例子(Sixth Sense, Wii-related HCI和Sikuli),讓大家明白有創意地結合不同領域的觀念可以產生相當大的影響力。
EX 1. SixthSense – A Wearable Gestural Interface
SixthSense 巧妙地結合了電腦視覺(Visual Tracking 和Recognition)和網際網路的資訊截取,實現了一個非常有趣的Augmented Reality的系統,相信在不久的未來應該就可以改變我們和許多科技的互動模式。
[1] SixthSense – A Wearable Gestural Interface, SIGGRAPH Asia 2009
EX 2. Wii Remote Control and HCI technology
前幾年Wii推出之後對遊戲界造成了不小的衝擊,其中Wii Remote Control的引入是其成功的關鍵因素,Johnny Lee [1] 利用Wii Remote Control的紅外線定位發明了一些很實用的技術。當然,你也可以用電腦視覺的技術來取代Wii Remote Controller,像是Microsoft最近的Natal Project便是一個很好的例子(見下面第二個連結)。
EX 3. Sikuli:Picture-driven computing
Sikuli結合了電腦視覺和程式設計而將圖形(i.e., 螢幕截圖) 帶進了程式開發的過程裡頭,一來大幅提升程式的可讀性以降低程式設計的門檻,二來Sikuli提供了使用者與圖形介面之間互動的一種數位化方法 (Serialization)。雖然類似的觀念在中國的一個軟體”按鍵精靈”也同樣存在,不過建立在Java平台和Open Source的Sikuli並定可以產生更大的影響力。
目前圍繞著Sikuli的應用才在剛起步的階段,目前已曉得的一些方向[2]有
Sikuli Search:網路上有相當多官方或是非官方的GUI使用者說明文件,往往都是以螢幕截圖的方式來呈現,這一類的資源便可以由使用者來圈選螢幕截圖來做搜尋。
Sikuli Script:Sikuli Script將圖形引入了程式裡面,使得過去人們在GUI軟體上許多繁複的操作得以自動化,另一方面,簡單直覺的介面使得每一個人不需要受到嚴謹的訓練也可以來設計自己的程式來幫助自己手邊的工作 [3]。
Sikuli Test:每當有個使用者介面(User Interface)提出來時,往往需要大量的人力來測試UI的可靠性和實用性,使用Sikuli可以使得這件繁瑣的工作自動化 [4]。
Sikuli Screencast:在介紹使用者透過GUI進行某種任務(e.g., 學習Photoshop的某種功能) 的時候,Screencast(將任務的過程以video呈現)是相當有效的方法,可是在使用者端有時候會發生沒有辦法跟上或是經歷太冗長的介紹,Sikuli Screencast提供了一個使用者與Screencast同步的方法。
還有在vgod的blog裡頭有提到的,使用者可以不需要自己寫Sikuli的script,只需要親自操作一便,Sikuli便可以記錄下使用者所操作的動作而自行產生相對應的script。這個觀念類似於這個產生圖片Tutorial的自動化軟體 [6]。
[1] Sikuli帶來的意義與無限的潛力, vgod's blog
[2] Ongoing projects on Sikuli, Tom Yeh's project page
[3] Searching documentation using text, OCR, and image, SIGIR 2009
[4] Sikuli: Using GUI Screenshots for Search and Automation, UIST 2009
[4] Sikuli: Using GUI Screenshots for Search and Automation, UIST 2009
[5] GUI Testing Using Computer Vision, CHI 2010
[6] Generating Photo Manipulation Tutorials by Demonstration, SIGGRAPH 2009
[6] Generating Photo Manipulation Tutorials by Demonstration, SIGGRAPH 2009
No comments :
Post a Comment