2014年4月17日 星期四

《哈利波特》

今天要說一個匹茲堡女神誕生的故事。




Y是 2010 年秋天來到匹茲堡的,比我早一年。

一如其他所有同學,經過一番小小的波折,Y最後在一位帥氣德國教授的麾下落腳。德國教授的研究領域很廣,主要是語音(speech)與多媒體檢索(multimedia retrieval),也兼作一些雜七雜八的工程項目。

教授年紀雖然稍大,但還是長得好看,談吐也溫文儒雅(套句中國女同學的評語),與妻子住在離學校車程四五十分鐘的郊區,家裡養了幾隻貓、幾隻狗──還有四匹馬。

我來的第一個學期,與Y和德國教授在同一個 project 裡。某日教授突然左手打著石膏來開會,我問Y:你老闆怎麼了?Y說,騎馬摔下來骨折了啊。

德國教授的好處倒不真是帥或會騎馬。在 CMU 這工作狂們拿命來拚的險惡叢林裡,他是我所見過罕有的、真心為學生著想的教授。他已經足夠資深,懂得並且願意(注意,這是兩個概念)以自己的位置幫學生與不利的條件周旋,並在嚴苛的環境下給學生最大程度的自由。

Y與我說過,他去阿拉斯加回來,買了個類似「熊出沒注意」的三角警告路標貼在辦公室門上,那時他很開心跟老闆講這件事,老闆笑著回答他:「It has been always on my list,但一直沒機會去。」Y說:他老闆是真的能 appreciate 這種事的人。這種教授在 CMU 不多了。

我心有戚戚。我是不知道整個 CMU 如何,但至少在我系上的教授裡,這肯定是少數。




教授與Y某日討論到他們手上的一組資料,是某個老人安養院裡真實的監視攝影機影片,總共好幾千小時。教授先講了這組影片的各個面向,包括室內環境的大小、照明,病人的人數、生活型態,攝影機的數量、位置、畫質,還有隱私權等等,接著問了一個問題:有沒有可能在不安裝感應器的情況下、光憑影片就能追蹤每個老人的位置?

Y立刻脫口而出:

──噢,你需要的就是一個「劫盜地圖」(The Marauder's Map)嘛!

「劫盜地圖」是《哈利波特》裡的一樣魔法道具,平時乍看是一張白紙,但當使用者對地圖說出「我莊嚴地宣誓我不懷好意」這句咒語,地圖上就會顯示出霍格華茲詳細的地圖(隱藏或禁閉的區域除外),以及「每個人的名字與位置」。

帥氣的德國教授竟還真有讀過哈利波特,立刻就懂了。

壞消息是,因為這樣那樣技術上的限制──主要還是監視攝影機畫質不夠高──室內多人 tracking 並不是做不到,而是通常很難區分哪個人是哪個人,頂多只能辨識「這裡有個人正在從這裡走到那裡」,至於認出他是誰,那就很難了。

不過還是有好消息。可能基於安全的考量,這老人安養院裡的監視攝影機數量異常地多,或許在某個程度上能夠彌補畫質的缺陷。

只是沒有人知道可不可行。也從來沒有人做過。

話說回來,劫盜地圖神奇的地方──同時也是這個道具在劇情中發揮關鍵作用的地方──就是劫盜地圖不會被各種法術與道具所蒙蔽,無論如何都能認出你的本來面目。像故事裡有個角色變成了老鼠,還是乖乖在劫盜地圖上顯示出了本名。

要是劫盜地圖沒辦法顯示名字的話,那就只剩下腳印,一點也不酷了。
  



德國教授要Y列出他想做的題目,從簡單到難。Y列了六個,從簡單到難,第六個就是劫盜地圖。

列完以後,Y想了想對老闆說:我還是先做第五個吧,第六個實在是太難了。

做了一個月,教授看了看初步結果,露出很猶豫的神色(大抵是「這題目真不知道在幹嘛」的意思)。

Y見狀便說:還是我試試做劫盜地圖?這個很難,我真的完全沒把握能不能做出來。我該試試嗎?

帥氣教授的回答很簡潔:Why not ?




果然是很難,這一做就是一年多 。

但Y不愧是Y,還真把東西做出來了。

這篇論文登上了 2013 年的 CVPR(Conference on Computer Vision and Pattern Recognition),是 CV 領域的第一大會,2013 年的論文錄取率是 25.2%。文章標題一開頭就是「劫盜地圖」:

Harry Potter's Marauder's Map: Localizing and Tracking Multiple Persons-of-Interest by Nonnegative Discretization. Shoou-I Yu, Yi Yang, Alexander Hauptmann. IEEE CVPR 2013.

這是世界上「第一個」成功在「複雜室內環境」中實現多人 tracking 的研究。Y就活生生出現在我眼前(還很常一起跟我去吃飯!),能夠認識如此神級人物真是我三生有幸。

同時似乎因為論文標題很萌的緣故,這篇文章在學術圈裡意外激起一陣波瀾。中國的校內網上許多帖子討論這篇 paper 很神,四面八方有關係沒關係的人都注意到了這篇文章。認識的人丟訊息來說恭喜、說這篇文章紅了,連不認識的也有寫信來說想合作的。

大家還在Y的個人板上起鬨,要他「快買巫師袍,到時候穿著報」、「魔杖還可以方便指著講解」。可惜最後生性木訥的Y沒有這麼做,不然肯定上頭條。




這件事還沒完。離Y正式成為匹茲堡女神還差一步。

文章爆紅以後,除了朋友的起鬨以外,許多英文媒體──包括科技媒體與不是科技的媒體──也都紛紛刊出了「來自 CMU 的劫盜地圖」這則報導;同時也吸引來了一些真正有興趣也真正有錢的研究者和公司。Y的帥氣德國教授因此多開了不少會、Y也在一些公司面前報了這篇論文。

接著這個研究登上了 CMU 網站的首頁。

CMU 網站的首頁可不比臺大首頁,登上首頁是非常非常了不起的殊榮。在媒體熱潮後一週,CMU 校方正式對外發出了新聞稿(news release)。

那是風風火火的 2013 年六月。這則新聞毫不意外地傳回了臺灣。

臺灣的新聞是這樣寫的:

劫盜地圖 哈利波特真實版

【聯合晚報╱蔡致仁】

「哈利波特」系列裡的魔法物品「劫盜地圖」 (Marauder's Map)現在有了真實版。美國賓州卡內基梅隆大學研究生發明了「智慧地圖」,讓監視攝影機裡的人在地圖上的位置一目瞭然,可以協助防止小偷或幫助在賣場迷路的民眾。

這個智慧地圖系統分析攝影機的畫面,透過臉部辨識、衣服顏色比對掌握某人的位置,而且還可以從他最後出現的地方預測他的去向。

與同事共同發明智慧地圖系統的卡內基梅隆大學研究生游舒逸(譯音)說,設計地圖最大的挑戰是從複雜的室內環境找到並且追蹤某人,因為牆壁與室內擺設會擋住攝影機。他與同事想到的辦法是結合多種追蹤技術,譬如辨識臉部以及衣服顏色。

游舒逸說,他的「劫盜地圖」是第一個可以在複雜的室內環境,透過監視攝影機同時追蹤多人的智慧地圖系統。日後該系統可用在療養院或大型商場,幫助迷路的病人或者民眾。

So, it's official now.

這篇報導不僅在聯合晚報上刊載,多家中文的網路科技媒體也轉貼了。Y的個人板上,朋友們興奮極了,紛紛起鬨,說他是「臺灣之光」、「匹茲堡第一正妹」、「CV 女神」。

直到 2014 年的今天,我們都還是會笑稱Y是「匹茲堡女神」(好像昨天中午吃飯的時候才剛講過的樣子)。




這則新聞什麼都好,只有一個小小的瑕疵。

而其實只要臺灣的記者把Y的英文名字丟進估狗一下,很快就可以發現的:

Y不姓「游」,而姓「余」。

Y的本名是「Shoou-I」,不是「舒逸」,而是「守壹」。守護的守、壹周刊的壹。

他從頭到尾都是個男的。




20140417@書一百 (4)



1 則留言: