講題 (Title)
Empirical dynamic modeling toward ecosystem management and sustainability
演講者 (Invited Speaker):謝志豪 教授
國立台灣大學海洋研究所 特聘教授兼所長
小編 (Editor):呂昀恆、黃千育、區嘉曦
大綱 & 新知
「預報」是一個人人渴望的技能,舉天氣來說,小從幾個小時後會不會下雨,大到幾年後此地氣候是否改變,都是人們想事先知道,並且為此作出改變或準備的。然而,預報能否準確,要考慮的面向非常多,不只不同領域有不同需要注意的點,「準確度」也時常備受考驗。如何作出「準確的預報」,是許多學者的重要課題。
常見的預報產生方式,為設計「方程式」,透過輸入「參數」,得出的結果可以作為預測「未來」的依據,例如透過方程式計算,得出某段時間後,獵物與狩獵者的數量消長。然而,參數的選擇是困難的,某些看起來相關的參數,事實上無因果關係,而是分別被第三個參數影響;或者用現有檢定法得出不相關的兩參數,事實上共同受到第三個參數影響;又或是A參數影響B參數,可是B卻不顯著影響A(例如氣候對某物種數量造成影響,該物種卻難以撼動氣候)……等等,諸多難以參透的複雜關係,時常造成方程式的預期結果不符合現實,準確率不高。
本週的講者擅長設計方程式以模擬某個議題的未來趨勢,並且與團隊研發出「Equation-free mechanic system forecasting」的方式,以改善既有的預測方式。既有的方式依賴參數的決定,而參數的決定是非常困難的,只要漏了應該被納入的參數、或者錯誤理解參數間的關係,方程式就會不準確。而講者團隊認為,既然如此,我們先別急著設計方程式,而是先透過搜集數據,畫出一個大時間尺度的趨勢圖,透過「convergent cross-mapping (CCM)」,先搞清楚參數與參數之間,是否有因果關係,或者造成影響是否有方向性(如上述氣候與物種的關係)。根據上述得來的資訊,讓軟體協助分析,得出一個接近長久以來變化的趨勢或規律的預測結果,比起現有方程式,多了經驗累積與校準。這樣的預測方式,在「預報鮭魚回流率」的經驗中,得到了很好的效果,比起既有設計參數的方程式,Equation-free mechanic system forecasting擁有較準確的預報效果。
根據講者的願景,他期待這樣Equation-free mechanic system forecasting的方式,能為現有設計方程式的方式帶來革新。如果在各個領域都能更準確的預測未來的走向,自然對人類社會,甚至對整個地球生態,帶來不可計量的福祉。
Q&A
1
老師我想要請問前面那個ecosystem的第二題,就是為什麼他們會選浮游植物來做這個研究?它有甚麼特殊嗎?
要選浮游植物這是非常重要的,因為我們知道說在海洋裡面浮游植物就像陸地上的植物一樣,它是整個基礎生產力的來源。所以說energy的base、那就是浮游植物,那浮游動物吃浮游植物,魚再吃浮游動物。所以浮游植物的這個、整個生態系統來講,它就是basic的food web的基層。
那第二個呢就是說,浮游植物它對於環境的變異,應該是因為它的生活史很短,所以它對環境變異非常非常敏感。你有汙染啊、你有優養化啊,它的種類組成就會很快的反應,所以它是一個很好的indicator,這就是為什麼幾乎所有全世界的這個湖泊監測—包含這個水庫—都一定要做浮游植物。那其實更好要做到浮游動物,可是因為你知道經費是有限的,所以大體上來講全世界的很多湖都有做浮游植物,但不見得會做到浮游動物。
2
我想問一個問題,就是假設現在是一個物種A跟B會吃一個Y,那Y又受環境影響,那物種A跟B可能會有競爭的關係。那有辦法透過這個model去預測說因為環境的問題造成Y變少,那物種A跟B的族群量會不會受影響?
可以。但就是說第一個你要找出A、B、Y跟環境之間的因果關係,對不對?那這個先決定,你想像到底是對不對。那接下來就是說它影響是、我現在這個方法目前是教你說決定說它因果關係有多強或是存不存在,它沒有告訴你因果關係是正向還是反向。你剛剛思考的是:「喔這個如果是top-down的話就是negative effect、bottom-up就是positive effect …」但是這個我來不及講,但是我們其實也有那個…我們有這個paper,這個是2018年發表的方法,利用這個方法最後我們可以得到就是interaction network隨著時間怎樣怎樣變,這個研究就在幫你解釋要問的問題,我今天沒有時間講,不過這個都已經publish了,所以可以上去看。
3
我想問剛剛鮭魚的例子,就是一開始看說有關係,但是又猜說它的關係會隨著環境因子改變,所以之後加入了新的環境因子然後來做預測。那要怎麼去找到應該加什麼環境因子?
這是個很好的問題,因為我們也不是盲測對不對?所以說我們生態學家當然有一些我們的經驗、我們所學的生態學對不對?所以你會決定說我到底要用甚麼因子,對這個魚當然就想說溫度對不對?或者是牠吃的浮游動物的數量對不對?然後當然會想說那雨量會不會影響、因為在河裡面嘛對不對?當然如果更直接的、生物上來講的,那牠的小時候如果這個數量可以算的準,那是不是會有幫助?也就是說還是需要有一些生態的這些knowledge,然後我們可以去決定說我們到底要測什麼東西。那這個當然就套用到我一句就是說:「啊你測了、你試了才知道有沒有效。」所以你沒測沒資料、你是不能試的。對啊,那這就不是那麼容易的問題。
那這樣的過程會不會很容易你加了第三個環境因子之後,你又覺得它還是跟第四個環境因子有關係,然後就一路套下去做不完。
基本上你可以嘗試,如果你有很多很多。如果你就:「啊我很有錢,我試各式各樣的東西、我試各式各樣的排列組合。」那你當然就可以這樣試。那我們最近也發明了新的方法,就是說怎麼樣做variable selection可以試。因為你variable太多,假設你現在我們說做NGS對不對,我們有上千種對不對,上千種兩兩在那邊設神經病,那我到底要算多久。我們還沒有發表,但我們最近發明了一種新的演算法,還是要算蠻久的,不過可以幫助這個variable selection。用model data的話它可以做像這個,而且它都可以算出來。
4
謝謝謝老師讓我們這些數學白癡也可以聽得懂… (笑) …我的問題是比較technical的問題。因為我一直很崇拜這個ecosystem,那ecosystem這個字其實有點tricky啦,它的scale可以很大也可以很小。那我的問題就是、我的concern是data collection的問題,就是說在漁業上面它其實原來用這個方法去做,我在想說現在全球暖化它可能會不會用原來的方法抓不到了,然後它switch它的niche到比較低的地方,你用原來的方法抓不到了,所以你的data變成說沒有辦法 … 那你有沒有辦法說全部把這個海面都撈完去調查?所以我不曉得說你們有沒有碰到這個問題?就是data collection這麼多年來都用一樣的方法,會不會因為這樣就抓不到?
基本上這個應該是說…第一個就是scale的問題、scale尺度問題,所以你要研究一個系統,一定要明白這個系統的時間跟空間尺度,然後決定你採樣的方法。比方說,在研究這個湖中間的植物,或許我們採一兩個代表性的樣本,其實就可以大體上確定。但沿岸上就不一樣對不對?但大體上我們在湖中間可以capture。那如果魚的話我們就說魚會游來游去,所以我們要在空間比較大的地方,所以這個叫做空間跟時間上面。那魚的話,魚基本上一年一筆data就可以了,那浮游植物的話可能就要一個禮拜一筆,或者是更高頻度的才會更有道理。不同尺度的問題要用不同時間跟空間的scale。然後在非線性系統中,即使是同樣的生物,牠在不同的時間跟空間牠behave的dynamic也不一樣。所以就是說最大的困難就是非線性運動系統不能夠做外插也不能夠做內插。
第二個呢就是說,我怎麼知道我採的生物data有沒有代表性。那這個等於就是說一個生態學家要overcome的問題,就是說我自己知不知道這個data有沒有代表性,那應該就是general生態的問題。到底是因為你沒抓到、還是… (笑) …這個其實就…但我們可以解釋說沒抓到可能是因為牠數量變少,所probability反而很難抓到,那其實牠又躲起來或是怎麼樣。或許當然有一些tricky的issue啦,但是還是看科學問題為主。
5
很快的三個問題。
第一個,您當年從動物系的階段,在動物系的時候怎麼樣對生態學產生興趣?怎麼走到這個世界去的?想聽聽您的心路歷程。
第二個,請教一下,怎麼樣可以把研究做的這麼好?
第三個,您發表這麼多paper,有沒有想寫一本書?
第二個問題我先回答。就是努力 (笑)。沒有、除了努力之外要搞清楚方向,就是說…我常常給比較年輕的學生、大學部的學生演講,其實就是剛才主任問我的就是說歷程啊,其實我還蠻常被要求做這樣的演講。那我常常給的建議一個就是說你一開始要進入一個領域的時候,當然要對這個領域有專精,這時候就是努力就可以了。但是到了某個地步之後呢,除了努力之外你要一邊拓展視野。像我以前是做浮游動物分類,我其實是搞分類不是搞數學的… (笑) …我到碩士班以前都是搞分類的,我很會分類,我在microscope下畫那什麼解剖都是我的專長,我教很多人這些東西。那但是學術生涯到了某個領域之後開始把眼界放寬、吸收不同領域的東西,然後要一直做檢討,那這樣子就可以慢慢…那你要跨出你原本的comfort zone,當然一開始就會痛苦,第一次會很困難,要慢慢就是…我常講就是要做一個「T字人」,然後T這一根就慢慢越來越粗越來越深,然後T的兩邊也會越來越寬。我自己就是說,當然有些因緣際會啦,其實我到了碩士班為止都是做分類的,然後我開始做海洋學,那海洋學除了做分類之外我們要瞭解說浮游動物的組成、跟洋流之間的關係,收集很多資料。收集很多資料之後呢,當時一九九幾、兩千年的時候,整個臺灣多變量分析都還不是學很多,都是學基礎的統計學而已,那我就發現說我不會分析這些巨量的data,我就去圖書館拿一本書叫做多變量分析,從第一頁看到最後一頁,做裡面所有的exercise。當時學SAS,就把SAS的教科書拿來,然後exercise第一頁做到最後一頁。到碩二的時候就發現說,噢我好像可以做分析資料這樣,但其實就是說比較多統計學得okay這樣,也不是okay啦就稍微可以寫程式也稍微可以。然後我出國的時候,我去美國、去海洋研究所,老師問我說你有沒有學過微分方程、你有沒有學過偏微分方程、你有沒有學過線性代數、你有沒有學過數值分析、你有沒有學過… (笑),他說這是institute of oceanography,海洋裡面這麼多物理化學,你只學生物那你將來就沒辦法做oceanography。所以我博士班的時候就在美國學大學部的這些東西,才開始覺得說自己有點數學的…當然是興趣啦,那也是需求,因為oceanography不只是生態問題,還有很多像Navier-Stokes equation啦,因為不知道人家在講甚麼,所以才必須去學這些。
第三個問題是…寫書!噢很多人都問我,前教務長也是一直逼我寫書啊。我不知道,但我現在當所長,所以maybe當我三年之後不當所長了之後、也可能不需要寫那麼多paper了之後,我應該會啦…這是to do list啦,就是說我其實是很想寫一本關於動態系統分析的introductory到比較深入的。那其實我覺得我們是蠻善良的啦,因為我們所有的code在網路上都是package free的啦,然後有tutorial paper。2017年以後做得當然上傳之後就可以for beginner too,但是code其實是一直更新的,是public available。這個文章裡面的supplementary也許有很多exercise,教你怎麼樣做,你可以「請你跟我這樣做」這樣子。當然in reality真正model的data就是straight forward,但是in reality data怎麼樣處理還是有很多挑戰,那個就是需要interactive的來解決這個問題。目前的stage就是說寫一些beginner東西,然後把code就是說讓大家可以用。寫教科書的話就等那個…現在是出版中心主任嗎?(笑) 我有constantly收到這個問題,keep in mind但是目前還沒有辦法。
6
我想請問謝老師您的例子都是在一些湖泊或是之類,我就很直覺比較大的影響應該是水體溫度。我想說如果model到這個陸域生態系,增加很多溫度啊雨量啊,會不會相對變得比較複雜?這個model還能不能做起來?
就是說當然會比較複雜,但是基本上我認為完全是可以做的。這個是—我沒有時間講這個例子,不過已經發表了—這個是在法屬玻里尼西亞的三個小島上面得到的mosquitoes的時間序列,那牠有三個小島叫做Horea、Tiano、Toamaro這樣,每個島上有三個有點距離的採樣點。我們又收集了一些和島上相關的資料,像你剛剛講的降雨啊、溫度啊、海拔啊。那合作者是比較懂昆蟲的,所以他們知道甚麼樣的data和mosquito會比較有關係。這篇文章其實已經發表,重點是我們發現說這三個島它有pesticide施用程度差異。其中一個是millionaire擁有這個島,所以他會一直regularly的去用這個pesticide;有一個島是完全沒有人管,它沒有pesticide;有一個是irregularly是政府有時候會去灑。然後他們就發現說它們動態會很不一樣。回到我剛剛說不同的環境因子,還是生態學家必須要決定說我要用甚麼樣的因子。除非你真的完全不知道,你就盲測也可以,但你盲測就需要很多很多的金錢。比方說像我跟做cancer research的人合作,他們就有時候會想要盲測這樣,因為他們好像就很有錢 (笑)。
Key words: Forecasting, convergent cross-mapping (CCM), Nonlinear state space reconstruction (EDM)