國際會議報告 -- 2012年ACM SIGEVO基因及演化計算會議 GECCO2012 @ 紐約 @ 黑色天空

參加會議經過

行前準備工作、確立計畫目標

ACM SIGEVO基因及演化計算會議是演化計算領域國際間最大的會議之一，更是本人研究領域(Learning Classifier Systems)於國際間最重要的國際會議；本人為第一次參加此會議，因此，本次參與本次國際會議主要目的在於結識本人研究領域各國傑出學者、建立連結，以接受刺激、交流研究，並了解該領域最新發展，以及了解該專業領域學者對於本人所提出之議題的看法、觀感與建議，更同時為接下來的期刊論文投稿鋪路。我於本次出發前即針對此預先準備，提出欲交流與會人士的名單，並對名單上的研究者的著作一定程度的review，同時事先提列欲討論的問題(在此不詳列)。

簡述會中及會後過程

7/7(第一天)，參與了Jon Rowe主講的Tutorial，課題名稱是Genetic Algorithm Theory，還有Tomas Bartz-Beielstein還有Mike Preuss所主講的Statistical Analysis of Optimization Algorithms with R，前者敘述的議題較深，大略是在講述如何透過Probability以理論模型去分析Genetic Algorithm (GA)的運作，在此不做詳述，後者所介紹的東西比較practical一點，提到R這個統計軟體用的程式語言暨開發平台，好處在於能夠提供一些interesting的data structure；不過感覺上R比較適合做單純的資料檢視/分析，但不適合做programmable的自動分析系統開發。後來在推廣所謂的R-studio整合介面，在該介面下研究者可使用interactive plots (直接透過data plotting就看出很多東西)，並且R-Studio對於speeding up generating plots and summary是非常powerful的。除此之外R還有很多優點，例如free並有active community support (package不斷產生)…但R也不是沒有缺點：因為是統計學家開發的它的troubles在於un-intuitive in looping the program。本人是傾向覺得R與Matlab蠻像的(but it's free)，but package in Data analysis可能較多，但自由度稍低。Additionnally講者還多介紹了兩個package: Sweave(提供自動data analysis ppt產生器)，以及Stangle。Sequential Parameter Optimization (SPO)主題部分則介紹了一個Data analysis懶人包 -- "SPOT": 專門for parameter tuning (已support部分知名Evolutionary Computation (EC) algorithms)；可於此下載：www.spotseven.de。另外還提到R也內建BBOB 2012 -- Black Box Benchmark Problem Set(2012年近期提出for EC algorithms做testing的Benchmark)，用以對data給測試algorithm的optimization能力。

另外還參與了Jaume Bacardit主講的Large Scale Data Mining (DM) using Genetic-based Machine Learning (GBML) 的tutorial(可參考此論文: http://dl.acm.org/citation.cfm?id=1570424。)該Tutorial中主要講述GBML in DM的優勢在於相較於傳統ML所提供的解讀能力，以及對Missing Data反應也較robust，唯仍存在efficiency問題可能被solve。

關於論文簡報的部分，由於在論文簡報在整體策略中占非常重要的地位，故於正式上台簡報前即精心設計，並確實重複演練以確保臨場表現水準。簡報的部分的作法選擇採用對比強烈的破題報告法，先以研究動機的部分吸引全場目光，後再循序漸進帶入問題的定義與創新處。在這樣的設計下，簡報順利的引起在場學者老師們的注意，不斷的有人提問、表達興趣直到提問時間用完無法繼續討論下去為止仍有聽眾來不及提問，只好與幾位老師相約私下於Break Time繼續。同時發現，或許是因為簡報表現的關係，該場簡報後，幾乎所有的人都已經認得自己(圖2)。

圖表 1 我於簡報間留影

7/08(第二天)，會議第二天，前往參與Fourteenth International Workshop on Learning Classifier System (14^th IWLCS)…會中Patrick Stalph介紹Martin Butz再作的"Hierarchial XCSF 基本上是在做Machine Vision透過bias attention的概念，讓系統對於focal points能夠有不同的resolution (這個領域目前最知名的學者XCS的提出者Prof. Stewart Wilson十分認同此方向, 他認為人類的運作還有這個世界的運行本身就全是Hierarchy, 而且他不認為Hierarchy Solution沒有技術價值 -- 最近他想在non-mardovian問題上永久突破，就是因為在這個問題上目前連Hierarchical Solution都尚未存在)。會中與與會學者討論了解到PPSN是最早最大的演化計算會議, 後來ICGA+GP = GECCO後GECCO才變最大.；IWLCS常與GECCO合辦，CEC我們領域的paper比較少投到那裏去，因為CEC講的東西會比較general點.. LCS不一定能上(無GBML track, reviewer素質不一)，但總的來說GECCO、CEC、PPSN都是非常很棒的會議，在我們LCS field排名應該是GECCO > PPSN > CEC。

IWLCS學者報告完以後，有個Panel Session讓與會人一同討論該領域未來發展方向，在討論過程中才了解到原來LCS社群其實有在討論如何將演算法中Fitness Value的計算透過relative accuracy(目前主流)的方式給置換掉，甚至get rid of GA (provided by Wilson) -- inspired from Tim Kovac's presentation。另外比較特別的是兩大LCS style之爭: Michigan Style與Pittsburgh Style -- 密西根style就是用很大的population set來分解policies，另一種則是all in one rule。還提到的就是XCS(F) in Weka的implementation將是這個領域未來發展所必須處理的事情。

圖表 2

其他心得：研究者做paper publication時都是呈現自己最好的結果，一般不會去談limitation，呈現出來的就是最好的成果了，一般不會再有更多(了解這點，來自Wilson對自己&Lanzi 2000年發表的XCSM, 以及Stalph的presentation -- 對於XCSF 6 dim. ~ 10 dim.說法的心得)的表現了，必須be aware of it)。

圖2為本人研究領域最重要、研究成果被最廣泛運用，並同時培育出許多active researcher例如德國的Prof. Martin Butz、義大利的Prof. Pier Luca Lanzi的Extended Classifier System (XCS)演算法鼻祖Prof. Stewart Wilson與我的合照，我們在會後針對XCS發展現況及所面臨的發展瓶頸做討論，Wilson並提出了AccessLCS的概念(AccessLCS的概念 -- 想要online map各LCS field的topics到各best papers)，希望能藉此引領更多年輕學者踏入此非常具發展性與潛力的研究領域。而他自己目前的研究主要在XCS的internal memory (希望能做真的AI... 突破目前Reinforcement Learning (RL)領域對於non-markovian問題的瓶頸，Wilson同時提到了Gift Trapping problem，目前的RL無法克服的問題，他說大部份的人不一定會認為這很重要，但他個人認為這很嚴重)。會議的第二天晚上，與在會中認識的7位教授(包含Prof. Stewart Wilson)、一位博士後研究員以及1位PhD學生前往酒吧用餐，交流研究心得，結束後，繼續前往義大利冰淇淋店小敘到當晚近十一點才一同返回旅館休息。圖3為小敘結束前留影。

圖表 3

7/09，會議第三天，去聽了KeyNote Speaker Prof. Chris Adami的演講，提到過去AI到現在，有所謂”有representation”與”無representation”之爭(目前是無representation掛帥，但發展上卡在internal memory問題)；一般認為的解法是讓一開始有default representation，then evolve that representations。講者認為重點在於要merge computationalist + connectionist => 認為當"computational structure" can be found for such brain，剩下的就變成找fitness landscape問題了 (個人認為這聽起來像是Prof. Wilson在1988年所提出的”Animal path to AI”)。講者試著build up一個model，透過邏輯閘網路來解釋Markov，並透過把output拉回input做feedback的方式，實現memory(做HMM)。後來透過做hierarchy的方式(network structure)，佐以rather single table的方式來解大table問題，其作法 -- 把network資訊也encode到string中做EC. (自己覺得這重點似乎會落在encoding，但對方說是落在Fitness Landscape)稱"Markov Network" (從reacting agent更往上躍昇)。這樣子Built出來的model跑出來的Results據說成功的generalize "ideas"變成non-sensor mapping，甚至可使Intelligent Agent跑在沒train過的maze裡。只能說這真是太強了，有機會應該好好拜讀一下paper；

圖表 4

但是會後與Prof. Wilson討論，他似乎並不十分認同這個問題可以透過這樣的方式解決，講者似乎沒有確實解決掉該問題，可能只是呈現一個比較佳的狀況的case而已。補充一下自己聽到的，這個方法的優點：使機器有memory的能力，並可任意download應用於問題(基於reinforcement learning)。該方法學目前發展狀況：1) 知識無法萃取(which is LCS community目前最大優勢)；2) 目前能應用的問題仍小。這個新提出來的架構，講者告知也被用於Prey Swam以躲避Predator (Predator Confusion) 的Hypothesis驗證.。在實驗中Prey、Swam是同時具備evolving的能力的。實驗目標在於evolve a brain that is complex enough that it can control a physical robot well enough for it to explore the world on its own。最後提到在OCR上的應用 – 有秀圖，個人覺得長出來的Markkov Network真是太複雜、太酷了！

接下來的三天(7/09-7/11)都在各track當中聆聽研究者報告，在Genetics Based Machine Learning (GBML), GBML-1(Best Papers session)中了解到Prof. Martin V. Butz的學生Patrict O. Stalph在” Guided Evolution in XCSF”中透過導入Guided Mutation(重要突破在於透過storing samples來減少GA的randomness性質 -- 進而guide the search -- 不再是uniform random gen.的mutation), 增加)來讓最佳化XCSF(但導入了

圖表 5與法國友人於Poster Session合照

一個新參數orz), 進一步從可從原來的n=6問題進化到n=10 (but n大時還是做不到... cl. exponential成長, 除非有很多可以generalize的dim.) P.S. 缺點 -- 系統似乎從online learning變成offline了。Jan Kneissler在Filtering Sensory Information with XCSF: Improving Learning Robustness and Control Performance則讓XCSF裡面各rules可個相互學習，在arm control中有多個prediction -- 做法是讓各prediction參數之間形成一個looping自我修正 -- 以增加Filter的效果 (Self-Delusional Loop); 大概可以吃到NS ratio = 0.5左右. 問題：又增加了一個參數.... Threshold of 使用Self-Delusional Loop與否。Prof. Jaume Bacardit的Post-processing Operators for Decision Lists則針對之前提出的BioHel系統把diecrete/continuous input混用，並對最後的final rule set做post-processing -- 目的是為了在不降低performance的前提下使decision list更精實。

在GMBL-2(LCS Fundamentals session)裡，Ryan Urbanowicz的Instance-Linked Attribute Tracking and Feedback for Michigan-Style Supervised Learning Classifier Systems，透過Guiding GA operators (Crossover + Mutation) by estimating the attribute feedback and turn the information containance into probabilities。概念：movie "Twins"， http://www.imdb.com/title/tt0096320/ (Ryan推薦大家可以看一下，想法相近)，認為這樣的方法可以讓好的children與壞的children分的比較開的GA，另外還提出了"Attribute tracking visualization"，把演算法做出來的結果做圖形化的呈現的方法，十分實用。

Prof. Will Brown的學生，Syahaneim Marzukhi提出的Two-Cornered Learning Classifier Systems for Pattern Generation and Classification有點像是Multi-agent approach，透過Flow Theory的方式去調整present instance，以使演算法能夠有效學習到問題。我有問他如何define problem難度?被告知透過在adaptive agent來做tutor負責選擇instance的方式，這邊的用詞叫做"Coevolution")。另外，Prof. Will Browne報告另一位學生Muhammad Iqbal所提出的Extracting and Using Building Blocks of Knowledge in Learning Classifier Systems則提出了改變representation使XCS變成推理模型建構器的方法。

在GMBL-3(Optimization and Feature Detection Session)中，Wenlong Fu提出Genetic Programming for Edge Detection Using Blocks to Extract Features，透過GP來對image的edge detection做偵測，取得了非常好的成果。Prof. Will Browne的XCS-based versus UCS-based Feature Pattern Classification System報告，先介紹了UCS(FPUCS)之於XCS(FPCS) -- supervised版本的CS。當UCS作圖片classification時，會有dimensionality問題，透過Haar-like features(有點像是focus attention透過一個rectangle highlight)，實現，並在MNIST data set (很多資料, 而且training與testing sample的來源population截然不同)做測試; 同時還導入了用confusion matrix來同時estimation&training (LCS community中很少見)(P.S. UCS的好處是 --- 比基於RL的XCS快多囉~ 因為XCS要對map全展開)，特別紀錄：inner confusion matrix can "guide" learning to "hard" areas of the problem in FPCS。但Prof. Will Brown仍坦言，這樣的結果跟Neural Network (NN)社群所提出基於Supervised Machine Learning的Classification方法系列的結果比起來還差得遠，但GBML最大的優勢就是transparency。個人覺得Will真是個充滿熱情又傑出的研究者，感覺似乎LCS社群大部分的人都是這類的研究者，蠻有意思的。Julien-Charles Levesque的Multi-Objective Evolutionary Optimization for Generating Ensembles of Classifiers in the ROC Space把Multi-objective GA的概念與XCS的概念結合(XCS的概念：pool of classifiers，但XCS原先僅純粹對accuracy做調控)，使Classifiers在single-step problem中可以進一步為不同utility的需求做進一步演化(此例為ROC Curve) -- 做法：Boolean Combinations of Classifiers、MOGA、Convex Hull。GMBL-4(Reinforcement Learning Session)的部分，Steven Loscalzo提出Sample Aware Embedded Feature Selection for Reinforcement Learning，想解決high dimensional features問題；他原想把supervised learning中的feature selection technique應用在RL，但發現不能用；so後來想試著improve genetic policy of search in RL來實現。過去的作法：(NEAT) NeuroEvolution of Augmenting Topologies (用EC來tune NN topologies) -- 有點像是Neural-XCS -- 想把feature selection加入這個online learning的過程。實際做法：透過sampling…storing以檢查feature對state transition based on actions的關係(有提出一個機率公式)。regularly做此operation。心裡比較大的疑問是curse of dimension -- 目前真的無解乎？沒有辦法透過類似hierarchical的方式以時間換取空間嗎？

在Genetic Algorithms (GA), GA-1(Linkage Learning Session)中，Hsuan Lee代表台大的一個research group提出的Off-Line Building Block Identification，目的是Offline做Building Block偵測、探討"Building Block as the optimatlity of crossover structure"；做法是透過做一個specialized的快速algorithm(比GA快很多)來事先篩選做offline分析，但目前成果僅限定於特定問題。Real World Applications (RWA), RWA-5(Best Papers Session)的部分，Adrian Agogino在講述所提出的Evolving Large Scale UAV Communication System時，指Motivation在於新型太陽能UAVs (Unmanned aerial vehicle) 要上線了(目前即將突破可overnight(很重要) – threshold；未來經濟效亦有可能取代衛星(達到同等功能, 但成本大幅降低))，以後全世界都會使用UAV -- 會有很多；但會產生很多問題(當Large-Scale), e.g. coordinating。問題在於要降低NS ratio。最後選擇採用Multi-Agent Distributed GA，基於一個共同的control system來解此問題。Antonio Canelas提出的A New SAX-GA Methodology applied to Investment Strategies Optimization是將Investment Strategy optimization task利用SAX (GA)，先把time series轉成symbolic strings，在做Optimization。做法：normalize > segmentation > piecewise aggregate approximation。(PAA) -- 其實就是依大小encoding symbol > define distance。Chromosome: Investment Rules + Pattern -- 一些買賣參數(hold幾天, 啥時進場etc.)Evaluation方法：ROI of the trading strategy on the time series data。有training data與testing data -- 重點在於找time series pattern與strategy之間的關係。最後還加入了window size進去chromosome, 變成了varialbe length的chromosome。自己認為是這樣的model還可加入Multi-Objective Approach -- 同時對Max Drawdown做Optimization。response1：no experience with non-stationary problem；一般解法認為可以開window；response2：在牛市表現會沒有B & H好，但若有上下起伏時，會比較佳 (類似程式交易系統？)。Taras Kowaliw提出The Unconstrained Automated Generation of Cell Image Features for Medical Diagnosis，基本上就是個auto image feature extractor -- evolvable, non-linear; 使用CellsDB的圖片s做研究by changing the representation of an image -- 類似focus attention的方式，對各pixel做priority；意義在於produce human-understandable results (這蠻重要的)，但目前只能off-line學。

Evolutionary Combinatorial Optimization and Metaheuristics (ECOM), ECOM-3 (Best Papers Session)中，Bo Song的A Hybridization between Memetic Algorithm and Semide?nite Relaxation for the Max-Cut Problem是一種結合化學機轉與演算法 (Chemical Inspired Computing)的方法；Combing 兩種不同 approach – hybrid，把強演算法與強relaxation結合 -- 但可惜本人宥於非本領域的人…看不出創新點在哪裡。有趣的是，他們的實驗，去比較錢人Performance部分都是直接跟其他系統的原作者要code來比較的(原來是會給的！)此經驗蠻值得參考的。Bin Hu的An Evolutionary Algorithm with Solution Archives and Bounding Extension for the Generalized Minimum Spanning Tree Problem的概念是想要把過去查過沒用的孩子(unnecessary ones)，還有重複的孩子(diversity loss)做Elimination，以做到Guided GA search的效果。作法：儲存過去的solution、intelligent mutation；目前是僅在MST上做應用，demonstrated在兩種不同的GA representation下都可以正常運行，稱"Solution Archive approach"。在Integrative Genetic and Evolutionary Computation (IGEC), IGEC-2 (Differential Evolution and Coevolution)的講演中，Daniel Ly介紹了"Co-evolutionary Predictors for Kinematic Pose Inference"，主要是在講述如何透過透過圖片就做到pose inference，直接建出模。主要概念用Kinet的動作偵測，使用圖片的方式達成不用train，且是unsupervise的學習。pose inference algorithm部分則是透過一種新的fitness function設計；而它的representation設計，則有點像parent去連child node sequence的方式(有一些可調變的變數) --> 但是他認為這樣的作法對其他ML來說是不容易學習的，所以就使用GA看看 -- 去tune那個可能的動作inference -- 但是其實對於她的fitness function來說calculate此是很慢的 -- 所以最後導入coevolution來解之。Co-evolutionary rank predictors – 但本人看來覺得好像只是使用了sampling的技巧而已；另外則聽起來似乎像是透過[P]來做假的fitness(predicted fitness) -- 來減少對true fitness的tracking所造成的overhead。以上為本次會議所有聽到的技術演講資訊，及本人的心得整理；最後，在7/11會議全部結束，大家負規以後，與會議認識的友人結伴前往賓州大學找尋ENIAC，圖6為於賓州大學Engineering Building地下室於ENIAC陳列館前留影。

圖表 6 到賓州大學找尋ENIAC (歷史最悠久的計算機)

總結

在7/07-07/11的整個國際會議過程中，確實執行了事先預訂的計畫：會中「提問」、會後「交流」、簡報「創造impressive image」(圖1為簡報留影)三個指導原則，在會中全場聆聽幾乎每一場簡報，並針對表現較突出的簡報，在簡報間，簡報後主動提出質疑、疑問或提供建議、交換意見。後來發現這樣的科研精神成功的引起了許多教授與年輕學者的注意，在會後紛紛主動前來了解我的學經歷與背景，留影交換連絡方式並對於這樣的表現主動給予極高的評價。此外，在會後的電郵溝通中，部分學者已主動提出未來可能的合作關係建立的要求。在可預見的未來除建立合作關係外，邀請國外優秀學者來台參訪交流、申請他國研究機構參訪交換、亦或是平日簡單的E-mail針對研究議題與國際友人交換意見等等，目前看來若有心經營，或預估實行上對國家發展能產生實益(需仰賴指導教授指導)，這些都是未來有可能被繼續經營開發的項目。