本文節(jié)選自《為什么偉大不能被計劃:對創(chuàng)意、創(chuàng)新和創(chuàng)造的自由探索》,上一篇鏈接:
《為什么偉大不能被計劃:對創(chuàng)意、創(chuàng)新和創(chuàng)造的自由探索》,作者是肯尼斯·斯坦利(Kenneth Stanley)和喬爾·雷曼(Joel Lehman),他們是目前享譽全球的創(chuàng)業(yè)公司OpenAI科學家。兩位作者持續(xù)多年扎根人工智能前沿領域,這本書是他們在科學研究的過程中蹦出的意外火花。他們在學校、TED、科研論壇等場合公開演講,讓這一新思維方式影響并激勵了許多人。他們自身也憑借寫入本書的“尋寶者思維”“踏腳石模型”“新奇性探索”等具體思維方法,在人工智能研發(fā)領域取得了飛躍式的突破和進展,產生了一系列惠及人類的偉大創(chuàng)造。
近期我將會在網易號平臺將這本書的各個章節(jié)分享給大家,感興趣的網友可以去買一本實體書。
第五章 有趣的和新奇的探索
抓住每一個時刻的獨特新奇性,享受意料之外的快樂。
——安德烈·紀德(Andre Gide)
我們身邊或許都有這樣一個人,他/她在新年當天許下愿望:新的一年,我要學會說一門流利的外語,每天慢跑七公里,三個月內只吃胡蘿卜和蘋果來減肥。但過了一周,所有這些豪情壯志就被徹底拋在腦后,但沒有人對此表示驚訝?;蛟S不需要什么科學調查的結果,你就已經知道,大多數新年愿望最終都會不了了之。老實說,盡管這些許下了新年愿望的人中,超過半數認為自己能夠堅持,但最終成功實現(xiàn)的人只占12%。
這個超低的成功率也提醒我們,設定目標盡管在當下很吸引人,卻是整個過程中最容易完成的事情。說出你想成為什么樣的人、想要去哪里,或你想要完成什么,并不需要太多的努力,真正難的是如何實現(xiàn)這些愿望。更確切地說,真正的問題是,我們很難確定從這里到最終目標之間的踏腳石。這也暗含了一個不尋常的想法:我們不妨將花在制定明確目標上的精力,轉投到那些有希望引導我們實現(xiàn)某些偉大事業(yè)的踏腳石上,但這些踏腳石不一定準確地通往我們設定的目標。畢竟,目標本身并沒有對通往它的踏腳石應該是什么樣子這件事提供任何有用的線索。因此,我們或許可以換一種角度來看待探索未知這件事。與其擔心我們想要去什么地方,不如將我們現(xiàn)在所處的位置,與我們曾經到過的位置進行比較。假如比較之后,我們發(fā)現(xiàn)自己身處一個新奇的位置,那么這個新奇的發(fā)現(xiàn),未來或許會被證明是通往全新領域的踏腳石。盡管我們可能無法確定這些新領域是什么,但當前的踏腳石,成了探尋新發(fā)現(xiàn)的大門。
對目標的過度關注,實際上反映了我們對未來的過分關注。每時每刻的進展,都要根據我們在未來想要達成的目標來衡量。我們是否正在逐步靠近目標?衡量的結果,是否證明我們正在向前邁進?未來好似成了一座遠方的燈塔,指引著我們所有努力的過程。但這座燈塔往往具有欺騙性,在燈光上玩弄花招,將我們引入歧途。指引人類發(fā)明飛機的“燈塔”,沒有提示我們需要感應線圈;指引人類發(fā)明計算機的“燈塔”,也沒有提示我們需要先發(fā)明真空管。即便我們在很久之前就發(fā)現(xiàn)了這些踏腳石,但并沒有意識到,它們可能通往如此遙遠的目標。既然如此,我們將現(xiàn)在與理想中的未來進行比較有什么好處呢?既然沒有好處,我們不妨嘗試一些不同的、更符合情理的做法。我們可以轉而將現(xiàn)在與過去進行比較,這總比與未來進行比較容易得多,畢竟我們可以確定地知道過去已經發(fā)生了什么。
誠然,過去不會告訴我們目標是什么,但它確實提供了一條同樣重要,甚至更加重要的線索——過去是創(chuàng)新的指南。但與未來不同的是,過去不存在模糊性或欺騙性,因為我們實際上已經知道自己在過去的位置,于是我們能夠清晰地知道,如何將其與當前位置進行對比。這種比較不會讓我們判斷自己朝向目標的進展如何,但可以讓我們判斷我們在多大程度上擺脫了過時事物的束縛。有趣的是,這種比較將問題從“我們正在接近什么”,變成“我們正在逃離什么”,而逃離過去的有趣之處在于,它能夠開啟全新的可能性。
新奇事物的重要性在于,它們往往可以成為踏腳石探測器,因為任何新奇的東西,都是催生更新奇事物的潛在踏腳石。換句話說,新奇性是識別趣味性的一條“簡單粗暴”的捷徑,而有趣的想法往往能夠開辟全新的可能性。盡管去尋找“有趣的”事物,聽起來相當兒戲,但有趣性的概念,實際上蘊含著驚人的深刻意義。用著名哲學家阿爾弗雷德·諾思·懷特黑德(Alfred North Whitehead)的話說:“一個命題的趣味性比真實性更重要?!绷硪晃徽軐W家斯塔斯(W.T.Stace)補充說:“把‘趣味性’批判成‘一個微不足道的目標’,源自一種被扭曲和顛倒了的價值尺度?!毙缕嬗腥さ南敕ú粌H遠非微不足道,而且往往還會帶來新的思維方式,進而觸發(fā)更偉大的創(chuàng)新和發(fā)現(xiàn)。
更重要的一點是,通過不斷地使新事物成為可能,新奇性(以及趣味性)能隨著時間的推移產生聚合效應。因此,我們與其尋求某個最終的目標,不如轉而尋求新奇的事物,因為后者的回報,將是一連串的、無窮無盡的踏腳石,即一項新奇事物的產生,將帶來更多的新奇事物。這樣一來,未來就不再是某個特定的終點,而是一條沒有盡頭、未被定義、潛力無限的道路。這種不強調目標的觀點,更好地體現(xiàn)了類似圖片孵化器網站、自然界的進化和人類創(chuàng)新背后的邏輯——繼一塊踏腳石之后,再找到下一塊,不設定特殊方向地向外不斷地分化和延展,朝著所有可能的方向發(fā)展,最終形成一個不斷更新迭代的循環(huán)。
在圖片孵化器網站上,“外星人臉”被選中并不是因為它可能會繁育出汽車圖片,而是因為“外星人臉”本身就是一種有趣且新奇的東西?!巴庑侨四槨彼_辟的道路是值得探索的,因為它具備了潛力——不是那種通過智力測試或成績評估來衡量的、實現(xiàn)既定目標的潛力,而是類似一望無垠的海洋地平線上低垂的斜陽所具備的那種潛力,那種開放的未來所具備的超越一切的可能性。我們不妨嘗試抓住這種潛力,而抓住它們的關鍵,將是追逐新奇性。
但似乎仍有一個問題。追逐新奇性意味著一種漫無目的的不確定性,我們怎么知道要去哪里?這其實就是關鍵所在,最偉大的創(chuàng)新過程之所以會成功,正是因為它們并不試圖去往任何特定的地方。按照這個邏輯,我們需要放棄目標帶來的虛假安全感,轉而去擁抱未知的、瘋狂的可能性。當然,我們仍然有理由擔心,這種對新奇性的探索令人不踏實,甚至可能有點聽天由命。它難道不就是純粹地從一個新奇事物,跳轉到另一個新奇事物嗎?我們?yōu)槭裁匆嘈?,這樣一個隨機的過程存在任何意義?
擔心這種獵奇的心態(tài)可能不會帶來任何有意義的結果也符合人之常情。導致這種懷疑的一個主要原因與信息量有關。人們擔心,指導未知探索的唯一有用信息是通過思考探索的目標而獲得的。但事實上,新奇性蘊含的信息量并不遜色于目標概念,區(qū)別只在于二者提供的信息類型不同而已。事實上,驅動新奇性概念的信息比目標概念能提供的信息更豐富、更可靠,尤其是目標往往充當了一個錯誤的指南針。新奇性的概念不要求我們依賴于一個具有欺騙性的指南針,只要求我們將當前的位置與過去進行比較。
簡而言之,設定目標意味著遵循一條未知的路徑,朝著遙遠的目的地前行,而新奇性只要求我們遠離已經到過的地方。離開一個已經到過的地方,不僅更簡單輕松,還蘊含了更豐富的信息。因為我們可以回顧過去的整個歷史發(fā)現(xiàn),將其作為判斷當前新奇性的參考。因此,相信新奇性是推動進步的一臺有意義的引擎。
證明新奇性在創(chuàng)新中具備重要作用的另一個證據是,人類往往對新奇性非常敏感。有時候,哪怕我們不確定某條道路或某個想法會通向何方,但依然會有探索它的沖動。雖然人類的直覺和預感往往促使我們朝著沒有任何目標的方向前行,但我們最終依然能發(fā)現(xiàn)一些與眾不同或有趣的東西。因此,在討論新奇性時,趣味性的概念會自然而然地出現(xiàn),這并不是巧合。當一個想法真正讓人感到新奇時,它就足以讓我們產生好奇心。這個想法的確激發(fā)了我們的興趣,即使它的最終目的并不明確。
這個見解,與另一個耳熟能詳的謬論有關,即“偉大的發(fā)現(xiàn)都來自偶然”。其謬誤之處在于將偶然性看成一種意外。關于偶然發(fā)現(xiàn)的刻板印象,通常是一個瘋狂的科學家,因為意外而稀里糊涂地發(fā)現(xiàn)了一些足以改變歷史的重大突破。這不禁讓人聯(lián)想到某個動畫片的故事:主人公不小心將一瓶花生醬放到微波爐中,導致了爆炸,卻意外發(fā)現(xiàn)了反重力的秘密。然而,這種漫畫故事卻不當地抹黑了偶然性,因為偉大的發(fā)現(xiàn)從來都不是什么稀里糊涂的意外。
現(xiàn)實情況是,人類天生對有趣事物有著敏銳的嗅覺。大家都知道,如果我們選擇了一條有趣的道路,它可能會通往重要的目的地,盡管我們可能并不知道這個目的地確切在哪里??v觀“偶然性發(fā)現(xiàn)”的歷史,有無數個成功案例支持了這一觀點。但如果偶然性發(fā)現(xiàn)純屬意外事件,那就意味著沒有任何特殊的教育背景或智力水平的人,也能夠得出同樣的發(fā)現(xiàn)。因此,我們或許會假設,凌亂無序或瘋狂甚至是開啟偉大發(fā)現(xiàn)之旅的最佳方式。但在現(xiàn)實世界中,情況似乎并非如此。因為大多數重大的偶然性發(fā)現(xiàn),都不是外行人的瘋狂想法推動的。事實上,這些偉大的發(fā)現(xiàn),大多數都出自智力超群、受過良好教育且在各自行業(yè)內頗有建樹的人之手。
例如,牛頓偶然觀察到一顆蘋果從樹上掉下來,進而發(fā)現(xiàn)了萬有引力定律,但牛頓的職業(yè)生涯,并不僅僅局限于觀察從樹上掉下來的蘋果,他在數學、天文學和物理學方面還有許多其他的偉大發(fā)現(xiàn)。另一個例子是法國科學家路易斯·巴斯德(Louis Pasteur),他在化學領域做出了重大貢獻,也是微生物學的創(chuàng)始人之一。他的許多重要發(fā)現(xiàn)似乎都充滿了偶然性的色彩,包括“手性”分子(chiral molecules)(注:具有不同性質的鏡像形式的分子)和拯救了無數生命的細菌疫苗。像牛頓一樣,巴斯德始終能夠跨越多個學科進行創(chuàng)新。充滿偶然性色彩的偉大發(fā)現(xiàn),事實上不勝枚舉。例如,古希臘數學家阿基米德某天在洗澡時,突然意識到浴缸中所排出的水等于他身體的體積,于是就有了舉世聞名的“尤里卡時刻”:他赤身裸體沖過大街,大聲狂喊著“尤里卡”。但我們對阿基米德的印象,更多的是一連串的根本性的創(chuàng)新,如杠桿原理、“阿基米德式螺旋抽水機”和流體力學定律。所以,這些偉大的發(fā)現(xiàn)者并不是狂熱的、沒有受過教育的人,也并非全憑純粹的好運才得以邂逅偉大的發(fā)現(xiàn)。
在任何偶然性發(fā)現(xiàn)的背后,幾乎總有一位心態(tài)開放的思想家,他們對什么計劃會產生最有趣的結果往往有著強烈的直覺。雖然幾千年來,萬有引力定律一直靜默地存在于世間,但牛頓才是第一個發(fā)現(xiàn)它的人。正如胡威立(William Whewell)寫道:“世界上成千上萬的人,甚至是最善于探究和推測的人,都曾看到過物體的自然墜落;但除了牛頓,誰又曾關注過這一現(xiàn)象背后的因果關系?!边@些偉大的發(fā)現(xiàn)者,注意到了一些現(xiàn)象背后深刻的規(guī)律,這不僅僅是一種偶然或機緣巧合。正如巴斯德的一句名言:“在觀察的領域里,機會只青睞有準備的頭腦?!?/p>
如果偶然性的發(fā)現(xiàn)的確不是純粹的好運,那我們是否可以通過尋找新奇而有趣的東西,最終獲得偶然性的發(fā)現(xiàn)——哪怕我們的心中沒有設定一個具體的目標?如果這個想法行得通,我們應該從科學上證明這種獲取偶然性的方法是有效的,至少存在那么一個可以開展的實驗,以便為這個想法提供一些科學證據。事實證明,我們的確可以開展這樣的實驗,但請諸位做好心理準備,接受一種不同尋常的實驗程序。為了研究非目標性探索的前景,我們將設計一種沒有目標的計算機程序或算法。
乍看之下,一個沒有設定目標的計算機算法,似乎是一個自相矛盾的存在?!八惴ā边@個詞會直接讓人聯(lián)想到一些有既定方向的、機械化的東西,并且算法通常被視為解決某些特定問題的良方。人們已經設計出各種不同的目標驅動型算法,機械性地完成諸如求解微分方程、對大型列表進行排序和數據加密等任務。但本質上,算法是一種寬泛的概念。作為一種明確地描述一個過程的方式,算法是一個不存在任何模糊性的、解決問題的方法,從而確保計算機可以精確地遵循其指令。因此,雖然大多數算法都有目標,但它們也可以被用于描述沒有目標的過程,比如尋找新奇的東西。由于算法能被具體地編寫成可被分析和研究的計算機程序,它就可以幫助我們檢測科學假設是否成立。
編寫未設定具體目標的算法有一大優(yōu)點,即我們可以說到做到,將資金花在刀刃上。如果僅靠尋找新奇的事物就能有效地幫助人們發(fā)現(xiàn)有用的東西,那么我們就應該可以真正地將這個過程,以算法的形式正式呈現(xiàn)出來。在算法設計出來之后,它就可以被投入測試。這種通過構建算法來測試理論的理念,在人工智能領域(與心理學領域不同)已被普遍接受。事實上,在人工智能研究中,關于任何事物的解釋,只有在被構建成一個計算機程序并在計算機上運行和測試之后,才會得到普遍認可。這樣一來,人工智能領域成功的門檻就變得相當苛刻,因為人工智能的研究人員不能只是簡單地提供文字解釋,而是必須真正建立起一項理論的原型,并通過測試證明它是有效的。因此,在這種情況下,我們可以借用人工智能領域的這一準則,并將其應用于非目標發(fā)現(xiàn)的論證。讓我們看看,當我們給計算機編程,讓它只搜索新奇的東西而沒有設計特定的目標時會發(fā)生什么。
我們編寫的新算法被稱為新奇性搜索,其靈感來源是用戶們在圖片孵化器網站上的操作。我們發(fā)現(xiàn),這個網站的用戶獲取的最佳發(fā)現(xiàn)成果,往往并不是他們預先設定的目標。這些“成功玩出新花樣”的用戶,在選擇圖片時采用的標準,并非某個特定目標,而是憑借本能去尋找有趣而新奇的東西。這個發(fā)現(xiàn)就激發(fā)了我們嘗試通過編程,讓電腦來干同樣的事情的靈感。而將一個想法編寫成算法的一個好處是,它能迫使我們去搞清楚其真正的含義。換句話說,當機器在運行測試時,我們的意圖就不可能隱藏在某些含糊不清的文字表述背后。因此,要編制一個算法,我們需要首先決定計算機究竟應該如何搜索新奇的東西。
測試這樣一個程序的第一步是確定什么叫領域。換句話說,計算機只會在一個特定的類別中搜索新奇的東西,如新奇的藝術、新奇的音樂或新奇的機器人行為,等等。之所以要明確領域,是因為每個領域可能需要以不同的方式進行編程,但更重要的是,領域決定了算法即將探索的空間和范圍。
為了讓大家更容易理解這個概念,我們以行為空間為例,因為大多數關于新奇事物搜索的計算機實驗都集中在這個空間。通常在新奇性搜索中,“行為”一詞指的是真實或模擬的機器人做出的一系列舉動。更簡單地說,機器人的行為,是指它在特定情況下做出的舉動?;仡櫼幌挛覀冊诒緯谝徽轮杏脕硎顾锌赡艿膱D像具象化的、看不到邊的“大房間”。我們可以想象一個類似的、包含了無數機器人行為的大廳,其中一個角落里的機器人可能除了不停地轉圈什么都不做,而另一個角落里的機器人可能正在地板上臨摹《蒙娜麗莎》的輪廓。我們可以輕易地發(fā)現(xiàn),這個大廳里的一些機器人行為,與其他行為有很大不同。例如,一個四處撞墻的機器人,和一個在走廊上根據導航前進然后走進一扇門的機器人有很大不同。一旦我們有辦法了解到是什么區(qū)分了不同的行為,就有可能會問:什么是新奇的行為?
試圖發(fā)現(xiàn)新奇事物的行為可以幫助說明,即使沒有特定的目標,尋找新奇事物的行為也會產生有趣的結果。想象一下這個場景:一個機器人被放在走廊的一端,另一端的門是開著的。這類實驗在機器學習領域很常見,即試圖讓計算機具備從經驗中學習的能力。在實驗中,機器人會通過越來越熟練地探索走廊來學習如何接近走廊另一端的門口。例如,在一系列實驗中,機器人總是被放回其起始位置,它可能會具備更強的、穿越整個走廊的能力,并越來越接近敞開的門——這就是目標。在這種目標驅動的方法中,無論哪種行為會使機器人最接近敞開的大門,它都會成為嘗試新行為的踏腳石。這種將進步視為一系列逐漸接近目標的漸進式改進的觀點,也反映了在我們的文化中追求成就的常見方式。
但我們也可以用一種基于新奇性搜索的、截然不同的方式來處理這個任務。例如,機器人可以無需嘗試走到走廊的另一端,只是純粹地嘗試做一些與以往不同的事情。機器人可能會先撞上一堵墻,因為它一開始并不具備探索和穿越走廊的經驗。(見圖5.1)然而,與追求特定目標(即抵達敞開的大門)時不同,在新奇性搜索中,機器人撞墻的行為被認為是好事,因為我們以前從未見過它這樣做。換句話說,撞墻的行為是新奇的,而這正是我們在探索新奇性時想要看到的東西。但如果撞墻被視為好事,那么機器人接下來可能會做什么?
注:通過窮盡各種撞墻的方式,新奇性搜索可以增加機器人對探索和穿越走廊的理解,并最終使它發(fā)現(xiàn)出門的方法,盡管成功地出門并不是新奇性搜索的目標。
答案是,它可能會撞上另一堵墻,但只要第二次撞墻與第一次不同,也會被認為是好事。即使第二次撞墻比第一次離目標更遠,這仍然被認為是新奇性搜索的一個好的跡象,因為這一次與以往不同。如你所見,這種欣賞新奇情況而不加評判的態(tài)度,就已經使新奇性搜索有別于目標驅動型搜索了。
測試中的機器人撞上各種墻壁,聽起來可能并不那么令人興奮,但接下來發(fā)生的事情堪稱神奇,凸顯了新奇性搜索的力量。到了某個時刻,在撞了足夠多的墻之后,就沒有新的墻可以撞了。在那一刻,新奇性搜索已經窮盡了所有的撞墻選擇,然后一個值得注意的事實開始發(fā)揮作用:現(xiàn)在機器人要做一些新奇的事情,而唯一可行的辦法,就是不再撞墻。這個進步很有意思,因為學習避開墻壁,從未被表述為一個目標。但即使它不是目標,只追求新奇行為的機器人,最終也必須學會避開墻壁才有望繼續(xù)產生新的行為。
事實上,尋求新奇行為的機器人,最終甚至不得不進入另一端的大門,因為它將再次窮盡在同一走廊內的所有新奇行為的可能性。這個新奇行為實驗的結果令人費解:一個只被告知要尋求新奇行為的機器人,卻學會了如何避開墻壁在走廊里自如地穿梭,最終走向敞開的大門,而且這些動作都沒被當成指令、獎勵這樣的目標。按照這個邏輯,追求新奇性過程中所產生的行為的復雜性,似乎比預期更多。
同時,這種顯而易見的成功似乎只是“窮盡一切可能性”(計算機科學家稱之為窮舉法)后出現(xiàn)的結果。如果你真的有時間去嘗試世界上每一種可能的行為,最終也可能辦成一些“聰明事”,但你可能要花上幾乎一輩子的時間才能得到這個結果。這個方法聽起來有點愚蠢,但事實證明,新奇性搜索中的發(fā)現(xiàn)比簡單地嘗試每一個你能想到的行為都要更深入。新奇性搜索比窮盡可能性更有趣的原因是,它傾向于以某種特定順序來產生行為。
順序是探索和發(fā)現(xiàn)的一個關鍵因素。事實上,我們對任何一種搜索都充滿信心的主要原因是,我們期望它能指導人們以某種合理的順序發(fā)現(xiàn)通往成功的踏腳石。在目標驅動型搜索中,我們通常期望壞的行為出現(xiàn)在好的行為之前。換句話說,我們期望搜索行為的質量,在搜索的過程中不斷得到提升。這樣一來,目標將帶來一連串的發(fā)現(xiàn)這一結論似乎就合乎邏輯了。
但問題是,從壞到好的順序雖然充滿吸引力,但卻是不切實際的想法。這只是目標驅動的欺騙性——這個“老騙子”安排的另一種套路?;仡櫼幌轮袊镐D陷阱——在這個案例中,通往成功的唯一正確順序是“讓本就糟糕的情況,變得更糟糕”,然后才是“否極泰來”。所有的欺騙性問題都會在某一點(而且往往是在很多點)上,表現(xiàn)出這種誤導性的特性。因此,考慮到目標的欺騙性,只遵循從壞到好的順序,應該很難讓你相信最終有可能發(fā)現(xiàn)偉大的事物。這就像堅定地認為通過智力測試可以將單細胞生物培育成愛因斯坦一樣天真(事實上,在本書第七章中我們將看到,試圖只進行從壞到好的改進,在對學生進行測試方面,也能有驚人的新發(fā)現(xiàn))。這些失敗意味著我們可以不再擔心自己是否總是要追求從差到好,而是考慮放棄過分在意好與壞的明顯順序,這實際上可能反而更有希望令我們得償所愿。
如你所料,新奇性搜索會產生與眾不同的排序。它不會按照從壞到好的順序進行搜索,因為沒有一個目標作為標桿,它甚至不知道什么是“好”。盡管看起來,顯著的“新奇性”總是比微小的“新奇性”“更好”,但這完全取決于個人在當前看到的情況——因為其他有不同經驗的人,可能作出完全相反的判斷。當新奇性得到回報時,“更好”不會隨著時間而保持“更好”的地位。因為一旦機器人發(fā)現(xiàn)一個新奇的行為,隨著類似行為的持續(xù)發(fā)現(xiàn),其新奇性很快就會降低。
并且一種事物或行為是否被認定為新奇,完全取決于具體的時間和環(huán)境。事實上,在新奇性搜索開始之前,我們甚至無法判斷哪些行為更新奇或更不新奇,因為新奇性是一個相對的衡量標準。這就是為什么孤立地考慮新奇性是沒有意義的——某樣東西是否具有新奇性,完全取決于它之前是否被發(fā)現(xiàn)過。
目標驅動型搜索則截然不同:一輛擁有更高效能發(fā)動機的汽車,總是比一輛擁有更低效能發(fā)動機的汽車更節(jié)能環(huán)保,無論兩種汽車是什么時候被發(fā)明的。關鍵的區(qū)別在于,在搜索目標時,什么是更好的,什么是更壞的,其標準并沒有改變。新奇性搜索不能提供這樣一個持續(xù)不變的壞和好的概念,也不能形成一個從壞到好的排序。但事實上,新奇性搜索確實提供了一種更有趣的排序:從簡單到復雜。
雖然大多數人都熟悉這樣一個概念,即將進步視為一個從壞到好的過程。從簡單到復雜的變化,由于沒有設定明確的目標,很容易令人覺得陌生。但在某種程度上,后者更為合理,因為它不會受到目標的欺騙性的影響(因為你并未試圖從中獲取任何特定的東西)。尋找新奇事物的過程,將導致行為從簡單變得復雜,其原因本身就非常直接。當所有簡單的行為方式都耗盡后,剩下的唯一可以被發(fā)現(xiàn)的新行為,自然就會變得更復雜。例如,我們再回顧一下前文那個試圖穿越走廊的機器人。一開始,幾乎所有類型的行為都是新奇的,因為它之前從未嘗試過任何行為。而在絕大多數情況下,這些最初的行為往往是簡單的,就像很多簡單的發(fā)明往往是通往更復雜發(fā)明的踏腳石那樣。
這種簡單行為的一個例子,就是機器人一開始總是走直線,哪怕直接撞到墻。但什么才是真正“簡單”的行為?關于簡單的本質,我們可以長篇大論地說上好幾章,但在本書范圍內,簡單行為的關鍵特征是,它不要求掌握關于這個世界的任何信息或知識。撞墻是一種簡單的行為,因為機器人可以在不了解墻壁、走廊的情況下做到這一點,事實上它也不需要有感知任何事物的能力。我們只是簡單地打開機器人的前進馬達,讓對周圍環(huán)境一無所知的機器人無條件地向前跑。但如果機器人最終想要成功地在有墻面的走廊里穿行,就需要獲得一些關于墻的知識。這種新知識,就是新奇性搜索中化腐朽為神奇的一步——將無知無畏的探索,轉化為有意義的探索。最終,做一些新奇的事情,總會要求我們學習一些關于世界的知識。就好像如果不先學會走路,就不可能發(fā)明出一種新的舞蹈;而如果不了解(哪怕是潛意識的)重力和運動的相關知識,就無法行走那樣。
歸根結底,我們必須獲得某種知識,才能繼續(xù)創(chuàng)造新奇事物,這就意味著新奇性搜索是一種信息收集器,用于不斷積累關于世界的知識。搜索的時間越長,它最終積累的關于世界的信息就越多。當然,信息量和復雜性是相輔相成的,更復雜的行為必然需要更多的信息。
有趣的是,新奇性搜索并不是唯一一種不斷積累信息的搜索。信息的積累和復雜性的增加,是任何一種沒有設定明確目標的搜索的標志性特征。新奇性搜索是一種特殊的非目標搜索,但其他的搜索,比如自然進化,也明顯表現(xiàn)出了這種特征。雖然自然進化與新奇性搜索不同(我們將在本書結尾處第一個案例的研究中更深入地探討二者之間的關系),但它與新奇性搜索有一個共同的關鍵屬性,即它最終產生的東西,不是它最初設定的目標。由于這個原因,前面講到的自然進化也成為一個從簡單到復雜的信息收集器。
正如斯蒂芬·杰·古爾德 (Stephen Jay Gould)(注:斯蒂芬·杰·古爾德(1941—2002),美國人,世界著名的進化論科學家、古生物學家、科學史學家和科學散文作家)指出的那樣,在進化過程中,一旦所有簡單的生存方式都被開發(fā)殆盡,創(chuàng)造新物種或生態(tài)位的唯一途徑就會變得更加復雜。換句話說,進化成細菌類生命體的方式,無論有多少,都是有限的。這就是為什么如果自然界要繼續(xù)進化,復雜性的增加便幾乎是不可避免的結果。但是這些復雜性的增加,并不是任意的。相反,它們反映了進化過程所在的世界的屬性,例如眼睛的出現(xiàn),代表宇宙中光的存在,耳朵象征著機械振動的存在,而腿和肺部則分別是重力和氧氣存在的證明。
在對進化的常見解釋中,類似眼睛或肺部等器官的進化,可能被認為是目標導向性帶來的進步,因為它們提高了生物的生存能力。但它們也可以被看作一種不可避免的趨勢,由一項沒有最終目標的搜索,積累了關于其所處世界的信息所導致。畢竟,最初的單細胞生物并不具備眼睛或肺部這些花哨的器官,但它們依然存活得很好,沒出任何問題。唯一的問題是,生物如果想要做一些新奇的事情,就需要將自然界某些方面的信息反饋到其DNA中。嚴格來說,視覺驅動的行為,并不是生物生存的必要條件,但如果自然界通過突變,不斷嘗試設計新的物種,即使沒有設定任何特定目標或方向,進化過程也最終會意識到光的存在這一事實。然后,它將成為進化論積累的信息庫存的一部分。
從某種意義上說,經過漫長歲月的進化后,人類的身體已經成為一種關于人類所處的宇宙的相關事實的百科全書。不僅宇宙的許多物理現(xiàn)實已經反映在人類的身體結構中(例如光、聲音、重力、熱、空氣等),而且考慮到進化已經持續(xù)了如此漫長的時間,人類現(xiàn)在實際上已經在身體內部的某個地方,編碼了令人難以置信的、關于宇宙的具體細節(jié)信息。人類的大腦記得哪些行星是圍繞太陽旋轉的,甚至記得街角商店里百吉餅的價格。在人類的一生中,學習和適應的能力已經將進化的信息積累性質,推向了一個新的極端。當然,這并不意味著自然進化的這個信息積累過程,會因人類的出現(xiàn)而停止。但我們再次觀察到的是,沒有明確目標的搜索(在這種情況下指自然進化),從最簡單的單細胞生物進化到最復雜的動物的過程,也是不斷積累信息的過程。這就是為什么地球上的生物已經成為一面反映世界現(xiàn)實的鏡子,不同的物種,以龐大的多樣性,反映了我們身處的宇宙所賦予的、物質形態(tài)上的無限可能性。
這種非目標搜索的觀點,也解釋了這樣一個事實:圖片孵化器網站好比是一面鏡子,它向我們反映了一些關于人類世界的信息。畢竟,圖片孵化器網站就是在人類世界里誕生并不斷發(fā)展的。因此,它已經成為一個收集了人們熟悉主題的龐大目錄:從蝴蝶到人臉、從城堡到行星、從日落到宇宙飛船。盡管這些都不是它的目標,但它們都是在這個網站上被發(fā)現(xiàn)的。
與圖片孵化器網站或自然進化一樣,新奇性搜索是另一種類型的非目標搜索。它不像自然進化那樣神奇,但它的優(yōu)點是,可以變成一種能在計算機上運行的算法,因此我們可以科學地測試它,看看它能做些什么。它也提供了極大的便捷性,因為它可以應用于容易編程的領域,如走廊內機器人行為的簡單模擬??梢韵胂?,單機電腦游戲Pong(注:Pong是美國雅達利公司(ATARI)于1972年發(fā)行的一款投幣式街機游戲,該游戲模擬乒乓球比賽,玩家需要控制乒乓球拍上下移動來反彈乒乓球。如果一方未能反彈乒乓球,對方就會得到1分。該游戲被認為是世界首款視頻游戲)的編程肯定比完全沉浸式的現(xiàn)代三維射擊游戲(通常需要花費數百萬美元來開發(fā))要簡單得多。因此,要判斷非目標搜索在新奇性搜索中的優(yōu)勢,我們不必編寫最復雜的程序,例如展示地球所有的榮耀歷史,重現(xiàn)類似自然進化這樣的宏大脈絡,等等。如果它能夠像預期的那樣運作,我們應該能夠在新奇性搜索運行時發(fā)現(xiàn)信息收集器正在按由簡到繁的順序收集信息,并表現(xiàn)出明顯的非目標特性。為了不斷尋找新事物,最終機器人不得不發(fā)現(xiàn),周圍世界是由墻壁和門組成的,而它雖然會撞到墻壁,但卻能穿過門洞。
但是,即便你暫時接受了這個觀點,即搜索是從簡單到復雜的過程,你仍可能擔憂新奇性搜索最終會永遠地被困在毫無意義的行為之中,找不到任何有意義的出口。目標的設定之所以讓人放心,是因為它將無窮可能性的空間,壓縮到僅剩少數幾個實用的選項。例如,既然可以選擇開車去上班,那便沒有人會認真考慮爬行去上班的好處。換句話說,目標可以幫助剔除那些明顯“得不償失”的想法,這可以避免人們在與目標不相關的活動中白白浪費精力。相比之下,新奇性搜索似乎缺乏這種實用性的約束,這可能意味著它會導致我們浪費大量的時間,在毫無意義的可能性的空間里徘徊。
然而,我們有充分的理由相信,我們不需要目標的約束來避免無意義的浪費。物理世界自身就提供了很多約束。新奇性搜索不會考慮許多可以想象但無法實現(xiàn)的行為(例如人類依賴自身的軀體飛行),因為它們是不可能的。例如,機器人不能穿過一堵墻,所以即使我們可以想象瞬間移動(teleportation)(注:超心理學領域中超感官知覺的一種,指的是將物體傳送到不同的空間,或者自己在一瞬間移動到他處的現(xiàn)象與能力),這些行為都不會被考慮,因為瞬間移動是一種在物理層面不可行的行為,也就是說,這種搜索的空間不存在。
一般來說,人類可以想象的許多行為,都會因為現(xiàn)實物理世界的限制,而淪為同樣的結果。例如,我們可能想象過成千上萬種穿墻而過的行為,但是由于物理現(xiàn)實的限制,所有這些可想象的行為,在現(xiàn)實中都被簡化為同一個結局,即撞到墻上并停下來,因為穿墻而過根本就不可能實現(xiàn)。重力以類似的方式限制了人類的行為,所以無論你如何想象自己在天空中自由飛翔,當你從前廊跳下時,現(xiàn)實的結果幾乎總是同樣的不幸——摔得傷痕累累。
因此,在搜索新奇事物時,實際嘗試的行為空間變成人類可以想象的所有行為空間。這個空間雖然看似更大,但新奇性搜索的空間,僅是其中的一小部分,這也是新奇性搜索變得實際可行的前提。世界的物理特性限制了新奇性搜索能考慮的所有行為,這一想法也解釋了新奇性搜索積累世界信息的趨勢:真正成為下一步行為的踏腳石的那些行為,必須尊重現(xiàn)實世界運作的方式和規(guī)律?;氐缴衔牡睦?,開車去上班比爬行去上班更有可能獲得新奇感,因為你不需要將一整天的時間都花在上下班的路上。因此,在同時面臨這兩種選擇時,新奇性搜索會傾向于集中在開車去上班這一選項上,因為這是一塊更優(yōu)質的踏腳石。正是由于這個原因,進一步的探索最終會集中在有意義的概念,而非毫無意義的徘徊上。簡而言之,創(chuàng)造新奇事物的最佳方式,是利用世界真正運作的方式,并據此積累有關信息。
在這一點上,你可能會質疑新奇性自身,是不是某種特殊類型的目標。事實上,自從2008年首次推出新奇性搜索算法以來,我們已經反復聽到了類似的質疑。人們會對“沒有目標的發(fā)現(xiàn)會更好”這一反直覺的信息持懷疑態(tài)度,這是正常且合理的。每當有新的理論挑戰(zhàn)主流的世界觀時,人們自然會試圖恢復舊有的秩序,而一個常見的辦法便是通過重新解釋新的理論以適應舊的思維方式,避免徹底地推倒重來。本著這種精神,拯救目標驅動范式的最常見嘗試,是試圖將新奇性強制套入舊的目標驅動觀點,將新奇性本身描述為一個目標,但這種策略存在很大的弊端??吹轿覀冊谙挛幕仡櫰渲械囊恍┱擖c時,你可能會想起本書上一章中關于為什么生存和繁衍不是傳統(tǒng)目標的討論。但這里的區(qū)別是,我們關注的是更廣泛層面的問題,即新奇性本身是否應該被稱為一個目標。
就傳統(tǒng)目標而言,成功意味著得償所愿。例如,你想成為一名銀行家并最終成了一名銀行家,那么你的目標就實現(xiàn)了。關于目標,我們通常認為,當我們實現(xiàn)了所設定的目標時,目標就得到了滿足。但是——這就是把新奇性稱為目標的第一個問題——新奇性并不是這樣運作的。畢竟,如果你的行為與其他人不同(或與你過去的行為不同),你也可能會成為一名銀行家,但在這種情況下,成為一名銀行家并不是你的目標。在探索新奇事物的過程中,你成為什么或實現(xiàn)什么,永遠不是你的目標。因此,新奇性與目標有著本質的不同。
你可能會繼續(xù)駁斥說,即使一個人確實通過保持新奇,最終努力成了一名銀行家,那么他依然實現(xiàn)了保持新奇這個目標,哪怕成為一名銀行家并不是目標。然而,第二個問題隨之而來,“保持新奇”本質上是一個難以捉摸的、變化莫測的概念。我們不可能時刻牢牢地秉持這個理念。例如,如果你保持銀行家的身份太久,新奇性便喪失了。那么我們是否可以說,你已經不再滿足“保持新奇”這個目標了呢?從另一方面來看,如果你的目標是成為一名銀行家,而你最終也成了一名銀行家,這個目標就得到了絕對滿足,其滿足性并不會隨著時間的推移而變得模糊或難以界定。不僅如此,假設保持新奇是你的目標,那么你在成為銀行家的過程中可能更換過多種職業(yè),每一種職業(yè)都與上一份職業(yè)不同,實現(xiàn)了新奇的目標。這會令你陷入一個自相矛盾的境地,即在成為銀行家之前,你實際上已經多次實現(xiàn)了“保持新奇”的目標。那么就這個意義而言,成為銀行家對實現(xiàn)新奇性的“目標”是否還有意義?最根本的問題在于,將新奇性視為一個目標,需要我們扭曲自己的邏輯,以盡可能地套用傳統(tǒng)的、以目標為導向的思維方式。
然而,這種邏輯層面的扭曲完全沒有必要。我們在本書中探討“目標”一詞,是為了幫助諸位做出重要的區(qū)分,而不是掩蓋差別或混淆定義。如果你能仔細思考“新奇性是如何從簡單走向復雜的”這一問題,那么搜索新奇性的整個過程,與追求傳統(tǒng)目標的實現(xiàn),兩者之間存在本質性區(qū)別。這就是如果我們試圖用“目標”概括所有類型的發(fā)現(xiàn)和探索過程,就必須要做出前述邏輯扭曲的原因。目標是驅動成功的老式引擎,而新奇性則是不同的東西。為此,讓我們時刻牢記目標與新奇性這兩個不同術語的差異,而不是將二者混為一談。
同樣的邏輯過程也解釋了為何“新奇性搜索”很像自然進化中的“生存和繁衍”(這也是一種非目標型的發(fā)現(xiàn)過程)。兩者都是對可能發(fā)生的事情的約束,并且可能都在一開始得到滿足(就像單細胞生物也同樣滿足了“生存與繁衍”的“目標”)。這兩個過程,都催生出了并未被設定為初始目標的偉大發(fā)現(xiàn),且兩者均未設定任何具體的目標。這些都是非目標探索的顯著標志。
此類非目標進程的另一個重要且強有力的屬性,是它們與發(fā)散以及發(fā)散性搜索概念之間的關聯(lián)。目標在本質上會促使探索的過程朝著特定目標聚攏,而聚合效應則意味著許多潛在且有趣的方向將得不到探索。然而,剝離了目標的聚合性負擔之后,探索就可以自由地朝著多個方向分化,在不斷發(fā)散的同時,收集不同類型的新踏腳石。盡管發(fā)散性探索犧牲了朝著某個預定的方向進行探索帶來的舒適感和安全感,但發(fā)散性思維這個詞通常與創(chuàng)造力和創(chuàng)新聯(lián)系在一起也并非巧合。正是因為發(fā)散性思維者不會被困在“搜索空間”的一個陳舊角落里,所以他們通常以大膽無畏和令人驚訝的發(fā)現(xiàn)而聞名,其他目標導向者往往會因專注于目標而錯過這些發(fā)現(xiàn)。放棄設定明確的最終目標,新奇性搜索就成為一種發(fā)散性的搜索形式,從而成為類似自然進化和人類創(chuàng)新的探索和發(fā)現(xiàn)過程,并充分契合了這種更奇特和激進的發(fā)現(xiàn)形式。
正如前文所述,從科學的角度來看,新奇性搜索概念的一大吸引力是,它實際上可以被編成一種計算機算法,并進行可衡量的測試,這正是我們所做的。事實上,到目前為止,我們已經將新奇性搜索置于大量不同的場景中進行了測試,第一項就是機器人在迷宮中的模擬實驗。換句話說,我們對計算機進行編程,模擬機器人在圍墻式迷宮中的行為,類似于駕駛模擬器模仿汽車上路的狀況。這就好像電腦自己玩的一個簡單的視頻游戲。機器人模擬實驗在人工智能領域很常見,因為模擬的機器人可以非常迅速地反復嘗試新的行為,而且不存在器材損毀風險。下圖是其中一個迷宮的示意圖。
注:大圈代表機器人的起始位置,小圈代表目標位置。地圖中看似通往目標位置的死胡同具有欺騙性。
所以想象一下,一個帶輪子的機器人在迷宮中嘗試新奇性搜索,總是試圖做出一些新舉動,實驗將如何開展?基本的想法是,計算機程序可以先產生新的“想法”,然后機器人嘗試做出相應的行為。如果該行為在機器人嘗試時被證明是新奇的,那么該行為可能是有趣的,所以程序可以將其認作一個好主意。請注意,這種判斷想法質量的方式,與設定了具體目標的情況不同。例如,如果設定的目標是讓機器人從起點位置走到迷宮的終點,那么“好”的行為,就應該是那些讓機器人最終會比之前更接近迷宮終點的行為。
什么行為是好的或壞的是一個很重要的問題,因為程序將只會繼續(xù)探索被認定為“好”的想法。換句話說,新奇性搜索的希望在于,好的想法可能是通往有趣事物的踏腳石。因此,在嘗試了一系列的行為之后,程序決定專注于測試那些看起來有趣的行為。為了做到這一點,程序將采用這些新奇的想法并進行微調,繼而觀察是否會出現(xiàn)更有趣、更新奇的東西。如果機器人繞過一堵從未繞過的墻,那么對該行為的微調就有可能讓機器人走得更遠。另一方面,如果機器人做了以前做過很多次的事情(比如撞墻),那么這個行為就會被忽略,不會被進一步探索。這種專注于如何在迷宮中實踐更新奇的想法的方式,與任何其他類型的創(chuàng)造性思維相同,即你可能有一個有趣的想法,然后在思考一段時間后,發(fā)現(xiàn)它啟發(fā)了其他有趣的想法。
這將是實驗變得更耐人尋味的地方。想象一下,如果機器人不斷嘗試新的行為并進一步探索最新奇的行為,它就與我們在本章前文描述的那個機器人有點像:一開始總撞墻,然后知道了如何避免撞墻,最后學會穿過門洞。問題是,如果我們持續(xù)這樣的新奇性搜索過程,機器人最終會不會發(fā)現(xiàn)一個能破除整個迷宮的行為(換句話說,一個能驅動機器人從起點順利走到終點的行為),哪怕走出迷宮并不是它的目標?
實驗結果表明,答案是肯定的——如果我們運行一段時間的新奇性搜索算法,計算機將持續(xù)產生驅動機器人通過整個迷宮的行為。這個實驗結果很有趣,因為沒有人編寫讓機器人順利通過迷宮的程序。更重要的是,穿越迷宮從來都不是一個既定目標,該程序甚至不知道目標的存在。因此,有趣的是,新奇性搜索最終發(fā)現(xiàn)了一個看起來相當智能的行為,盡管從來沒有人告訴計算機它應該做什么。
但是,情況從這里開始變得更加復雜,因為新奇性搜索并不是我們利用這個機器人走迷宮程序進行測試的唯一算法。我們還利用機器人走迷宮來測試了一種傳統(tǒng)的、基于目標的探索方法:在這個測試中,一個驅動機器人更接近終點目標的行為被認定為更好的行為。換句話說,計算機將進一步探索那些驅動機器人更靠近目標的行為。這與大多數目標驅動型活動的運作方式相似,即我們不斷地將時間和精力投入那些能夠使我們更接近目標的行為上。
如果你是目標論的“粉絲”,并且認為目標是實現(xiàn)任何偉大的成就不可或缺的因素,那么你可能會認為:基于目標的方法在發(fā)現(xiàn)通往迷宮終點的行為方面,比新奇性搜索更可靠,因為后者甚至沒有設定任何目標。但實驗的結果恰好相反,新奇性搜索在探索走出迷宮的行為方面要可靠得多。具體來說,我們重復了40次新奇性搜索的迷宮實驗,機器人在39次實驗中找到了終點;而40次基于目標的迷宮實驗中,機器人只成功了3次。
試圖找到走出迷宮的行為,在大多數情況下都失敗了,而不嘗試這個目標的行為卻一直成功,這個結果的確出乎意料。是不是因為實驗設置存在一些缺陷呢?正如你可能猜到的那樣,自從最初的迷宮實驗以來,科學界已經針對這個問題進行過多次辯論,現(xiàn)在已經有很多科學文獻提供了此類討論的大部分細節(jié)。探討的結果表明,這個實驗有著堅實的基礎,并遵循了本書迄今為止一直在強調的邏輯,即只關注目標會導致欺騙性結局??此齐x目標更近的機器人,實際上經常會走進死胡同,這些死胡同與通往真正解決方案的正確路徑相去甚遠。我們可以在圖5.2中看到這些死胡同,它們就像其他欺騙性的陷阱一樣——實際上與中國指銬這種整蠱玩具沒有本質區(qū)別??雌饋砟茏寵C器人更接近終點的方向,最終卻成了錯誤的方向。另一方面,新奇性搜索不存在欺騙性問題,因為它連目標都沒有,也就談不上所謂的目標欺騙性了。它只是嘗試不斷發(fā)現(xiàn)帶來新行為的行為。最終,其中一個新行為,恰好幫助機器人解決了迷宮難題。
有些人認為,迷宮中的欺騙行為太明顯了,它被故意設置成一個迷惑機器人的問題。但實際上,它并不比任何其他欺騙性問題更具迷惑性——這意味著幾乎所有有趣的問題都是如此。不過,為了說服那些仍持有懷疑態(tài)度的人,我們確實在一個更自然的場景中嘗試了新奇性搜索實驗——雙足機器人(biped robot)。換句話說,我們試圖為一個擁有雙腿的模擬機器人尋找新奇的行為。
如果你的第一反應是,“雙足機器人想做什么?”那么你就忘了,新奇性搜索并不試圖做任何特殊的事情。它只是觀察雙足機器人正在做什么,正在嘗試什么新行為,而這些行為在被發(fā)現(xiàn)時,都是新奇的。因此,如果雙足機器人摔倒了,只要它此前從未以同樣的方式摔倒過,這就是一個好的行為。你認為一個尋找新奇性的雙足機器人,最終會做出什么行為?
答案是,雙足機器人學會了行走(見下圖)。并且新奇性搜索中的雙足機器人學會行走的方式,比設定了以行走為目標進行學習的情況更好。換句話說,一個嘗試越走越遠的雙足機器人,行走的距離反而不如一個試圖一次又一次地嘗試一些新奇動作的雙足機器人。不出所料,背后的原因依然是目標的欺騙性。因為通往行走這一發(fā)現(xiàn)的踏腳石不一定是走得好,甚至不一定是平衡感。摔倒或踢腿可能反而是比邁步更好的踏腳石(因為踢腿是擺動的基礎,而擺動是行走的基本方式)。但如果行走被設定為目標,那么摔倒就會被認定為最糟糕的一件事情。因此,新奇性搜索在這個實驗中的表現(xiàn),再次將目標驅動型搜索的表現(xiàn)遠遠甩在身后。
注:Frame=畫面(1、2、3、4……12)
有趣的是,我們進行的機器人走迷宮和雙足機器人的新奇性搜索實驗結果,并沒有“獨領風騷”太長時間,因為來自世界各地的研究人員,也開始關注新奇性搜索。由讓·巴蒂斯特·穆萊(Jean Baptiste Mouret)領導的法國科學家團隊,復制了迷宮實驗的結果 。在加拿大,約翰·杜塞特(John Doucette)將新奇性搜索應用于計算機程序的進化,這些程序用于控制試圖追蹤食物的人造螞蟻的行為。在捷克,彼得·克拉荷(Peter Krcah)發(fā)現(xiàn)新奇性搜索不僅有助于解決搜索行為的欺騙性問題,還有助于設計模擬機器人的身體 。在美國,希瑟·格斯伯(Heather Goldsby)用新奇性搜索來發(fā)現(xiàn)計算機程序中的錯誤。而在我們位于佛羅里達州的實驗室里,我們的同事塞巴斯蒂安·里西(Sebastian Risi)發(fā)現(xiàn),終生學習并適應其環(huán)境的機器人也可以從新奇性搜索中獲益。從其廣泛的應用可以看出,機器人迷宮和雙足機器人實驗的結果并不是空穴來風,反而證明在一般情況下,新奇性搜索有時可能比尋找一個特定的目標產生更好的結果。因此,通過不試圖實現(xiàn)任何目標的做法,我們往往能夠獲得更多發(fā)現(xiàn)——現(xiàn)在我們還擁有一系列實驗證據來支持這個結論。
當然,也有人證明了新奇性搜索的局限性,說它不能“一招鮮,吃遍天”。在進一步的迷宮實驗中,我們生成了數百個不同難度的隨機迷宮,并分別用新奇性搜索和目標驅動型搜索的方法來破解這些迷宮。數據顯示的趨勢是,隨著迷宮變得越來越復雜,新奇性搜索和目標驅動型搜索都無法破解迷宮,但目標驅動型搜索解決問題的能力衰減得更快。換句話說,新奇性搜索的能力維度更大,但也不是無限的。這個結果提出了一個深刻的問題:對于最復雜的問題,還有什么方法可以確保持續(xù)性地解決它們呢?
關于這個問題,或許不存在一個真正令人滿意的答案。許多人都幻想過這個世界上存在一個萬能的公式,能夠讓我們解決所有問題。這種想法是如此誘人,甚至吸引了很多人投入畢生的激情和時間。但這就好像歷史上的探險家對青春不老之泉的虛幻追求。我們可能一直從錯誤的角度來看待整個問題,也許我們根本不可能總是在想要滿足愿望的時候就能夠得償所愿。也許并不存在什么神奇的方法,讓我們總是可以達成每一個可以想象的目標。最終,人類所有探索和發(fā)現(xiàn)的行為都可能是徒勞的,正如我們將在本書下一章探討的那樣。但是,即使沒有萬能的方法,也不能阻止我們發(fā)現(xiàn)有趣的事物。哪怕我們的探索漫無目的,在前方未知的道路上依然埋藏著無數的寶藏。我們可以將它們都挖掘出來,享受它們帶來的意外之喜,即使我們無法預知“能發(fā)現(xiàn)什么”或“何時發(fā)現(xiàn)”。這就是趣味性和新奇性搜索教給我們的經驗。但是,為了最清楚地理解這一點,我們需要理解潛伏在所有發(fā)現(xiàn)方法背后的徒勞本質,這樣我們才能從目標的“一招鮮,吃遍天”的虛妄幻想中解放出來,繼而擁抱現(xiàn)實,讓自己成為一名擁有“即便沒有目標,也能發(fā)現(xiàn)意外之喜”這種強大能力的“尋寶者”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.