雖然演示中的這些行為都比較簡單,不過確實很有意思。而OpenAI官方表示:所有這些小人兒都是獨立的,只能通過自己的觀察來認識世界,視野外的物體對他們來說都是不可見的,這很好地模擬了現(xiàn)實場景。所有復雜的策略都需要小人兒自行學習。
小人兒學會了搭建小屋躲避追蹤
除了捉迷藏游戲,OpenAI官方還進行了另一種模式的訓練,該模式?jīng)]有目的可自由探索,不過系統(tǒng)會鼓勵小人兒與物體交互。這種模式下小人兒的行為則無跡可尋,根本看不出小人兒要做什么。因此OpenAI認為像捉迷藏那樣的多角色競爭模式更利于訓練人工智能形成類人行為。
小人兒需進行成千上萬次訓練,不斷進化、學習
最后OpenAI表示,這種多角色互動、不斷適應型訓練模式可能在未來打造出更加復雜、更加聰明的人工智能。