遊戲領域AI運用:編劇戰鬥識中文對答 自拍生成3D角色
【遊戲的應用強化學習】世界較大的StarCraft 2和Dota 2 這兩款遊戲開發的遊戲AI——DeepMind和OpenAI已達到人類頂級玩家的水平,但是在商業遊戲投入了巨大的訓練資源進行AI研究,似乎並不合理。與這種現象反之的,是在遊戲上積累更多商業經驗的中國公司,然而,他們也帶來了能造就頂級玩家體驗的科技分析。
網易的「伏羲實驗室」是中國首家遊戲AI研究機構,就強化學習引入遊戲AI開發的成果入選遊戲開發者大會(GDC)2020,是中國首個入主GDC核心的遊戲研發方向提案。主要研究方向有:強化學習 Reinforcement Learning;自然語言處理 Natural Language Processing(NLP);圖像動畫 Computer Vision & Graphics;用戶畫像 User Persona;虛擬人 Virtual Human,並在大數據平台等眾多領域。
伏羲實驗室負責人李仁杰為《魔獸爭霸》工作,又在參與過《英雄聯盟》制作。基於網易遊戲的AI開發需求(=對科研機構很重要的資金來源決定研究方向),實驗室力圖全方位發掘人工智能技術在遊戲中的應用潛力。
直接生成「個人專屬」遊戲角色的智能捏臉系統
上傳一張2D照片,人工智能會根據它生成人臉﹑還符合遊戲裡的風格的3D模型。伏羲實驗室、密歇根大學、北航和浙大的研究者提出了一種遊戲角色自動創建方法,利用 Face-to-Parameter 的轉換快速創建遊戲角色,用戶還可以自行基於模型結果再次進行修改,直到得到自己滿意的人物。
強化學習AI 強到網友建議學電腦打
在MMORPG《逆水寒》的戰鬥中,採取了漸進式的課程學習方法,讓AI先從近距離的戰鬥開始訓練,進行訓練進行慢慢拉遠雙方距離, 最終導致AI學會更高層次的策略:追踪,逃跑等。實現了AI在打法和技能combo的使用上合理與流暢,也更像真實玩家會選擇的操作,討論區甚至建議新手學習AI打法。
全面匹配各個水平段位玩家,提升遊戲體驗
不同的獎勵參數意味著AI有不同的目標(偏激進、偏保守等類),而主訓練的Agent將在訓練過程中遇到這些不同目標的AI,並努力去打敗它們,從而減少上線之後AI無法適應玩家多樣化打法的風險。《潮人籃球》團隊最終採用了分層強化學習方法,讓上層網絡決策宏觀策略(如防守或擋拆),下層網絡則在上層網絡的指引下學習具體的操作。
為了滿足手機的硬件需求,讓AI在遊戲中運行地更加流暢,伏羲實驗室還使用了人工智能領域的壓縮和蒸餾技術,將龐大的模型壓縮到將近原先一半。在效果損失不大的情況下,讓速度提高一倍。
不是人的創作者 AI可以創造遊戲劇情
AVG(文字冒險遊戲)《遇見逆水寒》推出新玩法「大宋傀儡戲」,官方表示這是中國首個AI接入遊戲中,與玩家共同創作劇本的玩法。遊戲開始後,玩家輸入的言語就是所扮演角色的對白,而AI會依據玩家的對白編寫故事。如果AI識別其創作的故事達成了階段目標,戲劇就此會進入下一輪,直到故事達成最終目標。
當然任何機器訓練系統都不會是完美的,如果玩家亂寫不切合情境的對話,AI 也會答非所問。故官方還加入了讓完結了一段劇情的玩家,用送花和砸石頭兩個選項去評定AI編寫的段落合不合理。據伏羲實驗室介紹,這次使用的就是有7億個參數的「GPT-2的中文語料訓練」,它是強大的NLP模型,是目前我們能看到的有助於更加通用的語言智能的重要路徑之一。GPT-3 除了能問答、寫文章,甚至能寫代碼。
具體來說,GPT-2 生成型預訓練轉化(General Pretrained Transformer),先是經過了海量中文小說的預訓練,他們用來訓練的文字資料將近有30 GB(數百萬字的小說通常為20mb內)。然後再熟讀了《遇見逆水寒》的劇本,才有了故事劇情的生成基礎。國外有一款使用同類型 GPT-2 的遊戲名為 AI Dungeon,是首先擁有著無限可能的文字遊戲,使用人工智能來生成無限的開放式故事情節。
另一個可以參考的案例是,此前一款手機遊戲《倩女幽魂》的生育系統中,讓孩子可以根據玩家用中文與它聊天的內容自我學習。養育方式不同,智能小孩的性格和技能也不同讓玩家養育主角的體驗更加真實,這也是第一次有遊戲把對話式的AI技術運用在MMORPG中。除了AVG,NLP技術對其他女性向﹑生活及社交模擬﹑動作角色扮演遊戲的影響,估計也能促使玩法突破。
文章參考:遊戲葡萄﹑網易遊戲雷火伏羲招聘﹑機器之心