原創|行業資訊|編輯:陳俊吉|2017-02-24 09:40:05.000|閱讀 223 次
概述:這篇文章將要討論一種角色人工智能(character AI)的新形式。它與腳本動畫當中的動作捕獲非常相似,這種新技術也許可以通過觀察真實的人類產生的行為從而革新交互性角色被創建的方式。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
這篇文章將要討論一種角色(character AI)的新形式。它與腳本動畫當中的動作捕獲非常相似,這種新技術也許可以通過觀察真實的人類產生的行為從而革新交互性角色被創建的方式。
我將通過一個產品來說明我們在此技術上的領先地位。
bots_alive —— 一個邊玩邊找出路的機器人
我們今天在 Kickstarter (這里的活動)上推出了 bots_alive。這里是一分鐘的預告視頻,主要是腳本運動。
該產品(the Hexbug® Spider)是一個智能手機套件,可以使一個流行的遙控玩具(RC toy)擁有簡單卻逼真的自主權。
該視頻展示了我們最初的產品設計理念。在新的角色技術驅動其核心功能之后,現在你可以看到它是如何運作的。
觀察全速播放視頻,從而理解高級行為。使用 YouTube 的控制功能降低速度,以查看更多低級別的行為,比如好奇和不確定的時刻。
訓練數據以建立角色
以一種新方式為那些機器人構建角色人工智能(character AI)。下面是其工作原理。
人類在許多不同的場景中遠程操控機器人。遠程操控者就像是即興的傀儡師;他(她)遵循著啟發式方法,也理解機器人并真實地回應所發生的,無論是好奇,恐懼,歡慶或是另一種情緒。
對于 bots_alive,操控者通過屏幕看到系統所看到的鏡像并按下按鈕以發送前進、后退、左、右、前右、前左、后右或者后左的指令。我們同樣認為不按按鈕意味著無動作的指令。
從那些遠程操作會話中,我們收集訓練數據,其中包含 (a)遠程操作指令和 (b)所給出的每一個指令的上下文信息。應用被稱為監督學習的一類機器學習來創建操縱者的模型,問題得到了有效解答。
在上下文 X 中,遠程操控者給出命令 Y 的概率是多少?
構建一個行為模型
所有這些都發生在開發過程中。在最終用戶手中,機器人由模型自主控制。而模型的操控者則是角色人工智能(character AI)。
我們假設,在訓練數據中的上下文信息足夠證明為什么遠程操控者選擇一個動作而非另一個。然后,數據包含著自發性、不確定性以及由人類操控者所展示出的社會真實性。如果機器學習有效,則自動機器人將保有這些品質。
為什么選擇使用帶來麻煩的機器學習?
我們期待這個過程可以創造出比傳統角色人工智能(character AI)更加自然和鮮活的角色人工智能(character AI)。
傳統的方法包含了想象和書寫行為規則或者有限狀態機。比起作為操縱者沉浸在某一個情況中,這更像是一個抽象的練習。
如果你玩視頻游戲, 想象一下你有時會對你控制的角色產生共鳴。你甚至會忘記你們之間的距離,作為那個角色來體驗世界。如果你為這個角色簡單書寫了一套規則使其依靠規則行動,比起這個角色將會做的,你的控制在這些時刻是不同的,這個不同介于高水平和微小運動之間。
差異中蘊含著這種開發角色人工智能的方法的前景
在心理學的研究方法中,有一個廣泛的共識,如果你想要知道一個人在某種情況下將要做什么,你不要詢問他們會做什么。將他們置于這種情況下并進行觀察。傳統的角色人工智能(character AI)開發就像是在詢問人類開發員或者設計師。與之相反,我們的方法類似于對沉浸在角色體驗中的人進行觀察。這就是為什么我們期待它創造更加真實的角色。
我們的方法是一種被稱為 從示范中學習 的應用。很多時候,遠程操控需要包含人類與角色的互動,我們則對遠程操控保密,這樣人就不會因為和一個機器角色互動而對自己的行為有所改變。在 MIT 的多媒體實驗室,當它還是一個研究項目時,我們創建了這個保密的版本 (learning from the wizard 或者 LfW)。這個名字結合了 從示范中學習 和 Wizard of Oz 實驗范式。
我的第一份工作是通過人類遠程操控和機器學習來創建角色人工智能(character AI),與 Sam Spaulding 和 Cynthia Breazeal在 MIT 的多媒體實驗室完成。
作為交互式機器學習訓練
在我們的開發中,我是遠程操控者以及機器學習程序員。
訓練過程不僅僅是一連串的證明。不如說,它是一個關于證明的迭代過程。
將機器學習應用在示范數據集上,
從已知模型中觀察行為
在機器人不能令人滿意地行動的情況下,創建更多的范例。
應用機器學習等等
交互式機器學習的通用表示。來自 Amershi 等人,2015。 Power to the People: The Role of Humans in Interactive Machine Learning。 在 AI Magazine。
在這些迭代中,遠程操控者和算法設計者還會反映出上下文信息中什么地方需要被編碼以提升其學習能力,確定上下文不能被編碼并且因此應該被遠程操控者忽略,比起原始的操控者,這樣可以發現樂趣和更令人愉快的行為。
我們如何知道這是更好的呢?
我們不能。不能 100% 保證
但是我們已經看到它可以作出令人信服的角色人工智能(character AI)。
我們在 MIT 的研究中已經看到了它。在一個相對較大的隨機試驗中,孩子們與人類遠程操作的機器人或者一個從先前的遠程操作中學習自主行為的機器人互動。與無機器人的情況相比,遠程操控機器人和通過機器學習編程的自主機器人從它們的人類交互伙伴中引出了類似的行為。奇怪的是,當詢問孩子們這些機器人是遠程遙控的還是自主的時候,在每個條件下都會有大約一半的人認為這是人類操控的。如果你熟悉圖靈測試(Turing Test),一種廣為人知的檢測人工智能有效性的測試,你可能會意識到,MIT 的研究構成通過了一個狹隘和社會性的圖靈測試(Turing Test)。
在 2004 年的虛擬聯賽(Unreal Tournament),引人注目的角色人工智能(character AI),使用了類似于從演示中學習的技術,通過了另一個狹隘的圖靈測試(Turing Test)。在另一個針對機器人的年度學術競賽中,BotPrize 是類人型的最佳傳遞者。2012 年獲獎者是 Jacob Schrum、Igor Karpov、和 Risto Miikkulainen 的機器人。它結合了算法優化 — 這導致了仍然可以達到特殊目標的顯著非自然行為 — 的對抗效應以及選擇性記錄人類行為的重放。25 個人類的判斷者和虛擬機器人一起玩,在對抗中重復判斷其他角色是人類操控還是智能的。Schrum 和同事的機器人被判斷為人類的次數超過 51.9% 。這個百分比僅僅低于被判斷為最人性化的兩個人類角色之下,分別為 53.3% 和 52.2%。這里是算法描述。
Schrum 和同事的機器人在對抗
最后,在我們 bots_alive 的測試中,我們也可以看到從對人類操控的觀察中創造令人矚目的角色人工智能(character AI)。
這種基于操控的方法的局限性是(1)感測和編碼上下文信息(2)有效地應用機器學習。學術界和工業界正在深入地研究如何突破這兩個限制。在過去 10 年中取得了重大進步,最顯著的是通過深度學習,因此看來進一步的改善還未到來。
另一方面,我們的能力是否可以編寫行為法則來編碼真實的行為與生命的錯覺?我并沒有看到一個理由來說明這樣做對其有改進的意義。
我們的 bots_alive 機器人生物將是被我們稱為學習魔法師的技術的第一次重大測試。
我鼓勵你自己去感受它。查看我們的測試和實時演示視頻。如果你有足夠的興趣,趕快加入我們的 Kickstarter 運動,并為你自己拿到一個或者兩個機器人。
擁有一個機器人,你可以判斷他們是否在一個鮮活、可信的角色中邁進了一步。
文章來源:機器之心 翻譯
原文鏈接://medium.com/mit-media-lab/building-character-ai-through-machine-learning-7a3159dc4940?imm_mid=0ed405&cmp=em-data-na-na-newsltr_ai_20170213#.izd8d2gyr
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn