麻省理工學(xué)院:預(yù)測他人在路上的行為
人類可能是讓全自動駕駛汽車遠(yuǎn)離城市街道的障礙之一。
如果機器人要在波士頓市中心安全地駕駛車輛,它必須能夠預(yù)測附近的司機、騎自行車的人和行人接下來會做什么。
然而,行為預(yù)測是一個棘手的問題,目前的人工智能解決方案要么過于簡單(他們可能假設(shè)行人總是走直線),要么過于保守(為了避開行人,機器人只是將車停在公園里),要么只預(yù)測一個代理的下一步動作(道路通常同時承載許多用戶。)
麻省理工學(xué)院的研究人員為這一復(fù)雜挑戰(zhàn)設(shè)計了一種看似簡單的解決方案。他們將多智能體行為預(yù)測問題分解成更小的部分并單獨處理每個部分,因此計算機可以實時解決這一復(fù)雜任務(wù)。
他們的行為預(yù)測框架首先猜測兩個道路使用者之間的關(guān)系——哪輛車、騎自行車的人或行人擁有通行權(quán),以及哪個代理會讓路——并使用這些關(guān)系來預(yù)測多個代理的未來軌跡。
與自動駕駛公司 Waymo 編制的龐大數(shù)據(jù)集中的真實交通流量相比,這些估計的軌跡比其他機器學(xué)習(xí)模型的軌跡更準(zhǔn)確。麻省理工學(xué)院的技術(shù)甚至優(yōu)于 Waymo 近發(fā)布的模型。由于研究人員將問題分解為更簡單的部分,他們的技術(shù)使用的內(nèi)存更少。
“這是一個非常直觀的想法,但之前沒有人充分探索過,而且效果很好。簡單是一個優(yōu)點。我們正在將我們的模型與該領(lǐng)域的其他模型進(jìn)行比較,包括來自該領(lǐng)域公司 Waymo 的模型,我們的模型在這個具有挑戰(zhàn)性的基準(zhǔn)測試中實現(xiàn)了性能。這對未來有很大的潛力。計算機科學(xué)與人工智能實驗室(CSAIL)成員。
與黃和威廉姆斯一起參與論文的還有來自中國清華大學(xué)的三位研究人員:共同主要作者、研究助理孫喬;顧君如,研究生;和作者趙航博士'19,助理教授。該研究將在計算機視覺和模式識別會議上發(fā)表。
多個小模型
研究人員的機器學(xué)習(xí)方法稱為 M2I,它需要兩個輸入:汽車、騎自行車的人和行人在交通環(huán)境(例如四向交叉路口)中交互的過去軌跡,以及帶有街道位置、車道配置等的地圖。
使用此信息,關(guān)系預(yù)測器推斷出兩個代理中的哪一個首先擁有通行權(quán),將一個分類為通過者,一個分類為屈服者。然后一個預(yù)測模型(稱為邊際預(yù)測器)猜測通過代理的軌跡,因為該代理獨立運行。
第二個預(yù)測模型,稱為條件預(yù)測器,然后根據(jù)通過代理的動作猜測讓步代理將做什么。系統(tǒng)預(yù)測出讓者和通過者的許多不同軌跡,分別計算每一個的概率,然后選擇發(fā)生可能性的六個聯(lián)合結(jié)果。
M2I 輸出預(yù)測這些代理將如何在接下來的 8 秒內(nèi)通過流量。在一個示例中,他們的方法使車輛減速,以便行人可以過馬路,然后在他們通過交叉路口時加速。在另一個示例中,車輛等到幾輛汽車通過后才從一條小街轉(zhuǎn)向繁忙的主干道。
雖然這項初步研究側(cè)重于兩個代理之間的交互,但 M2I 可以推斷許多代理之間的關(guān)系,然后通過鏈接多個邊際和條件預(yù)測變量來猜測它們的軌跡。
真實世界的駕駛測試
研究人員使用 Waymo Open Motion 數(shù)據(jù)集訓(xùn)練模型,該數(shù)據(jù)集包含由安裝在公司自動駕駛汽車上的激光雷達(dá)(光檢測和測距)傳感器和攝像頭記錄的數(shù)百萬個涉及車輛、行人和騎自行車者的真實交通場景。他們特別關(guān)注具有多個代理的案例。
為了確定準(zhǔn)確性,他們將每種方法的六個預(yù)測樣本(按置信度加權(quán))與場景中汽車、騎自行車者和行人所遵循的實際軌跡進(jìn)行了比較。他們的方法是準(zhǔn)確的。它還在被稱為重疊率的指標(biāo)上優(yōu)于基線模型;如果兩條軌跡重疊,則表明發(fā)生了碰撞。M2I 的重疊率。
“我們不只是建立一個更復(fù)雜的模型來解決這個問題,而是采用了一種更像人類在推理與他人互動時的思維方式的方法。人類不會對未來行為的所有數(shù)百種組合進(jìn)行推理。我們做出決定的速度非常快,”黃說。
M2I 的另一個優(yōu)點是,因為它將問題分解成更小的部分,用戶更容易理解模型的決策。黃說,從長遠(yuǎn)來看,這可以幫助用戶更加信任自動駕駛汽車。
但是該框架無法解釋兩個代理相互影響的情況,例如兩輛車在四向停車時各自向前輕推,因為司機不確定誰應(yīng)該讓步。
他們計劃在未來的工作中解決這一限制。他們還希望使用他們的方法來模擬道路使用者之間的真實交互,這可用于驗證自動駕駛汽車的規(guī)劃算法或創(chuàng)建大量合成駕駛數(shù)據(jù)以提高模型性能。
“預(yù)測多個交互代理的未來軌跡尚未得到充分探索,并且對于在復(fù)雜場景中實現(xiàn)完全自治極具挑戰(zhàn)性。M2I 提供了一種非常有前途的預(yù)測方法,其關(guān)系預(yù)測器可以區(qū)分邊緣預(yù)測或有條件預(yù)測的代理,這顯著簡化了問題,”加州大學(xué)伯克利分校機械工程杰出教授和 Wei助理專業(yè)研究員詹在一封電子郵件中。“預(yù)測模型可以捕捉代理之間的內(nèi)在關(guān)系和交互,以實現(xiàn)的性能。” 這兩位同事沒有參與這項研究。
這項研究得到了高通創(chuàng)新獎學(xué)金的部分支持。豐田研究所也提供資金支持這項工作。