Google釋出機器學習API:在視訊中找東西更容易了

ADVERTISEMENT

新浪科技訊北京時間3月9日訊息,在舊金山GCNC(Google Cloud Next Conference)大會上,Google推出一個新的機器學習API,名叫“Cloud Video Intelligence”。有了這個API,開發者可以開發能在視訊內部偵測目標的應用程式,讓視訊變成可以搜尋、可以發現的視訊。比如我們可以用動詞、名詞代表這些目標物件,例如“跑”“狗”,然後進行搜尋。

API相當於服務與應用的橋樑。新API連線到“Google雲機器學習”(oogle Cloud Machine Learning)平臺,這個平臺主要用來計算;同時API又將帶註釋的視訊儲存到“Google雲儲存”(Google Cloud Storage)。用Google新API開發的應用程式可以獲得一些特殊功能,讓終端使用者在視訊內搜尋目標變得更加容易。

ADVERTISEMENT

Google介紹稱,使用者現在可以在視訊檔案中搜尋每一個瞬間,可以查詢事件,探尋意義;新技術還可以幫助使用者在視訊中確定名詞實體,搞清它們何時出現在視訊中。不只如此,新技術還可以檢索視訊、照片、每一幀之中的相關資訊,將訊號與噪音分離。

在演示樣本中,使用者在MP4視訊檔案中搜尋動物,檔案時長約為1.5分鐘。“Cloud Video Intelligence”會生成標籤,比如動物、野生動物、動物園、陸生動物、自然、旅遊、旅遊景點等標籤。演示視訊展示的是電影《瘋狂動物城》中出現的洛杉磯動物園。

新API可以偵測視訊場景。例如,在同樣的演示視訊中,Cloud Video Intelligence發現場景變化了48次,它可以實時偵測,當場景變化時為目標物貼上標籤。又例如,有一幕場景顯示的是狐狸Nick,API生成了7種標籤。還有一幕場景對準動物園的標誌,系統生成了2種標籤。請注意,這些標籤都是實時生成的。

ADVERTISEMENT

Google開發了一套工具,使用者可以利用工具在視訊中搜尋目標,正如在檔案中搜尋一樣。

“一直以來,Google就在與全球大型媒體公司合作,幫助它們從結構化資料(比如視訊)挖掘價值。”Google雲AI、機器學習首席科學家李飛飛(Fei-Fei Li)在部落格中表示,“這個API面向大型媒體機構、消費科技公司,它們可以建立自己的媒體庫,尋找更簡單的方法管理眾包內容。”(雲外)


» 新浪科技

ADVERTISEMENT
ADVERTISEMENT