Facebook開源機器視覺工具 帶你從像素點中發(fā)現(xiàn)規(guī)律

2016-09-01
編輯:summer
瀏覽:
評論

在臉書的人工智能研究中心(Facebook AI Research, FAIR),我們正在將計算機視覺技術(shù)推向一個全新的階段——我們的目標是讓計算機能像人類一樣,從像素的水平去分析圖像和物體。

  大范圍的應(yīng)用

  視覺識別技術(shù)應(yīng)用范圍很廣。在此基礎(chǔ)上,計算機可以識別圖片中的物體,比如,無須為每張照片加上標簽,即可更容易地搜索某些圖片。失去視覺的人們也可以理解他們的朋友所分享的圖片中的內(nèi)容,因為無論圖片是否配有說明文字,系統(tǒng)都可以告訴他們。

   最近,我們演示了為盲人用戶開發(fā)的技術(shù):評估照片,描述其內(nèi)容。目前,視覺障礙的用戶在臉書新信息推送中遇到圖片時,只能聽到照片發(fā)送者的名字,以及“圖片”這個詞。而我們的目的是提供更加豐富的描述,比如“圖片包含海灘,樹,和三個微笑的人”。

  更進一步,放大我們正在開發(fā)的技術(shù),我們的目標是更加沉浸式的虛擬體驗:當用戶用手指掃過圖片時,系統(tǒng)為他們描述所觸摸的內(nèi)容,這樣用戶好像真的“看”到了照片一樣。

  繼續(xù)前行,我們會繼續(xù)改善檢測和分割算法。你可以設(shè)想這種圖像檢測、分割、確認能力應(yīng)用在商業(yè)、健康等其他增強現(xiàn)實領(lǐng)域的那一天。

游俠網(wǎng)

   另外,我們的下一個挑戰(zhàn)是將這些技術(shù)應(yīng)用在視頻中。在視頻中,物體是移動的,交互的,隨時間變化的。對于觀看視頻,對其中的物體進行實時理解和分類,我們已經(jīng)在計算機視覺方面取得了一些進展。實時分類能幫助發(fā)現(xiàn)相關(guān)和重要的直播視頻,而應(yīng)用更好的技術(shù)來檢測場景、物體、時間和空間上的動作會使得實時解說在某一天成為現(xiàn)實。對于持續(xù)推進這些技術(shù),為每個人提供更好的Facebook體驗,我們非常興奮。

提示:支持鍵盤“← →”鍵翻頁
0

相關(guān)評論

VR最熱資訊

關(guān)于游俠 | 廣告合作 | 人才招聘 | 投訴建議 | 聯(lián)系我們 | 網(wǎng)站地圖 | 版權(quán)保護投訴指引
Copyright @ 1999-2018 ALi213.Net All Right Reserved 蘇ICP備2023007791號-1
游俠網(wǎng) 版權(quán)所有