《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > MEMS|傳感技術(shù) > 業(yè)界動態(tài) > 2016年展望 語音 圖像識別及大數(shù)據(jù)

2016年展望 語音 圖像識別及大數(shù)據(jù)

2016-02-17

  圖像、語音成為近兩年最熱門的概念,所謂娛樂驅(qū)動市場,市場驅(qū)動技術(shù)發(fā)展。在多元化的互聯(lián)網(wǎng)圈里“好玩”才能紅,而圖像與音像也從過去的美化處理往更高深的技術(shù)領(lǐng)域前進,在2016年,智能的語音識別和圖像識別將走進普通人的生活中,它們會有哪些展望和動作呢?讓我們所見所聽的世界將變得生動起來。

  語音識別

  語音識別技術(shù)雖然起源于1952年,但真正進入消費市場已經(jīng)是上世紀(jì)90年代的事了。目前語音識別有兩大發(fā)展方向,一個是純機械指令,基于產(chǎn)品定位而設(shè)計命令詞組,作為高效的輔助工具存在;一個是智能化理解語境,與人進行互動交流,并承擔(dān)部分處理工作。后者可能是語音識別未來的發(fā)展方向,但實際應(yīng)用中兩者并不沖突。簡單精準(zhǔn)的機械指令讓工作更為純粹,沒必要做多余的計算動作。而很多智能設(shè)備將語音作為“解放雙手”的第三類互動形態(tài),就需要對人的語境進行“理解”,相信很多朋友都玩過siri、GoogleNow、Cortana,也同時體驗過這些語音助手“會錯意”的賣萌行為。老羅在去年堅果發(fā)布會上曾說所有語音助手都是“偽”智能,雖然有點以偏概全,但目前語音對語境的識別確實還不夠智能,遠(yuǎn)不如機械指令效率。不過這些問題隨著深度學(xué)習(xí)等AI領(lǐng)域技術(shù)的崛起將逐漸克服。

  圖像識別

  圖像識別從以圖搜圖到明星、物體識別,再到場景識別,甚至現(xiàn)在延伸到了視頻領(lǐng)域,給行業(yè)帶來了太多驚喜?,F(xiàn)在圖片內(nèi)容的價值已經(jīng)超越圖片本身,并且建立了從圖片到電商的商業(yè)模式。圖像識別一般針對畫面中一個對象做識別,比如大眾熟知的人臉、明星臉等識別技術(shù)已經(jīng)很成熟了,基本識別率達(dá)到90%以上。近年、服飾品牌的同款識別和風(fēng)景識別大行其道,為旅游行業(yè)和服飾行業(yè)創(chuàng)造了商機。圖像識別在視頻領(lǐng)域涌現(xiàn)出強大的應(yīng)用前景,新興起的互動視頻技術(shù)video++已經(jīng)實現(xiàn)視頻中的人臉和服飾同款的識別,基于圖像識別技術(shù)發(fā)展視頻中的商業(yè)場景。另外瞳孔識別的研究已經(jīng)提上日程,不久的將來,科幻片中所見即所得的情景不再是幻想。

  深度學(xué)習(xí)

  沒有基礎(chǔ)的技術(shù)實力,語音和圖像是好玩不起來的,而高級和低級的門檻就在深度學(xué)習(xí)的研究上。國內(nèi)雖然起步較晚,好歹在去年趕上了這波風(fēng)潮,包括圖像識別和語音識別在內(nèi),還有自動駕駛、無人機、環(huán)境還原、機器人等項目,前段時間很火的谷歌AlphaGo在圍棋領(lǐng)域擊敗了歐洲二段冠軍,也是歸功于深度學(xué)習(xí)的算法支持。可以說跟用戶有交互行為的產(chǎn)品,都開始進行深度學(xué)習(xí)AI的研究了。通過神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí),語音識別變得更聰明, 實現(xiàn)快速精準(zhǔn)的識別動作以外,還能對下一句的語境情緒進行預(yù)測,模擬真人對話。另外,語音識別大量運用在翻譯市場,爭取未來十年內(nèi)在專業(yè)翻譯領(lǐng)域完全替代人類。圖像識別過去大多是建庫識別,深度學(xué)習(xí)釋放了圖像識別的識別領(lǐng)域,把識別對象的年齡變化記憶下來,實現(xiàn)動態(tài)、多角度、不同光照變化下的識別。

  應(yīng)用領(lǐng)域

  安防市場是要求語音和圖像識別技術(shù)雙高的行業(yè)之一,未來將不局限在解鎖開門等基礎(chǔ)功能,運用圖像識別技術(shù),實現(xiàn)對象動作識別,根據(jù)威脅等級進行危險性判斷,提前發(fā)出警報或報警。語音識別的運用領(lǐng)域?qū)⒊叨嘶l(fā)展,近年來語音識別速度屢創(chuàng)新高,在翻譯市場、智能硬件助手、AI輔助,行車幫助等等方面實現(xiàn)價值。而娛樂領(lǐng)域的玩法變得多元化,像最近大熱的faceu,運用了臉部識別跟蹤技術(shù),讓普通的自拍可以DIY。還有video++視頻開放平臺,可以對視頻中的明星、衣服同款進行識別搜索,打開了視頻到電商的入口。乘著去年SaaS的風(fēng)口,國內(nèi)外陸續(xù)出現(xiàn)了語音識別、圖像識別的技術(shù)開放平臺,從專業(yè)到普通領(lǐng)域,語音識別和圖像識別將在2016年做到技術(shù)全覆蓋。

  大數(shù)據(jù)

  數(shù)據(jù)收集是一個從被動到主動的過程,語音識別從接受指令變成了對指令使用頻率的分析,進而形成用戶的習(xí)慣圖表。圖像識別亦然,針對用戶的識別頻率,分析出用戶的興趣畫像,這將給予廣告主帶來精準(zhǔn)廣告推送的商機。

  結(jié)語

  2016年將是“最好玩”的一年,語音識別和圖像識別讓我們跟智能設(shè)備之間的交互更自然,基于大數(shù)據(jù)的技術(shù)支持,讓識別變得主動而聰明。語音識別和圖像識別將走進普通人的世界,讓我們的生活更生動。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国产无套露脸视频在线观看 | 国产一级免费在线观看 | 免费国产成人α片 | 猫咪视频网站 | 欧美自拍偷拍视频 | 九九九免费视频 | 国产高清好大好夹受不了了 | 日韩精品欧美视频 | 国产一区二区中文字幕 | 极情综合网| 日本一区二区三区久久久久 | 51香蕉视频 | 91精品国产9l久久久久 | 色迷迷影院| 福利小视频在线播放 | 国产精品欧美亚洲 | 久久精品视频网 | 免费一级毛片在播放视频 | 日韩久久中文字幕 | 国产亚洲欧美成人久久片 | 国内精品久久久久 | 汉宫春晓61式图解 | 免费看avapp| 欧美激情久久久久久久久 | 九九精品在线观看 | 日本福利片 | 99这里| 久久免费高清视频 | 一级一级一级毛片免费毛片 | 黄视频免费在线看 | 九九精品免视频国产成人 | 99热综合在线 | 国产精品久久天天影视 | 天天草综合 | 潦草影视2019 | 永久在线免费 | 欧美性色网 | 日韩激情影院 | 国产免费一级精品视频 | 日本高清中文 | 黑人中文字幕在线精品视频站 |