試想一下,我們在高速公路上使用GPS導航時(shí),我們更愿意口述目的地還是手動(dòng)輸入目的地?未來(lái),語(yǔ)音將極大程度上代替鍵盤(pán),成為我們與計算機交流的主要方式。
隨著(zhù)深度學(xué)習、大數據以及云計算在語(yǔ)音識別中的廣泛應用,語(yǔ)音識別的技術(shù)得到了長(cháng)足的進(jìn)展,在此方面有多年經(jīng)驗的東芝綜合運用其先進(jìn)的語(yǔ)音、圖像識別技術(shù)并綜合云計算服務(wù),開(kāi)發(fā)出能夠助力人與人交流的AI技術(shù)——“RECAIUS™”。
東芝產(chǎn)業(yè)信息通信技術(shù)ICT解決方案公司負責“RECAIUS™”項目研發(fā)的梅木秀雄介紹說(shuō):“為了實(shí)現人與AI安心、舒適、協(xié)調共存,AI需要具備能夠捕捉人類(lèi)感知和體驗的判斷。在語(yǔ)音識別方面,即便AI沒(méi)有完全聽(tīng)清人們的語(yǔ)音,也能夠從表情動(dòng)作中給出恰當的應答,并實(shí)現一對一的簡(jiǎn)單會(huì )話(huà),還可分辨多個(gè)會(huì )話(huà)組合,通過(guò)計算機算法形成文本。為此,東芝開(kāi)發(fā)出的 RECAIUS™ 能夠根據人的表情、聲音和動(dòng)作,綜合判斷把握具體意圖和狀況并做出適宜應答。”
“RECAIUS™” 你身邊的同聲傳譯
試想一下,如果一個(gè)以英語(yǔ)為母語(yǔ)的人,他一句普通話(huà)也不懂,當他想和一位土生土長(cháng)的中國人交談,他面臨的選擇有兩個(gè):要么他開(kāi)始艱難的學(xué)習,直到能夠熟練掌握中文;要么他就得雇另一個(gè)人來(lái)幫他翻譯對話(huà),而有了“RECAIUS™”,就相當于你身邊有一位同聲傳譯。
相對你手機里面其他的翻譯軟件,東芝的“RECAIUS™”具備了同聲傳譯的功能,其不僅可以翻譯多國語(yǔ)言,而且即便是語(yǔ)句間沒(méi)有間斷的連續語(yǔ)音,“RECAIUS™”也能自動(dòng)判斷適合翻譯的單位,實(shí)現智能斷句,然后逐句完成翻譯。面對一些固有名詞被生硬直譯后無(wú)法理解的情況,使用者可以登錄固有詞匯或例句,給出應當如何翻譯的指示,“RECAIUS™”就能給出恰當的翻譯。
所見(jiàn)即能翻譯 真正的讀圖時(shí)代
除了語(yǔ)音識別、交互、翻譯等功能,東芝還開(kāi)發(fā)了將可視文字信息即時(shí)翻譯成其他語(yǔ)言的技術(shù)。想象一下,人們出國旅行,來(lái)到一家以美味著(zhù)稱(chēng)的餐館,卻往往被菜單上的異國文字搞得一頭霧水,如果菜單上又沒(méi)有圖片,根本不知道該如何點(diǎn)菜,而東芝的“RECAIUS™”可幫你擺脫這個(gè)困境,拿起智能手機對準菜單進(jìn)行拍攝,東芝“RECAIUS™”可以瞬間把菜品翻譯成母語(yǔ),讓你輕松點(diǎn)菜。
(圖:抹茶 綠茶 烘焙茶 烏龍茶 玄米茶 中國茶)
但是,人們用相機拍攝圖像時(shí),照片上不只有文字,還有背景、圖案等其他信息,為了能夠清晰地從復雜圖像中辨別出文字信息,東芝開(kāi)發(fā)出獨有的圖像特征提取技術(shù),可以精準檢測到文字。而這一技術(shù)對國外的街景圖像很有效果,“RECAIUS™”可以輕松地從街景的圖像中識別其中的字符串,判斷語(yǔ)言屬性并將字符翻譯成你需要的語(yǔ)言文字顯示在屏幕上。未來(lái)我們帶上AR眼鏡,沉浸在異國他鄉的外語(yǔ)世界,或許能夠將眼前充斥著(zhù)外語(yǔ)的世界轉換成母語(yǔ)來(lái)欣賞,會(huì )不會(huì )是一種非常陌生而又熟悉的景象?
東芝秉承“以人為本”的技術(shù)研發(fā)理念
梅木秀雄表示:“隨著(zhù)科技的進(jìn)步以及物聯(lián)網(wǎng)IoT(Internet of Things)時(shí)代的到來(lái),未來(lái)不僅是物與物相連,還有人與人相連以及人與物相連。為了給人們的生活和工作創(chuàng )造更加安心、安全、舒適的環(huán)境,東芝將一如既往地秉承以人為本的理念,開(kāi)發(fā)越來(lái)越智能的AI技術(shù),實(shí)現更安全、舒適、人與AI和諧共生的社會(huì )。”