本技術(shù)涉及人機(jī)交互,特別是涉及一種數(shù)據(jù)處理方法及相關(guān)設(shè)備。
背景技術(shù):
1、隨著人工智能的發(fā)展,人工智能技術(shù)的應(yīng)用越來(lái)越廣泛。其中,基于人工智能技術(shù)的語(yǔ)音交互功能,例如語(yǔ)音問(wèn)答、機(jī)器翻譯和語(yǔ)音控制等,在用戶的學(xué)習(xí)、生活和工作等場(chǎng)景中帶來(lái)了極大的便利。
2、以語(yǔ)音交互在智能電動(dòng)汽車的應(yīng)用為例。近年來(lái)智能電動(dòng)汽車產(chǎn)業(yè)迅速發(fā)展,智能汽車保有量持續(xù)增長(zhǎng),智能座艙作為智能汽車的重要組成部分是汽車智能化主要發(fā)力點(diǎn)。智能汽車可以識(shí)別特定音區(qū)的乘員發(fā)出的語(yǔ)音中的語(yǔ)義,針對(duì)語(yǔ)義進(jìn)行相應(yīng)的答復(fù)或執(zhí)行相應(yīng)的操作,例如打開(kāi)關(guān)閉車窗、打開(kāi)關(guān)閉多媒體、調(diào)整溫度和定位導(dǎo)航等,提高了駕駛的安全性和娛樂(lè)性。
3、然而,座艙智能化體驗(yàn)增強(qiáng)給有限的車機(jī)計(jì)算資源帶來(lái)越來(lái)越大的挑戰(zhàn),當(dāng)出現(xiàn)車機(jī)計(jì)算資源占用超過(guò)警戒線或者車機(jī)高負(fù)荷運(yùn)行導(dǎo)致溫度超過(guò)臨界值時(shí)會(huì)觸發(fā)保護(hù)機(jī)制,通過(guò)限制部分負(fù)載較高的功能的使用達(dá)到降負(fù)載的目的,其中就包括對(duì)智能座艙基礎(chǔ)體驗(yàn)之一的多音區(qū)語(yǔ)音交互進(jìn)行限制,出現(xiàn)語(yǔ)音喚醒、識(shí)別卡頓甚至完全失效的情況,使語(yǔ)音交互功能受限。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供了一種數(shù)據(jù)處理方法及相關(guān)設(shè)備,以解決多音區(qū)語(yǔ)音交互計(jì)算資源占用大的問(wèn)題。
2、第一方面提供一種數(shù)據(jù)處理方法。該方法可以適用于交通工具、游戲、智能影院、智能家居和智能安防場(chǎng)景中的多音區(qū)語(yǔ)音交互,該方法可以由交通工具或交通工具中的芯片實(shí)現(xiàn),或計(jì)算機(jī)、智能終端設(shè)備或智能家電設(shè)備或其中的芯片等實(shí)現(xiàn)。該方法包括:獲取多個(gè)音頻和多個(gè)音區(qū)的用戶信息。其中,多個(gè)音頻來(lái)自多個(gè)音區(qū),用戶信息指示音區(qū)是否存在用戶。然后,根據(jù)多個(gè)音區(qū)的用戶信息對(duì)多個(gè)音頻進(jìn)行處理。每個(gè)音區(qū)例如設(shè)置有至少一個(gè)麥克風(fēng),多個(gè)音頻為多個(gè)音區(qū)中的麥克風(fēng)采集的。通過(guò)獲取多個(gè)音區(qū)中是否存在用戶的用戶信息,并根據(jù)用戶信息對(duì)來(lái)自多個(gè)音區(qū)的多個(gè)音頻數(shù)據(jù)進(jìn)行處理,從而能夠根據(jù)音區(qū)是否存在用戶來(lái)篩選哪些音區(qū)的音頻數(shù)據(jù)會(huì)被處理,能夠降低處理的音頻數(shù)據(jù)的數(shù)量,進(jìn)而降低音頻處理所需的計(jì)算資源。
3、在一種可能的實(shí)現(xiàn)方式中,根據(jù)多個(gè)音區(qū)的用戶信息對(duì)多個(gè)音頻進(jìn)行處理,包括:根據(jù)多個(gè)音區(qū)的用戶信息,在多個(gè)音頻中篩選出部分音頻進(jìn)行處理。從而,能夠減少所需要處理的音頻的數(shù)量,進(jìn)而減少對(duì)計(jì)算資源的占用,保證多音區(qū)語(yǔ)音交互功能的正常使用。
4、在一種可能的實(shí)現(xiàn)方式中,根據(jù)多個(gè)音區(qū)的用戶信息對(duì)多個(gè)音頻進(jìn)行處理,包括:根據(jù)多個(gè)音區(qū)的用戶信息,對(duì)多個(gè)音頻中存在用戶的音區(qū)的音頻進(jìn)行處理。對(duì)存在用戶的音區(qū)的音頻進(jìn)行處理,當(dāng)存在用戶的音區(qū)的數(shù)量少于所有音區(qū)數(shù)量時(shí),能夠減少所需處理的音頻的數(shù)量。并且,由于同一音區(qū)的麥克風(fēng)和用戶之間距離較近,從而存在用戶的音區(qū)的麥克風(fēng)采集到的音頻具有較高的信噪比,在減少處理的音頻的數(shù)量的情況下,也能夠保證語(yǔ)音識(shí)別的準(zhǔn)確性。
5、在一種可能的實(shí)現(xiàn)方式中,根據(jù)多個(gè)音區(qū)的用戶信息對(duì)多個(gè)音頻進(jìn)行處理,包括:根據(jù)多個(gè)音區(qū)的用戶信息,丟棄多個(gè)音頻中不存在用戶的音區(qū)的音頻。從而,丟棄不不存在用戶的音區(qū)的音頻,一方面能夠減少所需處理的音頻的數(shù)量從而減少多音區(qū)語(yǔ)音交互占用的計(jì)算資源,另一方面還能夠釋放部分存儲(chǔ)資源,減少對(duì)存儲(chǔ)資源的占用。
6、在一種可能的實(shí)現(xiàn)方式中,根據(jù)多個(gè)音區(qū)的用戶信息對(duì)多個(gè)音頻進(jìn)行處理,包括:根據(jù)多個(gè)音區(qū)的用戶信息,對(duì)多個(gè)音頻中存在用戶的音區(qū)的音頻,和部分不存在用戶的音區(qū)的音頻進(jìn)行處理。從而,能夠在減少所需處理的音頻的數(shù)量的情況下,進(jìn)一步提高語(yǔ)音識(shí)別的準(zhǔn)確率。
7、在一種可能的實(shí)現(xiàn)方式中,該方法還包括:獲取計(jì)算資源使用率;在計(jì)算資源使用率大于閾值時(shí),根據(jù)多個(gè)音區(qū)的用戶信息對(duì)多個(gè)音頻進(jìn)行處理包括:根據(jù)多個(gè)音區(qū)的用戶信息,對(duì)存在用戶的音區(qū)中的部分音區(qū)的音頻進(jìn)行處理。在計(jì)算資源的使用率較高時(shí),對(duì)存在用戶的音區(qū)中的部分音區(qū)的音頻進(jìn)行處理,能夠進(jìn)一步降低所需處理的音頻的數(shù)量,進(jìn)而進(jìn)一步降低音頻處理對(duì)計(jì)算資源的占用。
8、在一種可能的實(shí)現(xiàn)方式中,對(duì)存在用戶的音區(qū)中的部分音區(qū)的音頻進(jìn)行處理,包括:對(duì)目標(biāo)音區(qū)中存在用戶的音區(qū)的音頻進(jìn)行處理,目標(biāo)音區(qū)為多個(gè)音區(qū)中的部分音區(qū)。目標(biāo)音區(qū)中的音區(qū)的數(shù)量小于所有的音區(qū)的數(shù)量,從而減少所需處理的音頻的數(shù)量,能夠降低音頻處理所需的計(jì)算資源。
9、可選地,多個(gè)音區(qū)為車輛的座艙中多個(gè)座椅對(duì)應(yīng)的區(qū)域,目標(biāo)音區(qū)包括多個(gè)座椅對(duì)應(yīng)的區(qū)域中的主駕區(qū)域和/或副駕區(qū)域。在計(jì)算資源負(fù)載較高時(shí),僅對(duì)主駕駛艙和/或副駕駛艙的音頻進(jìn)行處理,能夠進(jìn)一步減少所需處理的音頻的數(shù)量,進(jìn)一步減少語(yǔ)音交互所需的計(jì)算資源,在計(jì)算資源負(fù)載較高時(shí)保證主副駕的語(yǔ)音交互的正常使用。
10、在一種可能的實(shí)現(xiàn)方式中,對(duì)存在用戶的音區(qū)中的部分音區(qū)的音頻進(jìn)行處理,包括:對(duì)存在用戶的音區(qū)中優(yōu)先級(jí)最高的至少一個(gè)音區(qū)的音頻進(jìn)行處理。在計(jì)算資源不足時(shí),優(yōu)先對(duì)優(yōu)先級(jí)別高的音區(qū)的音頻進(jìn)行處理,在減少處理的音頻的數(shù)量,降低計(jì)算資源負(fù)載的情況下,保證優(yōu)先級(jí)別高的音區(qū)的語(yǔ)音交互功能正常實(shí)現(xiàn)。
11、在一種可能的實(shí)現(xiàn)方式中,多個(gè)音區(qū)為車輛的座艙中多個(gè)座椅對(duì)應(yīng)的區(qū)域,一個(gè)音區(qū)包括一個(gè)或多個(gè)座椅對(duì)應(yīng)的區(qū)域。
12、第二方面提供一種裝置。裝置包括獲取模塊和處理模塊。其中,獲取模塊,用于獲取多個(gè)音頻,多個(gè)音頻來(lái)自多個(gè)音區(qū)。獲取模塊,用于獲取多個(gè)音區(qū)的用戶信息,用戶信息指示音區(qū)是否存在用戶。處理模塊,用于根據(jù)多個(gè)音區(qū)的用戶信息對(duì)多個(gè)音頻進(jìn)行處理。
13、在一種可能的實(shí)現(xiàn)方式中,處理模塊,具體用于根據(jù)多個(gè)音區(qū)的用戶信息,在多個(gè)音頻中篩選出部分音頻進(jìn)行處理。
14、在一種可能的實(shí)現(xiàn)方式中,處理模塊,具體用于根據(jù)多個(gè)音區(qū)的用戶信息,對(duì)存在用戶的音區(qū)的音頻進(jìn)行處理。
15、在一種可能的實(shí)現(xiàn)方式中,處理模塊,具體用于根據(jù)多個(gè)音區(qū)的用戶信息,丟棄不存在用戶的音區(qū)的音頻。
16、在一種可能的實(shí)現(xiàn)方式中,處理模塊,具體用于根據(jù)多個(gè)音區(qū)的用戶信息,對(duì)多個(gè)音頻中存在用戶的音區(qū)的音頻,和部分不存在用戶的音區(qū)的音頻進(jìn)行處理。
17、在一種可能的實(shí)現(xiàn)方式中,處理模塊,具體用于根據(jù)多個(gè)音區(qū)的用戶信息確定多個(gè)音區(qū)中的目標(biāo)音區(qū)存在用戶。處理模塊,具體用于對(duì)目標(biāo)音區(qū)的音頻進(jìn)行處理。
18、在一種可能的實(shí)現(xiàn)方式中,獲取模塊,用于獲取計(jì)算資源使用率。處理模塊,具體用于在計(jì)算資源使用率大于閾值時(shí),根據(jù)多個(gè)音區(qū)的用戶信息對(duì)存在用戶的音區(qū)中的部分音區(qū)的音頻進(jìn)行處理。
19、在一種可能的實(shí)現(xiàn)方式中,處理模塊,具體用于對(duì)目標(biāo)音區(qū)中存在用戶的音區(qū)的音頻進(jìn)行處理,目標(biāo)音區(qū)為多個(gè)音區(qū)中的部分音區(qū)。
20、在一種可能的實(shí)現(xiàn)方式中,多個(gè)音區(qū)為車輛的座艙中多個(gè)座椅對(duì)應(yīng)的區(qū)域,目標(biāo)音區(qū)包括多個(gè)座椅對(duì)應(yīng)的區(qū)域中的主駕區(qū)域和/或副駕區(qū)域。
21、在一種可能的實(shí)現(xiàn)方式中,多個(gè)音區(qū)具有優(yōu)先級(jí),處理模塊,具體用于對(duì)存在用戶的音區(qū)中優(yōu)先級(jí)最高的至少一個(gè)音區(qū)的音頻進(jìn)行處理。
22、第三方面提供一種設(shè)備。該設(shè)備包括處理器和存儲(chǔ)器,處理器耦接存儲(chǔ)器,處理器被配置為基于存儲(chǔ)在存儲(chǔ)器中的指令,實(shí)現(xiàn)如第一方面或第一方面的任意可能的實(shí)現(xiàn)方式中的數(shù)據(jù)處理方法。
23、第四方面提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括指令,當(dāng)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行如第一方面或第一方面的任意可能的實(shí)現(xiàn)方式中的數(shù)據(jù)處理方法。
24、第五方面提供一種包含指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)指令被電子設(shè)備運(yùn)行時(shí),使得電子設(shè)備執(zhí)行如第一方面或第一方面的任意可能的實(shí)現(xiàn)方式中的數(shù)據(jù)處理方法。