午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

信息處理設(shè)備、信息處理方法和程序與流程

文檔序號(hào):11236527閱讀:275來源:國(guó)知局
信息處理設(shè)備、信息處理方法和程序與流程

本公開內(nèi)容涉及信息處理設(shè)備、信息處理方法和程序。



背景技術(shù):

近來已經(jīng)開發(fā)了用于接受從用戶發(fā)出的語音作為輸入語音,并且對(duì)輸入語音執(zhí)行語音識(shí)別以從輸入語音識(shí)別串的技術(shù)。在一個(gè)示例中,已經(jīng)開發(fā)了使得用戶能夠發(fā)現(xiàn)啟動(dòng)了以下模式的技術(shù):在該模式中對(duì)輸入語音執(zhí)行語音識(shí)別(例如,參見專利文獻(xiàn)1)。

引用列表

專利文獻(xiàn)

專利文獻(xiàn)1:jp2013-25605



技術(shù)實(shí)現(xiàn)要素:

技術(shù)問題

然而,期望提供一種能夠使得用戶發(fā)現(xiàn)是否以能夠執(zhí)行語音識(shí)別的音量發(fā)出了語音的技術(shù)。

解決問題的技術(shù)方案

根據(jù)本公開內(nèi)容,提供了一種信息處理設(shè)備,其包括:確定部,該確定部被配置成基于輸入語音來確定用戶發(fā)出的語音音量;以及顯示控制器,該顯示控制器被配置成控制顯示部以使得顯示部顯示顯示對(duì)象。當(dāng)用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量時(shí),顯示控制器使顯示部顯示朝向顯示對(duì)象移動(dòng)的第一運(yùn)動(dòng)對(duì)象。

根據(jù)本公開內(nèi)容,提供了一種信息處理方法,其包括:基于輸入語音來確定用戶發(fā)出的語音音量;以及控制顯示部以使得顯示部顯示顯示對(duì)象。當(dāng)用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量時(shí),使顯示部顯示朝向顯示對(duì)象移動(dòng)的第一運(yùn)動(dòng)對(duì)象。

根據(jù)本公開內(nèi)容,提供了一種用于使計(jì)算機(jī)用作信息處理設(shè)備的程序,該信息處理設(shè)備包括:確定部,該確定部被配置成基于輸入語音來確定用戶發(fā)出的語音音量;以及顯示控制器,該顯示控制器被配置成控制顯示部以使得顯示部顯示顯示對(duì)象。當(dāng)用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量時(shí),顯示控制器使顯示部顯示朝向顯示對(duì)象移動(dòng)的第一運(yùn)動(dòng)對(duì)象。

本發(fā)明的有益效果

根據(jù)如上所描述的本公開內(nèi)容,提供了一種能夠使用戶發(fā)現(xiàn)是否以能夠執(zhí)行語音識(shí)別的音量發(fā)出了語音的技術(shù)。注意,如上所描述的效果并非是限制性的。與上述效果一起或代替于上述效果,可以實(shí)現(xiàn)本說明書中所描述的效果或者根據(jù)本說明書可以領(lǐng)悟到的其他效果中的任一效果。

附圖說明

圖1是示出根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)的配置示例的圖。

圖2是示出根據(jù)實(shí)施方式的信息處理系統(tǒng)的功能配置示例的框圖。

圖3是示出由顯示部顯示的屏幕的示例的圖。

圖4是示出以描述第一運(yùn)動(dòng)對(duì)象的顯示的開始的圖。

圖5是示出以描述能夠識(shí)別的音量的圖。

圖6是示出以描述能夠識(shí)別的音量的圖。

圖7是示出以描述能夠識(shí)別的音量的圖。

圖8是示出由顯示部顯示的屏幕的另一示例的圖。

圖9是示出以描述第二運(yùn)動(dòng)對(duì)象的顯示的開始的圖。

圖10a是示出信息處理系統(tǒng)的操作過程的示例的流程圖。

圖10b是示出信息處理系統(tǒng)的操作過程的示例的流程圖。

圖11是示出顯示部的顯示形式的修改示例1的圖。

圖12是示出顯示部的顯示形式的修改示例2的圖。

圖13是示出顯示部的顯示形式的修改示例3的圖。

圖14是示出顯示部的顯示形式的修改示例4的圖。

圖15是示出顯示部的顯示形式的修改示例5的圖。

圖16是示出信息處理系統(tǒng)的硬件配置示例的框圖。

具體實(shí)施方式

在下文中,將參照附圖來詳細(xì)描述本公開內(nèi)容的優(yōu)選實(shí)施方式。在本說明書和附圖中,用相同的附圖標(biāo)記來表示具有基本上相同的功能和結(jié)構(gòu)的結(jié)構(gòu)要素,并且省略對(duì)這些結(jié)構(gòu)要素的重復(fù)說明。

注意,在本說明書和附圖中,有時(shí)使用在相同的附圖標(biāo)記之后的不同字母將具有基本上相同功能和結(jié)構(gòu)的結(jié)構(gòu)要素彼此區(qū)分開。然而,當(dāng)不需要特別區(qū)分具有基本上相同功能和結(jié)構(gòu)的結(jié)構(gòu)要素時(shí),僅附上相同的附圖標(biāo)記。

此外,將按照以下順序給出描述。

1.本公開內(nèi)容的實(shí)施方式

1.1.系統(tǒng)配置示例

1.2.功能配置示例

1.3.第一運(yùn)動(dòng)對(duì)象的顯示

1.4.能夠識(shí)別的音量的設(shè)置

1.5.第二運(yùn)動(dòng)對(duì)象的顯示

1.6.操作的示例

1.7.顯示形式的修改示例

1.8.硬件配置示例

2.結(jié)論

<1.本公開內(nèi)容的實(shí)施方式>

[1.1.系統(tǒng)配置示例]

參照附圖來描述根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的配置示例。圖1是示出根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的配置示例的圖。如圖1所示,根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10被配置成包括:圖像輸入部110、操作輸入部115、語音輸入部120以及顯示部130。信息處理系統(tǒng)10能夠?qū)τ捎脩魎(在下文中還被簡(jiǎn)稱為“用戶”)發(fā)出的語音執(zhí)行語音識(shí)別。

圖像輸入部110具有輸入圖像的功能。在圖1所示的示例中,圖像輸入部110包括嵌入在桌子tb1中的兩個(gè)相機(jī)。然而,包括在圖像輸入部110中的相機(jī)的數(shù)目不限于特定數(shù)目,只要該數(shù)目是一個(gè)或更多個(gè)即可。在這種情況下,包括在圖像輸入部110中的一個(gè)或更多個(gè)相機(jī)中的每個(gè)相機(jī)被設(shè)置的位置也不限于特定位置。另外,一個(gè)或更多個(gè)相機(jī)可以包括單目相機(jī)或立體相機(jī)。

操作輸入部115具有輸入用戶u的操作的功能。在圖1所示的示例中,操作輸入部115包括懸掛于桌子tb1上方的天花板的一個(gè)相機(jī)。然而,包括在操作輸入部115中的相機(jī)被設(shè)置的位置不限于特定位置。另外,相機(jī)可以包括單目相機(jī)或立體相機(jī)。另外,操作輸入部115可以是除相機(jī)之外的任何事物,只要其具有輸入用戶u的操作的功能即可,并且操作輸入部115可以例如是觸摸面板或硬件按鈕。

顯示部130具有在桌子tb1上顯示屏幕的功能。在圖1所示的示例中,顯示部130懸掛于桌子tb1上方的天花板。然而,顯示部130被設(shè)置的位置不限于特定位置。另外,雖然顯示部130通常可以是能夠?qū)⑵聊煌队爸磷雷觮b1的頂表面上的投影儀,但是顯示部130也可以是其他類型的顯示器,只要該顯示器具有顯示屏幕的功能即可。

此外,盡管本文中主要描述了桌子tb1的頂表面是屏幕的顯示表面的情況,但是屏幕的顯示表面可以不同于桌子tb1的頂表面。屏幕的顯示表面的示例可以包括墻壁、建筑物、地板表面、地面表面、天花板或其他位置處的表面。另外,在顯示部130具有其自己的顯示表面的情況下,屏幕的顯示表面可以是顯示部130的顯示表面。

語音輸入部120具有輸入語音的功能。在圖1所示的示例中,語音輸入部120包括總計(jì)六個(gè)麥克風(fēng),也就是說,三個(gè)麥克風(fēng)位于桌子tb1的上方,三個(gè)麥克風(fēng)存在于桌子tb1的上表面上。然而,包括在語音輸入部120中的麥克風(fēng)的數(shù)目不限于特定數(shù)目,只要所述數(shù)目是一個(gè)或更多個(gè)即可。在這種情況下,包括在語音輸入部120中的一個(gè)或更多個(gè)麥克風(fēng)被設(shè)置的位置也不限于特定位置。然而,如果語音輸入部120包括多個(gè)麥克風(fēng),則可以根據(jù)輸入至多個(gè)麥克風(fēng)中的每個(gè)麥克風(fēng)的語音來估計(jì)聲音源的方向。另外,如果語音輸入部120包括具有指向性的麥克風(fēng),則可以根據(jù)輸入至指向性麥克風(fēng)的語音來估計(jì)聲音源的方向。

針對(duì)根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的配置示例給出了以上描述。

[1.2.功能配置示例]

隨后,描述了根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的功能配置示例。圖2是示出根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的功能配置示例的框圖。如圖2所示,根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10被配置成包括:圖像輸入部110、操作輸入部115、語音輸入部120、顯示部130以及信息處理設(shè)備140(在下文中還被稱為“控制器140”)。

信息處理設(shè)備140控制信息處理系統(tǒng)10中的每個(gè)部件。在一個(gè)示例中,信息處理設(shè)備140生成要從顯示部130輸出的信息。另外,在一個(gè)示例中,信息處理設(shè)備140將由圖像輸入部110、操作輸入部115以及語音輸入部120中的每個(gè)部輸入的信息并入到要從顯示部130輸出的信息中。如圖2所示,信息處理設(shè)備140被配置成包括:輸入圖像獲取部141、輸入語音獲取部142、操作檢測(cè)部143、確定部144、語音識(shí)別部145以及顯示控制器146。稍后將描述這些功能塊中的每個(gè)功能塊的細(xì)節(jié)。

此外,信息處理設(shè)備140可以包括例如中央處理單元(cpu)。在信息處理設(shè)備140包括諸如cpu的處理設(shè)備的情況下,該處理設(shè)備可以包括電子電路。

針對(duì)根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的功能配置示例給出了以上描述。

[1.3.第一運(yùn)動(dòng)對(duì)象的顯示]

如果操作檢測(cè)部143檢測(cè)到選擇語音識(shí)別開始對(duì)象(未示出)的操作,則語音識(shí)別部145開始對(duì)輸入語音進(jìn)行語音識(shí)別。圖3是示出由顯示部130顯示的屏幕的示例的圖。參照?qǐng)D3,顯示控制器146使語音識(shí)別取消操作對(duì)象bu1、語音識(shí)別結(jié)束操作對(duì)象bu2以及顯示對(duì)象sb被顯示。語音識(shí)別取消操作對(duì)象bu1是用于接受取消語音識(shí)別的操作的輸入的對(duì)象。語音識(shí)別結(jié)束操作對(duì)象bu2是用于接受終止語音識(shí)別的操作的輸入的對(duì)象。

顯示對(duì)象sb不限于特定對(duì)象,只要所述對(duì)象是用戶可以在視覺上識(shí)別的對(duì)象即可。在一個(gè)示例中,顯示對(duì)象sb可以是靜止對(duì)象或移動(dòng)對(duì)象。如果開始了語音識(shí)別,則確定部144基于輸入語音來確定用戶u發(fā)出的語音音量。在這方面,確定用戶發(fā)出的語音音量的方式不限于特定方式。在一個(gè)示例中,確定部144可以估計(jì)用戶發(fā)出的語音源方向du,并且可以將從用戶發(fā)出的語音源方向du輸入的音量確定為用戶發(fā)出的語音音量。此外,估計(jì)用戶發(fā)出的語音源方向du的方式不限于特定方式。

在一個(gè)示例中,確定部144可以將語音輸入部120輸入的具有以下音量的語音的到達(dá)方向估計(jì)為用戶發(fā)出的語音源方向du:該音量的大小超過閾值。此外,可能存在著具有以下音量的語音輸入的多個(gè)到達(dá)方向:該音量具有超過閾值的大小。在這種情況下,初始地,確定部144可以將多個(gè)到達(dá)方向之中的、具有超過閾值的大小的音量的語音輸入的到達(dá)方向估計(jì)為用戶發(fā)出的語音源方向du。另外,確定部144可以將多個(gè)到達(dá)方向之中的、與以下用戶的手指的方向(例如,從手指的指尖到根部的方向)相匹配的或相似的一個(gè)到達(dá)方向估計(jì)為用戶發(fā)出的語音源方向du:所述用戶執(zhí)行用于選擇基于語音的語音識(shí)別開始對(duì)象(未示出)的操作??梢灶A(yù)先確定相似性的范圍。另外,可以通過分析輸入圖像來獲得手指方向。

此外,在一個(gè)示例中,確定部144可以將語音輸入部120輸入的具有最大音量的語音的到達(dá)方向估計(jì)為用戶發(fā)出的語音源方向du??商娲兀_定部144可以將與以下用戶的手指的方向相匹配的或相似的一個(gè)到達(dá)方向估計(jì)為用戶發(fā)出的語音源方向du:所述用戶執(zhí)行用于選擇語音識(shí)別開始對(duì)象(未示出)的操作。在這種情況下,確定部144可以將從不同于用戶發(fā)出的語音源方向的方向輸入至語音輸入部120的語音確定為噪聲,并且可以將從不同于用戶發(fā)出的語音源方向du的方向輸入至語音輸入部120的音量確定為噪聲音量。

然后,在用戶發(fā)出的語音音量超過語音識(shí)別部145能夠執(zhí)行語音識(shí)別的音量(在下文中還被稱為“能夠識(shí)別的音量”)的情況下,顯示控制器146可以使顯示部130顯示朝向顯示對(duì)象sb移動(dòng)的第一運(yùn)動(dòng)對(duì)象mu。這使得用戶可以發(fā)現(xiàn)是否以能夠執(zhí)行語音識(shí)別的音量發(fā)出了語音。另外,顯示控制器146可以使顯示部130基于用戶發(fā)出的語音源方向du來顯示第一運(yùn)動(dòng)對(duì)象mu。這使得用戶可以可靠地發(fā)現(xiàn)用戶自己的語音音量是否超過能夠識(shí)別的語音音量。

具體地,顯示控制器146可以使第一運(yùn)動(dòng)對(duì)象mu沿與用戶發(fā)出的語音源方向du相反的方向朝向顯示對(duì)象sb移動(dòng)。雖然圖3所示的示例呈現(xiàn)了接連在用戶附近出現(xiàn)的圓形對(duì)象沿與用戶發(fā)出的語音源方向du相反的方向移動(dòng)、并且它們?cè)诘竭_(dá)顯示對(duì)象sb處時(shí)消失的情況,但是第一運(yùn)動(dòng)對(duì)象mu的移動(dòng)不限于該示例。在一個(gè)示例中,顯示控制器146可以基于與輸入語音對(duì)應(yīng)的預(yù)定信息來控制與第一運(yùn)動(dòng)對(duì)象mu有關(guān)的參數(shù)。在這種情況下使用的輸入語音可以是來自用戶發(fā)出的語音源方向的輸入語音。在一個(gè)示例中,與第一運(yùn)動(dòng)對(duì)象有關(guān)的參數(shù)可以包括以下中的至少一個(gè):第一運(yùn)動(dòng)對(duì)象mu的尺寸、形狀、顏色以及移動(dòng)速度。

與輸入語音對(duì)應(yīng)的預(yù)定信息可以包括以下中的至少一個(gè):用戶發(fā)出的語音音量、輸入語音的頻率、識(shí)別串獲取速度、根據(jù)輸入語音提取的特征量、以及基于輸入語音識(shí)別的用戶。在一個(gè)示例中,隨著識(shí)別串獲取速度增加,顯示控制器146可以增加第一運(yùn)動(dòng)對(duì)象mu的移動(dòng)速度。在識(shí)別串的獲取速度超過預(yù)定速度的情況下,顯示控制器146可以通過向第一運(yùn)動(dòng)對(duì)象mu提供預(yù)定移動(dòng)(例如,被顯示對(duì)象sb排斥的移動(dòng))來使用戶發(fā)現(xiàn)難以執(zhí)行語音識(shí)別的情況。

此外,語音識(shí)別部145優(yōu)選地通過對(duì)來自用戶發(fā)出的語音源方向的輸入語音執(zhí)行語音識(shí)別來獲取識(shí)別串。這使得可以對(duì)具有以下噪聲的語音執(zhí)行語音識(shí)別:所述噪聲小于在對(duì)語音輸入部120所輸入的語音直接執(zhí)行語音識(shí)別的情況下出現(xiàn)的噪聲,因此期望提高語音識(shí)別的準(zhǔn)確性。另外,顯示控制器146優(yōu)選地使顯示部130顯示識(shí)別串。這使得用戶可以發(fā)現(xiàn)通過語音識(shí)別獲得的識(shí)別串。

還描述了第一運(yùn)動(dòng)對(duì)象mu的顯示的開始。圖4是示出以描述第一運(yùn)動(dòng)對(duì)象mu的顯示的開始的圖。如圖4所示,呈現(xiàn)了噪聲音量和用戶發(fā)出的語音音量隨時(shí)間改變的情況。如圖4所示,在用戶發(fā)出的語音音量超過能夠識(shí)別的音量v_able的時(shí)候(或者在用戶發(fā)出的語音音量等于能夠識(shí)別的音量v_able的時(shí)候),顯示控制器146可以開始使顯示部130顯示第一運(yùn)動(dòng)對(duì)象mu。

[1.4.能夠識(shí)別的音量的設(shè)置]

隨后,詳細(xì)描述能夠識(shí)別的音量??梢韵氲降氖牵鲜瞿軌蜃R(shí)別的音量通常不是常量,而是隨噪聲音量改變。圖5至圖7是示出以描述能夠識(shí)別的音量的圖。在一個(gè)示例中,如圖5所示,在噪聲音量平均值n_ave低于預(yù)定最小限度(在下文中還被稱為“噪聲音量最小限度”)n_min的情況下,考慮能夠識(shí)別的音量v_able保持不變。因此,在噪聲音量平均值n_ave低于噪聲音量最小限度n_min的情況下,確定部144可以將能夠識(shí)別的音量v_able設(shè)置為規(guī)定值v_able_min。此外,可以使用噪聲音量自身來代替噪聲音量平均值n_ave。

另一方面,在一個(gè)示例中,如圖6所示,在噪聲音量平均值n_ave超過噪聲音量最小限度n_min的情況下,能夠識(shí)別的音量v_able可以取決于噪聲音量平均值n_ave而改變。因此,在噪聲音量平均值n_ave超過噪聲音量最小限度n_min的情況下,確定部144可以將能夠識(shí)別的音量v_able設(shè)置為與噪聲音量平均值n_ave對(duì)應(yīng)的音量(在圖6所示的示例中,通過將噪聲音量平均值n_ave乘以v_ratio而獲得的值)。此外,可以使用噪聲音量自身來代替噪聲音量平均值n_ave。

圖7示出了根據(jù)圖5和圖6所示的示例的噪聲音量平均值n_ave與能夠識(shí)別的音量v_able之間的關(guān)系。參照?qǐng)D7,在噪聲音量平均值n_ave低于噪聲音量最小限度n_min的情況下,能夠識(shí)別的音量v_able被設(shè)置為規(guī)定值v_able_min。然而,在噪聲音量平均值n_ave超過噪聲音量最小限度n_min的情況下,發(fā)現(xiàn)能夠識(shí)別的音量v_able被設(shè)置為通過將噪聲音量平均值n_ave乘以v_ratio而獲得的值。然而,在噪聲音量平均值n_ave超過噪聲音量最小限度n_min的情況下的能夠識(shí)別的音量v_able不是必須被線性地改變。

此外,在噪聲音量平均值n_ave等于噪聲音量最小限度n_min的情況下,能夠識(shí)別的音量v_able可以被設(shè)置為規(guī)定值v_able_min,或者能夠識(shí)別的音量v_able可以被設(shè)置為與噪聲音量平均值n_ave對(duì)應(yīng)的音量。另外,包括規(guī)定值v_able_min、噪聲音量最小限度n_min以及v_ratio的值可以取決于用于語音識(shí)別的產(chǎn)品的使用環(huán)境、使用情況等而被預(yù)先設(shè)置,或者可以通過在語音識(shí)別開始時(shí)執(zhí)行的軟件更新等而被動(dòng)態(tài)地更新。

[1.5.第二運(yùn)動(dòng)對(duì)象的顯示]

如上所描述的顯示第一運(yùn)動(dòng)對(duì)象mu使得用戶可以發(fā)現(xiàn)以能夠識(shí)別的語音音量發(fā)出了語音。另一方面,即使以能夠識(shí)別的語音音量發(fā)出語音,但是語音識(shí)別也可能被噪聲干擾。因此,使用戶發(fā)現(xiàn)是否存在噪聲是有效的。圖8是示出由顯示部130顯示的屏幕的另一示例的圖。參照?qǐng)D8,存在噪聲源ns1和ns2。在這方面,雖然以下描述了存在兩個(gè)噪聲源的情況,但是噪聲源的數(shù)目不限。

此外,雖然圖8示出了不同于用戶u的兩個(gè)人作為噪聲源ns1和ns2的示例,但是噪聲源的類型可以是除人之外的生物,或者可以是除生物之外的任何事物(例如,人工對(duì)象)。在這種情況下,確定部144基于輸入語音來確定噪聲音量。在這方面,確定噪聲音量的方式不限于特定方式。在一個(gè)示例中,確定部144可以估計(jì)噪聲源方向dn1和dn2,并且可以將從噪聲源方向dn1和dn2輸入的音量確定為噪聲音量。此外,估計(jì)噪聲源方向dn1和dn2的方式也不限于特定方式。

在一個(gè)示例中,可以存在下述情況:存在著具有以下音量的語音輸入的多個(gè)到達(dá)方向:該音量具有超過閾值的大小。在這種情況下,確定部144可以將多個(gè)到達(dá)方向之中的、具有以下音量的語音輸入的到達(dá)方向估計(jì)為噪聲源方向dn1和dn2:所述音量具有超過閾值的第二大小和后續(xù)大小。可替代地,在一個(gè)示例中,確定部144可以將語音輸入部120輸入的具有以下音量的語音的到達(dá)方向估計(jì)為噪聲源方向dn1和dn2:所述音量具有第二大小和后續(xù)大小。

然后,在噪聲音量超過能夠識(shí)別的語音音量的情況下,顯示控制器146可以使顯示部130顯示與第一運(yùn)動(dòng)對(duì)象mu不同的第二運(yùn)動(dòng)對(duì)象mn1和mn2。這使得用戶u可以發(fā)現(xiàn)是否存在著發(fā)出超過能夠識(shí)別的音量的音量的噪聲。另外,顯示控制器146可以使顯示部130基于噪聲源方向來顯示第二運(yùn)動(dòng)對(duì)象mn1和mn2。這使得用戶可以發(fā)現(xiàn)發(fā)出的音量超過能夠識(shí)別的音量的噪聲源的方向。

另外,顯示控制器146可以移動(dòng)第二運(yùn)動(dòng)對(duì)象mn1和mn2,以使得阻止向顯示對(duì)象sb的移動(dòng)。在一個(gè)示例中,如圖8所示,顯示控制器146可以移動(dòng)第二運(yùn)動(dòng)對(duì)象mn1和mn2以位于預(yù)定范圍之外。這使得用戶可以更直觀地發(fā)現(xiàn):在對(duì)來自用戶發(fā)出的語音源方向的輸入語音執(zhí)行語音識(shí)別的情況下,不對(duì)從噪聲源方向dn1和dn2發(fā)出的語音執(zhí)行語音識(shí)別。

圖9是示出以描述第二運(yùn)動(dòng)對(duì)象mn1和mn2的顯示的開始的圖。如圖9所示,呈現(xiàn)了從噪聲源ns1發(fā)出的噪聲的第一噪聲音量、從噪聲源ns2發(fā)出的噪聲的第二噪聲音量、以及由用戶u發(fā)出的語音音量隨時(shí)間改變的情況。在這種情況下,在第一噪聲音量超過能夠識(shí)別的音量v_able的時(shí)候(可替代地,在第一噪聲音量等于能夠識(shí)別的音量v_able的時(shí)候),顯示控制器146可以使顯示部130顯示第二運(yùn)動(dòng)對(duì)象mn1。另外,在第二噪聲音量超過能夠識(shí)別的音量v_able的時(shí)候(可替代地,在第二噪聲音量等于能夠識(shí)別的音量v_able的時(shí)候),顯示控制器146可以使顯示部130顯示第二運(yùn)動(dòng)對(duì)象mn2。第一運(yùn)動(dòng)對(duì)象mu的顯示的開始如上所述。

[1.6.操作示例]

隨后,描述了根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的操作過程。圖10a和圖10b是示出根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的操作過程的示例的流程圖。此外,圖10a和圖10b的流程圖僅是根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的操作過程的示例。因此,根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的操作過程不限于圖10a和圖10b的流程圖所示的示例。

輸入圖像獲取部141獲取由圖像輸入部110輸入的輸入圖像(s11)。另外,輸入語音獲取部142獲取由語音輸入部120輸入的輸入語音(s12)。隨后,如果根據(jù)輸入圖像和輸入語音不能指定用戶發(fā)出的語音源方向(s13中的“否”),則信息處理設(shè)備140使操作轉(zhuǎn)移至s11和s12。另一方面,如果根據(jù)輸入圖像和輸入語音可以指定用戶發(fā)出的語音源方向(s13中的“是”),則信息處理設(shè)備140使操作轉(zhuǎn)移至s14。

隨后,確定部144確定用戶發(fā)出的語音源方向和用戶發(fā)出的語音音量(s14),并且確定噪聲源方向和噪聲音量(s15)。隨后,如果噪聲音量超過噪聲音量最小限度n_min(s16中的“否”),則確定部144將能夠識(shí)別的音量v_able設(shè)置為通過將噪聲音量平均值n_ave乘以v_ratio而獲得的值,并且使操作轉(zhuǎn)移至s19。另一方面,如果噪聲音量低于噪聲音量最小限度n_min(s16中的“是”),則確定部144將能夠識(shí)別的音量v_able設(shè)置為規(guī)定值v_able_min(s18),并且使操作轉(zhuǎn)移至s19。

隨后,如果用戶發(fā)出的語音音量超過能夠識(shí)別的音量v_able(s19中的“否”),則信息處理設(shè)備140使操作轉(zhuǎn)移至s24。另一方面,如果用戶發(fā)出的語音音量超過能夠識(shí)別的音量v_able(s19中的“是”),則語音識(shí)別部145對(duì)輸入語音執(zhí)行語音識(shí)別。在這種情況下,語音識(shí)別部145優(yōu)選地對(duì)來自用戶發(fā)出的語音源方向的輸入語音執(zhí)行語音識(shí)別。

隨后,顯示控制器146使顯示部130顯示與用戶發(fā)出的語音源方向?qū)?yīng)的第一運(yùn)動(dòng)對(duì)象mu(s21)。然后,如果存在著發(fā)出的噪聲音量超過能夠識(shí)別的音量v_able的噪聲源(s22中的“是”),則顯示控制器146使顯示部130顯示與噪聲源方向?qū)?yīng)的第二運(yùn)動(dòng)對(duì)象(s23),并且使操作轉(zhuǎn)移至s13。另一方面,如果不存在發(fā)出的噪聲音量超過能夠識(shí)別的音量v_able的噪聲源(s22中的“否”),則信息處理設(shè)備140使操作轉(zhuǎn)移至s24。如果操作轉(zhuǎn)移至s24,則信息處理設(shè)備140使輸入圖像獲取部141和輸入語音獲取部142分別獲取下一時(shí)間單元的輸入圖像和輸入語音(s24),并且使操作轉(zhuǎn)移至s13。

[1.7.顯示形式的修改示例]

針對(duì)顯示部130是能夠?qū)⑵聊煌队爸磷雷觮b1的頂表面上的投影儀的示例給出了如上描述。然而,顯示部130的顯示形式不限于該示例。描述了顯示部130的顯示形式的修改示例。圖11是示出顯示部130的顯示形式的修改示例1的圖。如圖11所示,在信息處理系統(tǒng)10是移動(dòng)終端的情況下,顯示部130可以被設(shè)置在移動(dòng)終端中。移動(dòng)終端的類型不限于特定類型,并且移動(dòng)終端可以是平板終端、智能電話或蜂窩電話。

此外,圖12是示出顯示部130的顯示形式的修改示例2的圖。如圖12所示,在信息處理系統(tǒng)10包括電視接收機(jī)的情況下,顯示部130可以被設(shè)置在電視接收機(jī)中。在這種情況下,如圖12所示,顯示控制器146使顯示部130基于由用戶u發(fā)出的語音的聲源方向來顯示第一運(yùn)動(dòng)對(duì)象mu,并且使顯示部130基于噪聲源ns的方向顯示第二運(yùn)動(dòng)對(duì)象mn。

圖13是示出顯示部130的顯示形式的修改示例3的圖。如圖13所示,顯示部130可以是頭戴式顯示器。在這種情況下,如圖13所示,在從設(shè)置在頭戴式顯示器中的相機(jī)所捕獲的圖像中識(shí)別出與顯示對(duì)象sb相關(guān)聯(lián)的對(duì)象ob的情況下,顯示控制器146可以使顯示部130顯示顯示對(duì)象sb。在一個(gè)示例中,顯示控制器146可以識(shí)別對(duì)象ob的三維位置和姿態(tài),并且可以根據(jù)識(shí)別的三維位置和姿態(tài)將顯示對(duì)象sb布置在增強(qiáng)現(xiàn)實(shí)(ar)空間中。

還可以基于對(duì)象ob的三維位置來移動(dòng)第一運(yùn)動(dòng)對(duì)象mu。在一個(gè)示例中,在用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量的情況下,顯示控制器146可以通過將ar空間中的第一運(yùn)動(dòng)對(duì)象mu朝向?qū)ο髈b的三維位置移動(dòng)以使得第一運(yùn)動(dòng)對(duì)象mu從近側(cè)移動(dòng)至遠(yuǎn)側(cè),來使第一運(yùn)動(dòng)對(duì)象mu被顯示。在圖13所示的示例中,將用戶u的嘴估計(jì)為用戶發(fā)出的語音源方向,因此第一運(yùn)動(dòng)對(duì)象mu從用戶的嘴的附近出現(xiàn),并且移動(dòng)至顯示對(duì)象sb。

此外,圖13所示的示例假設(shè)了對(duì)象ob是照明器具并且在顯示對(duì)象sb被顯示的狀態(tài)下執(zhí)行語音識(shí)別的情況。在這種情況下,信息處理設(shè)備140使對(duì)象ob執(zhí)行與通過語音識(shí)別而獲得的識(shí)別串相對(duì)應(yīng)的操作(例如,在照明器具上在上電與斷電之間切換)。然而,對(duì)象ob可以是除照明器具之外的任何對(duì)象。

圖14是示出顯示部130的顯示形式的修改示例4的圖。如圖14所示,在信息處理系統(tǒng)10包括三維立體顯示器的情況下,顯示部130可以被設(shè)置在三維立體顯示器中。在這種情況下,如圖14所示,如果用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量,則顯示控制器146可以使第一運(yùn)動(dòng)對(duì)象mu被顯示,以使得第一運(yùn)動(dòng)對(duì)象mu以從近側(cè)至遠(yuǎn)側(cè)的移動(dòng)表示而朝向顯示對(duì)象sb移動(dòng)。從近側(cè)至遠(yuǎn)側(cè)的移動(dòng)表示可以通過使用用戶u的左眼和右眼的視差來實(shí)現(xiàn)。

在圖14所示的示例中,從近側(cè)至遠(yuǎn)側(cè)的移動(dòng)表示通過允許用戶u戴上立體眼鏡l來實(shí)現(xiàn)。然而,從近側(cè)至遠(yuǎn)側(cè)的移動(dòng)表示可以通過用戶u不戴立體眼鏡l的裸眼立體視圖來實(shí)現(xiàn)。在一個(gè)示例中,即使當(dāng)顯示部130顯示如圖14所示的多個(gè)對(duì)象(例如,應(yīng)用窗口)g1至g8時(shí),在對(duì)象g1上顯示的顯示對(duì)象sb的深度與第一運(yùn)動(dòng)對(duì)象mu的目的地的深度的相匹配也使得用戶u更容易發(fā)現(xiàn)針對(duì)對(duì)象g1使用語音識(shí)別。

圖15是示出顯示部130的顯示形式的修改示例5的圖。如圖15所示,顯示控制器146可以使顯示部130顯示虛擬對(duì)象vr,并且使顯示部130顯示包括在虛擬對(duì)象vr中的預(yù)定對(duì)象作為顯示對(duì)象sb。在圖15所示的示例中,雖然虛擬對(duì)象vr與游戲控制器cr相關(guān)聯(lián),但是虛擬對(duì)象vr可以與除游戲控制器cr之外的對(duì)象相關(guān)聯(lián)。另外,在圖15所示的示例中,雖然預(yù)定對(duì)象與包括在游戲控制器cr中的麥克風(fēng)mc相關(guān)聯(lián),但是預(yù)定對(duì)象不限于麥克風(fēng)mc。

如果虛擬對(duì)象vr和顯示對(duì)象sb被如上所述地顯示,則用戶u觀看到在顯示部130上顯示的第一運(yùn)動(dòng)對(duì)象mu的目的地,因此用戶u可以容易地發(fā)現(xiàn)用戶自己的語音被輸入的位置。另外,如果虛擬對(duì)象vr和顯示對(duì)象sb被如上所述地顯示,則可以防止用戶u的諸如對(duì)著錯(cuò)誤位置(例如,對(duì)著顯示部130)說話的動(dòng)作。

[1.8.硬件配置示例]

接下來,參照?qǐng)D16來描述根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的硬件配置。圖16是示出根據(jù)本公開內(nèi)容的實(shí)施方式的信息處理系統(tǒng)10的硬件配置示例的框圖。

如圖16所示,信息處理系統(tǒng)10包括:中央處理單元(cpu)901、只讀存儲(chǔ)器(rom)903、以及隨機(jī)存取存儲(chǔ)器(ram)905。另外,信息處理系統(tǒng)10可以包括:主機(jī)總線907、橋接器909、外部總線911、接口913、輸入設(shè)備915、輸出設(shè)備917、存儲(chǔ)設(shè)備919、驅(qū)動(dòng)器921、連接端口923以及通信設(shè)備925。信息處理系統(tǒng)10必要時(shí)還可以包括圖像捕獲設(shè)備933和傳感器935。與cpu901結(jié)合地或者代替于cpu901,信息處理系統(tǒng)10可以具有被稱為數(shù)字信號(hào)處理器(dsp)或?qū)S眉呻娐?asic)的處理電路。

cpu901用作算術(shù)處理單元和控制設(shè)備,并且其根據(jù)記錄在rom903、ram905、存儲(chǔ)設(shè)備919或可移除記錄介質(zhì)927中的各種程序來控制信息處理系統(tǒng)10中的全部操作或其一部分。rom903存儲(chǔ)例如由cpu901使用的程序和操作參數(shù)。ram905暫時(shí)存儲(chǔ)例如要由cpu901在執(zhí)行時(shí)使用的程序以及在執(zhí)行程序時(shí)視情況改變的參數(shù)。cpu901、rom903和ram905經(jīng)由主機(jī)總線907來彼此連接,主機(jī)總線907包括內(nèi)部總線如cpu總線。此外,主機(jī)總線907經(jīng)由橋接器909連接至外部總線911如外圍部件互連(pci)/接口總線。

輸入設(shè)備915例如是由用戶操作的設(shè)備,如鼠標(biāo)、鍵盤、觸摸面板、按鈕、開關(guān)和控制桿。輸入設(shè)備915可以包括用于檢測(cè)用戶的語音的麥克風(fēng)。輸入設(shè)備915可以例如是使用紅外線或其他無線電波的遠(yuǎn)程控制設(shè)備,或者可以是外部連接設(shè)備929,如符合信息處理系統(tǒng)10的操作的蜂窩電話。輸入設(shè)備915包括輸入控制電路,所述輸入控制電路根據(jù)用戶輸入的信息來生成輸入信號(hào)并且將輸入信號(hào)輸出至cpu901。用戶通過操作輸入設(shè)備915將各種數(shù)據(jù)輸入至信息處理系統(tǒng)10,并且指示信息處理系統(tǒng)10執(zhí)行處理操作。另外,稍后將描述的圖像捕獲設(shè)備933還可以通過捕獲用戶的手或手指等的移動(dòng)而用作輸入設(shè)備。在這種情況下,可以根據(jù)手的運(yùn)動(dòng)或手指的定向來確定指向位置。

輸出設(shè)備917包括能夠在視覺上或音頻上向用戶通知所獲取的信息的設(shè)備。輸出設(shè)備917可以是:諸如液晶顯示器(lcd)、等離子顯示面板(pdp)、有機(jī)電致發(fā)光(el)顯示器以及投影儀的顯示設(shè)備,全息顯示設(shè)備,諸如揚(yáng)聲器和耳機(jī)的音頻輸出設(shè)備,以及打印機(jī)設(shè)備等。輸出設(shè)備917將通過信息處理系統(tǒng)10的處理而獲得的結(jié)果作為視頻(如文本或圖像)來輸出,或者將所述結(jié)果作為音頻(如語音或聲音)來輸出。另外,輸出設(shè)備917可以包括例如用于照亮周圍環(huán)境的燈。

存儲(chǔ)設(shè)備919是被配置為信息處理系統(tǒng)10的存儲(chǔ)部的示例的數(shù)據(jù)存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備919例如包括諸如硬盤驅(qū)動(dòng)器(hdd)的磁存儲(chǔ)設(shè)備、半導(dǎo)體存儲(chǔ)設(shè)備、光學(xué)存儲(chǔ)設(shè)備以及磁光存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備919存儲(chǔ)由cpu901執(zhí)行的程序、各種數(shù)據(jù)、從外部獲得的各種類型的數(shù)據(jù)等。

驅(qū)動(dòng)器921是用于可移除記錄介質(zhì)927(如磁盤、光盤、磁光盤以及半導(dǎo)體存儲(chǔ)器)的讀寫器,并且驅(qū)動(dòng)器921包括在信息處理系統(tǒng)10中或者在外部附接至信息處理系統(tǒng)10。驅(qū)動(dòng)器921讀取記錄在附接的可移除記錄介質(zhì)927中的信息,并且將所述信息輸出至ram905。另外,驅(qū)動(dòng)器921在附接的可移除記錄介質(zhì)927中進(jìn)行寫入。

連接端口923是用于將設(shè)備直接連接至信息處理系統(tǒng)10的端口。連接端口923可以例如是通用串行總線(usb)端口、ieee1394端口或小型計(jì)算機(jī)系統(tǒng)接口(scsi)端口。另外,連接端口923可以例如是rs-232c端口、光纖音頻端子(opticalaudioterminal)或高清晰度多媒體接口(hdmi,注冊(cè)商標(biāo))端口。外部連接設(shè)備929連接至連接端口923,因此各種數(shù)據(jù)可以在信息處理系統(tǒng)10與外部連接設(shè)備929之間交換。

通信設(shè)備925例如是由通信設(shè)備等組成的通信接口,其用于連接至通信網(wǎng)絡(luò)931。通信設(shè)備925可以例如是用于有線或無線局域網(wǎng)(lan)、藍(lán)牙(注冊(cè)商標(biāo))或無線usb(wusb)的通信卡。另外,通信設(shè)備925可以例如是用于光通信的路由器、用于非對(duì)稱數(shù)字用戶線路(adsl)的路由器或者用于各種通信的調(diào)制解調(diào)器。例如,通信設(shè)備925使用預(yù)定協(xié)議如tcp/ip,與因特網(wǎng)或其他通信設(shè)備發(fā)送和接收信號(hào)等。另外,連接至通信設(shè)備925的通信網(wǎng)絡(luò)931是通過線路或無線地連接的網(wǎng)絡(luò),并且通信網(wǎng)絡(luò)931例如是因特網(wǎng)、家庭lan、紅外通信、無線電波通信、衛(wèi)星通信等。

圖像捕獲設(shè)備933通過使用圖像傳感器(如電荷耦合器件(ccd)或互補(bǔ)金屬氧化物半導(dǎo)體(cmos))以及各種構(gòu)件(如用于控制在圖像傳感器上對(duì)象圖像的成像的透鏡)來捕獲真實(shí)空間并且生成捕獲的圖像。圖像捕獲設(shè)備933可以捕獲靜止圖像或運(yùn)動(dòng)圖像。

傳感器935例如是各種傳感器,如加速計(jì)、陀螺儀傳感器、地磁傳感器、光電傳感器以及聲音傳感器。傳感器935獲取關(guān)于信息處理系統(tǒng)10自身狀態(tài)的信息(如信息處理系統(tǒng)10的外殼的姿態(tài)),以及關(guān)于信息處理系統(tǒng)10的周圍環(huán)境的信息(如信息處理系統(tǒng)10周圍的亮度或噪聲)。傳感器935還可以包括gps傳感器,所述gps傳感器接收全球定位系統(tǒng)(gps)信號(hào),并且測(cè)量設(shè)備的緯度、經(jīng)度以及海拔高度。

針對(duì)信息處理系統(tǒng)10的硬件配置的示例給出了以上描述??梢允褂猛ㄓ脴?gòu)件來配置上述部件中的每個(gè)部件,或者可以利用專用于每個(gè)部件的功能的硬件來配置上述部件中的每個(gè)部件。這樣的配置可以根據(jù)在實(shí)現(xiàn)時(shí)的技術(shù)水平而被適當(dāng)?shù)馗淖儭?/p>

<2.結(jié)論>

根據(jù)如上所描述的本公開內(nèi)容的實(shí)施方式,提供了包括確定部144和顯示控制器146的信息處理設(shè)備140。確定部144基于輸入語音來確定用戶發(fā)出的語音音量,顯示控制器146控制顯示部130以使得顯示部130顯示顯示對(duì)象sb。當(dāng)用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量時(shí),顯示控制器146使顯示部130顯示朝向顯示對(duì)象sb移動(dòng)的第一運(yùn)動(dòng)對(duì)象。

根據(jù)這樣的配置,用戶可以發(fā)現(xiàn)是否以能夠執(zhí)行語音識(shí)別的音量而發(fā)出語音。在一個(gè)示例中,在語音識(shí)別被不正確地執(zhí)行的情況下,用戶可以發(fā)現(xiàn)如何改變語音。另外,當(dāng)根據(jù)所獲得的結(jié)果來改變用戶的語音時(shí),期望將提高語音識(shí)別的成功率。

以上已經(jīng)參照附圖描述了本公開內(nèi)容的優(yōu)選實(shí)施方式,然而本公開內(nèi)容不限于以上示例。本領(lǐng)域技術(shù)人員可以在所附權(quán)利要求的范圍內(nèi)實(shí)現(xiàn)各種變型和修改,并且應(yīng)當(dāng)理解的是,所述各種變型和修改將自然落入本公開內(nèi)容的技術(shù)范圍內(nèi)。

雖然針對(duì)顯示部130的顯示形式的修改示例給出了以上描述,但是顯示部130的顯示形式不限于以上示例。顯示部130可以例如是除頭戴式顯示器之外的、被設(shè)置在可穿戴終端(例如,手表或眼鏡)中的顯示器。另外,顯示部130可以例如是被設(shè)置在車輛內(nèi)的導(dǎo)航系統(tǒng)中的顯示器。另外,顯示部130可以例如是在醫(yī)療領(lǐng)域中使用的顯示器。

此外,可以創(chuàng)建以下程序:該程序用于使硬件(如包括在計(jì)算機(jī)中的cpu、rom以及ram)執(zhí)行等同于上述信息處理系統(tǒng)10的那些功能的功能。另外,還可以提供記錄有該程序的計(jì)算機(jī)可讀記錄介質(zhì)。

此外,顯示控制器146生成用于在顯示部130上顯示顯示內(nèi)容的顯示控制信息,并且將所生成的顯示控制信息輸出至顯示部130,因此可以控制顯示部130以使得顯示部130顯示顯示內(nèi)容。可以根據(jù)系統(tǒng)配置來適當(dāng)?shù)馗淖冿@示控制信息的內(nèi)容。

具體地,用于實(shí)現(xiàn)信息處理設(shè)備140的程序可以例如是網(wǎng)絡(luò)應(yīng)用。在這種情況下,可以使用標(biāo)記語言,如超文本標(biāo)記語言(html)、標(biāo)準(zhǔn)通用標(biāo)記語言(sgml)以及可拓展標(biāo)記語言(xml),來創(chuàng)建顯示控制信息。

每個(gè)部件的位置不限于特定位置,只要上述信息處理系統(tǒng)10的操作被執(zhí)行即可。在一個(gè)具體示例中,可以將圖像輸入部110、操作輸入部115、語音輸入部120、顯示部130以及信息處理設(shè)備140設(shè)置在經(jīng)由網(wǎng)絡(luò)連接的不同設(shè)備中。在這種情況下,信息處理設(shè)備140例如對(duì)應(yīng)于服務(wù)器(如網(wǎng)絡(luò)服務(wù)器或云服務(wù)器),并且圖像輸入部110、操作輸入部115、語音輸入部120以及顯示部130可以對(duì)應(yīng)于經(jīng)由網(wǎng)絡(luò)連接至服務(wù)器的客戶端。

另外,在本說明書中所描述的效果僅是說明性的或示例性的效果,并非是限制性的。也就是說,與上述效果一起或代替于上述效果,根據(jù)本公開內(nèi)容的技術(shù)可以實(shí)現(xiàn)根據(jù)本說明書的描述對(duì)本領(lǐng)域技術(shù)人員而言清楚的其他效果。

另外,本技術(shù)還可以被配置為如下。

(1)一種信息處理設(shè)備,包括:

確定部,所述確定部被配置成基于據(jù)輸入語音來確定用戶發(fā)出的語音音量;以及

顯示控制器,所述顯示控制器被配置成控制顯示部以使得所述顯示部顯示顯示對(duì)象,

其中,當(dāng)所述用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量時(shí),所述顯示控制器使所述顯示部顯示朝向所述顯示對(duì)象移動(dòng)的第一運(yùn)動(dòng)對(duì)象。

(2)根據(jù)(1)所述的信息處理設(shè)備,

其中,所述確定部確定用戶發(fā)出的語音源方向,以及

所述顯示控制器使所述顯示部基于所述用戶發(fā)出的語音源方向來顯示所述第一運(yùn)動(dòng)對(duì)象。

(3)根據(jù)(2)所述的信息處理設(shè)備,還包括:

語音識(shí)別部,所述語音識(shí)別部被配置成通過對(duì)來自所述用戶發(fā)出的語音源方向的輸入語音執(zhí)行語音識(shí)別來獲取識(shí)別串。

(4)根據(jù)(3)所述的信息處理設(shè)備,

其中,所述顯示控制器使所述顯示部顯示所述識(shí)別串。

(5)根據(jù)(1)至(4)中任一項(xiàng)所述的信息處理設(shè)備,

其中,所述確定部基于所述輸入語音來確定噪聲音量,以及

當(dāng)所述噪聲音量超過所述能夠識(shí)別的語音音量時(shí),所述顯示控制器使所述顯示部顯示與所述第一運(yùn)動(dòng)對(duì)象不同的第二運(yùn)動(dòng)對(duì)象。

(6)根據(jù)(5)所述的信息處理設(shè)備,

其中,所述確定部確定噪聲源方向,以及

所述顯示控制器使所述顯示部基于所述噪聲源方向來顯示所述第二運(yùn)動(dòng)對(duì)象。

(7)根據(jù)(6)所述的信息處理設(shè)備,

其中,所述第二運(yùn)動(dòng)對(duì)象被移動(dòng),以使得朝向所述顯示對(duì)象的移動(dòng)被阻止。

(8)根據(jù)(1)至(7)中任一項(xiàng)所述的信息處理設(shè)備,

其中,所述顯示控制器基于與所述輸入語音對(duì)應(yīng)的預(yù)定信息來控制與所述第一運(yùn)動(dòng)對(duì)象有關(guān)的參數(shù)。

(9)根據(jù)(8)所述的信息處理設(shè)備,

其中,與所述第一運(yùn)動(dòng)對(duì)象有關(guān)的參數(shù)包括以下中的至少一個(gè):所述第一運(yùn)動(dòng)對(duì)象的尺寸、形狀、顏色以及移動(dòng)速度。

(10)根據(jù)(8)或(9)所述的信息處理設(shè)備,

其中,與所述輸入語音對(duì)應(yīng)的預(yù)定信息包括以下中的至少一個(gè):所述用戶發(fā)出的語音音量、所述輸入語音的頻率、識(shí)別串獲取速度、從所述輸入語音提取的特征量、以及根據(jù)所述輸入語音識(shí)別的用戶。

(11)根據(jù)(2)所述的信息處理設(shè)備,

其中,所述確定部基于語音輸入的到達(dá)方向來確定所述用戶發(fā)出的語音源方向,所述語音輸入的音量具有超過閾值的大小。

(12)根據(jù)(2)所述的信息處理設(shè)備,

其中,所述確定部基于具有最大音量的語音輸入的到達(dá)方向來確定所述用戶發(fā)出的語音源方向。

(13)根據(jù)(2)所述的信息處理設(shè)備,

其中,所述確定部基于從手指的指尖到根部的方向來確定所述用戶發(fā)出的語音源方向。

(14)根據(jù)(6)所述的信息處理設(shè)備,

其中,當(dāng)所述噪聲音量低于最小限度時(shí),所述確定部將所述能夠識(shí)別的語音音量設(shè)置為規(guī)定值。

(15)根據(jù)(6)所述的信息處理設(shè)備,

其中,當(dāng)所述噪聲音量超過最小限度時(shí),所述確定部將所述能夠識(shí)別的語音音量設(shè)置為與所述噪聲音量的平均值對(duì)應(yīng)的音量或者與所述噪聲音量對(duì)應(yīng)的音量。

(16)根據(jù)(1)至(15)中任一項(xiàng)所述的信息處理設(shè)備,

其中,當(dāng)從捕獲的圖像中識(shí)別出與所述顯示對(duì)象相關(guān)聯(lián)的對(duì)象時(shí),所述顯示控制器使所述顯示部顯示所述顯示對(duì)象。

(17)根據(jù)(1)至(16)中任一項(xiàng)所述的信息處理設(shè)備,

其中,當(dāng)所述用戶發(fā)出的語音音量超過所述能夠識(shí)別的語音音量時(shí),所述顯示控制器使所述顯示部以從近側(cè)至遠(yuǎn)側(cè)的移動(dòng)表示來顯示朝向所述顯示對(duì)象移動(dòng)的所述第一運(yùn)動(dòng)對(duì)象。

(18)根據(jù)(1)至(17)中任一項(xiàng)所述的信息處理設(shè)備,

其中,所述顯示控制器使所述顯示部顯示虛擬對(duì)象,并且顯示包括在所述虛擬對(duì)象中的預(yù)定對(duì)象作為所述顯示對(duì)象。

(19)一種信息處理方法,所述方法包括:

基于輸入語音來確定用戶發(fā)出的語音音量;以及

控制顯示部以使得所述顯示部顯示顯示對(duì)象,

其中,當(dāng)所述用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量時(shí),使所述顯示部顯示朝向所述顯示對(duì)象移動(dòng)的第一運(yùn)動(dòng)對(duì)象。

(20)一種用于使計(jì)算機(jī)用作信息處理設(shè)備的程序,所述信息處理設(shè)備包括:

確定部,所述確定部被配置成基于輸入語音來確定用戶發(fā)出的語音音量;以及

顯示控制器,所述顯示控制器被配置成控制顯示部以使得所述顯示部顯示顯示對(duì)象,

其中,當(dāng)所述用戶發(fā)出的語音音量超過能夠識(shí)別的語音音量時(shí),所述顯示控制器使所述顯示部顯示朝向所述顯示對(duì)象移動(dòng)的第一運(yùn)動(dòng)對(duì)象。

附圖標(biāo)記列表

10信息處理系統(tǒng)

110圖像輸入部

115操作輸入部

120語音輸入部

130顯示部

140信息處理設(shè)備(控制器)

141輸入圖像獲取部

142輸入語音獲取部

143操作檢測(cè)部

144確定部

145語音識(shí)別部

146顯示控制器

mu第一運(yùn)動(dòng)對(duì)象

mn,mn1,mn2第二運(yùn)動(dòng)對(duì)象

ns,ns2,ns1噪聲源

du用戶發(fā)出的語音源方向

dn,dn1,dn2噪聲源方向

sb顯示對(duì)象

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1