機(jī)器智能決策的方法
【專利摘要】本發(fā)明公開了一種機(jī)器智能決策的方法,采用特征項(xiàng)表達(dá)的方式將用戶意圖表示成因素集,根據(jù)因素集設(shè)計(jì)用戶手勢語義,并進(jìn)行機(jī)器訓(xùn)練,然后把手勢保存在手勢知識(shí)庫,以便對機(jī)器捕捉的手勢進(jìn)行理解,然后根據(jù)因素集與手勢集的映射關(guān)系,結(jié)合用戶交互偏好信息分析,判斷用戶意圖并進(jìn)行決策,相比依靠上下文判斷等方法,本方法具有較高的響應(yīng)速度以及較高的精確度,還解決了機(jī)器識(shí)別的經(jīng)典問題?“Midas Touch”難題。
【專利說明】
機(jī)器智能決策的方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及人機(jī)交互領(lǐng)域具體涉及一種機(jī)器智能決策的方法。
【背景技術(shù)】
[0002]人機(jī)交互是一門研究系統(tǒng)與用戶之間的交互關(guān)系的學(xué)問。系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件。人機(jī)交互界面通常是指用戶可見的部分。用戶通過人機(jī)交互界面與系統(tǒng)交流,并進(jìn)行操作。小如收音機(jī)的播放按鍵,大至飛機(jī)上的儀表板、或是發(fā)電廠的控制室。人機(jī)交互界面的設(shè)計(jì)要包含用戶對系統(tǒng)的理解(即心智模型),那是為了系統(tǒng)的可用性或者用戶友好性。作為一個(gè)科學(xué)學(xué)科,人機(jī)交互研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取‘信息’的人工智能系統(tǒng),所述信息可以是例如用戶認(rèn)知與意圖等信息。
[0003]用戶意圖具有主觀性,模糊性以及進(jìn)化性的特點(diǎn),難以編碼與度量,如果用戶意圖不能被機(jī)器所理解,機(jī)器就無法做出決策,人機(jī)交互就存在障礙。人機(jī)交互的障礙主要體現(xiàn)在兩個(gè)方面,一個(gè)是機(jī)器界面是否易于用戶理解與操作,從一開始的dos界面到現(xiàn)在的窗口界面再到基于計(jì)算機(jī)視覺的自然界面。由于機(jī)器是人類創(chuàng)造出來的,所以這一方面除了學(xué)習(xí)成本的不同外,不會(huì)存在太大難題。困難的是另外一個(gè)層面,機(jī)器如何理解用戶意圖。在鼠標(biāo)和鍵盤的年代,用戶通過非自然操作傳達(dá)有限的操作意圖,人機(jī)交互還算順暢,但隨著自然手勢界面發(fā)展,腦機(jī)通訊等技術(shù)的發(fā)展,用戶逐漸通過更加自然更多維度的方式傳達(dá)意圖,迄今為止,這種方式的意圖感知效果相當(dāng)有限,其根本原因在于用戶意圖的感知無法精確,尤其難以用計(jì)算機(jī)語言表達(dá)。
【發(fā)明內(nèi)容】
[0004]針對現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種機(jī)器智能決策的方法,以提高機(jī)器對用戶意圖感知和智能決策的精確度。
[0005]為了實(shí)現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案是:
[0006]—種機(jī)器智能決策的方法,包括步驟:
[0007]在人機(jī)交互系統(tǒng)中,預(yù)先確定用戶交互對象,并收集該交互對象所有可能的用戶認(rèn)知與用戶意圖的集合,形成因素集,將因素集中的因素映射成手勢,對映射成的各種手勢進(jìn)行手勢語義設(shè)計(jì)及機(jī)器訓(xùn)練,形成手勢知識(shí)庫;
[0008]在人機(jī)交互環(huán)境下探測用戶的手勢,得到用戶手勢操作行為流;
[0009]通過探測到的用戶手勢操作行為流,根據(jù)手勢與因素的映射關(guān)系,識(shí)別用戶意圖并進(jìn)行機(jī)器決策。
[0010]本發(fā)明機(jī)器智能決策的方法,采用特征項(xiàng)表達(dá)的方式將用戶交互對象表示成因素集,再將因素集中的因素映射成手勢,對各種手勢進(jìn)行訓(xùn)練形成手勢知識(shí)庫,根據(jù)手勢知識(shí)庫對計(jì)算機(jī)捕捉的手勢進(jìn)行理解,然后根據(jù)因素集與手勢集的映射關(guān)系這種系統(tǒng)邏輯判斷用戶意圖,同時(shí)結(jié)合用戶交互偏好信息輔助判斷用戶意圖并進(jìn)行決策,相比依靠上下文判斷等方法,本方法具有較高的響應(yīng)速度以及較高的精確度,還解決了機(jī)器識(shí)別的經(jīng)典問題-uMidas Touch” 難題。
【附圖說明】
[0011]圖1為本發(fā)明機(jī)器智能決策的方法的流程示意圖;
[0012]圖2為本發(fā)明機(jī)器智能決策的方法的模型示意圖。
【具體實(shí)施方式】
[0013]下面結(jié)合【具體實(shí)施方式】對本發(fā)明作進(jìn)一步的說明。
[0014]本發(fā)明機(jī)器智能決策的方法,如圖1所示,包括步驟:
[0015]步驟slOl、在人機(jī)交互系統(tǒng)中,確定用戶手勢的交互對象,例如一臺(tái)阿迪鍋,用戶希望通過手勢對阿迪鍋進(jìn)行搬運(yùn)、煮食與清洗等操作,則此時(shí),阿迪鍋即為用戶手勢的交互對象。
[0016]比如說是一個(gè)阿迪鍋,前期收集關(guān)于阿迪鍋所有可能的用戶認(rèn)知與用戶意圖的集合,這個(gè)集合定義為因素集,根據(jù)認(rèn)知科學(xué),用戶認(rèn)知與用戶行為具有映射關(guān)系,將因素集中的因素映射成用戶行為,即用戶手勢操作,根據(jù)因素集設(shè)定用戶手勢語義,對手勢進(jìn)行手勢訓(xùn)練。
[0017]步驟sl02、采用文本挖掘的方式求解交互對象的因素集。
[0018]繼續(xù)以阿迪鍋為例,所謂文本挖掘即將阿迪鍋?zhàn)鳛殛P(guān)鍵詞進(jìn)行檢索,獲取阿迪鍋的各種特征,各種特征的集合形成了因素集,其中的每個(gè)因素都代表了某個(gè)具體的用戶認(rèn)知與意圖。
[0019]步驟sl03、將因素集中的因素映射成手勢操作。
[0020]認(rèn)知科學(xué)把人的大腦機(jī)制分成認(rèn)知模型以及行為模型,因素集表達(dá)的是人的認(rèn)知模型,手勢操作表達(dá)的是人的行為模型,因素與手勢是一一映射的關(guān)系。
[0021]步驟sl04、對各種手勢進(jìn)行手勢語義設(shè)計(jì)及機(jī)器訓(xùn)練,形成手勢知識(shí)庫。
[0022]手勢知識(shí)庫中保存了各種與交互對象有關(guān)的手勢,可以對每個(gè)手勢進(jìn)行ID編號(hào)。
[0023]步驟sl05、分析用戶交互的偏好信息,如用戶場景、手勢幅度和手勢起止點(diǎn)等作為機(jī)器決策的輔助方法。
[0024]相同的手勢可能代表了不同的意圖,如揮揮手這個(gè)手勢,可能代表了用戶“再見”的意圖,也可能代表“不要”的意思,甚至還可以是“上一頁”和“下一頁”的意思。
[0025]步驟sl06、在人機(jī)交互環(huán)境下探測用戶的手勢。
[0026]人機(jī)交互中,帶有攝像頭或其他手勢感知設(shè)備的機(jī)器,識(shí)別跟蹤用戶手勢。
[0027]步驟sl07、將探測到的手勢與手勢知識(shí)庫中的手勢對比,理解用戶手勢。
[0028]由探測到的手勢可知對應(yīng)的因素,從而理解用戶認(rèn)知與意圖。計(jì)算機(jī)探測到的手勢,有些手勢是有意義的,有些則是沒有意義的,將探測到的手勢與手勢知識(shí)庫中的手勢進(jìn)行比較,理解用戶的手勢,感知用戶意圖。
[0029]步驟sl08、根據(jù)因素集與手勢集的映射關(guān)系這種系統(tǒng)邏輯,同時(shí)結(jié)合用戶交互偏好信息輔助判斷用戶意圖并進(jìn)行決策,這是機(jī)器決策的主要邏輯
[0030]當(dāng)捕捉的手勢與手勢邏輯相吻合時(shí),則認(rèn)定用戶當(dāng)前想執(zhí)行的是與該條邏輯對應(yīng)的任務(wù),即用戶意圖是執(zhí)行該任務(wù)。根據(jù)所確定的用戶意圖并響應(yīng)命令,完成用戶手勢的反饋操作。
[0031]舉個(gè)簡單的例子,當(dāng)用戶手勢向右一滑動(dòng)時(shí),這個(gè)手勢的意義是“下一頁”,但是手勢回來的時(shí)候,我們往往是一個(gè)自然的手勢收回,但是收回動(dòng)作有可能會(huì)觸發(fā)“上一頁”的命令,這個(gè)時(shí)候就需要用戶交互偏好信息的輔助判斷,在此輔助判斷下,用戶意圖的誤判得以降低。
[0032]上述方法在模糊數(shù)學(xué)理論的基礎(chǔ)上提出一種模糊集表達(dá)來描述隱藏的用戶意圖。首先,用戶意圖特征項(xiàng)表示,把對用戶意圖的求解轉(zhuǎn)換成對求解代表該用戶意圖的特征項(xiàng)集合,也叫因素集合,用戶意圖這個(gè)復(fù)雜對象稱之為論域。其次,通過數(shù)據(jù)挖掘技術(shù)尋找因素集并處理,求解得到的每個(gè)因素都代表了某個(gè)具體的用戶認(rèn)知與意圖,然后根據(jù)因素集設(shè)計(jì)相對應(yīng)的手勢語義,并以ID編號(hào)的方式保存在手勢知識(shí)庫里。
[0033]作為一個(gè)優(yōu)選的實(shí)施例,對于探測到的同一個(gè)手勢,當(dāng)所確定的用戶意圖有兩個(gè)及兩個(gè)以上時(shí),基于用戶交互偏好信息,對用戶意圖進(jìn)行最終確定。這是由于不同的使用場景下,同樣的手勢可能意味著不同的用戶意圖,比如揮手有可能是“再見”的意思,也可能是“否定”的意思,另外,手勢幅度的大小,手勢的起始點(diǎn)和終止點(diǎn)等都有可能引起歧義,引入使用場景等用戶交互偏好信息有利于更精確的識(shí)別與決策。偏好信息決策是手勢邏輯設(shè)計(jì)的一個(gè)重要補(bǔ)充。
[0034]另外,還可以采用機(jī)器學(xué)習(xí)的方式提高用戶手勢捕捉精確度。
[0035]圖2所示為本發(fā)明所采用的基于特征項(xiàng)表示的用戶意圖的“探測-理解-決策-輸出”模型。
[0036]^“用戶意圖—因素集”-用戶意圖加勺模糊集表達(dá)…二^^^…’如丨’通過數(shù)據(jù)挖掘技術(shù)求解Ui。
[0037]2) “因素集—邏輯設(shè)計(jì)—手勢知識(shí)庫”:對每一個(gè)U1進(jìn)行系統(tǒng)邏輯設(shè)計(jì),提取基本單元即手勢,對其進(jìn)行訓(xùn)練,形成手勢知識(shí)庫。
[0038]3)“用戶意圖—偏好信息—多準(zhǔn)則矩陣”:用戶意圖的表示是非邏輯化的,用戶對于某一個(gè)對象的意圖有可能是以功能的方式存在,也有可能是一個(gè)操作行為流,或者是一個(gè)使用場景等。主觀性和模糊性都非常明顯,通過偏好分析能夠解決有歧義的決策。
[0039]4) “手勢探測—理解”:手勢知識(shí)庫幫助理解用戶手勢。
[0040]5) “理解—決策”:由系統(tǒng)的邏輯設(shè)計(jì)以及偏好分析共同決定。
[0041]6)其中,第4點(diǎn)體現(xiàn)了用戶的行為模型,第2點(diǎn)體現(xiàn)了用戶的認(rèn)知模型,它們的一一映射關(guān)系決定了手勢的理解和決策具有非常高的準(zhǔn)確性。而偏好分析,讓這個(gè)決策模型具有更大的容錯(cuò)率。
[0042]除了用戶意圖,上述模型還能夠用于其它復(fù)雜對象。所述復(fù)雜對象譬如在軍事場合:當(dāng)檢測到地方出動(dòng)轟炸機(jī),殲擊機(jī),這些武器時(shí),一般是用來摧毀什么目標(biāo)的,達(dá)到什么目的的,這些是可以通過武器的特點(diǎn)以及平時(shí)的行為進(jìn)行訓(xùn)練的,而邏輯設(shè)計(jì),一般對于某種武器需要用對應(yīng)克制的武器迎敵,這種是邏輯設(shè)計(jì)的。但是,具體在不同的戰(zhàn)場,不同的天氣可能會(huì)有影響,所以需要進(jìn)行偏好分析。當(dāng)然,上述模型還可以用于商業(yè)以及其他的復(fù)雜系統(tǒng),在此不一一例舉。
[0043]上列詳細(xì)說明是針對本發(fā)明可行實(shí)施例的具體說明,該實(shí)施例并非用以限制本發(fā)明的專利范圍,凡未脫離本發(fā)明所為的等效實(shí)施或變更,均應(yīng)包含于本案的專利范圍中。
【主權(quán)項(xiàng)】
1.一種機(jī)器智能決策的方法,其特征在于,包括步驟: 在人機(jī)交互系統(tǒng)中,預(yù)先確定用戶交互對象,并收集該交互對象所有可能的用戶認(rèn)知與用戶意圖的集合,形成因素集,將因素集中的因素映射成手勢,對映射成的各種手勢進(jìn)行手勢語義設(shè)計(jì)及機(jī)器訓(xùn)練,形成手勢知識(shí)庫; 在人機(jī)交互環(huán)境下探測用戶的手勢,得到用戶手勢操作行為流; 通過探測到的用戶手勢操作行為流,根據(jù)手勢與因素的映射關(guān)系,識(shí)別用戶意圖并進(jìn)行機(jī)器決策。2.根據(jù)權(quán)利要求1所述的機(jī)器智能決策的方法,其特征在于, 對于探測到的同一個(gè)手勢,當(dāng)所確定的用戶意圖有兩個(gè)或兩個(gè)以上時(shí),采用基于偏好信息分析的多屬性矩陣協(xié)助判斷最終的用戶意圖。3.根據(jù)權(quán)利要求2所述的機(jī)器智能決策的方法,其特征在于, 所述基于偏好信息分析的多屬性矩陣中的維度包括使用場景、手勢幅度和手勢起止點(diǎn)。4.根據(jù)權(quán)利要求3所述的機(jī)器智能決策的方法,其特征在于, 以因素與手勢的映射關(guān)系作為判斷用戶意圖的主要依據(jù),以偏好信息分析作為決策的輔助方法。5.根據(jù)權(quán)利要求1或2或3所述的機(jī)器智能決策的方法,其特征在于, 采用機(jī)器學(xué)習(xí)的方式對手勢進(jìn)行訓(xùn)練。
【文檔編號(hào)】G06F3/01GK105892661SQ201610200880
【公開日】2016年8月24日
【申請日】2016年3月31日
【發(fā)明人】楊賢, 何漢武, 吳悅明, 陳和恩, 梁劍斌
【申請人】廣東工業(yè)大學(xué)