午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

實體名稱識別的制作方法

文檔序號:9454207閱讀:494來源:國知局
實體名稱識別的制作方法
【專利說明】實體名稱識別
[0001]相關串請的交叉引用
[0002]本申請要求2015年3月15日提交的美國申請序列號61/013,585和2014年6月18日提交的美國臨時申請序列號62/013,585的權(quán)益,這些申請通過引用并入。
技術(shù)領域
[0003]本公開內(nèi)容總體上涉及語音識別,并且根據(jù)一個示例實現(xiàn)方式,涉及識別話語中的專有名稱。
【背景技術(shù)】
[0004]語音命令可以包括專有名稱。例如,用戶可以說“Navigate to Pete’s PizzaPalace restaurant”,以便請求自然語言處理系統(tǒng)提供到名稱為“Pete’s Pizza Palace”的餐廳的方向。

【發(fā)明內(nèi)容】

[0005]—些語音命令包括可能很難使用常規(guī)語音識別器來準確地轉(zhuǎn)錄的專有名稱。例如,無論用戶說的多么清楚,常規(guī)語音識別器可能將語音命令“Navigate to CITYZENrestaurant in Washington DC”車專錄為“Navigate to CITYZEN restaurant in WashingtonDC”。這樣的轉(zhuǎn)錄可能導致自然語言處理系統(tǒng)輸出錯誤的或者無意義的結(jié)果。
[0006]考慮到來自該示例語音命令的正確轉(zhuǎn)錄的詞語“restaurant”和“Washington”,并且考慮到對應于專有名稱的語音命令的部分的語音轉(zhuǎn)錄“Sl-tee-O-ze-en”,本說明書中所描述的增強型自然語言處理系統(tǒng)可以通過利用實體名稱“CityZen”替換不準確的轉(zhuǎn)錄的專有名稱“citizen”,來準確地轉(zhuǎn)錄語音命令的該部分,該實體名稱“CityZen”:(i)匹配“restaurant”實體類型,(ii)與“Washington DC”位置相關聯(lián),(iii)與匹配對應于專有名稱的語音命令的部分的語音轉(zhuǎn)錄的語音表示預關聯(lián)。如本說明書中所使用的,“實體”可以指代任何人、地點、對象、事件,或者概念。
[0007]在一些方面,本說明書中描述的主題可以被實施為方法,該方法可以包括接收話語的動作,該話語包括(i)指示特定實體類型的第一詞語和(ii)指示實體名稱的第二詞語。附加的動作包括獲得第二詞語的語音表示和確定第二詞語的語音表示與關聯(lián)于特定實體的規(guī)范名稱集中的特定的規(guī)范名稱的特定語音表示匹配。進一步動作包括將與特定實體相關聯(lián)的參考名稱輸出為第二詞語的轉(zhuǎn)錄。
[0008]其他版本包括對應的系統(tǒng)、裝置和被配置為被編碼在計算機存儲設備上、執(zhí)行該方法的動作的計算機程序。
[0009]這些和其他版本可以每個可選擇地包括一個或多個以下特征。例如,在一些實施方式中,對于一個或多個實體中的每一個實體,獲得實體的規(guī)范名稱集中的每個規(guī)范名稱的語音表示包括:通過將一個或多個發(fā)音規(guī)則應用到每個規(guī)范名稱來生成針對每個規(guī)范名稱的語音表示。
[0010]在一些方面,確定第二詞語的語音表示與關聯(lián)于特定實體的規(guī)范名稱集中的特定規(guī)范名稱的特定語音表示匹配包括:基于第二詞語的語音表示與特定語音表示之間的距離確定匹配得分,并且確定該匹配得分滿足預定的閾值匹配得分。
[0011]在某些方面,動作包括確定話語的候選轉(zhuǎn)錄,該候選轉(zhuǎn)錄包括對應于第一詞語的類型詞語和對應于第二詞語的名稱詞語。附加動作包括確定對應于話語的地理位置并且確定該名稱詞語:(i)與對應于類型詞語的實體類型的實體的參考名稱不匹配,(ii)與位于匹配地理位置的地理位置的實體的參考名稱不匹配,其中確定第二詞語的語音表示與關聯(lián)于特定實體的規(guī)范名稱集中的特定規(guī)范名稱的特定語音表示匹配響應于確定該名稱詞語:
(i)與對應于類型詞語的實體類型的實體的參考名稱不匹配,(ii)與位于匹配地理位置的地理位置的實體的參考名稱不匹配。
[0012]在一些實施方式中,確定對應于話語的地理位置包括:確定候選轉(zhuǎn)錄中對應于地理位置的詞語。在一些方面,確定對應于話語的地理位置包括:確定話語被說出的位置。在某些方面,獲得第二詞語的語音表述:包括通過一將種或多種發(fā)音規(guī)則應用到名稱詞語來生成該第二詞語的語音表示。在一些實施方式中,參考名稱包括官方名稱,規(guī)范名稱包括官方名稱或者非官方名稱。在一些方面,詞語包括人、地點、對象、時間或者概念中的至少一項。
[0013]本說明書所描述的主題的一個或多個實施方式的細節(jié)在下文的附圖和描述中被闡述。本主題的其他潛在的特征、方面和優(yōu)點將從、附圖和權(quán)利要求中變得清楚。
【附圖說明】
[0014]圖1是用于識別語音中的實體名稱的示例系統(tǒng)的框圖。
[0015]圖2是用于識別語音中的實體名稱的示例過程的流程圖。
[0016]各個圖中的相同參考符號指示相同元件。
【具體實施方式】
[0017]圖1是用于識別語音中的實體名稱的示例系統(tǒng)100的框圖。通常,系統(tǒng)100包括列出各種實體的實體目錄112、存儲與各種實體的屬性(包括參考實體名稱、備選實體名稱、與特定實體相關聯(lián)的位置)有關的實體-關系模型的知識庫114。系統(tǒng)100還包括使用知識庫114來標識與存儲在實體目錄112中的實體相關聯(lián)的其他規(guī)范實體名稱的實體名稱擴展器110、和從擴展的實體目錄116生成語音擴展的目錄122的語音擴展器120。系統(tǒng)100進一步包括生成實體類型特定的、地理定位的實體數(shù)據(jù)庫132的實體類型地理定位器130、生成來自用戶150的話語152的候選轉(zhuǎn)錄170的自動語音識別器160、和利用特定實例類型、地理定位的實體數(shù)據(jù)庫132來驗證候選轉(zhuǎn)錄170并且輸出驗證的轉(zhuǎn)錄190的轉(zhuǎn)錄驗證器 180。
[0018]更加詳細地,實體目錄112可以是包括實體記錄的數(shù)據(jù)庫。例如,實體目錄112可以是特定區(qū)域的商業(yè)的黃頁類型的列表。每條記錄可以對應特定的實體,并包括:(i)參考名字,(?)地理位置以及(iii)針對特定實體的一個或多個實體類型。例如,實體目錄112可以包括具有參考名字“TINPOT DINER”、位于“100MAIN ST, SPRINGFIELD, MO”并且實體類型為“RESTAURANT”的實體記錄。
[0019]參考名字可以是實體的官方的或者依法登記的名字。例如,餐廳可以被命名為“TINPOT DINER”,即使該餐廳更通俗地由其他名稱(諸如“TIN DINER”、“TP DINER”,或者“TINPOT RESTAURANT”)而被熟知。地理位置可以由例如街道地址或者經(jīng)瑋度坐標或者二者指示。
[0020]知識庫114可以是包括指示實體的參考名稱與實體的規(guī)范名稱之間的關聯(lián)的信息和其他一些事項的實體-關系數(shù)據(jù)庫。規(guī)范名稱可以是實體可以由其引用的名稱。例如,知識庫114可以指示具有參考名稱“TINPOT DINER”的實體與規(guī)范名稱“TIN DINER”、“TPDINER”和“TINPOT RESTAURANT”相關聯(lián)。知識庫114可以從例如社交網(wǎng)絡信息、評論服務、網(wǎng)站和聚合的用戶查詢等各種信息中生成。
[0021]實體名稱擴展器110可以訪問實體目錄112中的記錄和知識庫114中的信息以生成擴展的實體目錄116。擴展的實體目錄116可以包括對應于實體目錄112中的記錄、具有指示每個實體的一個或多個規(guī)范名稱的集合的附加信息的記錄,其中每個實體的一個或多個規(guī)范名稱的集合包括實體的參考名稱。
[0022]實體名稱擴展器110可以通過訪問實體目錄112中的每條記錄、并且對于每條記錄,將由知識庫114指示的規(guī)范名稱識別為與記錄的參考名稱相關聯(lián),來生成擴展的實體目錄116。例如,實體名稱擴展器110可以訪問具有參考名稱“TINPOT DINER”的實體的記錄,確定知識庫114指示具有參考名稱“TINPOT DINER”的實體與規(guī)范名稱“TIN DINER”、“TP DINER”和“TINPOT RESTAURANT”相關聯(lián),并且在擴展的實體目錄116中生成記錄,該記錄指示:(i)實體目錄112中具有參考名稱“TINPOT DINER”的實體的記錄中的信息和(ii)規(guī)范名稱 “TIN DINER”、“TP DINER” 和 “TINPOT RESTAURANT” 的集合。
[0023]語音擴展器120可以訪問擴展的實體目錄116中的記錄以生成語音擴展目錄122。語音擴展目錄122可以包括對應于擴展的實體目錄116中的記錄的、具有指示規(guī)范名稱的可能的語音表示的附加信息的記錄。
[0024]語音擴展器120可以訪問擴展的實體目錄116中的每條記錄,并且對于記錄中的每個參考名稱和每個規(guī)范名稱,生成一個或多個語音表示。例如,語音擴展器120可以訪問擴展的實體目錄116中針對實體“TINPOT DINER”的記錄,訪問參考名稱“TINPOT DINER”,為“TINPOT”的正確識別的語音表示生成語音表示“T1-EN-PA-ATOD1-NAH”,為將“TINPOT”的錯誤識別如“TIN PORT”的語音表示生成附加的語音表示“T1-EN-PO-OTOD1-NAH”,訪問規(guī)范名稱 “ T RESTAURANT ”,并生成語音表示 “ TE-EEORE_ST_OR_ANT ”。
[0025]語音擴展器120可以通過應用定義單詞的可能發(fā)音的一個或多個規(guī)則來生成語音表示。例如,語音擴展器120可以應用定義“Ρ0Τ”可能被發(fā)音為“PA-AT”的規(guī)則并且應用定義“Ρ0Τ”被可能發(fā)音為“Ρ0-0Τ”的規(guī)則。
[0026]實體類型地理定位器130可以訪問語音擴展的目錄122中的記錄以生成至少一個實體類型特定的、地理定位的實體數(shù)據(jù)庫132。該實體類型特定的、地理定位的實體數(shù)據(jù)庫1
當前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1