午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

自然語言模型的生成方法和數(shù)據(jù)處理方法與流程

文檔序號:39526739發(fā)布日期:2024-09-27 17:03閱讀:36來源:國知局
自然語言模型的生成方法和數(shù)據(jù)處理方法與流程

本技術(shù)涉及人工智能,具體而言,涉及一種自然語言模型的生成方法和數(shù)據(jù)處理方法。


背景技術(shù):

1、自然語言模型通過逐步推理展現(xiàn)出驚人的解決問題的能力。然而,它們在處理更復(fù)雜的問題時往往會出錯,這些錯誤會影響后續(xù)的逐步推理路徑。在現(xiàn)有技術(shù)中缺乏對自然語言模型的推理模型進(jìn)行訓(xùn)練的方法,使得自然語言模型答復(fù)問題的準(zhǔn)確性比較低。

2、針對上述相關(guān)技術(shù)由于自然語言模型的推理能力較差導(dǎo)致自然語言模型答復(fù)問題的準(zhǔn)確性比較低的問題,目前尚未提出有效的解決方案。


技術(shù)實(shí)現(xiàn)思路

1、本技術(shù)實(shí)施例提供了一種自然語言模型的生成方法和數(shù)據(jù)處理方法,以至少解決相關(guān)技術(shù)中由于自然語言模型的推理能力較差導(dǎo)致自然語言模型答復(fù)問題的準(zhǔn)確性比較低的技術(shù)問題。

2、根據(jù)本技術(shù)實(shí)施例的一方面,提供了一種自然語言模型的生成方法,包括:獲取所述樣本問題,并獲取所述樣本問題對應(yīng)的推理路徑集合,其中,所述推理路徑集合中至少包括:參考推理路徑和推理路徑分支對,所述參考推理路徑包括答復(fù)所述樣本問題的真實(shí)答復(fù)信息,所述推理路徑分支對包括第一推理路徑分支和第二推理路徑分支,所述第一推理路徑分支為通向所述真實(shí)答復(fù)信息的路徑分支,所述第二推理路徑分支為不能通向所述真實(shí)答復(fù)信息的路徑分支;依據(jù)所述樣本問題和所述推理路徑集合構(gòu)建所述目標(biāo)訓(xùn)練集;依據(jù)所述目標(biāo)訓(xùn)練集對初始自然語言模型進(jìn)行訓(xùn)練,得到所述目標(biāo)自然語言模型。

3、進(jìn)一步地,獲取所述樣本問題對應(yīng)的推理路徑集合包括:依據(jù)所述樣本問題和思維鏈提示,生成思維鏈?zhǔn)绞纠?,其中,所述思維鏈?zhǔn)绞纠ǎ核鰳颖締栴}和所述樣本問題對應(yīng)的思維鏈?zhǔn)酵评砺窂浇M成,所述思維鏈?zhǔn)酵评砺窂街邪ù饛?fù)所述樣本問題的真實(shí)答復(fù)信息;通過所述初始自然語言模型對所述樣本問題和所述思維鏈?zhǔn)绞纠M(jìn)行處理,判斷是否能夠得到所述樣本問題對應(yīng)的所述參考推理路徑;在能夠得到所述樣本問題對應(yīng)的所述參考推理路徑的情況下,依據(jù)所述樣本問題、所述參考推理路徑和所述思維鏈?zhǔn)绞纠?,得到所述推理路徑分支對;依?jù)所述參考推理路徑和所述推理路徑分支對,得到所述推理路徑集合。

4、進(jìn)一步地,通過所述初始自然語言模型對所述樣本問題和所述思維鏈?zhǔn)绞纠M(jìn)行處理,判斷是否能夠得到所述樣本問題對應(yīng)的所述參考推理路徑包括:通過所述初始自然語言模型對所述樣本問題和所述思維鏈?zhǔn)绞纠M(jìn)行處理,得到第一推理路徑;依據(jù)所述第一推理路徑是否能夠推理得到所述真實(shí)答復(fù)信息,判斷是否能夠得到所述樣本問題對應(yīng)的所述參考推理路徑。

5、進(jìn)一步地,依據(jù)所述樣本問題、所述參考推理路徑和所述思維鏈?zhǔn)绞纠玫剿鐾评砺窂椒种Πǎ阂罁?jù)所述參考推理路徑,得到參考推理子路徑集合;依據(jù)所述樣本問題、所述參考推理子路徑集合和所述思維鏈?zhǔn)绞纠?,以所述參考推理子路徑集合的參考推理子路徑中的最后一個推理步驟為起點(diǎn)采樣生成推理路徑分支,得到所述參考推理子路徑集合的參考推理子路徑對應(yīng)的多個推理路徑分支;依據(jù)所述多個推理路徑分支,得到所述第一推理路徑分支和所述第二推理路徑分支;依據(jù)所述第一推理路徑分支和所述第二推理路徑分支,得到所述推理路徑分支對。

6、進(jìn)一步地,依據(jù)所述目標(biāo)訓(xùn)練集對初始自然語言模型進(jìn)行訓(xùn)練,得到所述目標(biāo)自然語言模型包括:通過所述初始自然語言模型對所述目標(biāo)訓(xùn)練集進(jìn)行處理,得到目標(biāo)預(yù)測推理路徑;依據(jù)所述目標(biāo)預(yù)測推理路徑,得到目標(biāo)損失函數(shù);依據(jù)所述目標(biāo)損失函數(shù)對初始自然語言模型進(jìn)行訓(xùn)練,得到所述目標(biāo)自然語言模型。

7、進(jìn)一步地,通過所述初始自然語言模型對所述目標(biāo)訓(xùn)練集進(jìn)行處理,得到目標(biāo)預(yù)測推理路徑包括:通過所述初始自然語言模型對所述樣本問題進(jìn)行處理,得到第二推理路徑;通過所述初始自然語言模型對所述樣本問題和所述參考推理路徑的參考推理子路徑集合進(jìn)行處理,得到第三推理路徑;依據(jù)所述第二推理路徑和所述第三推理路徑,得到所述目標(biāo)預(yù)測推理路徑。

8、進(jìn)一步地,依據(jù)所述目標(biāo)預(yù)測推理路徑,得到目標(biāo)損失函數(shù)包括:依據(jù)所述第二推理路徑和所述參考推理路徑進(jìn)行計(jì)算,得到參考路徑損失函數(shù);依據(jù)所述第三推理路徑和所述推理路徑分支對進(jìn)行計(jì)算,得到分支損失函數(shù);依據(jù)所述參考路徑損失函數(shù)和分支損失函數(shù),得到所述目標(biāo)損失函數(shù)。

9、進(jìn)一步地,依據(jù)所述第三推理路徑和所述推理路徑分支對進(jìn)行計(jì)算,得到分支損失函數(shù)包括:依據(jù)所述第三推理路徑和所述第一推理路徑分支進(jìn)行計(jì)算,得到第一損失函數(shù);依據(jù)所述第三推理路徑和所述第二推理路徑分支進(jìn)行計(jì)算,得到第二損失函數(shù);依據(jù)所述第一損失函數(shù)和所述第二損失函數(shù)進(jìn)行計(jì)算,得到所述分支損失函數(shù)。

10、根據(jù)本技術(shù)實(shí)施例的另一方面,提供了一種數(shù)據(jù)處理方法,包括:獲取目標(biāo)對象輸入的問題信息;通過目標(biāo)自然語言模型對所述問題信息進(jìn)行推理分析,得到目標(biāo)推理路徑,其中,所述目標(biāo)自然語言模型依據(jù)上述任意一項(xiàng)所述的自然語言模型的生成方法得到,所述目標(biāo)推理路徑由從所述問題信息推導(dǎo)至所述問題信息對應(yīng)的答復(fù)信息的邏輯步驟組成,所述目標(biāo)自然語言模型由目標(biāo)訓(xùn)練集得到,所述目標(biāo)訓(xùn)練集由樣本問題和所述樣本問題對應(yīng)的推理路徑集合組成;將所述目標(biāo)推理路徑返回至所述目標(biāo)對象。

11、進(jìn)一步地,通過目標(biāo)自然語言模型對所述問題信息進(jìn)行推理分析,得到目標(biāo)推理路徑包括:通過所述目標(biāo)自然語言模型基于所述問題信息進(jìn)行推理分析,生成多個候選推理路徑,其中,所述候選推理路徑中包括所述問題信息對應(yīng)的答復(fù)信息;通過所述目標(biāo)自然語言模型從所述多個候選推理路徑中,確定目標(biāo)推理路徑。

12、根據(jù)本技術(shù)實(shí)施例的另一方面,還提供了一種數(shù)據(jù)處理方法,包括:獲取客戶端發(fā)送的問題信息;在云端服務(wù)器中通過目標(biāo)自然語言模型對所述問題信息進(jìn)行推理分析,得到目標(biāo)推理路徑,其中,所述目標(biāo)推理路徑由從所述問題信息推導(dǎo)至所述問題信息對應(yīng)的答復(fù)信息的邏輯步驟組成,所述目標(biāo)自然語言模型由目標(biāo)訓(xùn)練集得到,所述目標(biāo)訓(xùn)練集由樣本問題和所述樣本問題對應(yīng)的推理路徑集合組成;將所述目標(biāo)推理路徑返回至所述客戶端。

13、根據(jù)本技術(shù)實(shí)施例的另一方面,還提供了一種自然語言模型的生成裝置,包括:第一獲取單元,用于獲取樣本問題,并獲取所述樣本問題對應(yīng)的推理路徑集合,其中,所述推理路徑集合中至少包括:參考推理路徑和推理路徑分支對,所述參考推理路徑包括答復(fù)所述樣本問題的真實(shí)答復(fù)信息,所述推理路徑分支對包括第一推理路徑分支和第二推理路徑分支,所述第一推理路徑分支為通向所述真實(shí)答復(fù)信息的路徑分支,所述第二推理路徑分支為不能通向所述真實(shí)答復(fù)信息的路徑分支;構(gòu)建單元,用于依據(jù)所述樣本問題和所述推理路徑集合構(gòu)建所述目標(biāo)訓(xùn)練集;訓(xùn)練單元,用于依據(jù)所述目標(biāo)訓(xùn)練集對初始自然語言模型進(jìn)行訓(xùn)練,得到所述目標(biāo)自然語言模型,其中,所述目標(biāo)自然語言模型用于對目標(biāo)對象輸入的問題信息進(jìn)行答復(fù)。

14、進(jìn)一步地,第一獲取單元包括:生成子單元,用于依據(jù)所述樣本問題和思維鏈提示,生成思維鏈?zhǔn)绞纠?,其中,所述思維鏈?zhǔn)绞纠ǎ核鰳颖締栴}和所述樣本問題對應(yīng)的思維鏈?zhǔn)酵评砺窂浇M成,所述思維鏈?zhǔn)酵评砺窂街邪ù饛?fù)所述樣本問題的真實(shí)答復(fù)信息;處理子單元,用于通過所述初始自然語言模型對所述樣本問題和所述思維鏈?zhǔn)绞纠M(jìn)行處理,判斷是否能夠得到所述樣本問題對應(yīng)的所述參考推理路徑;第一確定子單元,用于在能夠得到所述樣本問題對應(yīng)的所述參考推理路徑的情況下,依據(jù)所述樣本問題、所述參考推理路徑和所述思維鏈?zhǔn)绞纠?,得到所述推理路徑分支對;第二確定子單元,用于依據(jù)所述參考推理路徑和所述推理路徑分支對,得到所述推理路徑集合。

15、進(jìn)一步地,處理子單元包括:處理模塊,用于通過所述初始自然語言模型對所述樣本問題和所述思維鏈?zhǔn)绞纠M(jìn)行處理,得到第一推理路徑;判斷模塊,用于依據(jù)所述第一推理路徑是否能夠推理得到所述真實(shí)答復(fù)信息,判斷是否能夠得到所述樣本問題對應(yīng)的所述參考推理路徑。

16、進(jìn)一步地,第一確定子單元包括:第一確定模塊,用于依據(jù)所述參考推理路徑,得到參考推理子路徑集合;采樣模塊,用于依據(jù)所述樣本問題、所述參考推理子路徑集合和所述思維鏈?zhǔn)绞纠?,以所述參考推理子路徑集合的參考推理子路徑中的最后一個推理步驟為起點(diǎn)采樣生成推理路徑分支,得到所述參考推理子路徑集合的參考推理子路徑對應(yīng)的多個推理路徑分支;第二確定模塊,用于依據(jù)所述多個推理路徑分支,得到所述第一推理路徑分支和所述第二推理路徑分支;第三確定模塊,用于依據(jù)所述第一推理路徑分支和所述第二推理路徑分支,得到所述推理路徑分支對。

17、進(jìn)一步地,訓(xùn)練單元包括:處理子單元,用于通過所述初始自然語言模型對所述目標(biāo)訓(xùn)練集進(jìn)行處理,得到目標(biāo)預(yù)測推理路徑;第三確定子單元,用于依據(jù)所述目標(biāo)預(yù)測推理路徑,得到目標(biāo)損失函數(shù);訓(xùn)練子單元,用于依據(jù)所述目標(biāo)損失函數(shù)對初始自然語言模型進(jìn)行訓(xùn)練,得到所述目標(biāo)自然語言模型。

18、進(jìn)一步地,處理子單元包括:第一處理模塊,用于通過所述初始自然語言模型對所述樣本問題進(jìn)行處理,得到第二推理路徑;第二處理模塊,用于通過所述初始自然語言模型對所述樣本問題和所述參考推理路徑的參考推理子路徑集合進(jìn)行處理,得到第三推理路徑;第四確定模塊,用于依據(jù)所述第二推理路徑和所述第三推理路徑,得到所述目標(biāo)預(yù)測推理路徑。

19、進(jìn)一步地,第三確定子單元包括:第一計(jì)算模塊,用于依據(jù)所述第二推理路徑和所述參考推理路徑進(jìn)行計(jì)算,得到參考路徑損失函數(shù);第二計(jì)算模塊,用于依據(jù)所述第三推理路徑和所述推理路徑分支對進(jìn)行計(jì)算,得到分支損失函數(shù);第五確定模塊,用于依據(jù)所述參考路徑損失函數(shù)和分支損失函數(shù),得到所述目標(biāo)損失函數(shù)。

20、進(jìn)一步地,第二計(jì)算模塊包括:第一計(jì)算子模塊,用于依據(jù)所述第三推理路徑和所述第一推理路徑分支進(jìn)行計(jì)算,得到第一損失函數(shù);第二計(jì)算子模塊,用于依據(jù)所述第三推理路徑和所述第二推理路徑分支進(jìn)行計(jì)算,得到第二損失函數(shù);第三計(jì)算子模塊,用于依據(jù)所述第一損失函數(shù)和所述第二損失函數(shù)進(jìn)行計(jì)算,得到所述分支損失函數(shù)。

21、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種數(shù)據(jù)處理裝置,包括:第二獲取單元,用于獲取目標(biāo)對象輸入的問題信息;推理單元,用于通過目標(biāo)自然語言模型對所述問題信息進(jìn)行推理分析,得到目標(biāo)推理路徑,其中,所述目標(biāo)自然語言模型依據(jù)上述任意一項(xiàng)所述的自然語言模型的生成方法得到,所述目標(biāo)推理路徑由從所述問題信息推導(dǎo)至所述問題信息對應(yīng)的答復(fù)信息的邏輯步驟組成;返回單元,用于將所述目標(biāo)推理路徑返回至所述目標(biāo)對象。

22、進(jìn)一步地,推理單元包括:推理子單元,用于通過所述目標(biāo)自然語言模型基于所述問題信息進(jìn)行推理分析,生成多個候選推理路徑,其中,所述候選推理路徑中包括所述問題信息對應(yīng)的答復(fù)信息;第四確定子單元,用于通過所述目標(biāo)自然語言模型從所述多個候選推理路徑中,確定目標(biāo)推理路徑。

23、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種電子設(shè)備,包括存儲器,存儲有可執(zhí)行程序;處理器,用于運(yùn)行所述程序,其中,所述程序運(yùn)行時執(zhí)行上述任意一項(xiàng)所述的自然語言模型的生成方法,或數(shù)據(jù)處理方法。

24、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括存儲的計(jì)算機(jī)程序,在所述計(jì)算機(jī)程序由處理器運(yùn)行時,實(shí)現(xiàn)上述任意一項(xiàng)中任意一項(xiàng)所述的自然語言模型的生成方法,或數(shù)據(jù)處理方法。

25、在本技術(shù)實(shí)施例中,采用以下步驟:獲取樣本問題,并獲取所述樣本問題對應(yīng)的推理路徑集合,其中,所述推理路徑集合中至少包括:參考推理路徑和推理路徑分支對,所述參考推理路徑包括答復(fù)所述樣本問題的真實(shí)答復(fù)信息,所述推理路徑分支對包括第一推理路徑分支和第二推理路徑分支,所述第一推理路徑分支為通向所述真實(shí)答復(fù)信息的路徑分支,所述第二推理路徑分支為不能通向所述真實(shí)答復(fù)信息的路徑分支;依據(jù)所述樣本問題和所述推理路徑集合構(gòu)建所述目標(biāo)訓(xùn)練集;依據(jù)所述目標(biāo)訓(xùn)練集對初始自然語言模型進(jìn)行訓(xùn)練,得到所述目標(biāo)自然語言模型,其中,所述目標(biāo)自然語言模型用于對目標(biāo)對象輸入的問題信息進(jìn)行答復(fù),解決了相關(guān)技術(shù)中由于自然語言模型的推理能力較差導(dǎo)致自然語言模型答復(fù)問題的準(zhǔn)確性比較低的技術(shù)問題。

26、在本方案中,根據(jù)樣本問題進(jìn)行推理分析得到對應(yīng)的推理路徑集合,通過樣本問題和樣本問題對應(yīng)的推理路徑集合對初始自然語言模型進(jìn)行訓(xùn)練得到目標(biāo)自然語言模型,能夠有效探索給定問題的潛在解空間,以及增強(qiáng)自然語言模型的內(nèi)在推理能力,進(jìn)而達(dá)到提高自然語言模型答復(fù)問題的準(zhǔn)確性的效果。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1