本發(fā)明涉及內(nèi)容生成,尤其涉及一種基于人工智能的內(nèi)容生成方法。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)的快速發(fā)展和信息化的普及,用戶對(duì)高質(zhì)量?jī)?nèi)容的需求不斷增加。傳統(tǒng)的內(nèi)容創(chuàng)作方式通常依賴人工編輯和創(chuàng)作,然而,這種方式不僅耗時(shí)耗力,而且創(chuàng)作質(zhì)量受到編輯者個(gè)人能力和經(jīng)驗(yàn)的限制。此外,面對(duì)大規(guī)模的內(nèi)容需求,傳統(tǒng)方法難以實(shí)現(xiàn)快速響應(yīng)和高效產(chǎn)出。
2、人工智能技術(shù),尤其是基于深度學(xué)習(xí)的自然語(yǔ)言處理(nlp)和生成對(duì)抗網(wǎng)絡(luò)(gan)等方法的發(fā)展,為內(nèi)容自動(dòng)生成提供了新的解決方案。通過(guò)訓(xùn)練模型,使其具備理解和生成自然語(yǔ)言文本的能力,人工智能技術(shù)能夠在短時(shí)間內(nèi)生成大量高質(zhì)量的內(nèi)容,包括但不限于新聞文章、產(chǎn)品描述、市場(chǎng)報(bào)告、社交媒體帖子等。
3、目前,已有多種基于人工智能的內(nèi)容生成方法被提出和應(yīng)用,例如,基于遞歸神經(jīng)網(wǎng)絡(luò)(rnn)的文本生成方法、基于轉(zhuǎn)換器模型(transformer)的自然語(yǔ)言生成方法等。這些方法在一定程度上提高了文本生成的效率和質(zhì)量,但仍存在一些問題和挑戰(zhàn),無(wú)法有效的理解用戶對(duì)話的意圖和情感,對(duì)于多類型的對(duì)話無(wú)法有效識(shí)別,尤其對(duì)于圖像數(shù)據(jù),缺乏有效的內(nèi)容驗(yàn)證機(jī)制和修正機(jī)制,內(nèi)容生成過(guò)分依賴單一模型,容易因?yàn)槟P偷木植咳毕輰?dǎo)致無(wú)法生成有效內(nèi)容。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種基于人工智能的內(nèi)容生成方法,包括:s1.獲取用戶的對(duì)話數(shù)據(jù),包括文本、語(yǔ)音和圖像三種類型的數(shù)據(jù),對(duì)每種類型的對(duì)話數(shù)據(jù)進(jìn)行不同的處理,得到對(duì)話數(shù)據(jù)的意圖及情感類別;文本數(shù)據(jù):對(duì)文本數(shù)據(jù)進(jìn)行文法分析獲取意圖類別和關(guān)鍵詞,文法分析包括詞類分析、短語(yǔ)分析、句型分析和意圖分析;語(yǔ)音數(shù)據(jù):使用語(yǔ)音識(shí)別技術(shù)將語(yǔ)音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù);圖像數(shù)據(jù):將圖像數(shù)據(jù)送入圖像識(shí)別模型中進(jìn)行內(nèi)容識(shí)別,圖像識(shí)別模型由5個(gè)子單元構(gòu)成,分別為第一區(qū)域劃分單元、第二名詞獲取單元、第三動(dòng)詞獲取單元、第四形容詞獲取單元和第五文本生成單元,圖像數(shù)據(jù)經(jīng)過(guò)內(nèi)容識(shí)別后轉(zhuǎn)換為文本數(shù)據(jù);對(duì)轉(zhuǎn)換的文本數(shù)據(jù)進(jìn)行文法分析獲取意圖類別;對(duì)文本數(shù)據(jù)和轉(zhuǎn)換的文本數(shù)據(jù)進(jìn)行文本情感分析,獲取對(duì)話數(shù)據(jù)的情感類別;s2.將用戶對(duì)話數(shù)據(jù)的文本數(shù)據(jù)、意圖類別和情感類別送入內(nèi)容生成模型中進(jìn)行內(nèi)容生成,文本數(shù)據(jù)首先進(jìn)入內(nèi)容生成模型的通道選擇層,根據(jù)用戶對(duì)話數(shù)據(jù)的意圖類別、關(guān)鍵詞、情感類別、對(duì)話關(guān)聯(lián)性選擇內(nèi)容生成模型的合適通道進(jìn)行內(nèi)容生成;內(nèi)容生成模型有3條通道,分別為模版內(nèi)容生成通道、規(guī)則內(nèi)容生成通道和神經(jīng)網(wǎng)絡(luò)內(nèi)容生成通道;3條通道根據(jù)用戶對(duì)話數(shù)據(jù)的意圖類別和情感類別,分別進(jìn)行模版匹配生成、規(guī)則匹配生成和神經(jīng)網(wǎng)絡(luò)生成;模版匹配生成使用匹配模版替換變量后生成內(nèi)容,規(guī)則匹配生成通過(guò)匹配的規(guī)則生成內(nèi)容;神經(jīng)網(wǎng)絡(luò)生成通過(guò)預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型生成內(nèi)容;進(jìn)入內(nèi)容生成模型的內(nèi)容生成層,生成3條有差異的內(nèi)容,將第一次生成的內(nèi)容記為第一內(nèi)容,獲取每條第一內(nèi)容的意圖類別和情感類別,對(duì)第一內(nèi)容進(jìn)行主觀評(píng)估及客觀評(píng)估,得到第一內(nèi)容的主觀評(píng)估分?jǐn)?shù)及客觀評(píng)估分?jǐn)?shù),主觀評(píng)估分?jǐn)?shù)基于生成內(nèi)容與用戶對(duì)話的意圖類別及情感類別的匹配分?jǐn)?shù),客觀評(píng)估分?jǐn)?shù)基于生成內(nèi)容的邏輯性、準(zhǔn)確性和可讀性評(píng)估分?jǐn)?shù);將主觀評(píng)估分?jǐn)?shù)和客觀評(píng)估分?jǐn)?shù)加權(quán)求和獲取第一內(nèi)容綜合評(píng)估分?jǐn)?shù),選擇第一內(nèi)容綜合評(píng)估分?jǐn)?shù)最高的內(nèi)容輸出,將第一內(nèi)容保存在內(nèi)容生成模型的內(nèi)容修正層中;接收到后續(xù)的用戶對(duì)話后,再次對(duì)第一內(nèi)容進(jìn)行主觀評(píng)估和客觀評(píng)估,得到第一內(nèi)容的修正評(píng)估分?jǐn)?shù),修正評(píng)估分?jǐn)?shù)由修正主觀評(píng)估分?jǐn)?shù)和修正客觀評(píng)估分?jǐn)?shù)加權(quán)求和得到,修正主觀評(píng)估分?jǐn)?shù)基于第一內(nèi)容與后續(xù)用戶對(duì)話的意圖類別及情感類別的匹配分?jǐn)?shù),修正客觀評(píng)估分?jǐn)?shù)基于第一內(nèi)容與后續(xù)用戶對(duì)話連接段的邏輯性、準(zhǔn)確性和可讀性評(píng)估分?jǐn)?shù),將第一內(nèi)容的綜合評(píng)估分?jǐn)?shù)和修正評(píng)估分?jǐn)?shù)進(jìn)行加權(quán)求和,得到修正選擇分?jǐn)?shù);若修正選擇分?jǐn)?shù)與第一內(nèi)容綜合評(píng)估分?jǐn)?shù)對(duì)應(yīng)的內(nèi)容一致,則根據(jù)后續(xù)的用戶對(duì)話匹配內(nèi)容生成通道進(jìn)行內(nèi)容生成,在連續(xù)的對(duì)話中,根據(jù)后續(xù)的用戶對(duì)話匹配內(nèi)容生成通道進(jìn)行內(nèi)容生成得到的內(nèi)容,稱為第二內(nèi)容;否則,輸出意圖理解錯(cuò)誤和修正分?jǐn)?shù)最高的第一內(nèi)容,并根據(jù)修正后的第一內(nèi)容進(jìn)行內(nèi)容生成,在連續(xù)的對(duì)話中,根據(jù)修正后的第一內(nèi)容進(jìn)行內(nèi)容生成得到的內(nèi)容,稱為第二內(nèi)容;s3.記錄每個(gè)用戶的歷史行為,獲取用戶的語(yǔ)言習(xí)慣、生成類型偏好、生成模式偏好。
2、作為本發(fā)明的一種優(yōu)選技術(shù)方案,還包括對(duì)文本數(shù)據(jù)進(jìn)行文法分析獲取意圖類別和關(guān)鍵詞;對(duì)文本進(jìn)行預(yù)處理,包括文本清理、數(shù)據(jù)轉(zhuǎn)換、分節(jié)處理和分詞處理;文本清理,去除多余的空格及格式標(biāo)記;數(shù)據(jù)轉(zhuǎn)換,將文本中摻雜的表情符號(hào)進(jìn)行標(biāo)記,并轉(zhuǎn)換為文字類型數(shù)據(jù)進(jìn)行替換;分節(jié)處理,將每段話劃分為短語(yǔ);分節(jié)處理,將短語(yǔ)劃分為詞;詞類分析,獲取每個(gè)詞的所有可能的詞類,記為獨(dú)立詞類,根據(jù)短語(yǔ)結(jié)構(gòu)對(duì)獨(dú)立詞類進(jìn)行篩選,得到每個(gè)短語(yǔ)的詞的所有可能的詞性組合,記為關(guān)聯(lián)詞類,根據(jù)句子結(jié)構(gòu)對(duì)關(guān)聯(lián)詞類進(jìn)行篩選,得到句子的每個(gè)詞的詞性,記為句的詞類,并添在每個(gè)對(duì)應(yīng)的詞上進(jìn)行標(biāo)記;短語(yǔ)結(jié)構(gòu)和句子結(jié)構(gòu)均記錄在文法詞典中;短語(yǔ)分析,根據(jù)詞的詞性標(biāo)記獲取短語(yǔ)的結(jié)構(gòu)類型,根據(jù)結(jié)構(gòu)類型和詞在文法詞典中匹配短語(yǔ)的關(guān)鍵詞;句型分析,根據(jù)句子的非短語(yǔ)部分在文法詞典中進(jìn)行句型結(jié)構(gòu)的匹配,得到句子的句型結(jié)構(gòu);意圖分析,根據(jù)短語(yǔ)的關(guān)鍵詞和句子的句型結(jié)構(gòu),通過(guò)文法詞典中的句法規(guī)則得出文本的意圖類別及關(guān)鍵詞。
3、作為本發(fā)明的一種優(yōu)選技術(shù)方案,還包括情感分析;在文本數(shù)據(jù)中通過(guò)對(duì)情感相關(guān)詞的檢索,對(duì)檢索到的每種情感的情感相關(guān)詞進(jìn)行分?jǐn)?shù)疊加,每種情感的程度根據(jù)分?jǐn)?shù)區(qū)間進(jìn)行判定,情感相關(guān)詞的分?jǐn)?shù)具體記錄在文法詞典中的情感詞區(qū)中,若一個(gè)文本數(shù)據(jù)的情感為輕度悲傷,中度憤怒,則記為ed={s1、f2}。
4、作為本發(fā)明的一種優(yōu)選技術(shù)方案,還包括語(yǔ)音數(shù)據(jù)轉(zhuǎn)換和圖像數(shù)據(jù)轉(zhuǎn)換;語(yǔ)音數(shù)據(jù)通過(guò)預(yù)訓(xùn)練的語(yǔ)音識(shí)別模型轉(zhuǎn)換為文本數(shù)據(jù);圖像數(shù)據(jù)通過(guò)圖像識(shí)別模型中進(jìn)行內(nèi)容識(shí)別后轉(zhuǎn)換為文本數(shù)據(jù),圖像識(shí)別模型由5個(gè)子單元構(gòu)成,分別為第一區(qū)域劃分單元、第二名詞獲取單元、第三動(dòng)詞獲取單元、第四形容詞獲取單元和第五文本生成單元;第一區(qū)域劃分單元,通過(guò)mask?r-cnn對(duì)圖片中的物體進(jìn)行區(qū)域劃分,輸出物體的劃分掩碼,將掩碼傳遞至下一個(gè)子單元進(jìn)行對(duì)象檢測(cè);第二名詞獲取單元、第三動(dòng)詞獲取單元和第四形容詞獲取單元通過(guò)一個(gè)卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建,三個(gè)單元分別對(duì)應(yīng)卷積神經(jīng)網(wǎng)絡(luò)中不同隱藏層,第二名詞獲取單元為前三層的隱藏層,通過(guò)對(duì)劃分掩碼進(jìn)行識(shí)別,得到對(duì)應(yīng)的物體的識(shí)別結(jié)果,即物體名詞,第三動(dòng)詞獲取單元為第五至七層的隱藏層,通過(guò)對(duì)第二名詞獲取單元的輸出進(jìn)行識(shí)別,得到物體對(duì)應(yīng)的動(dòng)詞識(shí)別結(jié)果,第四形容詞獲取單元為第八至十層的隱藏層,通過(guò)對(duì)第三動(dòng)詞獲取單元的輸出進(jìn)行識(shí)別,得到物體的形容詞識(shí)別結(jié)果,模型的第四層隱藏層用于獲取不同區(qū)域的相鄰關(guān)系,三個(gè)單元的隱藏層間通過(guò)3個(gè)全連接層進(jìn)行連接;最終輸出每個(gè)區(qū)域的對(duì)應(yīng)的短語(yǔ)與區(qū)域的相鄰關(guān)系;第五文本生成單元通過(guò)文法規(guī)則,根據(jù)區(qū)域的相鄰關(guān)系和短語(yǔ)進(jìn)行文本生成。
5、作為本發(fā)明的一種優(yōu)選技術(shù)方案,內(nèi)容生成模型包括通道選擇層,內(nèi)容生成層和內(nèi)容修正層;通道選擇層用于根據(jù)用戶對(duì)話數(shù)據(jù)的意圖類別、關(guān)鍵詞、情感類別、對(duì)話關(guān)聯(lián)性進(jìn)行內(nèi)容生成通道選擇,獲取用戶的意圖類別,若類別為特定領(lǐng)域,則選擇模版內(nèi)容生成通道,計(jì)算用戶對(duì)話的復(fù)雜度,若復(fù)雜度為超出設(shè)定閾值且意圖類別不為特定領(lǐng)域,則選擇規(guī)則內(nèi)容生成通道,若復(fù)雜度超過(guò)設(shè)定閾值則選擇神經(jīng)網(wǎng)絡(luò)內(nèi)容生成通道;復(fù)雜度的計(jì)算公式為:公式中為情感權(quán)重,用于平衡情感對(duì)復(fù)雜度的影響,為情感分?jǐn)?shù)的合,輕度記為1,中度記為2,ht為意圖類別得分,為關(guān)鍵詞得分的合,意圖類別得分和關(guān)鍵詞得分在文法詞典中記錄,n為表示當(dāng)前為連續(xù)的第n條對(duì)話,表示當(dāng)前對(duì)話與前一條對(duì)話意圖類別的差異得分,為當(dāng)前對(duì)話和前一條對(duì)話的關(guān)鍵詞的差異得分,差異得分通過(guò)矩陣中的距離差得到,若當(dāng)前為第一條對(duì)話,則差異得分為0,通過(guò)該公式可根據(jù)對(duì)話數(shù)據(jù)本身的意圖類別和關(guān)鍵詞得出原始復(fù)雜度,并根據(jù)情感類別和對(duì)話間的關(guān)聯(lián)性進(jìn)行復(fù)雜度的進(jìn)一步評(píng)估;內(nèi)容生成層用于根據(jù)用戶的意圖類別和情感類別進(jìn)行內(nèi)容生成,模版內(nèi)容生成通道中通過(guò)設(shè)定的意圖類別對(duì)應(yīng)的模版,根據(jù)關(guān)鍵詞和情感類別替換模版中的變量及取值范圍后生成對(duì)應(yīng)的內(nèi)容,規(guī)則內(nèi)容生成通道中通過(guò)用戶的意圖類別和情感類別,在規(guī)則庫(kù)中匹配規(guī)則,按照規(guī)則邏輯生成對(duì)應(yīng)的內(nèi)容,神經(jīng)網(wǎng)絡(luò)內(nèi)容生成通道中通過(guò)將用戶的意圖類別和情感類別,及關(guān)鍵詞信息送入到預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)內(nèi)容生成模型中,生成復(fù)雜度較高的內(nèi)容;內(nèi)容修正層用于根據(jù)用戶的后續(xù)對(duì)話進(jìn)行內(nèi)容驗(yàn)證及修正。
6、作為本發(fā)明的一種優(yōu)選技術(shù)方案,還包括內(nèi)容驗(yàn)證及修正;內(nèi)容驗(yàn)證,對(duì)生成的內(nèi)容進(jìn)行文法分析和情感分析,得到各生成內(nèi)容的內(nèi)容類別,關(guān)鍵詞和情感類別,計(jì)算主觀評(píng)估得分,主觀評(píng)估得分的公式為:公式中為情感影響權(quán)重,表示每個(gè)用戶對(duì)話的情感類別得分,與生成內(nèi)容的每個(gè)情感類別得分的差的總和,分別表示用戶對(duì)話文本與生成內(nèi)容的意圖類別和關(guān)鍵詞的關(guān)聯(lián)得分,通過(guò)文法詞典中關(guān)聯(lián)向量獲取;通過(guò)該公式可以獲取主觀上的生成內(nèi)容與用戶對(duì)話的關(guān)聯(lián)性;客觀評(píng)估得分計(jì)算,對(duì)生成內(nèi)容進(jìn)行邏輯性檢測(cè),準(zhǔn)確性檢測(cè)和可讀性檢測(cè),得到客觀評(píng)估得分po,邏輯性檢測(cè)通過(guò)計(jì)算生成內(nèi)容中相鄰句子的語(yǔ)義相似度,得到邏輯評(píng)分,準(zhǔn)確性檢測(cè)通過(guò)計(jì)算生成內(nèi)容中所有可驗(yàn)證事實(shí)的準(zhǔn)確率,得到準(zhǔn)確評(píng)分,可讀性檢測(cè)通過(guò)smog可讀性公式計(jì)算生成內(nèi)容的可讀評(píng)分;
7、綜合評(píng)估得分p=α1ps+α2po,選擇綜合評(píng)估得分最高的生成內(nèi)容輸出,完成內(nèi)容驗(yàn)證;內(nèi)容修正,獲取用戶的后續(xù)對(duì)話后,獲取后續(xù)對(duì)話的意圖類別、關(guān)鍵詞和情感類別,并計(jì)算修正評(píng)估得分,計(jì)算的公式為:,式中ks為修正評(píng)估的主觀評(píng)估部分,計(jì)算方法與ps一致,ko為修正評(píng)估的客觀評(píng)估部分,通過(guò)第一內(nèi)容與用戶后續(xù)對(duì)話的連接段的邏輯性檢測(cè),準(zhǔn)確性檢測(cè)和可讀性檢測(cè)評(píng)分得到;計(jì)算修正選擇得分和綜合評(píng)估得分的合v=γ1p+γ2k,若v和p的值最高的為同一條內(nèi)容,則繼續(xù)生成第二內(nèi)容,若v和p的值最高的不為同一條內(nèi)容,則輸出輸出意圖理解錯(cuò)誤和v值最高的第一內(nèi)容,并根據(jù)修正后的第一內(nèi)容進(jìn)行內(nèi)容生成第二內(nèi)容。
8、作為本發(fā)明的一種優(yōu)選技術(shù)方案,還包括用戶行為分析;獲取用戶使用的歷史行為,為每個(gè)用戶建立使用偏好對(duì)象,偏好對(duì)象中包括用戶的語(yǔ)言習(xí)慣、類型偏好、模式偏好;檢測(cè)用戶的語(yǔ)言習(xí)慣,在生成內(nèi)容時(shí),優(yōu)選選擇語(yǔ)言習(xí)慣對(duì)應(yīng)的語(yǔ)言,檢測(cè)用戶的類型偏好,在生成內(nèi)容時(shí),若未檢測(cè)到用戶的內(nèi)容類型需求,則生成類型偏好對(duì)應(yīng)的內(nèi)容類型,檢測(cè)用戶的模式偏好,在生成內(nèi)容時(shí),優(yōu)選模式偏好對(duì)應(yīng)的內(nèi)容生成通道;語(yǔ)言習(xí)慣、類型偏好、模式偏好,通過(guò)需修改的記錄獲取,具體為3者各種類的初始權(quán)重一致,每產(chǎn)生一個(gè)歷史行為記錄,增加該種類的權(quán)重占比。
9、本發(fā)明具有以下優(yōu)點(diǎn):1、本發(fā)明通過(guò)對(duì)圖像數(shù)據(jù)進(jìn)行區(qū)域劃分,名稱、動(dòng)詞、形容詞分析后生成圖像數(shù)據(jù)對(duì)應(yīng)的文本數(shù)據(jù),并對(duì)文本數(shù)據(jù)進(jìn)行詳細(xì)的文法分析,獲取文本的詞的正確詞類后,獲取文本的短語(yǔ),提取短語(yǔ)的關(guān)鍵詞,并根據(jù)關(guān)鍵詞對(duì)文本進(jìn)行意圖分析,獲取文本數(shù)據(jù)的意圖類別,通過(guò)詞典對(duì)文本數(shù)據(jù)進(jìn)行情感分析,獲取文本數(shù)據(jù)的詳細(xì)情感類別,提高了在內(nèi)容生成過(guò)程中,對(duì)用戶對(duì)話的理解能力。
10、2、本發(fā)明通過(guò)設(shè)置基于意圖和情感的上下文驗(yàn)證及修正機(jī)制,并在驗(yàn)證及修正機(jī)制中引入主觀及客觀劃分,在生成內(nèi)容時(shí),對(duì)生成的多條內(nèi)容進(jìn)行驗(yàn)證,獲取最匹配意圖和情感的內(nèi)容進(jìn)行輸出,并基于后續(xù)的對(duì)話,對(duì)生成的內(nèi)容進(jìn)行再次驗(yàn)證與選擇性修正,提高了內(nèi)容生成過(guò)程中內(nèi)容生成的準(zhǔn)確性和內(nèi)容的修正性能。
11、3、本發(fā)明通過(guò)設(shè)置多通道的內(nèi)容生成模型,3個(gè)通道分別基于模版、規(guī)則和神經(jīng)網(wǎng)絡(luò),并計(jì)算復(fù)雜度以選擇合適的通道,通過(guò)這種多通道的方式,提高了資源利用能力,并防止了因?yàn)槟P偷木植咳毕荻鵁o(wú)法生成有效內(nèi)容。