午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

基于生成式人工智能的科技情報感知與獲取方法及系統(tǒng)與流程

文檔序號:39729428發(fā)布日期:2024-10-22 13:34閱讀:6來源:國知局
基于生成式人工智能的科技情報感知與獲取方法及系統(tǒng)與流程

本發(fā)明涉及人工智能,尤其涉及一種基于生成式人工智能的科技情報感知與獲取方法及系統(tǒng)。


背景技術(shù):

1、長期以來,科技情報為科學(xué)研究、技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展、社會進步、管理決策發(fā)揮著重要的支撐作用,充分體現(xiàn)了“耳目、尖兵、參謀”的核心價值。要在日趨激烈的競跑中攻克系列關(guān)鍵、瓶頸技術(shù),搶占技術(shù)高地,離不開科技情報工作持續(xù)深入的跟進支撐。

2、傳統(tǒng)的情報獲取存在著海量開源情報數(shù)據(jù)帶來的信息過載,大量有預(yù)見性價值但模糊零碎的“弱信號”情報難以發(fā)現(xiàn)的問題,仍然需要依靠研究機構(gòu)或咨詢專家的業(yè)務(wù)經(jīng)驗與研究能力去獲取有效的情報信息,這樣方式不僅效率較低,并且所獲取到的信息存在準確性與完整性較差的問題。

3、上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認上述內(nèi)容是現(xiàn)有技術(shù)。


技術(shù)實現(xiàn)思路

1、本發(fā)明的主要目的在于提供一種基于生成式人工智能的科技情報感知與獲取方法及系統(tǒng),旨在解決現(xiàn)有技術(shù)獲取信息的效率較低且準確性與完整性較差的技術(shù)問題。

2、為實現(xiàn)上述目的,本發(fā)明提供了一種基于生成式人工智能的科技情報感知與獲取方法,所述基于生成式人工智能的科技情報感知與獲取方法包括以下步驟:

3、基于情報感知獲取初始科技情報數(shù)據(jù);

4、對所述初始科技情報數(shù)據(jù)進行數(shù)據(jù)清洗,得到參考科技情報數(shù)據(jù);

5、識別所述參考科技情報數(shù)據(jù)中所有的實體指稱項;

6、利用生成式人工智能模型基于所述實體指稱項獲取候選實體;

7、根據(jù)所述候選實體確定目標實體;

8、構(gòu)建所述目標實體與科技情報知識庫之間的關(guān)聯(lián),以得到目標科技情報數(shù)據(jù)。

9、可選地,所述基于情報感知獲取初始科技情報數(shù)據(jù),包括:

10、發(fā)送信息提取請求,以獲取與科技情報關(guān)聯(lián)的期刊頁面的統(tǒng)一資源定位符;

11、基于所述統(tǒng)一資源定位符從所述期刊頁面中提取相應(yīng)的字段,并判斷是否存在剩余未獲取的統(tǒng)一資源定位符;

12、若不存在,則對提取到的所有字段進行格式化處理并存入數(shù)據(jù)庫中,以得到初始科技情報數(shù)據(jù)。

13、可選地,所述對所述初始科技情報數(shù)據(jù)進行數(shù)據(jù)清洗,得到參考科技情報數(shù)據(jù),包括:

14、對所述初始科技情報數(shù)據(jù)進行歸一化處理,得到處理后的科技情報數(shù)據(jù);

15、對所述處理后的科技情報數(shù)據(jù)進行真詞、同音詞以及短文誤解檢測與修復(fù);

16、計算檢測與修復(fù)后的科技情報數(shù)據(jù)的綜合準確性分數(shù);

17、若所述綜合準確性分數(shù)未達到預(yù)設(shè)分數(shù),則返回執(zhí)行所述對所述處理后的科技情報數(shù)據(jù)進行真詞、同音詞以及短文誤解檢測與修復(fù);

18、若所述綜合準確性分數(shù)達到預(yù)設(shè)分數(shù),則將檢測與修復(fù)后的科技情報數(shù)據(jù)作為參考科技情報數(shù)據(jù)。

19、可選地,所述利用生成式人工智能模型基于所述實體指稱項獲取候選實體,包括:

20、通過生成式人工智能模型獲取實體指稱項對應(yīng)的各個實體之間的關(guān)系;

21、根據(jù)所述各個實體之間的關(guān)系構(gòu)建鄰接矩陣;

22、根據(jù)所述鄰接矩陣、所述生成式人工智能模型的系數(shù)矩陣、偏置向量以及預(yù)設(shè)激活函數(shù)確定候選實體的嵌入表示;

23、基于所述候選實體的嵌入表示獲取候選實體。

24、可選地,所述基于所述候選實體的嵌入表示獲取候選實體,包括:

25、獲取實體指稱項的上下文特征;

26、在同一維度下分別構(gòu)建所述上下文特征的特征向量和所述候選實體的嵌入表示對應(yīng)的向量;

27、將同一維度下的所述上下文特征的特征向量和所述候選實體的嵌入表示對應(yīng)的向量進行向量拼接,得到候選實體向量;

28、根據(jù)所述候選實體向量獲取候選實體。

29、可選地,所述根據(jù)所述候選實體確定目標實體,包括:

30、將所述候選實體與預(yù)設(shè)條目進行鏈接;

31、比較候選實體與已鏈接條目對應(yīng)實體之間的上下文特征;

32、基于比較結(jié)果對所述候選實體進行消歧;

33、根據(jù)消歧后的候選實體確定目標實體。

34、可選地,所述根據(jù)消歧后的候選實體確定目標實體,包括:

35、利用預(yù)設(shè)分類器確定消歧后的候選實體與預(yù)測實體之間的相似度;

36、根據(jù)所述相似度進行相似度評分;

37、將相似度評分最大的消歧后的候選實體作為目標實體。

38、此外,為實現(xiàn)上述目的,本發(fā)明還提出一種基于生成式人工智能的科技情報感知與獲取系統(tǒng),所述基于生成式人工智能的科技情報感知與獲取系統(tǒng)包括:

39、采集模塊,用于基于情報感知獲取初始科技情報數(shù)據(jù);

40、清洗模塊,用于對所述初始科技情報數(shù)據(jù)進行數(shù)據(jù)清洗,得到參考科技情報數(shù)據(jù);

41、識別模塊,用于識別所述參考科技情報數(shù)據(jù)中所有的實體指稱項;

42、構(gòu)建模塊,用于利用生成式人工智能模型基于所述實體指稱項獲取候選實體;

43、篩選模塊,用于根據(jù)所述候選實體確定目標實體;

44、處理模塊,用于構(gòu)建所述目標實體與科技情報知識庫之間的關(guān)聯(lián),以得到目標科技情報數(shù)據(jù)。

45、可選地,所述采集模塊,還用于發(fā)送信息提取請求,以獲取與科技情報關(guān)聯(lián)的期刊頁面的統(tǒng)一資源定位符;

46、基于所述統(tǒng)一資源定位符從所述期刊頁面中提取相應(yīng)的字段,并判斷是否存在剩余未獲取的統(tǒng)一資源定位符;

47、若不存在,則對提取到的所有字段進行格式化處理并存入數(shù)據(jù)庫中,以得到初始科技情報數(shù)據(jù)。

48、可選地,所述清洗模塊,還用于對所述初始科技情報數(shù)據(jù)進行歸一化處理,得到處理后的科技情報數(shù)據(jù);

49、對所述處理后的科技情報數(shù)據(jù)進行真詞、同音詞以及短文誤解檢測與修復(fù);

50、計算檢測與修復(fù)后的科技情報數(shù)據(jù)的綜合準確性分數(shù);

51、若所述綜合準確性分數(shù)未達到預(yù)設(shè)分數(shù),則返回執(zhí)行所述對所述處理后的科技情報數(shù)據(jù)進行真詞、同音詞以及短文誤解檢測與修復(fù);

52、若所述綜合準確性分數(shù)達到預(yù)設(shè)分數(shù),則將檢測與修復(fù)后的科技情報數(shù)據(jù)作為參考科技情報數(shù)據(jù)。

53、本發(fā)明通過基于情報感知獲取初始科技情報數(shù)據(jù);對所述初始科技情報數(shù)據(jù)進行數(shù)據(jù)清洗,得到參考科技情報數(shù)據(jù);識別所述參考科技情報數(shù)據(jù)中所有的實體指稱項;利用生成式人工智能模型基于所述實體指稱項獲取候選實體;根據(jù)所述候選實體確定目標實體;構(gòu)建所述目標實體與科技情報知識庫之間的關(guān)聯(lián),以得到目標科技情報數(shù)據(jù),通過上述方式,能夠應(yīng)對任意網(wǎng)站布局和結(jié)構(gòu)的變化,有效地從多種網(wǎng)站結(jié)構(gòu)中提取信息,提升科技情報數(shù)據(jù)的獲取效率,同時利用生成式人工智能模型進一步保證科技情報數(shù)據(jù)的準確性與完整性。



技術(shù)特征:

1.一種基于生成式人工智能的科技情報感知與獲取方法,其特征在于,所述基于生成式人工智能的科技情報感知與獲取方法包括:

2.如權(quán)利要求1所述的基于生成式人工智能的科技情報感知與獲取方法,其特征在于,所述基于情報感知獲取初始科技情報數(shù)據(jù),包括:

3.如權(quán)利要求1所述的基于生成式人工智能的科技情報感知與獲取方法,其特征在于,所述對所述初始科技情報數(shù)據(jù)進行數(shù)據(jù)清洗,得到參考科技情報數(shù)據(jù),包括:

4.如權(quán)利要求1所述的基于生成式人工智能的科技情報感知與獲取方法,其特征在于,所述利用生成式人工智能模型基于所述實體指稱項獲取候選實體,包括:

5.如權(quán)利要求4所述的基于生成式人工智能的科技情報感知與獲取方法,其特征在于,所述基于所述候選實體的嵌入表示獲取候選實體,包括:

6.如權(quán)利要求1所述的基于生成式人工智能的科技情報感知與獲取方法,其特征在于,所述根據(jù)所述候選實體確定目標實體,包括:

7.如權(quán)利要求6所述的基于生成式人工智能的科技情報感知與獲取方法,其特征在于,所述根據(jù)消歧后的候選實體確定目標實體,包括:

8.一種基于生成式人工智能的科技情報感知與獲取系統(tǒng),其特征在于,所述基于生成式人工智能的科技情報感知與獲取系統(tǒng):

9.如權(quán)利要求8所述的基于生成式人工智能的科技情報感知與獲取系統(tǒng),其特征在于,所述采集模塊,還用于發(fā)送信息提取請求,以獲取與科技情報關(guān)聯(lián)的期刊頁面的統(tǒng)一資源定位符;

10.如權(quán)利要求8所述的基于生成式人工智能的科技情報感知與獲取系統(tǒng),其特征在于,所述清洗模塊,還用于對所述初始科技情報數(shù)據(jù)進行歸一化處理,得到處理后的科技情報數(shù)據(jù);


技術(shù)總結(jié)
本發(fā)明屬于人工智能技術(shù)領(lǐng)域,公開了一種基于生成式人工智能的科技情報感知與獲取方法及系統(tǒng),通過基于情報感知獲取初始科技情報數(shù)據(jù);對所述初始科技情報數(shù)據(jù)進行數(shù)據(jù)清洗,得到參考科技情報數(shù)據(jù);識別所述參考科技情報數(shù)據(jù)中所有的實體指稱項;利用生成式人工智能模型基于所述實體指稱項獲取候選實體;根據(jù)所述候選實體確定目標實體;構(gòu)建所述目標實體與科技情報知識庫之間的關(guān)聯(lián),以得到目標科技情報數(shù)據(jù),通過上述方式,能夠應(yīng)對任意網(wǎng)站布局和結(jié)構(gòu)的變化,有效地從多種網(wǎng)站結(jié)構(gòu)中提取信息,提升科技情報數(shù)據(jù)的獲取效率,同時利用生成式人工智能模型進一步保證科技情報數(shù)據(jù)的準確性與完整性。

技術(shù)研發(fā)人員:房超,張開猛,靳如意,汪立坤,陳露瑩,涂瑜,黃珊珊
受保護的技術(shù)使用者:湖北光谷實驗室
技術(shù)研發(fā)日:
技術(shù)公布日:2024/10/21
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1