1.一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成方法,其特征在于,步驟(1)中,獲取目標(biāo)文獻(xiàn)的全文內(nèi)容,對于pdf格式內(nèi)容,使用pymupdf庫解析為文本格式;對于網(wǎng)頁全文內(nèi)容,使用elsevier?api或其他學(xué)術(shù)出版商api,獲取全文內(nèi)容;將學(xué)術(shù)文本的摘要和全文進(jìn)行清洗后保存;其中,學(xué)術(shù)文獻(xiàn)的類型為公開出版的學(xué)術(shù)文獻(xiàn)。
3.根據(jù)權(quán)利要求1所述的一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成方法,其特征在于,步驟(2)中,結(jié)構(gòu)化假設(shè)關(guān)系陳述句包括:假設(shè)關(guān)系陳述句類型、假設(shè)關(guān)系陳述句具體內(nèi)容、假設(shè)關(guān)系陳述句來源學(xué)術(shù)文本id,以及其他相關(guān)屬性;語法特征包括:句子的主謂賓結(jié)構(gòu)分析、時(shí)態(tài)分析、語義角色標(biāo)注;規(guī)則模板是指使用正則表達(dá)式從學(xué)術(shù)文本潛在包含假設(shè)關(guān)系的章節(jié)抽取基本結(jié)構(gòu)的模板;假設(shè)關(guān)系陳述句表示為:
4.根據(jù)權(quán)利要求1所述的一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成方法,其特征在于,步驟(3)中,預(yù)定義的假設(shè)關(guān)系架構(gòu)模式是指用于從假設(shè)關(guān)系陳述句中抽取多種類型的假設(shè)關(guān)系框架及其相應(yīng)的數(shù)據(jù)組織結(jié)構(gòu),其中,架構(gòu)模式采用嵌套json格式進(jìn)行組織,以確保假設(shè)關(guān)系的多維度、層次化抽取;多類型、結(jié)構(gòu)化假設(shè)關(guān)系包括:自變量、因變量、效應(yīng)、中介變量、調(diào)節(jié)變量;具體如下:
5.根據(jù)權(quán)利要求1所述的一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成方法,其特征在于,步驟(4)中,多種關(guān)系類型,包括:正向關(guān)系、負(fù)向關(guān)系、調(diào)節(jié)作用、中介作用以及因果效應(yīng)。
6.一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成系統(tǒng),其特征在于,包括:
7.根據(jù)權(quán)利要求6所述的一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成系統(tǒng),其特征在于,收集模塊中,獲取目標(biāo)文獻(xiàn)的摘要和全文內(nèi)容,對于pdf格式內(nèi)容,使用pymupdf庫解析為文本格式;對于網(wǎng)頁全文內(nèi)容,使用elsevier?api或其他學(xué)術(shù)出版商api,獲取全文內(nèi)容;將學(xué)術(shù)文本的摘要和全文進(jìn)行清洗后保存;其中,學(xué)術(shù)文獻(xiàn)的類型為公開出版的學(xué)術(shù)文獻(xiàn)。
8.根據(jù)權(quán)利要求6所述的一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成系統(tǒng),其特征在于,陳述句模塊中,結(jié)構(gòu)化假設(shè)關(guān)系陳述句包括:假設(shè)關(guān)系陳述句類型、假設(shè)關(guān)系陳述句具體內(nèi)容、假設(shè)關(guān)系陳述句來源學(xué)術(shù)文本id,以及其他相關(guān)屬性;語法特征包括:句子的主謂賓結(jié)構(gòu)分析、時(shí)態(tài)分析、語義角色標(biāo)注;規(guī)則模板是指使用正則表達(dá)式從學(xué)術(shù)文本潛在包含假設(shè)關(guān)系的章節(jié)抽取基本結(jié)構(gòu)的模板;假設(shè)關(guān)系陳述句表示為:
9.根據(jù)權(quán)利要求6所述的一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成系統(tǒng),其特征在于,多類型結(jié)構(gòu)化假設(shè)關(guān)系模塊中,預(yù)定義的假設(shè)關(guān)系架構(gòu)模式是指用于從假設(shè)關(guān)系陳述句中抽取多種類型的假設(shè)關(guān)系框架及其相應(yīng)的數(shù)據(jù)組織結(jié)構(gòu),其中,架構(gòu)模式采用嵌套json格式進(jìn)行組織,以確保假設(shè)關(guān)系的多維度、層次化抽?。欢囝愋?、結(jié)構(gòu)化假設(shè)關(guān)系包括:自變量、因變量、效應(yīng)、中介變量、調(diào)節(jié)變量;具體如下:
10.根據(jù)權(quán)利要求6所述的一種基于假設(shè)關(guān)系識(shí)別的科學(xué)假說圖譜生成系統(tǒng),其特征在于,判別模塊中,多種關(guān)系類型,包括:正向關(guān)系、負(fù)向關(guān)系、調(diào)節(jié)作用、中介作用以及因果效應(yīng)。