技術(shù)特征:1.一種基于全局檢測和雙向標(biāo)記的重疊關(guān)系三元組抽取方法,其特征在于,步驟如下:
2.根據(jù)權(quán)利要求1所述的基于全局檢測和雙向標(biāo)記的重疊關(guān)系三元組抽取方法,其特征在于:
3.根據(jù)權(quán)利要求1所述的基于全局檢測和雙向標(biāo)記的重疊關(guān)系三元組抽取方法,其特征在于:
4.根據(jù)權(quán)利要求3所述的基于實體對注意力機制的實體關(guān)系聯(lián)合抽取方法,其特征在于:
5.根據(jù)權(quán)利要求3所述的基于實體對注意力機制的實體關(guān)系聯(lián)合抽取方法,其特征在于:
6.根據(jù)權(quán)利要求1所述的基于全局檢測和雙向標(biāo)記的重疊關(guān)系三元組抽取方法,其特征在于:
7.根據(jù)權(quán)利要求1所述的基于全局檢測和雙向標(biāo)記的重疊關(guān)系三元組抽取方法,其特征在于:
技術(shù)總結(jié)一種基于全局檢測和雙向標(biāo)記的重疊關(guān)系三元組抽取方法,屬于自然語言處理技術(shù)領(lǐng)域。首先對數(shù)據(jù)集進行預(yù)處理,模型使用預(yù)訓(xùn)練模型BERT作為編碼器,獲得句子初始的語義特征表示,并使用四個線性層對編碼后的語義特征表示進行抽象以適用于不同的任務(wù);基于雙向標(biāo)記的實體對識別模塊從兩個方向抽取所有存在潛在關(guān)系的實體對;全局檢測模塊對抽取得到的實體對進行過濾,篩除置信度低的實體對;最后基于實體注意力的關(guān)系抽取模塊抽取實體對之間的語義關(guān)系,完成關(guān)系三元組的抽取;在訓(xùn)練階段使用實體對負采樣策略,提升模型的泛化性,通過訓(xùn)練實體關(guān)系聯(lián)合抽取模型,并對模型進行測試,再依據(jù)測試結(jié)果更新模型。本發(fā)明可實現(xiàn)非結(jié)構(gòu)化文本的知識化。
技術(shù)研發(fā)人員:朱繼召,史阿康,潘新龍,劉顥,代新曉,王海鵬,范純龍,丁國輝,滕一平
受保護的技術(shù)使用者:沈陽航空航天大學(xué)
技術(shù)研發(fā)日:技術(shù)公布日:2024/12/10