技術(shù)總結(jié)
一種確定關(guān)鍵詞上下文窗口的混合方法,初始化統(tǒng)計(jì)方法模塊,通過(guò)求解輸入的關(guān)鍵詞C相鄰的上下文中每個(gè)位置的權(quán)重貢獻(xiàn)值進(jìn)行歸一化曲線處理,最后計(jì)算出關(guān)鍵詞C語(yǔ)境中上下文窗口的左右窗口n值,根據(jù)n值計(jì)算出上下文窗口的左右窗口值。本發(fā)明對(duì)上下文語(yǔ)境有效范圍的確定提供了非常有價(jià)值的定量化的描述,克服了前人主觀描述的不足;上下文對(duì)關(guān)鍵詞的描述能力相對(duì)位置由近及遠(yuǎn)逐漸遞減,符合人們一般認(rèn)識(shí);為更好的解決詞語(yǔ)、句子相似度計(jì)算提供了極為有價(jià)值的理論基礎(chǔ);權(quán)重貢獻(xiàn)值的線性與信噪比要更好,易于后續(xù)計(jì)算簡(jiǎn)便;權(quán)重貢獻(xiàn)值的歸一化曲線準(zhǔn)確率更高;考慮了關(guān)鍵詞左右窗口中的句子成分關(guān)系對(duì)上下文有效窗口界定的影響。
技術(shù)研發(fā)人員:金平艷;胡成華
受保護(hù)的技術(shù)使用者:四川用聯(lián)信息技術(shù)有限公司
文檔號(hào)碼:201610833587
技術(shù)研發(fā)日:2016.09.20
技術(shù)公布日:2017.05.03