技術編號:40378746
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本申請涉及計算機,尤其涉及一種長文本解析方法、裝置、存儲介質以及終端。背景技術、面對包括各種文檔的知識庫,為了提升信息檢索的效率與準確性,構建高效、精準的索引系統(tǒng)成為了不可或缺的一環(huán)。這一過程中,文檔解析的準確性影響著文檔索引的準確性。通常來說,文檔解析都是遵循著一套精心設計的規(guī)則與模式,將連續(xù)的文本流切割成一塊塊易于處理與理解的片段。然而,這種直接的解析方式,在應對長文本時卻逐漸顯露出其局限性。長文本的內部結構復雜多變,上下文之間的關聯(lián)往往跨越了多個段落乃至章節(jié)。因此傳統(tǒng)的固定模式的解析方法...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。