專利名稱::一種基于規(guī)則的專利摘要自動(dòng)抽取和關(guān)鍵詞標(biāo)引方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于fi然語言計(jì)算機(jī)處理領(lǐng)域,具體涉及一種基于規(guī)則的專利摘要自動(dòng)抽取和關(guān)鍵詞標(biāo)引方法。
背景技術(shù):
:隨著專利文獻(xiàn)數(shù)tt的迅速增長,實(shí)現(xiàn)專利文獻(xiàn)數(shù)據(jù)的査全率和査準(zhǔn)率日益成為專利信息檢索的重點(diǎn)和難點(diǎn)。長期以來,禾u用原始專利數(shù)據(jù)來完成的專利信息的檢索,往往會(huì)存在較為嚴(yán)重的査全率和査準(zhǔn)率相互矛盾的問題。由于專利文獻(xiàn)原始信息來源于申請人:的原始提交資料,為了實(shí)現(xiàn)對專利技術(shù)的描述和保護(hù),往往會(huì)引用人量直接相關(guān)和間接相關(guān)的技術(shù)資料來描述專利技術(shù)。因此,在專利檢索當(dāng)屮,如果為了保證檢索的查全率,往往會(huì)同時(shí)檢索出大量"噪音數(shù)據(jù)",而如果為了保證檢索的查準(zhǔn)率,又往往因?yàn)橄拗茥l件過f嚴(yán)格,而丟失大量有用的檢索結(jié)果。為了解決上述問題,目甜-一種通用的方法就是采用利信息深度加工的技術(shù)。包括由專業(yè)技術(shù)人員在全面了解專利技術(shù)內(nèi)容的基礎(chǔ)上,按照一定加工規(guī)則,對專利文獻(xiàn)進(jìn)行摘耍重新撰寫和關(guān)鍵詞標(biāo)引,力爭提取出和技術(shù)主題直接相關(guān)、具有重耍檢索價(jià)值的專利信息。而專利數(shù)據(jù)的深度加工需要耗費(fèi)大量的時(shí)間、人力和物力才能完成,其建設(shè)成本十分高昂,加工效率嚴(yán)重偏低。為了解決上述問題,在專利文獻(xiàn)深度加工過程屮,采用fi動(dòng)摘要和fi動(dòng)標(biāo)引技術(shù),并輔助相應(yīng)的人丁處理,可以顯著提高專利文獻(xiàn)深度加丁的丁作效率,減低成本。中國專利申請94103485.2公開了一種漢語文獻(xiàn)計(jì)算機(jī)自動(dòng)標(biāo)引技術(shù)。在對大量句型進(jìn)行系統(tǒng)分析研究的基礎(chǔ)上,按照漢語的語法邏輯關(guān)系及語句結(jié)構(gòu)特點(diǎn),采取--些獨(dú)特的技術(shù)措施,創(chuàng)造了一種獨(dú)特的"模式化標(biāo)引法"。使用該方法可以克服現(xiàn)有人工標(biāo)引方法效率低、誤差大的缺點(diǎn),乂可以完全消除機(jī)器標(biāo)引中可能發(fā)生的"誤切"、"漏切"和由此引起的"誤標(biāo)"與"漏標(biāo)",從而保證了文獻(xiàn)的準(zhǔn)確標(biāo)引以及高效率、高準(zhǔn)確率的檢索。屮國專利中請01138654.1公開了一種棊于網(wǎng)絡(luò)環(huán)境的屮文信息fi動(dòng)標(biāo)引系統(tǒng),公開了一種在互聯(lián)網(wǎng)環(huán)境下基于WINDOWS或NT操作系統(tǒng)的中文自動(dòng)標(biāo)引系統(tǒng)。中國專利申請2()061()024618.7公開了一種專利文獻(xiàn)的標(biāo)引方法,包括提供一相關(guān)技術(shù)主題^"利文獻(xiàn)數(shù)據(jù)庫;建立該技術(shù)主題的技術(shù)分類及其對應(yīng)的關(guān)鍵字/詞;選抒部分或全部專利文獻(xiàn)進(jìn)行標(biāo)引,對每一篇專利文獻(xiàn),建立其與關(guān)鍵字/詞和技術(shù)分類的對應(yīng)關(guān)系;在此步驟中,根據(jù)標(biāo)引的專利文獻(xiàn),修正技術(shù)分類或者技術(shù)分類對應(yīng)的關(guān)鍵字此外,中國專利申請200410000936.0也公開了--------種計(jì)算機(jī)標(biāo)引和檢索的方法。fi動(dòng)摘要抽取和fi動(dòng)關(guān)鍵詞標(biāo)引技術(shù)已經(jīng)經(jīng)過了多年的發(fā)展,但針對專利文獻(xiàn)數(shù)據(jù)深度加工中的特定技術(shù)方法還未見報(bào)道。中國專利申請200610024618,7中公開的專利文獻(xiàn)的標(biāo)引方法,僅僅解決了在專利文獻(xiàn)快速閱讀和了解大意時(shí)的問題,并不能從根本上解決專利檢索的問題。本發(fā)明B在采用一種基于規(guī)則的專利摘要自動(dòng)抽取和關(guān)鍵詞標(biāo)引方法,從而可以顯著提高專利文獻(xiàn)深度加工的效率,并解決專利文獻(xiàn)深度加工當(dāng)中人力成本高昂的現(xiàn)狀。
發(fā)明內(nèi)容針對現(xiàn)有技術(shù)巾存在k述不足之處,木發(fā)明的目的在于提供一種專利摘要自動(dòng)抽取和關(guān)鍵詞標(biāo)引方法,可以實(shí)現(xiàn)基于規(guī)則的專利文獻(xiàn)fi動(dòng)深度加工。本發(fā)明的fi動(dòng)摘要提取和關(guān)鍵詞標(biāo)引方法的一般過程是根據(jù)后臺(tái)知識(shí)庫對專利文獻(xiàn)全文進(jìn)行特征技術(shù)詞匯等關(guān)鍵字的自動(dòng)標(biāo)記,然后由各段中特征詞出現(xiàn)的類型、次數(shù)、位置關(guān)系等判斷其在文章中的功能及相互關(guān)系,再抽取其中關(guān)鍵的段落組成摘要,最后從摘要中提取關(guān)鍵詞組成該文獻(xiàn)的各個(gè)標(biāo)引項(xiàng)。通常情況下由五個(gè)功能模塊來實(shí)現(xiàn)的知識(shí)庫模塊、特征詞標(biāo)記模塊、段落分析與評(píng)價(jià)模塊、摘要自動(dòng)撰寫模塊和標(biāo)引模塊。其巾的關(guān)鍵技術(shù)在于在摘要抽取和關(guān)鍵詞標(biāo)引的過程中,采用了適合于專利文獻(xiàn)特點(diǎn)的fi動(dòng)抽取和標(biāo)弓I規(guī)則。1、知識(shí)庫模塊知識(shí)庫是實(shí)現(xiàn)本方法的系統(tǒng)的基礎(chǔ),可采用本領(lǐng)域通用的方法和加丁手段建立知識(shí)庫。為了對文獻(xiàn)解析的更加清楚,本系統(tǒng)構(gòu)建基f不同
技術(shù)領(lǐng)域:
的科技術(shù)語知識(shí)庫,其中包括各領(lǐng)域科技術(shù)語名稱及其IPC屬性信息、同義詞和近義詞信息等,并同時(shí)建立了基于不同
技術(shù)領(lǐng)域:
的工藝動(dòng)詞知識(shí)庫。以中藥領(lǐng)域的科技術(shù)語知識(shí)庫為例,其知識(shí)庫樣例如下樣例一<table>tableseeoriginaldocumentpage5</column></row><table>中藥正名白及中藥異名;白及粉;;甘根;白根;白給;白芨;冰球子;白烏兒頭;地螺絲;羊角七;千年棕;君球子;一兜棕;白雞兒;皸口藥;利知子;白芨片;連及草;箬蘭;朱蘭;紫蘭;紫蕙;百笠;白及粉ipc號(hào)A61K036/898;A61K125/00白暨豚;白旗;白鰭;白鰭豚;白江豬;A61K035/12樣例二正式詞lrij義詞組配詞IPCPHC平滑肌瘤;平滑肌細(xì)胞瘤;LEIOMYOMA;腫瘤;癌A61P035/0003;12平滑肌肉瘤;LEIOMYOSARCOMA;腫瘤;癌A61P035/0003;12破傷風(fēng);強(qiáng)直癥;TETANUS;A61P021/0212葡萄膜炎;色素膜炎;眼色素層炎;色素層炎;uveitis;A61P027/0214葡萄球菌;STAPHYLOCOCCUS;抗菌A61P031/04Ti-葡萄球菌病A61P031/00ll葡萄胎;葡萄簇狀瘤;水泡狀胎塊;hydatidiformmo:le;ves1cularmole;腫瘤;癌A61P035/0007;03期前收縮;PREMATURESYSTOLE;早搏;心律失常A61P009/0604氣管炎;tracheitis;a61p011/0016中藥領(lǐng)域的工藝動(dòng)詞知識(shí)庫樣例樣例一6加入混合粉碎濃縮加水煎煮提取過濾浸泡加水粉碎成千燥2、特征詞標(biāo)記模塊該模塊的功能是讀入專利文本后,采用本領(lǐng)域中通用的正向最大匹配分詞算法,根據(jù)后臺(tái)知識(shí)庫對文本進(jìn)行特征術(shù)語標(biāo)記。3、段落分析與評(píng)價(jià)模塊在特征術(shù)語標(biāo)注的基礎(chǔ)上,進(jìn)一步完成基于規(guī)則的段落分析和評(píng)價(jià)。首先是判斷分析專利文獻(xiàn)中的功能段落,即含有專利文獻(xiàn)的-'些特征術(shù)語,并且對檢索具有重要價(jià)值的段落。其技術(shù)方法是,統(tǒng)計(jì)段落中標(biāo)記字與非標(biāo)記字的字?jǐn)?shù)比率,并根據(jù)不同
技術(shù)領(lǐng)域:
設(shè)定的比率,提取出高于此比率的段落做為備選功能段落,然后再根據(jù)不同
技術(shù)領(lǐng)域:
設(shè)定的具體分析規(guī)則提取出不同類型的功能段落。上述統(tǒng)計(jì)中標(biāo)記字與非標(biāo)記字的比率根據(jù)經(jīng)驗(yàn)值通常設(shè)定在0.3,也可以根據(jù)不同
技術(shù)領(lǐng)域:
的特點(diǎn),適當(dāng)調(diào)整上述比例。設(shè)定具休分析規(guī)則提取出不同類型的功能段落中,可以根據(jù)段落中不同句子的結(jié)構(gòu)性關(guān)鍵詞來設(shè)定規(guī)則。例如句子結(jié)構(gòu)中包含[有...功效]、[有...功能]、[有...作用]、[有...療效]、[用T]、[組方具有]等短語結(jié)構(gòu)的可以判斷是功效功能段落;句子結(jié)構(gòu)中包含[步驟為]、[步驟是]、[步驟]、[下...步驟]、[制備]、[解決方案]、[技術(shù)方案]、〃[實(shí)施例...]、[制備...]、[以下...步]、[如下...步]、[解決方案...]、[技術(shù)方案...]、[生產(chǎn)方法...]、[技術(shù)措施...]等短語結(jié)構(gòu)的可以判斷是制作工藝功能段落;句子結(jié)構(gòu)屮包含[包括...組分]、[下...原料]、[配比...]、[——制成]、[用量...]等短語結(jié)構(gòu)的可以判斷是組合物功能段落。上述分析規(guī)則的設(shè)定是基于不同
技術(shù)領(lǐng)域:
的專利文獻(xiàn)特點(diǎn),可以山使用者自主設(shè)定并積累功能類型和結(jié)構(gòu)性關(guān)鍵詞規(guī)則等。本模塊的初始狀態(tài)下,僅提供上述舉例中包括的功能類型和結(jié)構(gòu)性關(guān)鍵詞規(guī)則。[OO31]4、摘要自動(dòng)撰寫模塊在評(píng)價(jià)完所有段落的功能后,即可用摘耍自動(dòng)撰寫模塊査找其中最關(guān)鍵的段落,然后以合理的次序"拼接"成摘要。在這里,將段落的關(guān)鍵性稱為段落的"權(quán)值"。具體方法如下對于功能單-一的段落,每種類型按照其先后順序來確定其重要程度,因?yàn)榘凑瘴墨I(xiàn)的特點(diǎn),越前面的段落往往也是越歪要的,即權(quán)值越大;對于功能復(fù)合的段落(例如此段中既敘述了配方也敘述了制作工藝),可以根據(jù)本領(lǐng)域常用的辦法,til本段中各類特征詞與普通詞的比例來進(jìn)行確定,比例越大的段落越重要,權(quán)值也就越大。最后,挑選各種類型中權(quán)重最大的段》牛成自動(dòng)摘要的結(jié)果。但是,有時(shí)在同-一類功能段中,越靠的段明顯比較短,這£取最長的一段來作為關(guān)鍵段。當(dāng)自動(dòng)摘耍的結(jié)果生成后,-'般情況下需耍加入人工干預(yù),刪掉-'些不必耍的語句,使自動(dòng)摘耍讀起來符合習(xí)慣、更加通順。本發(fā)明的技術(shù)方案中,優(yōu)選是在fi動(dòng)抽取的文摘基礎(chǔ)上進(jìn)行關(guān)鍵詞標(biāo)引,更加優(yōu)選的是在經(jīng)過人工千預(yù)校對的摘要某礎(chǔ)上進(jìn)行關(guān)鍵詞標(biāo)引。關(guān)鍵詞標(biāo)引方法的具體方法是根據(jù)段落分析與評(píng)價(jià)模塊中的方法和規(guī)則來分析不同句了的具體類型,并調(diào)用知識(shí)庫模塊中已經(jīng)設(shè)定好的關(guān)鍵詞,對摘要中的關(guān)鍵詞按不同標(biāo)引項(xiàng)目進(jìn)行抽取。標(biāo)引時(shí),可以根據(jù)知識(shí)庫提供的同義詞、異名等信息,對標(biāo)引詞進(jìn)行自動(dòng)修訂,也可以通過人工方式,主動(dòng)對標(biāo)引詞進(jìn)行修訂。并生成最終標(biāo)引結(jié)果。有益效果和實(shí)用性本發(fā)明的方法的最人的優(yōu)點(diǎn)在于,可以充分實(shí)現(xiàn)人機(jī)力:動(dòng)一方面,通過人工不斷優(yōu)化處理知識(shí)庫和對不同領(lǐng)域?qū)@谋拘畔⒌囊?guī)則分析,可以顯著提高fi動(dòng)摘要的準(zhǔn)確性和內(nèi)容全面性;另-一方面,在自動(dòng)摘要的基礎(chǔ)上,進(jìn)一歩由人工對摘要進(jìn)行完善和優(yōu)化,又可以顯著提高自動(dòng)標(biāo)引的準(zhǔn)確性。采用本發(fā)明的方法,可以達(dá)到較高水平的自動(dòng)標(biāo)引水平,同時(shí)結(jié)合--定程度的人工輔助干預(yù),可以達(dá)到人工標(biāo)引水平的80-90%,標(biāo)引結(jié)果具有很強(qiáng)的檢索價(jià)值。與完全人工標(biāo)引相比,采用本發(fā)明的方法可以.顯著提高專利數(shù)據(jù)深度加工的效率,并顯著降低數(shù)據(jù)加工成木。傳統(tǒng)的專利數(shù)據(jù)深加工,平均一個(gè)標(biāo)引人員只能完成8-10件專利/每天的標(biāo)引工作,而釆用本發(fā)明的方法,完成自動(dòng)標(biāo)引可以達(dá)到1000件以上專利/每天的標(biāo)引工作。如果考慮人工輔助的工作效率,也可達(dá)到20件專利左右/每天的標(biāo)引效率。附圖1是根據(jù)本發(fā)明方法的自動(dòng)摘要撰寫和自動(dòng)關(guān)鍵詞抽取流程圖。具體實(shí)施方式實(shí)施例一以下是采用本發(fā)明的方法對中國專利申請00100617.7的進(jìn)行摘要自動(dòng)抽取和關(guān)鍵詞自動(dòng)標(biāo)引流程和結(jié)果。該^利原文如下權(quán)利要求書1、-浙治療玻璃體混濁和出血的顆粒沖劑,其特征是含有丹參、石決明、主蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓和甘草;其中所述各成份的歪一份數(shù)配比為丹參48-192份石決明48-192份生蒲黃24-96份柴胡24-96份昆布2'1-96份當(dāng)歸16-64份白術(shù)i6-64份蒼術(shù)i6-64份獲茶16-64份豬茶16-64份甘草8-32份2、如權(quán)利要求l所述的治療玻璃體混濁和出血的顆粒沖劑的制備方法,其特征是包括取石決明加水9-11倍先煎1-2小時(shí),然后加入其它丹參、生蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓和甘草|-味藥材煎煮3次,第一次加水量為藥材的941.倍,第二次和第—次加水量分別為藥材的9-ll倍,3次的煎煮時(shí)間為1-3、0.5-1.5、0.5-1.5小時(shí),合并煎液,過濾,真空減壓T燥,濃縮至相對密度為1.25(60°C)的清膏,將干膏粉碎過80-120目篩,取藥粉i份加入糊精i份,用70%乙醇攪拌均勻后制粒。說明書-浙治療玻璃體混濁和出血的顆粒沖劑及其制備方法木發(fā)明涉及中藥制劑,特別是一種治療玻璃體混濁和出血的顆粒沖劑及其制備方法。玻璃體混濁指玻璃體的l—F:常透明度發(fā)生混濁性改變,屮醫(yī)謂之"云霧移晴","蠅翅黑花"等。多源于膽肝腎-:經(jīng)病變,W因腎水不足,水不涵木,虛熱內(nèi)生,移熱f膽;津液煎竭,不能升運(yùn)精華以涵養(yǎng)神膏;因素體虛弱,去血過多,深思積忿,耗氣傷精,目失涵養(yǎng);因濕池痰火,蒸傷淸純之氣而導(dǎo)致本病。故補(bǔ)益肝腎,淸膽和胃,滋補(bǔ)腎水,以制相火,益氣養(yǎng)血,活血化痰為本病主治之法。玻璃體出血多系肝膽火旺,迫血妄行,血絡(luò)破損,灌入神膏;或因肝腎陰5,水不制火,虛火i:炎,血不循經(jīng),溢于絡(luò)外;也有岡撞擊傷目或金針開內(nèi)障等手術(shù)損傷黃〈————:血絡(luò),血溢絡(luò)外,灌入神膏等。故清肝泄火,滋陰降火,清熱涼血,活血化瘀為本病主治之法。本發(fā)明的目的是提供一種對各種原因引起的玻璃體混濁、出血、飛蚊癥仃明顯療效或起到改善作用的治療玻璃體混濁和出血的顆粒沖劑。本發(fā)明的另--個(gè)目的是提供-一種上述治療玻璃休混濁和出血的顆粒沖劑的制備方法。本發(fā)明的治療玻璃體混濁和出血的中藥制劑中含有丹參、石決明、生蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓和甘草;其巾所述各成份的重量份數(shù)配比為:丹參48-192份石決明48-192份[OOeo]生蒲黃24-96份柴胡24-96份昆布24-96份當(dāng)歸丄6-64份白術(shù)16-64份蒼術(shù)16-64份[OO63]茯苳16-64份豬零16-64份甘草8-32份本發(fā)明的治療玻璃體混濁和出血的顆粒沖劑的制備方法包括取石決明加水9-11倍先煎1-2小時(shí),然后加入其它丹參、生蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓和甘草十味藥材煎煮3次,第一次加水量為藥材的9-ll倍,第二次和第三次加水量分別為藥材的9-ll倍,3次的煎煮時(shí)間為1-3、0.5-1.5、0.5-1.5小時(shí),合并煎液,過濾,真空減壓干燥,濃縮至相對密度為i.25(60。C)的淸膏,將干膏粉碎過80-丄20冃篩,取藥粉1份加入糊精1份,用7()%乙醇攪拌均勻后制粒。本發(fā)明的治療玻璃體混濁的顆粒沖劑具有活血調(diào)經(jīng)、通絡(luò)散結(jié)、泄火淸膽、補(bǔ)益肝腎的作用,對各種原岡引起的玻璃體混濁、出血、飛蚊癥有明顯療效或起到改善作用的治療玻璃體混濁和出血的顆粒沖劑。下面結(jié)合實(shí)施例進(jìn)一步描述本發(fā)明。-—種治療玻璃體混濁和出血的顆粒沖劑,它含W丹參、石決明、生蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬冬和tJ'草;其中所述各成份的虛W配比為:丹參丄44g石決明丄44g生蒲黃72g柴胡72gki布72g當(dāng)歸48g白術(shù)48g蒼術(shù)48g茯:務(wù)48g豬冬48g甘草24.g制備時(shí),先取石決明加水10倍煎1小時(shí),然后加入丹參、生蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓和tJ'草十味藥材煎煮3次,第一次加l()倍的水,第二次和第三次分別加水8倍量,3次煎煮時(shí)間為2、i、i小時(shí),合并煎液,過濾,真空減壓千燥,濃縮至相對密度為i.25(6(rc)的清&,將卜ir粉碎過i()()冃篩,取藥粉l份加入糊精l份,用適量70%乙醇攪拌均勻后制粒,干燥后整粒分裝成12g/袋,即得。如附圖l巾所示,首先調(diào)用特征詞標(biāo)記模塊,用常用的正向最大匹配法分詞算法處理后,得到的帶標(biāo)記的全文如下(其中U代表藥物名稱,O代表操作工序,[]代表治療效果。段落前面括號(hào)內(nèi)的數(shù)字為段落編號(hào))權(quán)利要求書(1)1、一種治療[玻璃體混濁]和[出血]的顆粒沖劑,其特征是含有{丹參}、{石決明}、{牛蒲黃}、{柴胡}、{昆布}、{當(dāng)歸}、{白術(shù)}、{蒼術(shù)}、{茯苓}、{豬苓}和{甘草};其中所述各成份的重量份數(shù)配比為(2){丹參}48-192份{石決明}48-192份;(3){生蒲黃}24-96份{—柴胡}24-96份;10(4){昆布}24-96份{當(dāng)歸}16-64份;(5){0術(shù)}16-64份{蒼術(shù)}16-64份;(6){茯苓}16-64份{豬苓}16-6'1份;(7){廿草}8-32份;(8)2、如權(quán)利要求1所述的治療[玻璃體混濁]和[出血]的顆粒沖劑的制備方法,其特征是包括取{石決明}<加水>941倍先煎卜2小時(shí),然后<加入>其它{丹參}、{生蒲黃}、{柴胡}、{昆布}、{當(dāng)歸}、{白術(shù)}、{蒼術(shù)}、{茯苓}、{豬苓}和.(甘草}十味藥材<煎煮>3次,第--次<加水>量為藥材的9-11倍,第二次和第三次<加水>量分別為藥材的9-11倍,3次的<煎煮>時(shí)間為1-3、0.5-1.5、0.5-1.5小時(shí),<合并煎液>,<過濾>,真空<減壓干燥>,<濃縮>至相對密度為1.25(6(TC)的清膏,將'「膏<粉碎>過80-120目篩,取藥粉1份<加入>糊精1份,用7()%乙醇<攪拌均勻>后制粒。[OO肪]說明書(g)-f巾治療[玻璃體混濁]和[出血]的顆粒沖劑及其制備方法(1—0)木發(fā)明涉及中藥制劑,特別是一種治療[玻璃體混濁]和[出血]的顆粒沖劑及其制備方法。(l.l)[玻璃體混濁]指[玻璃體]的iE常透明度發(fā)生混濁性改變,屮醫(yī)謂之"云霧移晴","蠅翅黑花"等。多源于膽肝腎—經(jīng)病變,W因腎水不足,水不涵木,虛熱內(nèi)生,移熱f膽;津液煎竭,不能升運(yùn)精華以涵養(yǎng)神膏;因素體虛弱,去血過多,深思積忿,耗氣傷精,目失涵養(yǎng);因濕濁痰火,蒸傷淸純之氣而導(dǎo)致本病。故補(bǔ)益肝腎,淸膽和胃,[滋補(bǔ)]腎水,以制相火,益氣養(yǎng)血,活血[化痰]為本病主治之法。(12)[玻璃體出血]多系肝膽火旺,迫血妄行,血絡(luò)破損,灌入神膏;或因肝[腎陰]虧,水不制火,虛火l:炎,血不循經(jīng),溢于絡(luò)外;也有岡撞擊傷目或金針開內(nèi)障等手術(shù)損傷黃仁血絡(luò),血溢絡(luò)外,灌入神膏等。故清肝泄火,滋陰降火,清熱涼血,活血化瘀為本病主治之法。(13)本發(fā)明的目的是提供一種對各種原因引起的[玻璃體混濁]、[出血]、飛蚊癥有明顯療效或起到改善作用的治療[玻璃體混濁]和[出血]的顆粒沖劑。(i4)本發(fā)明的另--個(gè)目的是提供-一種上述治療[玻璃休混濁]和[出血]的顆粒沖劑的制備方法。(15)本發(fā)明的治療[玻璃體混濁]和[出血]的中藥制劑中含有{丹參}、{石決明}、{生蒲黃}、{柴胡}、{昆布}、{當(dāng)歸}、{—白術(shù)}、{蒼術(shù)}、{—茯苓}、{豬苓}和{甘草};其中所述各成份的重量份數(shù)配比為(1—6){丹參}48-192份{石決明}48-1—92份(17){生蒲黃}24-96份{柴胡}24-96份(18){昆布}2'1-96份{當(dāng)歸}16-6'1份(丄9){白術(shù)}16-64份{蒼術(shù)}丄6-64份(20){茯苓}16-64份{豬苓}16-64份(21)(甘草}8-32份(22)木發(fā)明的治療[玻璃體混濁]和[出血]的顆粒沖劑的制備方法包括取11{石決明}<加水>9-11倍先煎1-2小時(shí),然后<加入>其它{丹參}、{生蒲黃}、{柴胡}、{昆布}、{當(dāng)歸}、{0術(shù)}、{蒼術(shù)}、{茯苓}、{豬苓}和{甘草}十味藥材<煎煮>3次,第一次<加水>量為藥材的9-11倍,第二次和第三次<加水>量分別為藥材的9-ii倍,3次的<煎煮>時(shí)間為i-3、0.5-1.5、0.5-i.5小時(shí),<合并煎液>,<過濾>,真空<減壓千燥>,<濃縮>至相對密度為1.25(6()"C)的清膏,將千膏<粉碎>過80-120目篩,取藥粉1份<加入>糊精1份,用70%乙醇<攪拌均勻>后制粒。(23)木發(fā)明的治療[玻璃體混濁]的顆粒沖劑具有活血[調(diào)經(jīng)]、通絡(luò)散結(jié)、泄火清膽、補(bǔ)益肝腎的作用,對各種原因引起的[玻璃體混濁]、[出血]、飛蚊癥有明顯療效或起到改善作用的治療[玻璃體混濁]和[出血]的顆粒沖劑。(24)下面結(jié)合實(shí)施例進(jìn)一歩描述本發(fā)明。(25)一種治療[玻璃體混濁]和[出血]的顆粒沖劑,它含有{丹參}、{石決明}、{牛蒲黃}、{柴胡}、{昆布}、{當(dāng)歸}、{白術(shù)}、{蒼術(shù)}、{茯苓}、{豬苓}和{甘草};其中所述各成份的重量配比為(26){丹參}144g{石決明}144g(27){生蒲黃}72g{.柴胡}72g(28){昆布}72g{當(dāng)U—|}48g(29){白術(shù)}48g{蒼術(shù)}48g(30){茯苓}48g{豬苓}48g(31){tf草}2'lg(32)制備時(shí),先取{石決明}<加水>10倍煎1小時(shí),然后<加入>{丹參}、{生蒲黃}、{柴胡}、{昆布}、{當(dāng)歸}、{白術(shù)}、{蒼術(shù)}、{伙苓}、{豬苓}和(甘草}十味藥材<煎煮>3次,第-'次加10倍的水,第二次和第三次分別<加水>8倍^:,3次<煎煮>時(shí)間為2、1、l小時(shí),<合并煎液>,<過濾>,真空<減壓千燥>,<濃縮>至相對密度為1.25(60°C)的清膏,將干膏<粉碎>過100目篩,取藥粉1份<加入>糊精1份,rtj適量70%乙醇<攪拌均勻>后制粒,<千燥>后整粒分裝成1.2g/袋,即得。然后調(diào)用附圖1中所不的段落分析與評(píng)價(jià)模塊,分析過程如下經(jīng)過逐段計(jì)算,發(fā)現(xiàn)標(biāo)記字與非標(biāo)記字的字?jǐn)?shù)比例大于閾值0.3的段落編號(hào)有i9、i3、i523、2532。再根據(jù)段落分析與評(píng)價(jià)模塊中列舉的一些列結(jié)構(gòu)性關(guān)鍵詞,判斷出17、1521、2531為組合物功能段,8、22、32為制作工藝功能段,9、13、23為功效功能段。經(jīng)過以上段落分析與評(píng)價(jià),如附圖1所示,就可以調(diào)用摘要自動(dòng)撰寫模塊來撰寫摘要了,其分析過程如下在組合物功能段屮,按照越靠前段落權(quán)值越大的棊本方法,挑選出18為關(guān)鍵段來組成自動(dòng)摘要;在制作工藝功能段中,按照越靠前段落權(quán)值越大的方法,挑選9為關(guān)鍵段;在功效功能段中,由f第9段明顯比較短,不適宜做關(guān)鍵度,所以應(yīng)選取最長的第23段作為關(guān)鍵段。這樣,便得到自動(dòng)摘要的結(jié)果,如下—種治療玻璃體混濁和出血的顆粒沖劑,其特征是含有丹參、石決明、生蒲黃、柴胡、ki布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓和甘草;其中所述各成份的重量份數(shù)配比為丹參48-192份石決明48-192份;生蒲黃24-96份柴胡24-96份;昆布24-96份當(dāng)歸16-64-份;白術(shù)1.6-64份蒼術(shù)16-64.份;茯苳16-64份豬零1.6-64份;甘草8-32份;其特征是包括取石決明加水9-11倍先煎1-2小時(shí),然后加入其它丹參、生蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓和y'草十味藥材煎煮3次,第一次加水量為藥材的9-ii倍,第—次和第三次加水量分別為藥材的9-ii倍,3次的煎煮時(shí)間為i-3、().5-1.5、().5-1.5小時(shí),合并煎液,過濾,真空減壓千燥,濃縮至相對密度為1.25(6(rC)的清膏,將干膏粉碎過80-120目篩,取藥粉l份加入糊精l份,用70%乙醇攪拌均勻后制粒。木發(fā)明的治療玻璃體混濁的顆粒沖劑具有活血調(diào)經(jīng)、通絡(luò)散結(jié)、泄火清膽、補(bǔ)益肝腎的作用,對各種原因引起的玻璃體混濁、出血、飛蚊癥有明顯療效或起到改善作用的治療玻璃體混濁和出血的顆粒沖劑。得到如上所示的自動(dòng)摘要后,如附圖所示,-一般需要進(jìn)行人工干預(yù),調(diào)整、修改、刪除一些語句,使摘要更加簡練、通順。經(jīng)過人工十預(yù)后的摘要如下—種治療玻璃休混濁和出血的顆粒沖劑,由丹參、石決明、牛蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓、甘草組成。將石決明、丹參、生蒲黃、柴胡、昆布、當(dāng)歸、白術(shù)、蒼術(shù)、茯苓、豬苓和甘草十味藥材煎煮、真空減壓干燥、濃縮,W用乙醇攪拌均勻后制粒。具有活血調(diào)經(jīng)、通絡(luò)散結(jié)、泄火清膽、補(bǔ)益肝腎的作用,對各種原因引起的玻璃體混濁、出血、飛蚊癥有明顯療效或起到改善作用。最后,如圖i所示,對摘要進(jìn)行標(biāo)引。分析摘要屮的"由......組成"特征字句,并調(diào)用知識(shí)庫中的詞典,可以抽出IT-結(jié)合方法(MIX)的標(biāo)引詞丹參;石決明;生蒲黃;柴胡;昆布;當(dāng)歸;白術(shù);蒼術(shù);茯苓;豬苓;tf草。類似的,對"具有......作用""對......有療效""對......有作用"特征字句進(jìn)行分心,并調(diào)用知識(shí)庫中的詞典,可以抽出EFF-治療作用(THEF)的標(biāo)引詞:玻璃體混濁;飛蚊癥;活血調(diào)經(jīng);通絡(luò)散結(jié);泄火淸膽;補(bǔ)益肝腎。1權(quán)利要求一種專利文獻(xiàn)的摘要自動(dòng)抽取和關(guān)鍵詞標(biāo)引方法,利用知識(shí)庫模塊、特征技術(shù)詞匯標(biāo)記模塊、段落分析與評(píng)價(jià)模塊、摘要自動(dòng)撰寫模塊和標(biāo)引模塊進(jìn)行摘要自動(dòng)抽取和關(guān)鍵詞標(biāo)引,其基本步驟如下(1)、建立不同
技術(shù)領(lǐng)域:
中專利科技術(shù)語知識(shí)庫;(2)、采用正向最大匹配分詞算法,根據(jù)后臺(tái)知識(shí)庫對文本進(jìn)行特征術(shù)語標(biāo)記;(3)、基于標(biāo)記內(nèi)容對專利文獻(xiàn)的段落進(jìn)行分析和評(píng)價(jià);(4)、在上述基礎(chǔ)上,自動(dòng)撰寫摘要并進(jìn)行關(guān)鍵詞標(biāo)引;其特征在于在步驟3中,首先是根據(jù)知識(shí)庫,統(tǒng)計(jì)專利文獻(xiàn)不同段落中標(biāo)記字與非標(biāo)記字的字?jǐn)?shù)比率,并根據(jù)該比率識(shí)別備選功能段落,然后再根據(jù)默認(rèn)設(shè)定或者用戶設(shè)定的句子結(jié)構(gòu)性關(guān)鍵詞規(guī)則,識(shí)別不同類型的功能段落;在步驟4中,根據(jù)不同段落的標(biāo)記字與非標(biāo)記字字?jǐn)?shù)比率、段落功能類型和在專利文獻(xiàn)中出現(xiàn)的位置信息進(jìn)行摘要自動(dòng)抽取;并在摘要自動(dòng)抽取或者人工修改后的摘要基礎(chǔ)上,根據(jù)段落分析與評(píng)價(jià)模塊中的方法和規(guī)則來分析不同句子的具體類型,并調(diào)用知識(shí)庫中已經(jīng)設(shè)定好的關(guān)鍵詞,對摘要中的關(guān)鍵詞按不同標(biāo)引項(xiàng)目進(jìn)行抽取。2.如權(quán)利要求1所述的方法,其特征在于所述后臺(tái)知識(shí)庫是為特征技術(shù)詞匯標(biāo)記模塊提供供分詞用的后臺(tái)詞典,后臺(tái)知識(shí)庫根據(jù)
技術(shù)領(lǐng)域:
進(jìn)行劃分,其包括各領(lǐng)域科技術(shù)語名稱及其I:PC屬性信息、同義詞和近義詞信息,并同時(shí)建立了基于不同
技術(shù)領(lǐng)域:
的工藝動(dòng)詞知識(shí)庫。3.如權(quán)利耍求1所述的方法,其特征在T:所述識(shí)別備選功能段落是根據(jù)后臺(tái)知識(shí)庫統(tǒng)計(jì)專利文獻(xiàn)不同段落巾標(biāo)記字與非標(biāo)記字的字?jǐn)?shù)比率,當(dāng)該比率高于0.3時(shí),可以將該段落識(shí)別為備選功能段落。4.如權(quán)利要求1所述的方法,其特征在于所述識(shí)別備選功能段落是根據(jù)后臺(tái)知識(shí)庫統(tǒng)計(jì)專利文獻(xiàn)不同段落中標(biāo)記字與非標(biāo)記字的字?jǐn)?shù)比率,該比率nj以根據(jù)具體
技術(shù)領(lǐng)域:
不同,由用戶自定義設(shè)定,當(dāng)該比率高f用戶設(shè)定值時(shí),可以將該段落識(shí)別為各選功能段落。5.如權(quán)利要求1所述的方法,其特征在于所述識(shí)別不NJ類型的功能段落是根據(jù)段落中不M句子的結(jié)構(gòu)性關(guān)鍵詞來設(shè)定規(guī)則,其巾,包含[有…功效]、[有...功能]、[有…作用]、[有...療效]、[用于]、[組方具有]等短語結(jié)構(gòu)的句子可以判斷是功效功能段落;包含[步驟為]、[步驟是]、[步驟]、['————F...步驟]、[制備]、[解決方案]、[技術(shù)方案]、"[實(shí)施例...]、[制備...]、[以下...歩]、[如下...歩]、[解決方案...]、[技術(shù)方案...]、[生產(chǎn)方法...]、[技術(shù)措施...]等短語結(jié)構(gòu)的句了nj以判斷是制作工藝功能段落;包含[包括...組分]、[下...原料]、[配比...]、[下...制成]、[用量...]等短語結(jié)構(gòu)的句子可以判斷是組合物功能段落。6.如權(quán)利耍求1所述的方法,其特征在IS所述的摘要自動(dòng)抽取是,對于功能申.一的段落,每種類型按照其先后順序來確定其重要程度,越前面的段落往往也是越重要的,即權(quán)值越人;對于功能復(fù)合的段落,根據(jù)本段屮各類標(biāo)記字與非標(biāo)記字的比率來進(jìn)行確定,比率越大的段落越歪要,權(quán)值也就越大。最后,挑選各種類型中權(quán)重最大的段落生成自動(dòng)摘要的結(jié)果。7.如權(quán)利要求6所述的方法,其特征在于當(dāng)自動(dòng)摘要的結(jié)果生成后,-一般情況下需要人工進(jìn)行檢査,刪掉-一些不必要的語句,使自動(dòng)摘要讀起來符合習(xí)慣、更加通順。全文摘要一種基于規(guī)則的專利摘要自動(dòng)抽取和關(guān)鍵詞標(biāo)引方法。主要步驟包括根據(jù)后臺(tái)知識(shí)庫對專利文獻(xiàn)全文進(jìn)行特征技術(shù)詞匯等關(guān)鍵字的自動(dòng)標(biāo)記,然后由各段中特征詞出現(xiàn)的類型、次數(shù)、位置關(guān)系等判斷其在文章中的功能及相互關(guān)系,再抽取其中關(guān)鍵的段落組成摘要,最后從摘要中提取關(guān)鍵詞組成該文獻(xiàn)的各個(gè)標(biāo)引項(xiàng)。本發(fā)明的自動(dòng)摘要提取和關(guān)鍵詞標(biāo)引方法由五個(gè)模塊組成,即知識(shí)庫模塊、特征詞標(biāo)記模塊、段落分析與評(píng)價(jià)模塊、摘要自動(dòng)撰寫模塊、標(biāo)引模塊。本發(fā)明的方法可以顯著提高專利數(shù)據(jù)深度加工的效率,并顯著降低數(shù)據(jù)加工成本,標(biāo)引結(jié)果具有很強(qiáng)的檢索價(jià)值。文檔編號(hào)G06F17/30GK101692240SQ20091016238公開日2010年4月7日申請日期2009年8月14日優(yōu)先權(quán)日2009年8月14日發(fā)明者崔征,李紅梅,王海虹,王維,王進(jìn),胡先勇申請人:北京中獻(xiàn)電子技術(shù)開發(fā)中心