国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法和裝置制造方法

      文檔序號(hào):6626562閱讀:239來(lái)源:國(guó)知局
      保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法和裝置制造方法
      【專利摘要】本發(fā)明實(shí)施例公開(kāi)了一種保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法和裝置。所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法包括:利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源;利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù);利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞;根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系。本發(fā)明實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法和裝置能夠向用戶提供關(guān)于保健食品的詳細(xì)信息。
      【專利說(shuō)明】保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法和裝置

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明實(shí)施例涉及數(shù)據(jù)庫(kù)【技術(shù)領(lǐng)域】,尤其涉及一種保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法和裝置。

      【背景技術(shù)】
      [0002]根據(jù)2005年國(guó)家食品藥品監(jiān)督管理局頒布的《保健食品注冊(cè)管理辦法(試行)》中對(duì)保健食品的定義,保健食品是指聲稱具有特定保健功能或者以補(bǔ)充維生素、礦物質(zhì)為目的的食品,即適宜于特定人群食用,具有調(diào)節(jié)機(jī)體功能,不以治療疾病為目的,并且對(duì)人體不產(chǎn)生任何急性、亞急性或者慢性危害的食品。根據(jù)保健食品的定義,我國(guó)保健食品分為兩類(lèi):一類(lèi)是調(diào)節(jié)機(jī)體功能的保健食品。國(guó)家食品藥品監(jiān)督管理局公布的保健食品具有27種功能,有增強(qiáng)免疫力的功能、緩解體力疲勞的功能、輔助降血脂的功能、輔助降血糖的功能、輔助降血壓的功能、減肥動(dòng)能等;另一類(lèi)是營(yíng)養(yǎng)補(bǔ)充劑,以補(bǔ)充一種或多種維生素、礦物質(zhì)而不以提供能量為目的的產(chǎn)品,其作用是補(bǔ)充膳食供給的不足,預(yù)防營(yíng)養(yǎng)缺乏和降低發(fā)生某些慢性疾病的危險(xiǎn)性,此類(lèi)產(chǎn)品僅限于補(bǔ)充維生素和礦物質(zhì)。所以,保健食品首先是食品。但是,保健食品又與人們?nèi)粘J秤玫钠胀ㄊ称废鄥^(qū)別。它對(duì)人體有調(diào)節(jié)機(jī)體功能的作用,對(duì)醫(yī)治人體的疾病往往具有輔助作用。
      [0003]普通消費(fèi)者往往希望通過(guò)互聯(lián)網(wǎng)查詢到保健食品對(duì)哪些疾病能夠起到輔助醫(yī)治的效果。然而,消費(fèi)者在搜索時(shí),一般會(huì)搜索出大量信息,且準(zhǔn)確性低,需要做大量的篩選工作,這使得消費(fèi)者更難以選擇。


      【發(fā)明內(nèi)容】

      [0004]有鑒于此,本發(fā)明實(shí)施例提出一種保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法和裝置,以便于提高消費(fèi)者獲取保健食品信息的準(zhǔn)確性和信息篩選效率。
      [0005]第一方面,本發(fā)明實(shí)施例提供了一種保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法,所述方法包括:
      [0006]利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源;
      [0007]利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù);
      [0008]利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞;
      [0009]根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系O
      [0010]第二方面,本發(fā)明實(shí)施例提供了一種保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建裝置,所述裝置包括:
      [0011]參考信息檢索模塊,用于利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源;
      [0012]語(yǔ)料庫(kù)建立模塊,用于利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù);
      [0013]語(yǔ)料分詞模塊,用于利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞;
      [0014]關(guān)聯(lián)建立模塊,用于根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0015]本發(fā)明實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法和裝置通過(guò)建立保健食品與其具有輔助醫(yī)治效果的疾病之間的關(guān)聯(lián)關(guān)系,能夠?qū)Ρ=∈称返拇罅繑?shù)據(jù)進(jìn)行統(tǒng)一處理,能夠提高關(guān)于保健食品信息的準(zhǔn)確性,且減少了用戶的篩選操作,提高了用戶獲取保健食品信息的效率和便捷性。

      【專利附圖】

      【附圖說(shuō)明】
      [0016]通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
      [0017]圖1是本發(fā)明第一實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法的流程圖;
      [0018]圖2是本發(fā)明第一實(shí)施例提供的互聯(lián)網(wǎng)上關(guān)于保健食品的參考信息的網(wǎng)頁(yè)的頁(yè)面圖;
      [0019]圖3是本發(fā)明第一實(shí)施例提供的保健視頻關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法中語(yǔ)料庫(kù)建立的流程圖;
      [0020]圖4是本發(fā)明第二實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法的流程圖;
      [0021]圖5是本發(fā)明第二實(shí)施例提供的為描述語(yǔ)料庫(kù)中未收錄的保健食品建立關(guān)聯(lián)疾病的流程不意圖;
      [0022]圖6是本發(fā)明第三實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法的流程圖;
      [0023]圖7是本發(fā)明第四實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建裝置的結(jié)構(gòu)圖。

      【具體實(shí)施方式】
      [0024]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。可以理解的是,此處所描述的具體實(shí)施例僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部?jī)?nèi)容。
      [0025]圖1至圖3示出了本發(fā)明的第一實(shí)施例。
      [0026]圖1是本發(fā)明第一實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法的流程圖。參見(jiàn)圖1,所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法包括:
      [0027]S110,利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源。
      [0028]所述保健食品知識(shí)庫(kù)是預(yù)置的關(guān)于保健食品的關(guān)鍵信息的數(shù)據(jù)庫(kù)。所述保健食品知識(shí)庫(kù)中按照不同的保健食品名稱存儲(chǔ)有保健食品的關(guān)鍵信息。所述保健食品的關(guān)鍵信息至少包括保健食品的名稱,還有可能包括保健食品的生產(chǎn)廠家、商標(biāo)名稱、產(chǎn)品型號(hào)等信肩、O
      [0029]所述參考信息源是存儲(chǔ)有關(guān)于保健食品的參考信息的信息源。所述參考信息源可以是互聯(lián)網(wǎng)上關(guān)于保健食品的參考信息的網(wǎng)頁(yè),例如百度百科的網(wǎng)頁(yè)。圖2示出了的一個(gè)互聯(lián)網(wǎng)上關(guān)于保健食品的參考信息的網(wǎng)頁(yè)。參見(jiàn)圖2,所述網(wǎng)頁(yè)不僅提供了保健食品的名稱、生產(chǎn)廠家,還會(huì)提供保健食品的功能等更加詳細(xì)的信息。
      [0030]在本實(shí)施例中,首先從預(yù)置的保健食品知識(shí)庫(kù)中獲取保健食品的名稱,然后利用所述保健食品的名稱對(duì)所述參考信息源進(jìn)行檢索,以獲取關(guān)于所述保健食品的更多信息。優(yōu)選的,當(dāng)選擇互聯(lián)網(wǎng)上關(guān)于保健食品的參考信息的網(wǎng)頁(yè)作為所述參考信息源時(shí),可以通過(guò)搜索引擎檢索互聯(lián)網(wǎng)網(wǎng)頁(yè),來(lái)實(shí)現(xiàn)對(duì)所述參考信息源的檢索。
      [0031]S120,利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。
      [0032]對(duì)所述參考信息源進(jìn)行檢索以后,獲取到了關(guān)于所述保健食品的更多信息。以獲取到的信息為基礎(chǔ)數(shù)據(jù),建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。所述描述語(yǔ)料庫(kù)是對(duì)所述保健食品的詳細(xì)信息進(jìn)行描述的數(shù)據(jù)庫(kù),其中包含著不同保健食品的描述語(yǔ)料。而保健食品的描述語(yǔ)料會(huì)對(duì)保健食品的成分、功效等信息做詳盡的描述。
      [0033]S130,利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞。
      [0034]所述疾病詞典是預(yù)先配置的記錄不同疾病的名稱的數(shù)據(jù)字典。所述疾病詞典不僅會(huì)記錄一些常見(jiàn)疾病的疾病名稱,還會(huì)記錄一些不太常見(jiàn)的疾病的名稱。如果一個(gè)疾病在中文中有多個(gè)名稱,則所述疾病詞典會(huì)對(duì)該疾病的不同名稱分別進(jìn)行記錄。
      [0035]預(yù)先配置了記錄疾病名稱的疾病詞典以后,可以利用所述疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中的描述語(yǔ)料進(jìn)行分詞。對(duì)所述描述語(yǔ)料進(jìn)行分詞就是將所述描述語(yǔ)料切分為以詞為單元的切分結(jié)果。然后可以通過(guò)與所述疾病詞典中收錄的疾病名稱進(jìn)行比較,獲取到所述描述語(yǔ)料中包含的疾病名稱。
      [0036]S140,根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0037]如果在所述保健食品的描述語(yǔ)料中出現(xiàn)了一個(gè)疾病的疾病名稱,那么說(shuō)明該保健食品對(duì)所述疾病的治療有輔助作用,因此應(yīng)該建立所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系O
      [0038]示例的,建立所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系可以將保健食品與同它有關(guān)聯(lián)關(guān)系的疾病按照它們之間的對(duì)應(yīng)關(guān)系存入同一個(gè)數(shù)據(jù)表中。
      [0039]圖3是本發(fā)明第一實(shí)施例提供的保健視頻關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法中語(yǔ)料庫(kù)建立的流程圖。參見(jiàn)圖3,優(yōu)選的,利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)包括:
      [0040]S121,根據(jù)所述參考信息源中的段落標(biāo)題,對(duì)所述檢索結(jié)果進(jìn)行過(guò)濾,以獲得有效的描述語(yǔ)料數(shù)據(jù)。
      [0041]所述參考信息源中關(guān)于所述保健食品的描述語(yǔ)料通常以不同的段落組成,而且不同的段落通常有不同的標(biāo)題。從所述描述語(yǔ)料的不同標(biāo)題能夠得知所述參考信息源中該段落的大致內(nèi)容。
      [0042]在不同的段落標(biāo)題中,有一些段落標(biāo)題所標(biāo)明的段落通常與需要獲取的描述語(yǔ)料數(shù)據(jù)非常相關(guān),而另一些段落標(biāo)題所表明的段落則與需要獲取的描述語(yǔ)料數(shù)據(jù)不那么相關(guān)。把與需要獲取的描述語(yǔ)料數(shù)據(jù)非常相關(guān)的段落成為有效的描述語(yǔ)料數(shù)據(jù)。例如,以段落標(biāo)題中包含“功效”或者“作用”的段落一般與需要獲取的描述語(yǔ)料數(shù)據(jù)十分相關(guān),可以作為有效的描述語(yǔ)料數(shù)據(jù)。
      [0043]可以將類(lèi)似“功效”、“作用”這樣的關(guān)鍵詞作為標(biāo)題關(guān)鍵詞對(duì)從所述參考信息源中獲取的數(shù)據(jù)進(jìn)行過(guò)濾,從而得到有效的描述語(yǔ)料數(shù)據(jù)。
      [0044]S122,將關(guān)于相同保健食品的有效的描述語(yǔ)料數(shù)據(jù)合并,從而建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。
      [0045]對(duì)所述從所述參考信息源中獲取的數(shù)據(jù)進(jìn)行過(guò)濾以后,獲取到有效的描述語(yǔ)料數(shù)據(jù)可能包含若干數(shù)據(jù)段。將這些數(shù)據(jù)段進(jìn)行合并,便可以建立關(guān)于所述保健視頻的描述語(yǔ)料庫(kù)。
      [0046]具體的,對(duì)所述有效描述語(yǔ)料數(shù)據(jù)的合并可以是將表示不同數(shù)據(jù)段的字符串連接,以形成一個(gè)新的包含不同數(shù)據(jù)段內(nèi)容的字符串。
      [0047]本實(shí)施例通過(guò)利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源,利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù),利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞,根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系,從而建立了保健食品與其具有輔助醫(yī)治效果的疾病之間的關(guān)聯(lián)關(guān)系,提高了用戶獲取保健食品信息的效率和便捷性。
      [0048]圖4及圖5示出了本發(fā)明的第二實(shí)施例。
      [0049]圖4是本發(fā)明第二實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法的流程圖。所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法以本發(fā)明第一實(shí)施例為基礎(chǔ),進(jìn)一步的,建立所述保健食品與所述描述預(yù)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,還包括:根據(jù)保健食品的描述字段計(jì)算所述描述語(yǔ)料庫(kù)中已收錄的保健食品與未收錄的保健食品之間的相似度;若所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預(yù)設(shè)的相似度閾值,則建立所述未收錄的保健食品同所述已收錄的保健食品相關(guān)聯(lián)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0050]參見(jiàn)圖4,所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法包括:
      [0051]S410,利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源。
      [0052]S420,利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。
      [0053]S430,利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞。
      [0054]S440,根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0055]S450,根據(jù)保健食品的描述字段計(jì)算所述描述語(yǔ)料庫(kù)中已收錄的保健食品與未收錄的保健食品之間的相似度。
      [0056]所述保健食品的描述字段是在所述預(yù)置的保健食品知識(shí)庫(kù)中所述保健食品的描述字段。所述描述字段包括所述保健食品的名稱字段、功效字段以及成分字段。
      [0057]所述參考信息源本身的收錄數(shù)據(jù)是不完整的,也就是說(shuō)參考信息源本身有數(shù)據(jù)稀疏的問(wèn)題,并不是所有的保健食品都能在所述參考信息源中找到相應(yīng)的記錄。因此,在建立所述保健食品的描述語(yǔ)料庫(kù)以后,在所述預(yù)置的保健食品知識(shí)庫(kù)中的保健食品有的被收錄在所述描述語(yǔ)料庫(kù)中,有的沒(méi)有被收錄在所述描述語(yǔ)料庫(kù)中。而沒(méi)有被收錄在所述描述語(yǔ)料庫(kù)中的保健食品就無(wú)法與疾病數(shù)據(jù)建立關(guān)聯(lián)。
      [0058]所述描述語(yǔ)料庫(kù)中未收錄的保健食品中,有一部分與已收錄的保健食品相同或者功效十分相似。為了能夠建立描述語(yǔ)料庫(kù)中未收錄的保健食品與疾病之間的關(guān)聯(lián),計(jì)算所述描述語(yǔ)料庫(kù)中未收錄的保健食品與已收錄的保健食品之間的相似度。
      [0059]優(yōu)選的,可以將未收錄的保健食品的描述字段組成所述未收錄的保健食品的描述向量,并將已收錄的保健食品的描述字段組成所述已收錄的保健食品的描述向量。然后,根據(jù)二者的描述向量計(jì)算未收錄的保健食品與已收錄的保健食品之間的相似度。進(jìn)一步的優(yōu)選的,所述未收錄的保健食品與已收錄的保健食品之間的相似度是余弦相似度。
      [0060]計(jì)算所述未收錄的保健食品與已收錄的保健食品之間的余弦相似度的公式如下:
      3,,、3,q./?
      「00611 similarityia, b) ^ Y Wi.SimXai, b) = Y Wi.., ,1 ,, !,

      i=l ' i=l \ai\bi\
      [0062]其中,similarity表示保健食品a與保健食品b之間的相似度,表示保健食品a的描述向量中的第i個(gè)元素Ai表示保健食品b的描述向量中的第i個(gè)元素,Wi表示兩個(gè)描述向量中第i個(gè)元素之間的權(quán)重,SinKai, bj表示保健食品a和保健食品b的描述向量中第i個(gè)元素之間的相似度。
      [0063]S460,若所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預(yù)設(shè)的相似度閾值,則建立所述未收錄的保健食品同所述已收錄的保健食品相關(guān)聯(lián)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0064]可以預(yù)先設(shè)置已收錄保健食品與未收錄保健食品之間的相似度閾值,當(dāng)計(jì)算得到的未收錄保健食品與已收錄保健食品之間的相似度高于該相似度閾值時(shí),則認(rèn)為所述未收錄保健食品與所述已收錄保健食品非常相似。因此,可以將所述已收錄保健食品的疾病關(guān)聯(lián)關(guān)系拷貝至所述未收錄保健食品,也就是加你所述未收錄的保健食品同所述已收錄的保健食品相關(guān)聯(lián)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0065]圖5示出了為描述語(yǔ)料庫(kù)中未收錄的保健食品建立關(guān)聯(lián)疾病的流程。參見(jiàn)圖5,已收錄的保健食品510在建立的數(shù)據(jù)庫(kù)中有與之相關(guān)聯(lián)的疾病512。而對(duì)于未收錄的保健食品520,由于在所述描述語(yǔ)料庫(kù)中沒(méi)有收錄關(guān)于它的相關(guān)數(shù)據(jù),并不能挖掘出與它有關(guān)聯(lián)關(guān)系的疾病數(shù)據(jù)。但是,已收錄的保健食品510和未收錄的保健食品520都有它們各自的描述向量511、521。利用它們的描述向量511、521計(jì)算二者之間的相似度,并且在二者之間的相似度高于預(yù)設(shè)的相似度閾值時(shí)將所述已收錄的保健食品510的關(guān)聯(lián)疾病數(shù)據(jù)512拷貝給所述未收錄的保健食品520,就完成了對(duì)未收錄的保健食品520的關(guān)聯(lián)疾病數(shù)據(jù)的挖掘522。
      [0066]本實(shí)施例通過(guò)在建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,根據(jù)保健食品的描述字段計(jì)算所述描述語(yǔ)料庫(kù)中已收錄的保健食品與未收錄的保健食品之間的相似度,并且當(dāng)所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預(yù)設(shè)的相似度閾值時(shí),建立所述未收錄的保健食品同所述已收錄的保健食品相關(guān)聯(lián)的疾病之間的關(guān)聯(lián)關(guān)系,完成了描述語(yǔ)料中未收錄的保健食品與疾病之間的關(guān)聯(lián),解決了參考信息源的數(shù)據(jù)稀疏問(wèn)題。
      [0067]圖6示出了本發(fā)明的第三實(shí)施例。
      [0068]圖6是本發(fā)明第三實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法的流程圖。所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法以本發(fā)明第一實(shí)施例為基礎(chǔ),進(jìn)一步的,建立所述保健食品與所述描述預(yù)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,還包括:利用所述保健食品對(duì)應(yīng)的癥狀以及與所述保健食品之間有關(guān)聯(lián)關(guān)系的疾病的癥狀,計(jì)算所述保健食品同與之具有關(guān)聯(lián)關(guān)系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對(duì)所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系進(jìn)行確認(rèn)。
      [0069]參見(jiàn)圖6,所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法包括:
      [0070]S610,利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源。
      [0071]S620,利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。
      [0072]S630,利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞。
      [0073]S640,根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0074]S650,利用所述保健食品對(duì)應(yīng)的癥狀以及與所述保健食品之間有關(guān)聯(lián)關(guān)系的疾病的癥狀,計(jì)算所述保健食品同與之具有關(guān)聯(lián)關(guān)系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對(duì)所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系進(jìn)行確認(rèn)。
      [0075]因?yàn)樗霰=∈称返拿枋稣Z(yǔ)料可能出現(xiàn)數(shù)據(jù)不準(zhǔn)確的情況,所以已經(jīng)建立的保健食品與疾病之間的關(guān)聯(lián)關(guān)系也可能會(huì)有數(shù)據(jù)不準(zhǔn)確的情況出現(xiàn)。在本實(shí)施例中,建立了所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系以后,對(duì)所建立的保健食品與疾病之間的關(guān)聯(lián)關(guān)系進(jìn)行確認(rèn)。
      [0076]對(duì)所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系的確認(rèn)需要依據(jù)與它們相關(guān)的癥狀數(shù)據(jù)。假設(shè)疾病d和保健品h存在關(guān)聯(lián),疾病d對(duì)應(yīng)的癥狀的集合為S1 = Isym1, sym2,…,symn},保健品h功效對(duì)應(yīng)的癥狀集合為S2 = (Sym1, sym2,…,symm},通過(guò)計(jì)算SI和S2的相關(guān)性,得到疾病d和保健品h功效的相似度。
      [0077]設(shè)S = S1 U S2為疾病和保健品功效對(duì)應(yīng)的所有癥狀,所述疾病與所述保健品之間的相似度計(jì)算公式推導(dǎo)過(guò)程如下:
      「 ?Σ M log + V h{i) log
      [0078]n h , , ^ +h(i) zTd{i).c
      Dn\d I I h) = --^" e 5 0
      [0079]其中,d(i) = num⑴/num(S), num⑴為癥狀i在疾病d的描述文檔中出現(xiàn)的總次數(shù),num(S)為S中的所有癥狀在疾病d的描述文檔中出現(xiàn)的次數(shù)的和。類(lèi)似的,h(i)=num⑴為癥狀i在保健品的描述文檔中出現(xiàn)的總次數(shù),num(S)為S中的所有癥狀在保健品h的描述文檔中出現(xiàn)的次數(shù)的和。
      [0080]上述公式的計(jì)算結(jié)果,也就是D1Jd I |h)越大則疾病與保健品的相關(guān)度越低??梢愿鶕?jù)實(shí)際情況調(diào)整閾值,將相似度低于閾值的結(jié)果從構(gòu)建出的關(guān)聯(lián)中刪除,以確保準(zhǔn)確率。
      [0081]本實(shí)施例通過(guò)收集保健食品及疾病對(duì)應(yīng)的癥狀數(shù)據(jù),根據(jù)所述保健食品對(duì)應(yīng)的癥狀以及所述疾病對(duì)應(yīng)的癥狀計(jì)算所述保健食品與所述疾病之間的相似度,并根據(jù)計(jì)算得到的所述保健食品與所述疾病之間的相似度對(duì)所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系進(jìn)行確認(rèn),從而保證了保健食品關(guān)聯(lián)知識(shí)庫(kù)中關(guān)聯(lián)關(guān)系的準(zhǔn)確,提高了數(shù)據(jù)的可信度。
      [0082]圖7示出了本發(fā)明的第四實(shí)施例。
      [0083]圖7是本發(fā)明第四實(shí)施例提供的保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建裝置的結(jié)構(gòu)圖。參見(jiàn)圖7,所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建裝置包括:參考信息檢索模塊710、語(yǔ)料庫(kù)建立模塊720、語(yǔ)料分詞模塊730以及關(guān)聯(lián)建立模塊740。
      [0084]所述參考信息檢索模塊710用于利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源。
      [0085]所述語(yǔ)料庫(kù)建立模塊720用于利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。
      [0086]所述語(yǔ)料分詞模塊730用于利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞。
      [0087]所述關(guān)聯(lián)建立模塊740用于根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0088]優(yōu)選的,所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建裝置還包括:保健食品相似度計(jì)算模塊750以及關(guān)聯(lián)關(guān)系拷貝模塊760。
      [0089]所述保健食品相似度計(jì)算模塊750用于在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預(yù)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,根據(jù)保健食品的描述字段計(jì)算所述描述語(yǔ)料庫(kù)中已收錄的保健食品與未收錄的保健食品之間的相似度。
      [0090]所述關(guān)聯(lián)關(guān)系拷貝模塊760用于在所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預(yù)設(shè)的相似度閾值之時(shí),則建立所述未收錄的保健食品同所述已收錄的保健食品相關(guān)聯(lián)的疾病之間的關(guān)聯(lián)關(guān)系。
      [0091]優(yōu)選的,所述保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建裝置還包括:關(guān)聯(lián)關(guān)系確認(rèn)模塊770。
      [0092]所述關(guān)聯(lián)關(guān)系確認(rèn)模塊770用于在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預(yù)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,利用所述保健食品對(duì)應(yīng)的癥狀以及與所述保健食品之間有關(guān)聯(lián)關(guān)系的疾病的癥狀,計(jì)算所述保健食品同與之具有關(guān)聯(lián)關(guān)系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對(duì)所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系進(jìn)行確認(rèn)。
      [0093]優(yōu)選的,所述語(yǔ)料庫(kù)建立模塊720包括:檢索結(jié)果過(guò)濾單元721以及數(shù)據(jù)合并單元722。
      [0094]所述檢索結(jié)果過(guò)濾單元721用于根據(jù)所述參考信息源中的段落標(biāo)題,對(duì)所述檢索結(jié)果進(jìn)行過(guò)濾,以獲得有效的描述語(yǔ)料數(shù)據(jù)。
      [0095]所述數(shù)據(jù)合并單元722用于將關(guān)于相同保健食品的有效的描述語(yǔ)料數(shù)據(jù)合并,從而建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。
      [0096]優(yōu)選的,所述保健食品的描述字段包括所述保健食品的名稱字段、功效字段以及成分字段。
      [0097]優(yōu)選的,所述已收錄的保健食品與未收錄的保健食品之間的相似度包括所述已收錄的保健食品與未收錄的保健食品之間的余弦相似度。
      [0098]上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
      [0099]本領(lǐng)域普通技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,他們可以用計(jì)算機(jī)裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件的結(jié)合。
      [0100]本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間的相同或相似的部分互相參見(jiàn)即可。
      [0101]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域技術(shù)人員而言,本發(fā)明可以有各種改動(dòng)和變化。凡在本發(fā)明的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
      【權(quán)利要求】
      1.一種保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建方法,其特征在于,包括: 利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源; 利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù); 利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞; 根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預(yù)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,還包括: 根據(jù)保健食品的描述字段計(jì)算所述描述語(yǔ)料庫(kù)中已收錄的保健食品與未收錄的保健食品之間的相似度; 若所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預(yù)設(shè)的相似度閾值,則建立所述未收錄的保健食品同所述已收錄的保健食品相關(guān)聯(lián)的疾病之間的關(guān)聯(lián)關(guān)系。
      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預(yù)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,還包括: 利用所述保健食品對(duì)應(yīng)的癥狀以及與所述保健食品之間有關(guān)聯(lián)關(guān)系的疾病的癥狀,計(jì)算所述保健食品同與之具有關(guān)聯(lián)關(guān)系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對(duì)所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系進(jìn)行確認(rèn)。
      4.根據(jù)權(quán)利要求1-3任一所述的方法,其特征在于,利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)包括: 根據(jù)所述參考信息源中的段落標(biāo)題,對(duì)所述檢索結(jié)果進(jìn)行過(guò)濾,以獲得有效的描述語(yǔ)料數(shù)據(jù); 將關(guān)于相同保健食品的有效的描述語(yǔ)料數(shù)據(jù)合并,從而建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。
      5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述保健食品的描述字段包括所述保健食品的名稱字段、功效字段以及成分字段。
      6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述已收錄的保健食品與未收錄的保健食品之間的相似度包括所述已收錄的保健食品與未收錄的保健食品之間的余弦相似度。
      7.一種保健食品關(guān)聯(lián)知識(shí)庫(kù)構(gòu)建裝置,其特征在于,包括: 參考信息檢索模塊,用于利用預(yù)置的保健食品知識(shí)庫(kù)中保健食品的名稱關(guān)鍵詞檢索參考信息源; 語(yǔ)料庫(kù)建立模塊,用于利用對(duì)所述參考信息源的檢索結(jié)果建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù); 語(yǔ)料分詞模塊,用于利用預(yù)先配置的疾病詞典對(duì)所述描述語(yǔ)料庫(kù)中所述保健食品的描述語(yǔ)料進(jìn)行分詞; 關(guān)聯(lián)建立模塊,用于根據(jù)分詞結(jié)果,建立所述保健食品與所述描述語(yǔ)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系。
      8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 保健食品相似度計(jì)算模塊,用于在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預(yù)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,根據(jù)保健食品的描述字段計(jì)算所述描述語(yǔ)料庫(kù)中已收錄的保健食品與未收錄的保健食品之間的相似度; 關(guān)聯(lián)關(guān)系拷貝模塊,用于在所述未收錄的保健食品與已收錄的保健食品之間的相似度高于預(yù)設(shè)的相似度閾值之時(shí),則建立所述未收錄的保健食品同所述已收錄的保健食品相關(guān)聯(lián)的疾病之間的關(guān)聯(lián)關(guān)系。
      9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 關(guān)聯(lián)關(guān)系確認(rèn)模塊,用于在根據(jù)分詞結(jié)果,建立所述保健食品與所述描述預(yù)料中出現(xiàn)的疾病之間的關(guān)聯(lián)關(guān)系之后,利用所述保健食品對(duì)應(yīng)的癥狀以及與所述保健食品之間有關(guān)聯(lián)關(guān)系的疾病的癥狀,計(jì)算所述保健食品同與之具有關(guān)聯(lián)關(guān)系的疾病之間的相似度,并根據(jù)所述保健食品與所述疾病之間的相似度對(duì)所述保健食品與所述疾病之間的關(guān)聯(lián)關(guān)系進(jìn)行確認(rèn)。
      10.根據(jù)權(quán)利要求7-9任一所述的裝置,其特征在于,所述語(yǔ)料庫(kù)建立模塊包括: 檢索結(jié)果過(guò)濾單元,用于根據(jù)所述參考信息源中的段落標(biāo)題,對(duì)所述檢索結(jié)果進(jìn)行過(guò)濾,以獲得有效的描述語(yǔ)料數(shù)據(jù); 數(shù)據(jù)合并單元,用于將關(guān)于相同保健食品的有效的描述語(yǔ)料數(shù)據(jù)合并,從而建立關(guān)于所述保健食品的描述語(yǔ)料庫(kù)。
      11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述保健食品的描述字段包括所述保健食品的名稱字段、功效字段以及成分字段。
      12.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述已收錄的保健食品與未收錄的保健食品之間的相似度包括所述已收錄的保健食品與未收錄的保健食品之間的余弦相似度。
      【文檔編號(hào)】G06F17/30GK104239500SQ201410459501
      【公開(kāi)日】2014年12月24日 申請(qǐng)日期:2014年9月10日 優(yōu)先權(quán)日:2014年9月10日
      【發(fā)明者】曾剛, 陸彬, 李岱峰, 伊凱 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1