背景技術(shù):
在現(xiàn)代媒體活動中,關(guān)于特定媒體元素的外觀和感覺的大量信息被用來產(chǎn)生定制的營銷和郵寄資料。該信息可以或者可以不按結(jié)構(gòu)化格式遞送。此外,當(dāng)以結(jié)構(gòu)化格式時,不存在標(biāo)準(zhǔn)化媒體開發(fā)中所使用的信息的結(jié)構(gòu)的統(tǒng)一規(guī)則。
存在對這樣的系統(tǒng)的需要,該系統(tǒng)將允許標(biāo)準(zhǔn)化用于產(chǎn)生定制的媒體產(chǎn)品的信息。
技術(shù)實(shí)現(xiàn)要素:
本公開的一個實(shí)施方案包括一種媒體管理系統(tǒng),該媒體管理系統(tǒng)包括:內(nèi)容分析單元,所述內(nèi)容分析單元對媒體輸出上的信息進(jìn)行分析以標(biāo)識所述信息的數(shù)據(jù)結(jié)構(gòu),并且將所述信息結(jié)構(gòu)與已知信息結(jié)構(gòu)進(jìn)行比較;模板分析單元,如果所述信息的結(jié)構(gòu)基本上類似于已知信息結(jié)構(gòu),則所述模板分析單元將所述信息重新格式化為類似的文件結(jié)構(gòu),如果所述信息的結(jié)構(gòu)不是基本上類似于已知信息結(jié)構(gòu),則所述模板分析單元基于所述文件信息的結(jié)構(gòu)來創(chuàng)建新的信息結(jié)構(gòu);以及媒體制作單元,所述媒體制作單元基于所述結(jié)構(gòu)化信息來產(chǎn)生媒體產(chǎn)品。
在另一個實(shí)施方案中,內(nèi)容分析單元可以對文件中的頭信息進(jìn)行分析。
在另一個實(shí)施方案中,內(nèi)容分析單元可以標(biāo)識媒體輸出中的至少一個數(shù)據(jù)元素。
在另一個實(shí)施方案中,內(nèi)容分析單元可以將所述至少一個標(biāo)識的數(shù)據(jù)元素與至少一個已知數(shù)據(jù)元素進(jìn)行比較。
在另一個實(shí)施方案中,模板分析單元可以基于所標(biāo)識的數(shù)據(jù)元素與所述已知數(shù)據(jù)元素的比較來標(biāo)識信息模板。
在另一個實(shí)施方案中,模板分析單元可以標(biāo)識與模板相關(guān)聯(lián)的至少一個規(guī)則。
在另一個實(shí)施方案中,模板分析單元可以將所述至少一個規(guī)則應(yīng)用于所述媒體輸出。
在另一個實(shí)施方案中,媒體出口的數(shù)據(jù)結(jié)構(gòu)可以是可擴(kuò)展標(biāo)記語言結(jié)構(gòu)。
在另一個實(shí)施方案中,媒體出口的數(shù)據(jù)結(jié)構(gòu)可以是逗號分隔可變結(jié)構(gòu)。
在另一個實(shí)施方案中,媒體出口是非結(jié)構(gòu)化的。
本公開的另一個實(shí)施方案包括一種結(jié)構(gòu)化媒體的方法,該方法包括以下步驟:收集媒體輸出上的信息;對所述媒體輸出上的信息進(jìn)行分析以標(biāo)識所述信息的數(shù)據(jù)結(jié)構(gòu);將所述信息結(jié)構(gòu)與已知信息結(jié)構(gòu)進(jìn)行比較;如果所述信息的結(jié)構(gòu)基本上類似于已知信息結(jié)構(gòu),則將所述信息重新格式化為類似的文件結(jié)構(gòu);如果所述信息的結(jié)構(gòu)不是基本上類似于已知信息結(jié)構(gòu),則基于所述文件信息的結(jié)構(gòu)來創(chuàng)建新的信息結(jié)構(gòu);并且基于所述結(jié)構(gòu)化信息來產(chǎn)生媒體產(chǎn)品。
在另一個實(shí)施方案中,所述方法包括對媒體輸出上的信息進(jìn)行分析的步驟可以包括對文件中的頭信息進(jìn)行分析。
在另一個實(shí)施方案中,所述方法包括對媒體輸出上的信息進(jìn)行分析的步驟可以包括標(biāo)識媒體輸出中的至少一個數(shù)據(jù)元素的步驟。
在另一個實(shí)施方案中,所述方法包括將所述至少一個標(biāo)識的數(shù)據(jù)元素與至少一個已知數(shù)據(jù)元素進(jìn)行比較的步驟。
在另一個實(shí)施方案中,所述方法包括基于所標(biāo)識的數(shù)據(jù)元素與已知數(shù)據(jù)元素的比較來標(biāo)識信息模板的步驟。
在另一個實(shí)施方案中,所述方法包括標(biāo)識與模板相關(guān)聯(lián)的至少一個規(guī)則的步驟。
在另一個實(shí)施方案中,所述方法包括將所述至少一個規(guī)則應(yīng)用于媒體輸出的步驟。
在另一個實(shí)施方案中,媒體出口的數(shù)據(jù)結(jié)構(gòu)可以是可擴(kuò)展標(biāo)記語言結(jié)構(gòu)。
在另一個實(shí)施方案中,媒體出口的數(shù)據(jù)結(jié)構(gòu)可以是逗號分隔可變結(jié)構(gòu)。
在另一個實(shí)施方案中,媒體出口可以是非結(jié)構(gòu)化的。
附圖說明
在審閱以下詳細(xì)描述和附圖之后,本發(fā)明的細(xì)節(jié)(包括非限制性益處和優(yōu)點(diǎn))對于相關(guān)領(lǐng)域的普通技術(shù)人員將變得更容易明白,其中:
圖1描繪適合于和與本發(fā)明一致的方法和系統(tǒng)一起使用的媒體管理系統(tǒng)的框圖;
圖2示出圖1的計算機(jī)的更詳細(xì)描繪;
圖3示出圖1的附加計算機(jī)的更詳細(xì)描繪;
圖4描繪圖1的mms的操作的說明性實(shí)施例;
圖5描繪標(biāo)識文件的文件結(jié)構(gòu)的方法的示意圖;以及
圖6描繪標(biāo)識文件的文件結(jié)構(gòu)內(nèi)的元素的方法的示意圖。
具體實(shí)施方式
雖然本文中描述了本發(fā)明的各種實(shí)施方案,但是本領(lǐng)域技術(shù)人員將清晰的是,在本發(fā)明的范圍內(nèi)的更多實(shí)施方案和實(shí)現(xiàn)是可能的。因此,除了依據(jù)所附權(quán)利要求書及其等同形式之外,本發(fā)明不受限制。
本文中描述了一種用于從媒體文件讀取媒體信息、標(biāo)識該媒體信息并且基于該媒體信息產(chǎn)生媒體輸出的系統(tǒng)。該系統(tǒng)還通過將媒體信息重新格式化到預(yù)定模板中并且基于新的媒體信息產(chǎn)生新模板來使媒體信息標(biāo)準(zhǔn)化。
圖1描繪了適合于和與本發(fā)明一致的方法和系統(tǒng)一起使用的媒體管理系統(tǒng)(“mms”)100的框圖。mms100包括經(jīng)由網(wǎng)絡(luò)110連接的多個計算機(jī)102、104、106和108。網(wǎng)絡(luò)110是適合于連接計算機(jī)以用于通信的類型,比如電路交換網(wǎng)絡(luò)或數(shù)據(jù)包交換網(wǎng)絡(luò)。此外,網(wǎng)絡(luò)110可以包括若干個不同的網(wǎng)絡(luò),比如局域網(wǎng)、廣域網(wǎng)(比如互聯(lián)網(wǎng))、電話網(wǎng)絡(luò)(包括具有專用通信鏈路的電話網(wǎng)絡(luò))、無連接網(wǎng)絡(luò)以及無線網(wǎng)絡(luò)。在圖1所示的說明性實(shí)施例中,網(wǎng)絡(luò)110是互聯(lián)網(wǎng)。圖1所示的計算機(jī)102、104、106和108中的每個經(jīng)由合適的通信鏈路(比如專用通信線路或無線通信鏈路)連接到網(wǎng)絡(luò)110。
在說明性實(shí)施例中,計算機(jī)102用作媒體產(chǎn)生單元(“mgu”),該mgu包括信息收集單元112、內(nèi)容分析單元114、模板分析單元116以及媒體制作單元118。圖1所示的計算機(jī)和網(wǎng)絡(luò)配置的數(shù)量僅僅是說明性實(shí)施例。本領(lǐng)域技術(shù)人員將意識到,mms100可以包括不同數(shù)量的計算機(jī)和網(wǎng)絡(luò)。例如,計算機(jī)102可以包括信息收集單元112和模板分析單元116,并且內(nèi)容分析單元114和媒體制作單元118可以駐存在不同計算機(jī)上。
圖2示出了計算機(jī)102的更詳細(xì)的描繪。計算機(jī)102包括中央處理單元(cpu)202、輸入輸出(io)單元204、通信地耦合到io單元204的顯示裝置206、二級存儲裝置208以及內(nèi)存210。計算機(jī)202可以進(jìn)一步包括標(biāo)準(zhǔn)輸入裝置,比如鍵盤、鼠標(biāo)、數(shù)字化器或語音處理裝置(每個均未被圖示說明)。
計算機(jī)102的內(nèi)存210包括圖形用戶界面(“gui”)212,gui212用于經(jīng)由如本文中所描述的顯示裝置206和i/o單元204從用戶收集信息。gui212包括能夠顯示在顯示裝置206上的任何用戶界面,包括但不限于網(wǎng)頁、可執(zhí)行程序中的顯示面板或能夠顯示在計算機(jī)屏幕上的任何其他界面。gui212還可以被存儲在二級存儲單元208中。在與本發(fā)明一致的一個實(shí)施方案中,gui212使用市售超文本標(biāo)記語言(“html”)瀏覽軟件而被顯示,所述市售html瀏覽軟件比如但不限于微軟internetexplorer、googlechrome或任何其他市售html瀏覽軟件。二級存儲單元208可以包括信息存儲單元214。信息存儲單元可以是關(guān)系數(shù)據(jù)庫,比如但不限于微軟的sql、oracle或任何其他數(shù)據(jù)庫。
圖3示出了計算機(jī)104、106和108的更詳細(xì)的描繪。每個計算機(jī)104、106和108包括中央處理單元(cpu)302、輸入輸出(io)單元304、通信地耦合到io單元304de顯示裝置306、二級存儲裝置308以及內(nèi)存310。每個計算機(jī)104、106和108可以進(jìn)一步包括標(biāo)準(zhǔn)輸入裝置,比如鍵盤、鼠標(biāo)、數(shù)字化器或語音處理裝置(每個均未被圖示說明)。
每個計算機(jī)104、106和108的內(nèi)存310包括gui312,gui312用于經(jīng)由如本文中所描述的顯示裝置306和io單元304從用戶收集信息。gui312包括能夠顯示在顯示裝置206上的任何用戶界面,包括但不限于網(wǎng)頁、可執(zhí)行程序中的顯示面板或能夠顯示在計算機(jī)屏幕上的任何其他界面。gui312還可以被存儲在二級存儲單元208中。在與本發(fā)明一致的一個實(shí)施方案中,gui312使用市售html瀏覽軟件被顯示,所述市售html瀏覽軟件比如但不限于微軟internetexplorer、googlechrome或任何其他市售html瀏覽軟件。
圖4描繪了mms100的操作的說明性實(shí)施例。在步驟402中,在信息收集單元112中接收將產(chǎn)生的包含媒體上的信息的文件。在步驟404中,內(nèi)容分析單元116確定該文件中的信息的格式。該格式可以是結(jié)構(gòu)化或非結(jié)構(gòu)化文件格式,包括但不限于pdf文件、xml文件、xls文件或任何其他結(jié)構(gòu)化或非結(jié)構(gòu)化文件格式。在步驟406中,內(nèi)容分析單元114打開該文件,并且將該文件中的信息的結(jié)構(gòu)與已知信息結(jié)構(gòu)進(jìn)行比較。在比較該文件的結(jié)構(gòu)中,內(nèi)容分析單元114標(biāo)識文件中的已知指示符,比如頭信息、標(biāo)記信息、單詞或字符布置或任何其他指示符,并且將該指示符與已知數(shù)據(jù)結(jié)構(gòu)中的指示符進(jìn)行比較。作為說明性實(shí)施例,內(nèi)容分析單元114可以標(biāo)識xml文件的頭部分,并且將該頭部分與存儲在信息存儲單元214中的已知頭部分進(jìn)行比較。
在步驟408中,如果標(biāo)識的數(shù)據(jù)結(jié)構(gòu)與已知數(shù)據(jù)結(jié)構(gòu)匹配,則從信息存儲單元214檢索已知數(shù)據(jù)結(jié)構(gòu)上的信息。在步驟410中,模板分析單元116對所述文件中的信息進(jìn)行修訂以符合已知數(shù)據(jù)結(jié)構(gòu)。作為說明性實(shí)施例,如果所述文件被標(biāo)識為xml文件,則對所述文件的結(jié)構(gòu)(包括標(biāo)記和頭)進(jìn)行修訂以使它遵守已知數(shù)據(jù)結(jié)構(gòu)的標(biāo)記和頭。在步驟412中,如果對于標(biāo)識的數(shù)據(jù)結(jié)構(gòu)不存在匹配,則模板分析單元116基于所述文件中的信息的結(jié)構(gòu)來產(chǎn)生模板。在產(chǎn)生模板中,模板分析單元114可以使用常規(guī)的ocr和對象識別算法來標(biāo)識不同單詞和短語的分隔指示符。模板分析單元114可以收集外部信息(比如收集用戶輸入)來確定所述文件中的不同關(guān)鍵字或元素的類別。在所有關(guān)鍵字和元素都被識別之后,將新文件結(jié)構(gòu)作為已知文件結(jié)構(gòu)保存在信息存儲單元214中。
在步驟414中,模板分析單元116重新對所述文件中的信息進(jìn)行結(jié)構(gòu)化以符合新產(chǎn)生的模板中的新文件結(jié)構(gòu)。在步驟416中,模板分析單元116使用所述文件中的信息和標(biāo)識的文件結(jié)構(gòu)來創(chuàng)建新文件。在步驟418中,媒體制作單元118基于所述文件中的信息和文件結(jié)構(gòu)來產(chǎn)生媒體。作為說明性實(shí)施例,所述文件中的信息可以是關(guān)于將被打印在標(biāo)簽上的位置、布置和顏色的信息。文件信息可以使用未知標(biāo)記和子標(biāo)記被以xml格式布置。內(nèi)容分析單元114可以確定標(biāo)記和子標(biāo)記與另一個標(biāo)志布局是否相同或類似。如果標(biāo)記和子標(biāo)記與存儲在信息存儲單元214中的已知標(biāo)記和子標(biāo)記相同或類似,則使用這些已知標(biāo)記和子標(biāo)記重新格式化文件。如果標(biāo)記與已知標(biāo)記不相同或類似,則可以基于文件中的標(biāo)記和子標(biāo)記來創(chuàng)建新的xml格式。一旦文件結(jié)構(gòu)被確定,就基于文件中的信息來產(chǎn)生媒體。通過將文件中的信息與已知數(shù)據(jù)結(jié)構(gòu)進(jìn)行比較,所有媒體都可以被配置為標(biāo)準(zhǔn)格式以用于更快速地且更精確地處理。
圖5描繪了標(biāo)識文件的文件結(jié)構(gòu)的方法的示意圖。在步驟502中,信息收集單元112打開包含媒體上的信息的文件。在步驟504中,內(nèi)容分析單元114標(biāo)識該文件中的頭信息。在步驟506中,內(nèi)容分析單元114將該文件中的標(biāo)識的頭信息與來自已知文件結(jié)構(gòu)的頭信息進(jìn)行比較。在步驟508中,如果標(biāo)識的頭信息與已知頭信息不匹配,則內(nèi)容分析單元114標(biāo)識不匹配的頭信息。在步驟510中,內(nèi)容分析單元114創(chuàng)建并入新的頭信息的新模板。在步驟512中,如果頭信息匹配已知頭信息,則內(nèi)容分析單元114將所述文件中的每個頭與已知頭信息相關(guān)聯(lián)。在步驟514中,內(nèi)容分析單元114標(biāo)識所述文件中的數(shù)據(jù)元素。數(shù)據(jù)元素可以包括xml文件中用標(biāo)記或子標(biāo)記標(biāo)注的信息或被指示符(比如逗號)分隔的信息。在步驟516中,內(nèi)容分析單元116基于頭信息、與數(shù)據(jù)元素相關(guān)聯(lián)的信息或數(shù)據(jù)元素本身來對數(shù)據(jù)元素進(jìn)行歸類。在步驟518中,模板分析單元118產(chǎn)生并入歸類的元素的新模板。
圖6描繪了標(biāo)識文件的文件結(jié)構(gòu)內(nèi)的元素的方法的示意圖。在步驟602中,信息收集單元112打開文件。在步驟604中,內(nèi)容分析單元114標(biāo)識該文件中的數(shù)據(jù)元素。數(shù)據(jù)元素可以包括xml文件中用標(biāo)記或子標(biāo)記標(biāo)注的信息或被指示符(比如逗號)分隔的信息。在步驟606中,內(nèi)容分析單元112將標(biāo)識的元素與已知元素類型進(jìn)行比較。在步驟608中,如果標(biāo)識的元素與來自文件模板的已知元素類型相同或類似,則模板分析單元116使用并入該已知元素類型的模板來創(chuàng)建文件。在步驟612中,模板分析單元116基于與信息存儲單元214中的模板相關(guān)聯(lián)的規(guī)則來對新創(chuàng)建的文件中的信息進(jìn)行驗(yàn)證。規(guī)則可以包括關(guān)于輸出的媒體的布置、顏色、措辭或任何其他方面的信息。在步驟614中,媒體制作單元118基于新文件來產(chǎn)生媒體。在步驟610中,如果標(biāo)識的元素與已知元素不匹配,則產(chǎn)生并入新元素的新模板。
在本公開中,詞語“一(a或an)”要被看作既包括單數(shù)、又包括復(fù)數(shù)。相反,對復(fù)數(shù)物品的任何引用在適當(dāng)處應(yīng)包括單數(shù)。
應(yīng)理解,對本文中所公開的目前優(yōu)選的實(shí)施方案的各種改變和修改對于本領(lǐng)域技術(shù)人員將是清晰的。此類改變和修改可以在不脫離本公開的精神和范圍并且不削弱其預(yù)期優(yōu)點(diǎn)的情況下做出。因此,意圖是此類改變和修改被所附權(quán)利要求書所涵蓋。