專利名稱::信息處理裝置、信息處理方法和程序的制作方法
技術領域:
:本公開涉及信息處理裝置、信息處理方法和程序,具體地,涉及使得能夠向用戶提供與檢索關鍵詞相關聯(lián)的信息的信息處理裝置、信息處理方法和程序。
背景技術:
:傳統(tǒng)上,除了網(wǎng)頁和博客,互聯(lián)網(wǎng)上充斥了使用以推特(Twitter)為代表的各種社交網(wǎng)絡服務(SNS)的多種信息。此外,從多種信息中提取包括任意關鍵詞的信息的系統(tǒng)是已知的。具體地,在使用現(xiàn)有檢索系統(tǒng)的情況下,使用用戶任意設定的關鍵詞作為檢索條件,可以向用戶提供包括檢索條件的信息。此外,根據(jù)包括檢索關鍵詞的信息的新鮮度或者檢索頻率,可以向用戶提供新信息或者頻繁檢索的信息(例如,參照日本公開專利公布第2009-15407號)。
發(fā)明內(nèi)容如上所述,在相關技術中可以檢索包括檢索關鍵詞的信息。然而,仍未提出用于提供與檢索關鍵詞相關聯(lián)的信息(可以不包括檢索關鍵詞)或者從與檢索關鍵詞相關聯(lián)的信息中提取已成為世界流行主題的信息的技術。鑒于上述情況設計了本公開,并且本公開能夠提取已變?yōu)槭澜缌餍兄黝}的信息。根據(jù)本公開的一個實施例,提供了一種信息處理裝置,該信息處理裝置包括獲取單元,獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù);移動偏差計算單元,基于與預定測量時段t之前的預定時段對應的N個采樣值Χ、ΧΗ、Χ_2、…、和xt_N+1的移動平均值Hlt計算移動偏差Vt;以及評估值計算單元,基于與測量時段t對應的移動偏差Vt和與測量時段t-ι對應的移動偏差vt_i,計算表示測量時段t中的離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值St。評估值計算單??梢杂嬎阍u估值St=移動偏差Vt/移動偏差vt_lt)評估值計算單元可以對每個測量時段的連續(xù)時間序列數(shù)據(jù)求和并且將連續(xù)時間序列數(shù)據(jù)轉(zhuǎn)換為離散系統(tǒng)的時間序列數(shù)據(jù)。評估值計算單元可以將測量時段設定為在時間上重疊,并且對每個測量時段的連續(xù)時間序列數(shù)據(jù)求和并且將連續(xù)時間序列數(shù)據(jù)轉(zhuǎn)換為離散系統(tǒng)的時間序列數(shù)據(jù)。根據(jù)本公開的另一實施例,提供了一種由信息處理裝置執(zhí)行的信息處理方法,該信息處理方法包括獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù),基于與預定測量時段t之前的預定時段對應的N個采樣值Χ、ΧΗ、Χ_2、…、和xt_N+1的移動平均值mt計算移動偏差vt,并且基于與測量時段t對應的移動偏差Vt和與測量時段t-ι對應的移動偏差Vw,計算表示測量時段t中的離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值st。根據(jù)本公開的另一實施例,提供了一種使計算機用作如下單元的程序獲取單元,獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù);移動偏差計算單元,基于與預定測量時段t之前的預定時段對應的N個采樣值Χ、ΧΗ、Χ_2、…、和xt_N+1的移動平均值mt計算移動偏差Vt;以及評估值計算單元,基于與測量時段t對應的移動偏差Vt和與測量時段t-Ι對應的移動偏差vt_i,計算表示測量時段t中的離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值st。根據(jù)上面描述的本公開的各實施例,獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù),基于與預定測量時段t之前的預定時段對應的N個采樣值xt、xt_i、Xt_2、…、和Xt_N+1的移動平均值Hlt計算移動偏差Vt,并且基于與測量時段t對應的移動偏差Vt和與測量時段t-ι對應的移動偏差vt_i,計算表示測量時段t中的離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值St。根據(jù)上面描述的本公開的各實施例,可以提取已變?yōu)槭澜缌餍兄黝}的信息。圖I是圖示作為本公開的一個實施例的檢索裝置的配置示例的框圖;圖2是圖示數(shù)據(jù)庫的詳細配置的框圖;圖3是圖示檢索裝置執(zhí)行的相關聯(lián)的信息檢索處理的流程圖;圖4是圖不噪聲去除的不意圖;圖5是圖示主題提取處理的流程圖;圖6是圖示主題候選字符串的示圖;圖7是圖示變?yōu)闄z索裝置的用戶接口的屏幕的顯示示例的示圖;圖8是圖示變?yōu)闄z索裝置的用戶接口的屏幕的顯示示例的示圖;圖9A和9B是圖示頻率測量時段的示圖;圖10是圖示頻率演變的示例的示圖;圖11是圖示與圖10對應的頻率的移動平均值和移動方差的示圖;圖12是圖示與圖10對應的評估值的示圖;圖13是圖示圖10至12的統(tǒng)一狀態(tài)的示圖;以及圖14是圖示計算機的配置示例的框圖。具體實施例方式下面將參照附圖詳細描述本公開的優(yōu)選實施例。根據(jù)本公開的一個實施例,提供了一種信息處理裝置,該信息處理裝置包括獲取單元,獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù);移動偏差計算單元,基于與預定測量時段t之前的預定時段對應的N個采樣值Χ、ΧΗ、Χ_2、…、和xt_N+1的移動平均值Hlt計算移動偏差Vt;以及評估值計算單元,基于與測量時段t對應的移動偏差Vt和與測量時段t-ι對應的移動偏差vt_i,計算表示測量時段t中的離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值St。根據(jù)本公開的另一實施例,提供了一種由信息處理裝置執(zhí)行的信息處理方法,該信息處理方法包括獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù),基于與預定測量時段t之前的預定時段對應的N個采樣值Χ、ΧΗ、Χ_2、…、和xt_N+1的移動平均值mt計算移動偏差vt,并且基于與測量時段t對應的移動偏差Vt和與測量時段t-Ι對應的移動偏差Vw,計算表示測量時段t中的離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值St。〈I.實施例〉首先,將描述與應用了根據(jù)本公開的信息處理裝置的實施例對應的檢索裝置的概況。檢索裝置將互聯(lián)網(wǎng)或者內(nèi)聯(lián)網(wǎng)上出現(xiàn)的各種文檔設定為檢索對象,檢索包括檢索關鍵詞的文檔,并且提取檢索文檔中共同包括的字符串(以下稱為同現(xiàn)關鍵詞或者主題)。檢索裝置提供在包括檢索關鍵詞和同現(xiàn)關鍵詞的互聯(lián)網(wǎng)上的文檔中在預定時點已變?yōu)槭澜缌餍兄黝}(時髦主題)的信息,作為與檢索信息相關聯(lián)的信息。例如,檢索裝置將互聯(lián)網(wǎng)上出現(xiàn)的推特的發(fā)布信息(tweets)(顯示推特用戶張貼(輸入)的140個或更少的字符的短句)設定為檢索對象,檢索包括檢索關鍵詞的發(fā)布信息,并且提取檢索的發(fā)布信息中共同包括的同現(xiàn)關鍵詞。檢索裝置針對每個提取的同現(xiàn)關鍵詞計算表示流行性的評估值,顯示評估值列表使得同現(xiàn)關鍵詞被用戶選擇,并且向用戶提供包括所選擇的同現(xiàn)關鍵詞和檢索關鍵詞的發(fā)布信息。由此,可以向用戶提供關于已變?yōu)槭澜缌餍兄黝}的信息的發(fā)布信息。例如,如果檢索關鍵詞被設定為“淺草寺(SensojiTemple)”,則提取“臺東區(qū)(TaitoWard)”、“護國寺(Gokokuji)”、“地震”、“在淺草”、以及“交叉點”作為同現(xiàn)關鍵詞。如果用戶從提取的同現(xiàn)關鍵詞中選擇“地震”,則向用戶提供包括所選同現(xiàn)關鍵詞“地震”和檢索關鍵詞“淺草寺”的發(fā)布信息。檢索關鍵詞可以由用戶輸入,或者可以基于用戶的操作歷史自動設定。例如,用戶創(chuàng)建的文檔中頻繁出現(xiàn)的字符串、用戶創(chuàng)建的播放列表中包括的藝術家名稱或者歌曲標題、以及用戶觀看的電視節(jié)目中頻繁出現(xiàn)的明星名稱可以被提取,并且可以被設定為檢索關鍵詞。作為與檢索關鍵詞的對比,可以設定一個或者多個對比關鍵詞。與檢索關鍵詞相似,對比關鍵詞可以由用戶輸入,或者可以基于用戶的操作歷史自動設定。當自動設定對比關鍵詞時,可以基于設定的檢索關鍵詞確定對比關鍵詞。例如,當檢索關鍵詞是藝術家名稱時,可以從互聯(lián)網(wǎng)上的信息中檢索來自同一國家的另一個藝術家,并且該另一個藝術家的藝術家名稱可以被確定為對比關鍵詞。例如,當AAA被設定為檢索關鍵詞而BBB被設定為對比關鍵詞時,從包括檢索關鍵詞AAA的多個發(fā)布信息中提取同現(xiàn)關鍵詞。然而,在包括對比關鍵詞BBB的多個發(fā)布信息中出現(xiàn)頻率高的關鍵詞被排除在外??梢詫⒍鄠€字符串設定為檢索關鍵詞和對比關鍵詞,并且可以執(zhí)行“與(AND)”檢索。在本公開中,下面將描述其中推特的每個發(fā)布信息被設定為檢索對象的情況的示例。然而,作為實施例的檢索裝置的檢索對象不限于發(fā)布信息。檢索對象文檔和檢索關鍵詞不限于由諸如日語和英語的自然語言表示的檢索對象文檔和檢索關鍵詞,只要檢索對象文檔和檢索關鍵詞可以由字符串或者符號串表不。例如,DNA信息、音素、樂譜信息、通過以一維排列方式表不被量化的并且包括在符號串中的真實數(shù)值獲得的數(shù)據(jù)、以及通過以一維排列方式表示通過以多維排列方式表示被量化的并且包括在符號串中的真實數(shù)值獲得的數(shù)據(jù)而獲得的數(shù)據(jù),可以被設定為檢索對象文檔和檢索關鍵詞。[檢索裝置的配置示例]圖I圖示了作為實施例的檢索裝置中包括的功能塊的配置示例。檢索裝置10包括關鍵詞設定單元11、文檔檢索單元12、噪聲去除單元13、檢索索引創(chuàng)建單元14、流行性確定單元15、主題提取單元16、主題輸出單元17、主題文檔輸出單元18以及數(shù)據(jù)庫20。圖2圖示了數(shù)據(jù)庫(DB)20的詳細配置。數(shù)據(jù)庫20包括檢索文檔存儲數(shù)據(jù)庫(DB)21、文檔檢索索引數(shù)據(jù)庫(DB)22、以及主題存儲數(shù)據(jù)庫(DB)23。關鍵詞設定單元11將用戶輸入的字符串設定為檢索關鍵詞。關鍵詞設定單元11將用戶輸入的字符串設定為對比關鍵詞。關鍵詞設定單元11可以自動設定檢索關鍵詞和對比關鍵詞至少之一。文檔檢索單元12將互聯(lián)網(wǎng)上出現(xiàn)的推特的每個發(fā)布信息設定為檢索對象,并且檢索包括檢索關鍵詞的發(fā)布信息。文檔檢索單元12將互聯(lián)網(wǎng)上出現(xiàn)的推特的每個發(fā)布信息設定為檢索對象,并且檢索包括對比關鍵詞的發(fā)布信息??梢詫⒈辉O定為檢索對象的每個發(fā)布信息的提及日期和時間的時段限定為從當前時間到一個月之前。作為文檔檢索單元12的檢索結(jié)果獲得的發(fā)布信息與檢索關鍵詞或者對比關鍵詞相關聯(lián),并且關聯(lián)結(jié)果被存儲在數(shù)據(jù)庫20的檢索文檔存儲數(shù)據(jù)庫21中。噪聲去除單元13從作為檢索結(jié)果獲得的發(fā)布信息中去除不會變?yōu)橥F(xiàn)關鍵詞的字符串(以下稱為噪聲)。這將參照圖4具體描述。檢索索引創(chuàng)建單元14基于關于作為檢索結(jié)果獲得的存儲在檢索文檔存儲數(shù)據(jù)庫20中的發(fā)布信息的后綴數(shù)組,創(chuàng)建檢索索引。所創(chuàng)建的檢索索引存儲在數(shù)據(jù)庫20的文檔檢索索引數(shù)據(jù)庫22中。通過創(chuàng)建檢索索引,可以高速計算當在每個發(fā)布信息中提取同現(xiàn)關鍵詞時所需的主題(同現(xiàn)關鍵詞)候選字符串的出現(xiàn)頻率DF(文檔頻率)。當自動設定檢索關鍵詞或者對比關鍵詞時,流行性確定單元15確定檢索關鍵詞或者對比關鍵詞的候選者的流行性。流行性確定單元15確定所提取的同現(xiàn)關鍵詞(主題)的流行性。主題提取單元16從噪聲被去除的檢索結(jié)果的每個發(fā)布信息中提取同現(xiàn)關鍵詞(主題)。所提取的同現(xiàn)關鍵詞(主題)存儲在數(shù)據(jù)庫20的主題存儲數(shù)據(jù)庫23中。主題輸出單元17輸出提取的同現(xiàn)關鍵詞(主題)。主題輸出單元17可以具有用于基于所提取的同現(xiàn)關鍵詞(主題)自動創(chuàng)建發(fā)布信息并且在推特上張貼該發(fā)布信息的機器人(bot)創(chuàng)建功能。主題文檔輸出單元18從檢索文檔存儲數(shù)據(jù)庫21獲取包括所提取的同現(xiàn)關鍵詞(主題)的發(fā)布信息,并且輸出這些發(fā)布信息。[描述操作]接著將描述檢索裝置10的操作。圖3是圖示檢索裝置10執(zhí)行的相關聯(lián)的信息檢索處理的流程圖。在步驟SI中,關鍵詞設定單元11將用戶輸入的字符串設定為檢索關鍵詞。用戶創(chuàng)建的文檔中頻繁出現(xiàn)的字符串、用戶創(chuàng)建的播放列表中包括的藝術家名稱或者歌曲標題、以及用戶觀看的電視節(jié)目中頻繁出現(xiàn)的明星名稱都可以被提取并且設定為檢索關鍵詞。在這種情況下,可以針對所提取的藝術家名稱計算下面描述的流行性的評估值,并且可以采用評估值是預定閾值或更大的藝術家名稱作為檢索關鍵詞。在步驟SI中,關鍵詞設定單元11將用戶輸入的字符串或者自動確定的字符串設定為對比關鍵詞??梢允÷詫Ρ汝P鍵詞的設定。在步驟S2中,文檔檢索單元12將互聯(lián)網(wǎng)上出現(xiàn)的推特的每個發(fā)布信息設定為檢索對象并且檢索包括檢索關鍵詞的發(fā)布信息。檢索結(jié)果的發(fā)布信息與檢索關鍵詞相關聯(lián)并且關聯(lián)結(jié)果存儲在檢索文檔存儲數(shù)據(jù)庫21中。當對比關鍵詞被設定時,文檔檢索單元12將互聯(lián)網(wǎng)上出現(xiàn)的推特的每個發(fā)布信息設定為檢索對象并且檢索包括該對對比關鍵詞的發(fā)布信息。檢索結(jié)果的發(fā)布信息與對比關鍵詞相關聯(lián)并且關聯(lián)結(jié)果存儲在檢索文檔存儲數(shù)據(jù)庫21中。在步驟S3中,噪聲去除單元13從作為檢索結(jié)果獲得的發(fā)布信息中去除不會變?yōu)橥F(xiàn)關鍵詞的噪聲。圖4圖示了作為檢索結(jié)果的示例的發(fā)布信息。在圖4中,下劃線字符串被噪聲去除單元13作為噪聲去除。就是說,當檢索對象是發(fā)布信息時,意指銳推(retweet)的“RT”,表示答復方的目的地的用戶名”(在圖4中用戶名是tokyotralver),表示統(tǒng)一資源定位符(URL)的“http://.··”,以及表示無用信息的··”被去除?;氐綀D3,在步驟S4中,檢索索引創(chuàng)建單元14基于后綴數(shù)組針對作為檢索結(jié)果獲得的被存儲在檢索文檔存儲數(shù)據(jù)庫20中的發(fā)布信息創(chuàng)建檢索索引。所創(chuàng)建的檢索索引被存儲在文檔檢索索引數(shù)據(jù)庫22中。在步驟S5中,主題提取單元16執(zhí)行主題提取處理,用于從噪聲被去除的檢索結(jié)果的每個發(fā)布信息中提取同現(xiàn)關鍵詞(主題)。所提取的同現(xiàn)關鍵詞(主題)被存儲在數(shù)據(jù)庫20的主題存儲數(shù)據(jù)庫23中。圖5是具體圖示主題提取處理的流程圖。在步驟Sll中,主題提取單元16在噪聲被去除的檢索結(jié)果的發(fā)布信息組中出現(xiàn)的所有部分字符串中,提取僅作為其他部分字符串的一部分出現(xiàn)的部分字符串之外的字符串組。這相當于在出現(xiàn)頻率DF不變的范圍中提取最長的部分字符串組??梢允褂没诤缶Y數(shù)組的檢索索引來高速執(zhí)行該處理。根據(jù)下述字符類型的符合規(guī)則的字符串被排除在主題候選字符串之外,并且提取其余字符串作為主題候選字符串。[采用的字符類型]空格(空白)、半角英文字符、羅馬字符擴展、平假名、片假名、全角符號、長音符號、半角符號、控制字符、無效字符、日本漢字、半角數(shù)字、標點符號、朝鮮語字符、泰語字符、阿拉伯字符、希伯來語字符、西里爾字符以及希臘字符被采用作為字符類型。[從主題候選字符串中排除標志(token)的規(guī)則]當標志之前的字符(前一標志的最后字符)是長音符號時,該標志不被指定為主題候選字符串。當標志的第一字符是空格時,該標志不被指定為主題候選字符串。當標志的第一字符是全角符號時,該標志不被指定為主題候選字符串。當標志的第一字符是長音符號時,該標志不被指定為主題候選字符串。當標志的第一字符是半角符號時,該標志不被指定為主題候選字符串。當標志的第一字符是控制字符和無效字符時,該標志不被指定為主題候選字符串O當標志的第一字符是標點符號時,該標志不被指定為主題候選字符串。當標志之后的字符(下一標志的第一字符)是長音符號時,該標志不被指定為主題候選字符串。當標志的最后字符是空格時,該標志不被指定為主題候選字符串。當標志的最后字符是全角符號時,該標志不被指定為主題候選字符串。當標志的最后字符是半角符號時,該標志不被指定為主題候選字符串。當標志的最后字符是控制字符和無效字符時,該標志不被指定為主題候選字符串O當標志的最后字符是標點符號時,該標志不被指定為主題候選字符串。當標志之前的字符(前一標志的最后字符)和標志的第一字符或者標志之后的字符(下一標志的第一字符)和標志的最后字符均為半角英文字符和羅馬字符擴展時,該標志不被指定為主題候選字符串。當標志之前的字符(前一標志的最后字符)和標志的第一字符或者標志之后的字符(下一標志的第一字符)和標志的最后字符均是片假名時,該標志不被指定為主題候選字符串。當標志之前的字符(前一標志的最后字符)和標志的第一字符或者標志之后的字符(下一標志的第一字符)和標志的最后字符均是半角數(shù)字時,該標志不被指定為主題候選字符串。當標志之前的字符(前一標志的最后字符)和標志的第一字符或者標志之后的字符(下一標志的第一字符)和標志的最后字符均是朝鮮語字符時,該標志不被指定為主題候選字符串。當標志之前的字符(前一標志的最后字符)和標志的第一字符或者標志之后的字符(下一標志的第一字符)和標志的最后字符均是西里爾字符時,該標志不被指定為主題候選字符串。例如,如圖6所示,當噪聲被去除的發(fā)布信息是“Peoplewhostockuponchocolateraiseyourhands(囤積巧克力的人,舉手)”時,首先在檢索結(jié)果的發(fā)布信息組中的所有部分字符串中提取僅作為其他部分字符串的一部分出現(xiàn)的部分字符串之外的字符串組。例如,當“cho”、“chocolate,”和“chocolate”的出現(xiàn)頻率DF分別是10、10和4時,提取“chocolate”。然而,不提取“cho”。然后,通過應用從主題候選字符串中排除標志的規(guī)則,提取主題候選字符串。這樣,主題提取單元16可以基于出現(xiàn)頻率DF的變化點以及字符類型的差異,而非根據(jù)檢索對象文檔的語言,來提取主題候選字符串。然而,主題提取單元16可以基于文檔語言的特性使用語形學分析來提取主題候選字符串。當提取相似的字符串作為主題候選字符串時,可以收集相似的字符串作為一個字符串。在該情況下,相似意味著字符串的相似度高,并且出現(xiàn)文檔的相似度高。在步驟S12中,主題提取單元16使用存儲在文檔檢索索引數(shù)據(jù)庫22中的檢索索弓丨,來計算噪聲被去除的檢索結(jié)果的發(fā)布信息中的每個主題字符串的出現(xiàn)頻率DF。在步驟S13中,主題提取單元16采用其中出現(xiàn)頻率DF滿足預定條件的主題候選字符串作為主題(同現(xiàn)關鍵詞)。就是說,當檢索關鍵詞和對比關鍵詞兩者被設定時,主題提取單元16采用如下主題候選字符串作為主題其中通過將使用檢索關鍵詞的檢索結(jié)果的發(fā)布信息的出現(xiàn)頻率DF除以使用對比關鍵詞的檢索結(jié)果的發(fā)布信息的出現(xiàn)頻率DF而獲得的值是預定閾值或更大。當僅檢索關鍵詞被設定時,主題提取單元16采用如下主題候選字符串作為主題其中使用檢索關鍵詞的檢索結(jié)果的發(fā)布信息的出現(xiàn)頻率DF是預定閾值或更大。當確定是否采用主題候選字符串作為主題時,不同于使用上述出現(xiàn)頻率DF,可以計算并且使用信息增益、交互信息、二元正態(tài)分離、倍數(shù)變化、以及相關系數(shù)??梢詧?zhí)行諸如卡方測試的測試以測量主題的特異性。在如上所述提取主題之后,主題提取處理結(jié)束并且處理返回到圖3的步驟S6。在步驟S6中,流行性確定單元15針對在步驟S5中提取的每個同現(xiàn)關鍵詞(主題)計算流行性的評估值。下文將參照附圖9A至13描述計算方法。在步驟S7中,主題輸出單元17向用戶提供所提取的同現(xiàn)關鍵詞(主題)及其流行性的評估值。在步驟S8中,當檢索裝置自動設定主題時,主題輸出單元17可以不向用戶提供所提取的同現(xiàn)關鍵詞(主題)及其流行性的評估值。如果用戶選擇所提供的同現(xiàn)關鍵詞(主題)或者由檢索裝置自動選擇其中流行性的評估值是閾值或更大的同現(xiàn)關鍵詞,則在步驟S8中,主題文檔輸出單元18從檢索文檔存儲數(shù)據(jù)庫21獲取包括所提取的同現(xiàn)關鍵詞(主題)和檢索關鍵詞的發(fā)布信息,并且將這些發(fā)布信息作為與檢索關鍵詞相關聯(lián)的信息提供給用戶。當獲取的多個發(fā)布信息彼此相似時,可以收集多個發(fā)布信息作為一個發(fā)布信息并且可以將該發(fā)布信息提供給用戶。以這種方式,作為相關聯(lián)的信息檢索處理而執(zhí)行的一系列操作結(jié)束。[用作用戶接口的屏幕顯示示例]圖7圖示了用作檢索裝置10的用戶接口的屏幕的顯示示例。屏幕50設置有檢索關鍵詞輸入欄51、獲取發(fā)布信息按鈕52、從發(fā)布信息獲取主題詞按鈕53、顯不發(fā)布信息按鈕54、主題顯示欄55、評估值顯示欄56、和發(fā)布信息顯示欄57。用戶可以將檢索關鍵詞輸入到檢索關鍵詞輸入欄51。如果用戶操作獲取發(fā)布信息按鈕52,則從互聯(lián)網(wǎng)上出現(xiàn)的推特的發(fā)布信息中檢索包括檢索關鍵詞的發(fā)布信息。如果用戶操作從發(fā)布信息獲取主題詞按鈕53,則從檢索結(jié)果的發(fā)布信息中提取同現(xiàn)關鍵詞(主題)并且使同現(xiàn)關鍵詞和流行性的評估值顯示在主題顯示欄55中。如果用戶選擇顯示在主題顯示欄55上的同現(xiàn)關鍵詞(主題),則關于所選擇的同現(xiàn)關鍵詞(主題)的流行性的評估值的時間演變顯示在評估值顯示欄56上。如果在其中選擇了同現(xiàn)關鍵詞(主題)的狀態(tài)下用戶操作顯示發(fā)布信息按鈕54,則包括檢索關鍵詞和所選擇的同現(xiàn)關鍵詞(主題)的發(fā)布信息顯示在發(fā)布信息顯示欄57中。例如,如圖7所示,如果用戶將“淺草寺(SensojiTemple)”作為檢索關鍵詞輸入到檢索關鍵詞輸入欄51并且操作獲取發(fā)布信息按鈕52,則包括檢索關鍵詞“淺草寺(SensojiTemple)”的發(fā)布信息被檢索。在該情況下,如果用戶操作從發(fā)布信息獲得主題詞按鈕53,則同現(xiàn)關鍵詞(主題)“臺東區(qū)(TaitoWard)”、“護國寺(Gokokuji)”、“地震”、“地震災難發(fā)生時間下午2:46”、“在淺草”、和“交叉點”以及流行性的評估值顯示在主題顯示欄55中。如果用戶從顯示在主題顯示欄55上的同現(xiàn)關鍵詞(主題)中選擇“臺東區(qū)(TaitoWard)”,則所選擇的同現(xiàn)關鍵詞(主題)的流行性的評估值的時間演變顯示在評估值顯示欄56中。如果在其中選擇“臺東區(qū)(TaitoWard)”作為同現(xiàn)關鍵詞(主題)的狀態(tài)下用戶操作顯示發(fā)布信息按鈕54,則包括檢索關鍵詞“淺草寺(SensojiTemple)”和所選擇的同現(xiàn)關鍵詞(主題)“臺東區(qū)(TaitoWard)”的發(fā)布信息顯示在發(fā)布信息顯示欄57中。然而,在圖7中,在發(fā)布信息顯示欄57中發(fā)布信息的句子由*(星號)代替。例如,如圖8所示,如果用戶在檢索關鍵詞輸入欄51上輸入“蔬菜(vegetables)”作為檢索關鍵詞,并且操作獲取發(fā)布信息按鈕52,則包括檢索關鍵詞“蔬菜(vegetables)”的發(fā)布信息被檢索。在這種情況下,如果用戶操作從發(fā)布信息獲取主題詞按鈕53,則同現(xiàn)關鍵詞(主題)“兒童(child)”、“兒童的(ofchild)”、“制成飲料(madetodrink)”、“飲用(drank)”、“喂養(yǎng)(fed)”、“有運輸限制的(ofshipmentlimitation)”、以及“消費者的(ofconsumer)"以及流行性的評估值顯示在主題顯示欄55上。如果用戶從主題顯示欄55上顯示的同現(xiàn)關鍵詞(主題)中選擇“有運輸限制的(ofshipmentlimitation)”,則關于所選擇的同現(xiàn)關鍵詞(主題)的流行性的評估值的時間演變顯示在評估值顯示欄56上。如果在其中選擇“有運輸限制的(ofshipmentlimitation)”作為同現(xiàn)關鍵詞(主題)的狀態(tài)下用戶操作顯示發(fā)布信息按鈕54,則包括檢索關鍵詞“蔬菜(vegetables)”和所選擇的同現(xiàn)關鍵詞(主題)“有運輸限制的(ofshipmentlimitation)”的發(fā)布信息顯示在發(fā)布信息顯示欄57上。然而,在圖8中,在發(fā)布信息顯示欄57中,發(fā)布信息的句子由*(星號)代替。如上所述,檢索裝置10可以針對每個主題收集包括用戶感興趣的主題的發(fā)布信息并且可以將這些發(fā)布信息提供給用戶。如果檢索關鍵詞被自動設定,則檢索裝置10可以針對每個主題收集包括用戶感興趣的估計主題的發(fā)布信息并且可以將這些發(fā)布信息提供給用戶。[計算流行性的評估值的方法]接著,將描述在相關聯(lián)的信息檢索處理的步驟S6中計算同現(xiàn)關鍵詞的流行性的評估值的方法。首先,基于其中出現(xiàn)同現(xiàn)關鍵詞的發(fā)布信息的張貼日期和時間,將檢索結(jié)果的發(fā)布信息中的同現(xiàn)關鍵詞的出現(xiàn)頻率DF轉(zhuǎn)換為離散系統(tǒng)的時間序列數(shù)據(jù)。具體地,將同現(xiàn)關鍵詞的出現(xiàn)頻率DF轉(zhuǎn)換為預定測量時段(例如,24小時)中的頻率。圖9A和9B圖示了設定頻率測量時段的方法。就是說,如圖9A所示,頻率測量時段未被設定為在時間軸T上重疊,并且如圖9B所示,頻率測量時段可以被設定為在時間軸T上重疊。當頻率測量時段被設定為不在時間軸T上重疊時,每個測量間隔中的頻率和變?yōu)槌霈F(xiàn)頻率DF。當頻率測量時段被設定為在時間軸T上重疊時,可以在短時段中獲取多個頻率的樣本。當特定測量時段t中的頻率被設定為Xt時,使用測量時段t之前的N個測量時段t、t-l、t-2、…、和t-N+1中的頻率xpxt+x^、…、和xt_N+1計算測量時段t中的流行性的評估值St。具體地,依次計算移動平均值mt、移動偏差Vt和評估值st。移動平均值Hit=(Sxi)/N…(I)移動偏差Vt=V評估值St=Vt/Vh...(3)Σ意指與i=t至i=t_N+l對應的N個值的和。例如,當用作離散系統(tǒng)的時間序列數(shù)據(jù)的頻率Xt如圖10所示演變時,移動平均值mt如圖11中的粗線所示演變,而移動偏差Vt基于圖11中的粗線如細線所示以帶的形式演變。同時,評估值st如圖12所示演變。圖13圖示了圖10和12的重疊狀態(tài)。如從圖13所見,當頻率Xt迅速改變時,評估值St增加。因此,如果針對同現(xiàn)關鍵詞計算評估值st,則當確定關鍵詞是否已變?yōu)?正趨向于)世界流行主題時,評估值可以被用作索引。當測量時段t短時,評估值St表示短期流行性趨勢,并且當測量時段t長時,評估值St表示長期流行性趨勢。因此,可以計算測量時段t短時(例如,I天=24小時)的評估值^卜⑴和當測量時段長時(例如,I個月=30天)的評估值st(3C^),并且可以計算評估值的加權平均值作為最終評估值。所計算的最終評估值可以用作索引,用于表示關鍵詞是否已變?yōu)?正趨向于)世界流行主題的短期流行性趨勢和長期流行性趨勢。[評估值的其他使用目的]除了確定同現(xiàn)關鍵詞的流行性之外,還可以以各種方式使用評估值St。例如,如果預定時段中的各種產(chǎn)品中的每個的銷售量被設定為頻率Xt并且計算評估值st,則評估值St可以用作用于確定拳頭產(chǎn)品的索引。如果檢索關鍵詞的檢索次數(shù)被設定為頻率Xt并且計算評估值St,則評估值St可以用作用于確定已變?yōu)槭澜缌餍兄黝}的關鍵詞的索引。上述系列處理可以由硬件或軟件實現(xiàn)。當系列處理由軟件實現(xiàn)時,形成軟件的程序從程序記錄介質(zhì)安裝到嵌入專用硬件的計算機中以及可以安裝各種程序并且可以執(zhí)行各種功能的通用計算機中。圖14是圖示了通過程序執(zhí)行系列處理的計算機的硬件配置示例的框圖。在計算機100中,中央處理單元(CPU)lOl、只讀存儲器(ROM)以及隨機存取存儲器(RAM)103通過總線104互相連接。輸入/輸出接口105連接到總線104。輸入單元106,包括鍵盤、鼠標和麥克風;輸出單元107,包括顯示器和揚聲器;存儲單元108,使用硬盤或者非易失性存儲器配置;通信單元109,使用網(wǎng)絡接口配置;以及驅(qū)動器110,驅(qū)動諸如磁盤、光盤、磁光盤或者半導體存儲器的可移除介質(zhì)111連接到輸入/輸出接口105。在如上所述配置的計算機100中,CPU101通過輸入/輸出接口105和總線104將存儲在存儲單元108中的程序加載到RAM103中,并且執(zhí)行這些程序,并且執(zhí)行系列處理。由計算機執(zhí)行的程序可以根據(jù)本公開中描述的順序按時間序列處理,并且可以并行地處理或者在執(zhí)行調(diào)用時在所需的定時處理。一個計算機可以處理程序并且多個計算機可以對程序執(zhí)行分布式處理。程序可以被傳送到遠程計算機并且可以被執(zhí)行。本公開的實施例不限于以上示例,并且在不偏離本公開的精神和范圍的情況下,可以進行各種改變。本公開包含與2011年5月18日提交日本專利局的日本在先專利申請JP2011-111644中公開的主題內(nèi)容相關的主題內(nèi)容,其整體內(nèi)容通過引用合并于此。權利要求1.一種信息處理裝置,包括獲取單元,獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù);移動偏差計算單元,基于與預定測量時段t之前的預定時段對應的N個采樣值XpXt+xt_2、…、和xt_N+1的移動平均值mt計算移動偏差Vt;以及評估值計算單元,基于與測量時段t對應的移動偏差Vt和與測量時段t-Ι對應的移動偏差Vh,計算表示測量時段t中的所述離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值St。2.根據(jù)權利要求I所述的信息處理裝置,其中所述評估值計算單兀計算所述評估值St=移動偏差Vt/移動偏差vt_lt)3.根據(jù)權利要求2所述的信息處理裝置,其中所述評估值計算單元對每個測量時段的連續(xù)時間序列數(shù)據(jù)求和并且將所述連續(xù)時間序列數(shù)據(jù)轉(zhuǎn)換為所述離散系統(tǒng)的時間序列數(shù)據(jù)。4.根據(jù)權利要求3所述的信息處理裝置,其中所述評估值計算單元將所述測量時段設定為在時間上重疊,并且對每個測量時段的連續(xù)時間序列數(shù)據(jù)求和并且將所述連續(xù)時間序列數(shù)據(jù)轉(zhuǎn)換為所述離散系統(tǒng)的時間序列數(shù)據(jù)。5.一種由信息處理裝置執(zhí)行的信息處理方法,包括獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù);基于與預定測量時段t之前的預定時段對應的N個采樣值Χ、ΧΗ、Χ_2、…、和xt_N+1的移動平均值mt計算移動偏差vt;以及基于與測量時段t對應的移動偏差Vt和與測量時段t-Ι對應的移動偏差vt_i,計算表示測量時段t中的所述離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值st。6.一種使計算機用作如下單元的程序,獲取單元,獲取包括測量時段i中的采樣值Xi的離散系統(tǒng)的時間序列數(shù)據(jù);移動偏差計算單元,基于與預定測量時段t之前的預定時段對應的N個采樣值xt、xt_i、xt_2、…、和Xt-N+1的移動平均值mt計算移動偏差Vt;以及評估值計算單元,基于與測量時段t對應的移動偏差Vt和與測量時段t-Ι對應的移動偏差vt_i,計算表示測量時段t中的所述離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值st。全文摘要本公開涉及信息處理裝置、信息處理方法和程序。根據(jù)本公開的信息處理裝置包括獲取單元,獲取包括測量時段i中的采樣值xi的離散系統(tǒng)的時間序列數(shù)據(jù);移動偏差計算單元,基于與預定測量時段t之前的預定時段對應的N個采樣值xt、xt-1、xt-2、…、和xt-N+1的移動平均值mt計算移動偏差vt;以及評估值計算單元,基于與測量時段t對應的移動偏差vt和與測量時段t-1對應的移動偏差vt-1,計算表示測量時段t中的離散系統(tǒng)的時間序列數(shù)據(jù)的迅速改變的評估值st。文檔編號G06F17/30GK102841913SQ20121014781公開日2012年12月26日申請日期2012年5月11日優(yōu)先權日2011年5月18日發(fā)明者金本勝吉,宮嵜充弘,萩原丈博,右田隆仁,增田弘之,藤田拓也,森田昌裕申請人:索尼公司