本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種數(shù)據(jù)遷移方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及電子設(shè)備。
背景技術(shù):
1、數(shù)據(jù)遷移是指將數(shù)據(jù)從一個(gè)系統(tǒng)、數(shù)據(jù)庫(kù)或其他存儲(chǔ)介質(zhì)轉(zhuǎn)移到另一個(gè)系統(tǒng)、數(shù)據(jù)庫(kù)或存儲(chǔ)介質(zhì)的過(guò)程。在傳統(tǒng)的模式中,客戶(hù)需要先手動(dòng)整理源系統(tǒng)和目標(biāo)系統(tǒng)的數(shù)據(jù),并通過(guò)管理界面建立兩者之間的映射關(guān)系,然后再基于映射關(guān)系實(shí)現(xiàn)源系統(tǒng)和目標(biāo)系統(tǒng)之間的數(shù)據(jù)遷移。由于前述方式依賴(lài)于人工執(zhí)行,因此會(huì)導(dǎo)致確定映射關(guān)系的速度慢,從而影響數(shù)據(jù)遷移,存在數(shù)據(jù)遷移效率低下的問(wèn)題,且難以快速適應(yīng)數(shù)據(jù)量增長(zhǎng)和業(yè)務(wù)變化。
2、針對(duì)上述的問(wèn)題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例提供了一種數(shù)據(jù)遷移方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及電子設(shè)備,以至少解決相關(guān)技術(shù)中將數(shù)據(jù)從源系統(tǒng)遷移至目標(biāo)系統(tǒng)時(shí),依賴(lài)人工確定源系統(tǒng)與目標(biāo)系統(tǒng)之間的數(shù)據(jù)映射關(guān)系,導(dǎo)致數(shù)據(jù)遷移效率低的技術(shù)問(wèn)題。
2、根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種數(shù)據(jù)遷移方法,包括:獲取源系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息,得到至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息,并獲取目標(biāo)系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息,得到至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息;對(duì)于每個(gè)第一基礎(chǔ)數(shù)據(jù)信息,根據(jù)第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的重復(fù)詞語(yǔ)以及重復(fù)詞語(yǔ)對(duì)應(yīng)的目標(biāo)權(quán)重,確定第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息的相似度,其中,目標(biāo)權(quán)重是指詞語(yǔ)所屬的詞語(yǔ)類(lèi)別對(duì)應(yīng)的權(quán)重;根據(jù)相似度確定至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息與至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的映射關(guān)系;根據(jù)映射關(guān)系在源系統(tǒng)和目標(biāo)系統(tǒng)之間進(jìn)行數(shù)據(jù)遷移。
3、進(jìn)一步地,數(shù)據(jù)遷移方法還包括:對(duì)第一基礎(chǔ)數(shù)據(jù)信息進(jìn)行分詞,得到第一分詞集合;對(duì)于每個(gè)第二基礎(chǔ)數(shù)據(jù)信息,對(duì)第二基礎(chǔ)數(shù)據(jù)信息進(jìn)行分詞,得到第二分詞集合;計(jì)算第一分詞集合與第二分詞集合的交集,得到重復(fù)詞語(yǔ)集合;計(jì)算重復(fù)詞語(yǔ)集合中各個(gè)重復(fù)詞語(yǔ)的長(zhǎng)度與重復(fù)詞語(yǔ)對(duì)應(yīng)的目標(biāo)權(quán)重之間的乘積,得到各個(gè)重復(fù)詞語(yǔ)對(duì)應(yīng)的第一乘積;根據(jù)第一乘積之和確定第一基礎(chǔ)數(shù)據(jù)信息與第二基礎(chǔ)數(shù)據(jù)信息之間的相似度。
4、進(jìn)一步地,數(shù)據(jù)遷移方法還包括:計(jì)算第一分詞集合中各個(gè)分詞的長(zhǎng)度與分詞對(duì)應(yīng)的目標(biāo)權(quán)重之間的乘積,得到第一分詞集合中各個(gè)分詞對(duì)應(yīng)的第二乘積;計(jì)算第二分詞集合中各個(gè)分詞的長(zhǎng)度與分詞對(duì)應(yīng)的目標(biāo)權(quán)重之間的乘積,得到第二分詞集合中各個(gè)分詞對(duì)應(yīng)的第三乘積;根據(jù)第一乘積之和與第二乘積之和之間的數(shù)值關(guān)系、第一乘積之和與第三乘積之和之間的數(shù)值關(guān)系,確定第一基礎(chǔ)數(shù)據(jù)信息與第二基礎(chǔ)數(shù)據(jù)信息之間的相似度。
5、進(jìn)一步地,數(shù)據(jù)遷移方法還包括:計(jì)算第一乘積之和與第二乘積之和之間的比值,得到第一比值;計(jì)算第二乘積之和與第三乘積之和之間的比值,得到第二比值;根據(jù)第一比值與第二比值的和,確定第一基礎(chǔ)數(shù)據(jù)信息與第二基礎(chǔ)數(shù)據(jù)信息之間的相似度。
6、進(jìn)一步地,數(shù)據(jù)遷移方法還包括:對(duì)于每個(gè)第一基礎(chǔ)數(shù)據(jù)信息,判斷至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息中是否存在目標(biāo)基礎(chǔ)數(shù)據(jù)信息,其中,目標(biāo)基礎(chǔ)數(shù)據(jù)信息是指與第一基礎(chǔ)數(shù)據(jù)信息之間的相似度大于預(yù)設(shè)相似度的第二基礎(chǔ)數(shù)據(jù)信息;在存在目標(biāo)基礎(chǔ)數(shù)據(jù)信息的情況下,確定第一基礎(chǔ)數(shù)據(jù)信息與目標(biāo)基礎(chǔ)數(shù)據(jù)信息之間存在映射關(guān)系,以得到至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息與至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的映射關(guān)系。
7、進(jìn)一步地,數(shù)據(jù)遷移方法還包括:向目標(biāo)對(duì)象展示映射關(guān)系;在接收到目標(biāo)對(duì)象的關(guān)系更新指令的情況下,根據(jù)關(guān)系更新指令更新映射關(guān)系,得到目標(biāo)映射關(guān)系;根據(jù)目標(biāo)映射關(guān)系在源系統(tǒng)和目標(biāo)系統(tǒng)之間進(jìn)行數(shù)據(jù)遷移。
8、進(jìn)一步地,數(shù)據(jù)遷移方法還包括:獲取源系統(tǒng)中待遷移的目標(biāo)數(shù)據(jù),其中,目標(biāo)數(shù)據(jù)包括至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息以及業(yè)務(wù)數(shù)據(jù)信息;從目標(biāo)數(shù)據(jù)中確定至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息;將目標(biāo)數(shù)據(jù)中各個(gè)第一基礎(chǔ)數(shù)據(jù)信息的信息內(nèi)容轉(zhuǎn)換為第一基礎(chǔ)數(shù)據(jù)信息對(duì)應(yīng)的第二基礎(chǔ)數(shù)據(jù)信息的信息內(nèi)容,得到更新后的目標(biāo)數(shù)據(jù);將更新后的目標(biāo)數(shù)據(jù)保存至目標(biāo)系統(tǒng)。
9、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種數(shù)據(jù)遷移裝置,包括:獲取模塊,用于獲取源系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息,得到至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息,并獲取目標(biāo)系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息,得到至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息;第一確定模塊,用于對(duì)于每個(gè)第一基礎(chǔ)數(shù)據(jù)信息,根據(jù)第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的重復(fù)詞語(yǔ)以及重復(fù)詞語(yǔ)對(duì)應(yīng)的目標(biāo)權(quán)重,確定第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息的相似度,其中,目標(biāo)權(quán)重是指詞語(yǔ)所屬的詞語(yǔ)類(lèi)別對(duì)應(yīng)的權(quán)重;第二確定模塊,用于根據(jù)相似度確定至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息與至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的映射關(guān)系;處理模塊,用于根據(jù)映射關(guān)系在源系統(tǒng)和目標(biāo)系統(tǒng)之間進(jìn)行數(shù)據(jù)遷移。
10、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其中,計(jì)算機(jī)程序被設(shè)置為運(yùn)行時(shí)執(zhí)行上述的數(shù)據(jù)遷移方法。
11、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種電子設(shè)備,電子設(shè)備包括一個(gè)或多個(gè)處理器;存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序,當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行時(shí),使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)用于運(yùn)行程序,其中,程序被設(shè)置為運(yùn)行時(shí)執(zhí)行上述的數(shù)據(jù)遷移方法。
12、在本發(fā)明實(shí)施例中,采用根據(jù)源系統(tǒng)和目標(biāo)系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息之間的相似度自動(dòng)確定數(shù)據(jù)映射關(guān)系,并基于映射關(guān)系進(jìn)行數(shù)據(jù)遷移的方式,通過(guò)獲取源系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息,得到至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息,并獲取目標(biāo)系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息,得到至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息,然后對(duì)于每個(gè)第一基礎(chǔ)數(shù)據(jù)信息,根據(jù)第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的重復(fù)詞語(yǔ)以及重復(fù)詞語(yǔ)對(duì)應(yīng)的目標(biāo)權(quán)重,確定第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息的相似度,接著根據(jù)相似度確定至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息與至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的映射關(guān)系,從而根據(jù)映射關(guān)系在源系統(tǒng)和目標(biāo)系統(tǒng)之間進(jìn)行數(shù)據(jù)遷移。
13、在上述過(guò)程中,通過(guò)根據(jù)第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的重復(fù)詞語(yǔ)以及重復(fù)詞語(yǔ)對(duì)應(yīng)的目標(biāo)權(quán)重,確定第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息的相似度,實(shí)現(xiàn)了對(duì)源系統(tǒng)和目標(biāo)系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息之間的相似度的自動(dòng)確定。通過(guò)根據(jù)相似度確定第一基礎(chǔ)數(shù)據(jù)信息與第二基礎(chǔ)數(shù)據(jù)信息之間的映射關(guān)系,實(shí)現(xiàn)了根據(jù)相似度自動(dòng)確定源系統(tǒng)和目標(biāo)系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息之間的映射關(guān)系,從而提高了確定映射關(guān)系的速度,進(jìn)而提高了數(shù)據(jù)遷移效率。此外,通過(guò)根據(jù)第一基礎(chǔ)數(shù)據(jù)信息與第二基礎(chǔ)數(shù)據(jù)信息之間的重復(fù)詞語(yǔ)以及目標(biāo)權(quán)重確定相似度,實(shí)現(xiàn)了對(duì)根據(jù)基礎(chǔ)數(shù)據(jù)信息之間的重合內(nèi)容和重要度確定基礎(chǔ)數(shù)據(jù)信息之間的相似度,從而提高了確定的相似度的準(zhǔn)確性。
14、由此可見(jiàn),本申請(qǐng)所提供的方案達(dá)到了根據(jù)源系統(tǒng)和目標(biāo)系統(tǒng)中的基礎(chǔ)數(shù)據(jù)信息之間的相似度自動(dòng)確定數(shù)據(jù)映射關(guān)系,并基于映射關(guān)系進(jìn)行數(shù)據(jù)遷移的目的,從而實(shí)現(xiàn)了提高數(shù)據(jù)遷移效率的技術(shù)效果,進(jìn)而解決了相關(guān)技術(shù)中將數(shù)據(jù)從源系統(tǒng)遷移至目標(biāo)系統(tǒng)時(shí),依賴(lài)人工確定源系統(tǒng)與目標(biāo)系統(tǒng)之間的數(shù)據(jù)映射關(guān)系,導(dǎo)致數(shù)據(jù)遷移效率低的技術(shù)問(wèn)題。
1.一種數(shù)據(jù)遷移方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的重復(fù)詞語(yǔ)以及所述重復(fù)詞語(yǔ)對(duì)應(yīng)的目標(biāo)權(quán)重,確定所述第一基礎(chǔ)數(shù)據(jù)信息與各個(gè)第二基礎(chǔ)數(shù)據(jù)信息的相似度,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)第一乘積之和確定所述第一基礎(chǔ)數(shù)據(jù)信息與所述第二基礎(chǔ)數(shù)據(jù)信息之間的相似度,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述第一乘積之和與第二乘積之和之間的數(shù)值關(guān)系、所述第一乘積之和與第三乘積之和之間的數(shù)值關(guān)系,確定所述第一基礎(chǔ)數(shù)據(jù)信息與所述第二基礎(chǔ)數(shù)據(jù)信息之間的相似度,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述相似度確定所述至少一個(gè)第一基礎(chǔ)數(shù)據(jù)信息與所述至少一個(gè)第二基礎(chǔ)數(shù)據(jù)信息之間的映射關(guān)系,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述映射關(guān)系在所述源系統(tǒng)和所述目標(biāo)系統(tǒng)之間進(jìn)行數(shù)據(jù)遷移,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,
8.一種數(shù)據(jù)遷移裝置,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被設(shè)置為運(yùn)行時(shí)執(zhí)行所述權(quán)利要求1至7任一項(xiàng)中所述的數(shù)據(jù)遷移方法。
10.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括一個(gè)或多個(gè)處理器;存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序,當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行時(shí),使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)用于運(yùn)行程序,其中,所述程序被設(shè)置為運(yùn)行時(shí)執(zhí)行所述權(quán)利要求1至7任一項(xiàng)中所述的數(shù)據(jù)遷移方法。