廣告精準投放方法和系統的制作方法
【技術領域】
[0001 ]本發(fā)明涉及廣告投放領域,尤其涉及一種廣告精準投放方法和系統。
【背景技術】
[0002] 社交網絡經過近幾年的發(fā)展,已經逐漸成為人們相互溝通、傳播信息的重要途徑 之一;由于社交網絡具有傳播速度快、覆蓋范圍廣等特點,因此越來越多的廣告商選擇通過 社交網絡推送廣告?,F有技術中,廣告推送一般使用廣播的方式,即向所有社交網絡的用戶 無差別的推送廣告。
[0003] 然而,由于每個廣告的受眾群體不同,因此無差別的廣告推送可能引起用戶的反 感甚至導致用戶屏蔽廣告,進而導致廣告的傳播效果較差。
[0004] 因此,對于新型的廣告精準投放方法和系統,仍存在著繼續(xù)研究的必要和需求,這 也正是本發(fā)明得以完成的動力所在和基礎所倚。
【發(fā)明內容】
[0005] 為了解決上述缺陷以及提供新型的廣告精準投放方法和系統,本發(fā)明人進行了大 量的深入研究,在付出了創(chuàng)造性勞動后,從而完成了本發(fā)明。
[0006] 具體而言,本發(fā)明提供一種廣告精準投放方法和系統,所述方法和系統能夠有針 對性地推送廣告,進而提升廣告的傳播效果。
[0007] 更具體而言,第一個方面,本發(fā)明提供一種廣告精準投放方法,所述方法包括:
[0008] S10、根據待投放廣告要求的投放類別獲取對應的歸一化需求強度值;
[0009] S20、分別獲取預設所有投放賬號的影響領域;
[0010] S30、分別獲取每個投放賬號在各自影響領域下的影響力;
[0011] S40、根據所述待投放廣告要求的投放類別對應的歸一化需求強度值和每個投放 賬號在各自影響領域下的影響力,獲取所述待投放廣告與每個投放賬號的匹配度;
[0012] S50、由匹配度高到低依次從所有投放賬號中選取預設第一個數個賬號作為目標 投放賬號,并向所述目標投放賬號發(fā)送所述待投放廣告。
[0013] 在本發(fā)明的所述廣告精準投放方法中,所述S10,包括:
[0014] S101、判斷所述待投放廣告要求的投放類別的個數N是否為1;如果是,執(zhí)行S102; 否則,執(zhí)行S103;所述N2 1;
[0015] S102、獲取值為1的歸一化需求強度值;
[0016] S103、獲取每個投放類別對應的優(yōu)先級,根據所述優(yōu)先級分別獲取每個投放類別 對應的歸一化需求強度值。
[0017] 在本發(fā)明的所述廣告精準投放方法中,所述S103,包括:
[0018] S1031、根據所述優(yōu)先級將所述待投放廣告的所有投放類別進行排序,得到每個投 放類別的排列順序;
[0019] S1032、對于任一投放類別x,獲取該投放類別x的排列順序rankx的倒數一V ;所 rank、. 3?,Ν > X > 1 ;
V......' J
[0020]
[0021]
[0022]
[0023] S1036、將所述k],得到所述投放類別x的歸一 化需求強度值。
[0024] 在本發(fā)明的所述廣告精準投放方法中,所述S20包括:
[0025] S201、對于任一投放賬號,獲取該投放賬號所發(fā)表的所有文章;
[0026] S202、分別獲取該投放賬號所發(fā)表的每篇文章的內容分類;
[0027 ] S203、分別獲取該投放賬號所發(fā)表的每篇文章的權重;
[0028] S204、根據該投放賬號所發(fā)表的所有文章的內容分類和權重獲取該投放賬號的影 響領域。
[0029] 在本發(fā)明的所述廣告精準投放方法中,所述S202,包括:
[0030] S2021、對于該投放賬號所發(fā)表的任意一篇文章,對該篇文章進行分詞,得到該篇 文章的至少一個詞語;
[0031] S2022、對于該篇文章的至少一個詞語中任一詞語,根據該詞語在該篇文章中出現 的次數獲取該詞語的出現頻率,并根據所有文章中包含該詞語的文章個數獲取該詞語的逆 文檔頻率;
[0032] S2023、根據每個詞語的出現頻率和逆文檔頻率,以及預先訓練的所有類別的類別 分類器,分別獲取該篇文章屬于每個類別的權重;
[0033] S2024、根據該篇文章屬于每個類別的權重,獲取權重最大的類別作為該篇文章的 內容分類。
[0034]在本發(fā)明的所述廣告精準投放方法中,在所述S2023之前,所述S202還包括:
[0035] S2025、訓練任一類別的類別分類器時,獲取P篇文章樣本和每篇文章樣本的類別 值,屬于該類別的文章樣本占所述P篇文章樣本的一半;所述ρ>1;
[0036] S2026、從所述P篇文章樣本中隨機選取第二個數篇文章,并分別獲取第二個數篇 文章中每篇文章的至少一個詞語、每個詞語的出現頻率和每個詞語的逆文檔頻率;
[0037] S2027、將所述第二個數篇文章中每篇文章的至少一個詞語、每個詞語的出現頻率 和每個詞語的逆文檔頻率,以及每篇文章樣本的類別值,輸入至預設第一核函數和第一模 型參數的第一 SVM分類器進行訓練,得到該類別的類別分類器;
[0038] S2028、將所述P篇文章樣本中除所述第二個數篇文章之外的測試文章分別輸入到 該類別的類別分類器,得到測試文章的分類結果;
[0039] S2029、根據測試文章的分類結果和類別值,判斷分類差異是否大于預設第一分類 閾值;如果小于,訓練結束;否則,修改所述第一核函數和/或第一模型參數,重新執(zhí)行所述 S2027至S2029。
[0040] 在本發(fā)明的所述廣告精準投放方法中,所述S203包括:
[0041] S2031、對于該投放賬號所發(fā)表的任意一篇文章,獲取該篇文章的轉發(fā)數和所有文 章的最高轉發(fā)數;
[0042] S2032、將該篇文章的轉發(fā)數除以最高轉發(fā)數,得到轉發(fā)數加權;
[0043] S2033、獲取該篇文章的評論數和所有文章的最高評論數;
[0044] S2034、將該篇文章的評論數除以最高評論數,得到評論數加權;
[0045] S2035、根據該篇文章的發(fā)表時間獲取該篇文章的時間加權;
[0046] S2036、獲取轉發(fā)數加權、評論數加權和時間加權之積,得到該篇文章的權重。
[0047] 在本發(fā)明的所述廣告精準投放方法中,所述S204,包括:
[0048] S2041、將該投放賬號所發(fā)表的所有文章中相同內容分類的文章的權重求和,得到 每個內容分類的匯總權值;
[0049] S2042、將該投放賬號所發(fā)表的所有文章的權重求和,得到所有類別的匯總權值;
[0050] S2043、分別將每個內容分類的匯總權值除以所有類別的匯總權值,得到每個內容 分類的歸一化權重值;
[0051 ] S2044、從每個內容分類的歸一化權重值中,獲取預設第三個數個較大的歸一化權 重值;
[0052] S2045、根據所述第三個數個較大的歸一化權重值對應的內容分類確定該投放賬 號的影響領域。
[0053] 在本發(fā)明的所述廣告精準投放方法中,所述S30包括:
[0054] S301、對于任一投放賬號的任一影響領域,獲取屬于該影響領域的分類文章組;
[0055] S302、根據所述分類文章組中每篇文章的轉發(fā)數,獲取轉發(fā)中位數;
[0056] S303、獲取該投放賬號的賬號真粉率;
[0057] S304、根據所述賬號真粉率、該投放賬號的粉絲數和關注數、所有投放賬號的個數 和預設阻尼系數,獲取該投放賬號的PR值;
[0058] S305、根據該投放賬號的PR值、粉絲數、轉發(fā)中位數和提及數,獲取該投放賬號在 該影響領域下的影響力。
[0059]在本發(fā)明的所述廣告精準投放方法中,所述S303包括:
[0060] S3031、對于該投放賬號的所有粉絲中任一粉絲,獲取該粉絲的粉絲特征信息,所 述粉絲特征信息包括粉絲昵稱中包含的英文字母的個數、粉絲昵稱中包含的數字的個數、 個人描述的字數、是否有頭像、收藏數、關注數、粉絲數、微博數、關注與粉絲之比中的一種 或多種;
[0061] S3032、將該粉絲的粉絲特征信息與預設基礎規(guī)則進行匹配,判斷該粉絲是否屬于 僵尸粉;當該粉絲不屬于僵尸粉時,執(zhí)行S3033;否則,執(zhí)行S3034;
[0062] S3033、將該粉絲的粉絲特征信息輸入到預先訓練的僵尸粉分類器,獲取該粉絲的 真粉率;
[0063] S3034、獲取值為0的該粉絲的真粉率;
[0064] S3035、獲取該投放賬號所有粉絲的真粉率之和,得到總真粉率;
[0065] S3036、將所述總真粉率除以該投放賬號的粉絲個數,得到該投放賬號的賬號真粉 率。
[0066]在本發(fā)明的所述廣告精準投放方法中,在所述S3033之前,所述S303還包括:
[0067] S3037、獲取Q個粉絲樣本、每個粉絲樣本的粉絲特征信息和真粉值;
[0068] S3038、從所述Q個粉絲樣本中隨機選取第四個數個粉絲樣本,將第四個數個粉絲 樣本中每個粉絲樣本的粉絲特征信息和真粉值輸入預設第二核函數和第二模型參數的第 二SVM分類器進行訓練,得到僵尸粉分類器;
[0069] S3039、將所述Q個粉絲樣本中除上述第四個數個粉絲樣本之外的粉絲樣本分別輸 入到所述僵尸粉分類器,得到僵尸粉分類結果;
[0070] S3030、根據所述僵尸粉分類結果和真粉值,判斷分類差異是否大于預設第二分類 閾值;如果小于,訓練結束;否則,修改所述第二核函數和/或第二模型參數,重新執(zhí)行所述 S3038至S3030。
[0071 ]在本發(fā)明的所述廣告精準投放方法中,所述S304包括:
[0072] S3041、獲取該投放賬號t的初始PR值/欠1",所述= *TF7?,), 所述f〇ll〇Wers_C〇untt為該投放賬號t的粉絲數,TFR t為該投放賬號t的賬號真粉率;預設所 有投放賬號的個數為y,所述y 2 1,y 2 12 1;
[0073] S3042、根據所述和y獲取該投放賬號t第i輪迭代的PR值,所述 所述d為預設阻尼系數,所述d>0;所述
·** -- J ^ 1為投放賬號j第i -1輪迭代的PR值;所述f r i ends_coun t j為投放賬號j的關注數;所述u 2i2 1,所述u為預設迭代閾值;
[0074] S3043、根據該投放賬號t第i輪迭代的PR值,獲取整