日韩欧美视频一区-日韩欧美三区-日韩欧美群交P内射捆绑-日韩欧美精品有码在线播放免费-成人免费一区二区无码视频-成人免费一级毛片在线播放视频

SCI期刊 | 網站地圖 周一至周日 8:00-22:30
你的位置:首頁 >  移動通信論文 ? 正文

重入網識別原理探索

2021-4-9 | 移動通信論文

作者:艾達 羅愛平 單位:西安郵電學院通信與信息工程學院 中國聯通上海分公司

重入網用戶的識別原理是對比新增用戶特征和離網用戶在系統中記錄的特征,如果特征符合判斷條件,則認為該用戶是重入網用戶,如果沒有符合特征的記錄,則認為該用戶為新增用戶[6]。用戶特征包括:用戶資料,如姓名,身份證號;用戶設備,如用戶使用的手機的國際移動設備標識號碼(InternationalMobileEquipmentIdentity,IMEI);用戶呼叫指紋,如用戶交往圈,頻繁發生呼叫的地理位置等。較為簡單的重入網用戶識別方法是通過對比用戶資料或設備特征實現的。用戶資料,例如身份證信息,只能用于識別資料完整的用戶,對資料缺失、偽造以及大多數無需登記資料即可入網的預付費用戶無效。每部手機都有唯一的IMEI號,當用戶撥打電話時,手機的IMEI會自動記錄在用戶的通話話單中,因此可以利用用戶手機判別是否重入網。采用對比IMEI號碼識別重入網用戶,具有方法簡單,速度快的優點。但通過調查發現,重入網用戶手機更換率達32%以上[7],IMEI識別方法準確率較低,約為42%[8]。

用戶的呼叫特征具有相對穩定性和個體差異性兩個特性,可用于識別重入網用戶。相對穩定性是指用戶通話習慣,通話群體等因素在一段時期內相對穩定,發生改變的概率較小。個體差異性是指每個移動用戶都有自己獨特的通話習慣和聯系群體,不同用戶存在一定的差別。這種呼叫特征的相對穩定性和個體差異性就像指紋一樣可以用于個體的識別。用戶在使用移動產品及服務時,產生的各種行為和屬性的綜合表征稱為呼叫指紋。呼叫指紋可分為用戶交往圈、位置特征、消費特征、終端特征等多個維度。用戶交往圈是與用戶有通話行為的所有號碼的集合。位置特征是用戶在工作時間和休息時間活動較為頻繁的小區標識等信息。消費特征是指用戶的消費行為、消費水平等信息。終端特征是指用戶使用過的手機終端信息。通過對用戶原始話單的數據采集和加工,生成不同維度的呼叫指紋[5]。采用呼叫指紋識別技術,通過一系列的比較運算就可找到重入網用戶,其重入網技術框圖如圖1所示。

基于呼叫指紋的識別算法

目前廣泛采用的有效交往圈算法[2],綜合運用了用戶消費層次、交往圈、頻繁活動小區、用戶手機終端等4個維度的呼叫指紋,其識別步驟如下。

步驟1首先判斷離網用戶和新入網用戶消費層次是否一致,將不一致的用戶排除。

步驟2消費層次一致的用戶判斷交往圈匹配程度是否達到一定條件,滿足條件則認為是重入網用戶,不滿足條件則認為不是重入網用戶。

步驟3無法用交往圈匹配方法判斷的用戶,再對比其手機終端是否一致,如果一致則認為是重入網用戶。

步驟4如果手機終端不一致,則判斷頻繁活動的小區匹配程度,如果位置信息匹配程度達到一定條件,則認為是重入網用戶。

步驟5如果位置信息不匹配,則變更用戶消費層次,重新執行步驟1。其中步驟1根據目標用戶的消費層次大小,分別確定每個目標用戶的有效交往圈成員數N,即那些與所述用戶聯系比較頻繁且能保持長期交往的重要交往對象個數。步驟2使用用戶的通話頻率Freq,通話次數Num,通話時長Dura等參數,計算出用戶交往指數Exp=f(Freq,Num,Dura)。

用交往指數排名前N個的號碼作為用戶的有效交往圈。計算離網用戶與新入網用戶有效交往圈交集的成員個數,并計算符合率,即交集成員個數占離網用戶有效交往圈成員數的比例。如果符合率大于門限值,則認為是重入網用戶;如果符合率小于門限值,但大于0,則屬于不確定情況。此時,需要步驟3做進一步判斷。交往圈余弦相似度算法在有效交往圈算法基礎上[2-3],將當月離網用戶和新增用戶(分本網和競爭對手)分別作為待匹配集和目標匹配集,并按照位置信息和交往圈進行k-means聚類,形成待匹配識別的基礎表。然后按照待識別號碼的類別信息計算位置信息的重合度,找出目標集合中與待匹配號碼相近的號碼群,再通過計算待識別號碼交往圈的重合度對號碼群進行篩選,最后通過呼叫指紋找出匹配的號碼,并用對比IMEI方式確認。與文[2]計算有效交往圈符合率的判別方法不同,交往圈余弦相似度算法分別加權計算共有交往圈號碼的語音呼叫次數,語音呼叫時長,短信次數的余弦相似度最大值αj=βj=(t1,t2,…,tm)T(j=1,2,…,n),而n表示交往圈號碼的總個數。另外,當k=1時,ti(i=1,2,…,m)為特定時間段內與某一號碼通話(或短信)的次數;當k=2時,ti(i=1,2,…,m)為特定時間段內與某一號碼的通話時長。當i=1時,m=7,表示通話行為的周特征;當i=2時,m=24表示通話行為的日特征(工作日和休息日)。當l=1時,交往圈取通話信息;當l=2時,交往圈取短信信息(此時k為特定時間內與某一號碼的短信通話次數)。其中ωl為權值,根據用戶的通話行為和短信行為動態選取,通常根據交往圈內的通話次數和短信次數的比例確定。根據式(1)分別計算待檢測號碼與目標號碼集中每個號碼的θ,如果最大的θ≥0.85時,即認為待識別號碼與所對應的目標號碼完全匹配,否則認為待檢測號碼離網或轉網。

改進Hausdorff距離算法[4],用修改后的Hausdorff距離取代余弦相似度作為判別依據,進一步提高呼叫指紋比對的準確性。在改進的Haus-dorff距離中,認為兩個集合匹配程度和他們的共有元素個數相關,并且不使用單個dH(A,B)衡量集合之間的距離,而取其中所有的dH和作為統一的判別。首先定義任意兩個號碼的相似度,其中Ω是所有可以連接元素a和b鏈的集合,kl為當前鏈的節點個數,M為給定的常數,tl為鏈l中所有節點元素通話時間的總和。改進后的Hausdorff距離定義為在計算復雜度方面,盡管該算法較以往的算法更復雜,但由于對待匹配樣本集和目標樣本集進行了聚類細分,且采用并行運算,因此整體的計算量略大于以往算法,在識別精度上有進一步提高。TF-IDF加權余弦相似度算法[5]與上述三種算法所采用的識別方法不同,采用結合TF-IDF加權與Cosine相似算法相結合的呼叫指紋識別方法。TF-IDF是一種統計方法,用以評估一個字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。用于識別呼叫指紋時的實現步驟如下。步驟1使用TF-IDF算法獲取某一個用戶的話單中呼叫號碼的TF-IDF值其中ni是號碼i在用戶D話單中出現的次數,分母是該用戶話單中所有號碼數之和,|D|是用戶總數,|{d:ti∈d}|是出現有號碼i話單的用戶總數。步驟2將該用戶話單用矩陣的形式表示,計算得到TF-IDF=TF•IDF。步驟3使用Cosine相似算法計算兩個用戶之間的相似度。通過對多個相似用戶常撥打的(10~30個)號碼的權重和相似度進行分析,從而達到判斷是否為重入網用戶。

Top
主站蜘蛛池模板: 在线视频中文字幕 | 亚洲视频精品在线观看 | 任你躁精品一区二区三区 | 午夜精品久久久内射近拍高清 | 国产日韩欧美综合久久 | 日本不卡三卡四卡 | 国产日韩精品一区二区在线观看 | 紧缚束缚调教丨vk | 娇妻玩4P被三个男人伺候电影 | 花季v3.0.2黄在线观看 | 99久久久久精品国产免费麻豆 | 起碰免费公开97在线视频 | 97精品国产自产在线观看永久 | 成人免费一级毛片在线播放视频 | 老鸭窝毛片 | 国产亚洲精品网站在线视频 | 夜夜国产亚洲视频香蕉 | 青青久在线 | 99热精品在线视频观看 | 国内精品久久久久久久试看 | 99精品福利视频 | 欲乱艳荡少寡妇全文免费 | 成人在线高清不卡免费视频 | 日韩精品熟女一区二区三区中文 | 久久久久久久久久综合情日本 | 寂寞夜晚在线视频观看 | 99福利在线观看 | 国产一区二区三区内射高清 | 学生小泬无遮挡女HD | 99re8热视频这在线视频 | 国产免国产免费 | 国产毛片女人高潮叫声 | 神马伦理不卡午夜电影 | 天天躁人人躁人人躁狂躁 | 鬼灭之刃花街篇免费樱花动漫 | 日日日夜夜在线视频 | 九九热视频在线观看 | 国产精品成人无码免费视频 | 乳液全集电影在线观看 | 性色爽爱性色爽爱网站 | 国产一级做a爰片久久毛片男 |