2021-4-10 | 證券交易論文
1概述
隨著互聯網的普及以及網上證券交易系統功能的不斷豐富、完善和使用的便利性,網上交易正成為證券投資者交易的主流模式,據統計,證券經營機構網上交易業務的交易量已經占到總交易量的80%以上,網上證券交易系統已經成為證券公司交易系統的重要組成部分。另一方面,隨著互聯網應用的普及,針對網上證券交易的安全事件日益增多。
“盜買盜賣”惡意行為、“證券大盜”等病毒木馬給投資者和證券公司帶來經濟損失的同時,也影響到網上證券交易市場的長遠發展,如何提升網上證券交易系統的安全性,已成為證券行業關注的熱點。
2網上證券交易面臨的問題和分析
2.1網上證券交易面臨的安全問題
在當前信息技術日新月異、電子商務高速發展、資本市場規模不斷擴大、業務創新層出不窮的前提下,證券業的信息系統變得越來越龐大和復雜。在行業信息化建設過程中,信息安全的各個環節都暴露了一些亟待解決的問題。
互聯網應用的快速發展,促使攻擊事件變得越來越普及,網絡犯罪活動已經從最初的個人惡意攻擊行為,轉變成目標明確,有組織、有分工的職業化行為。危及網上證券交易安全的病毒、木馬、釣魚、竊取、篡改等攻擊手段層出不窮,大部分網上證券交易的用戶安全防范意識不高,對于可能盜取用戶口令的攻擊手段沒有任何防范能力。這些問題極大地影響了證券交易體系的安全性。同時,以盈利為目的的黑色產業鏈,正促使這種局面愈加惡劣。
如近期集中爆發的網絡釣魚事件,更是給廣大的網上用戶,直接帶來了巨大的經濟損失。因此,維護網絡安全成為了證券業信息化建設的重要工作。
網上證券交易系統的安全可以分為賬戶安全和系統安全。保護賬戶安全是指保護個人賬戶的賬戶/密碼、資金、交易行為等信息的機密性,不被他人竊取或監聽;保護系統安全是指保護網上證券交易系統,使之不受合法賬戶的非法交易行為的影響。
分析證券交易中的異常行為,有針對性地提出安全信息系統的解決方案,是保障網上證券交易系統安全、可靠運行的有效途徑。
2.2網上證券交易異常行為定義和分析
證券交易中的異常行為主要表現在用戶在買賣股票、債券或資金劃轉過程中出現的異常舉動。根據《上海證券交易所證券異常交易實時監控指引》對證券交易異常行為的歸類和定義,基本包括以下幾種異常交易類別:高買低賣利益傳送、資金頻繁存取、長期閑置賬戶頻繁異動、大量委托或查詢請求、虛假申報、短線操縱、連續集中交易等。
1)高買低賣利益傳送
證券交易盜買盜賣行為,通常是通過頻繁交易國債或企業債品種,利用債券T+0交易、無漲跌停、且交投不活躍的特點,通過高買低賣方式,實現利益輸送。此類異常行為一般在市場整體交投不活躍、投資者不經常查看賬戶狀態的情況下進行,降低了被投資者及時發現的可能。
2)長期閑置賬戶頻繁異動
長期閑置的賬戶突然發生異常波動,包括頻繁登錄、頻繁交易,或無交易頻繁轉賬等,都可以視為疑似異常行為。如,正常交易日無交易賬戶資金劃轉每天發生3次以上,或者無交易賬戶資金劃轉每天發生1次,且持續發生3天以上,出現接近于大額現金交易標準的現金收付的交易行為。
3)大量委托或查詢請求
攻擊者通過利用多個賬戶發送大量無效的委托或查詢請求(如失敗委托或不可能成交委托),攻擊證券公司的交易系統。交易系統需要對委托、查詢訂單進行處理,勢必會占用券商交易系統和交易所撮合系統的資源,也會影響到其他用戶的正常交易行為。
除上面介紹的異常行為外,虛假申報、短線操縱、連續集中交易等也嚴重影響了網上證券交易的政策秩序,需要及時發現并予以控制。
但是,網上證券交易的異常行為是在不斷變化的,很難僅憑借現有的行為特征予以識別和防范,還需要不斷了解新的異常行為,并作出反應。本文提出了一種基于數據挖掘的異常行為分析方式,它通過收集交易行為數據,利用挖掘算法,對數據進行清理、降維、歸納、模式識別、結果分析與評價,不斷豐富異常行為數據庫,從而實現對網上證券異常交易行為的及時預警。
3基于數據挖掘的證券交易異常行為分析
3.1數據挖掘的概念及方法
數據挖掘常特指數據庫數據挖掘(KnowledgeDiscoveryinDatabase),按照Fayyad的定義,“KDD是從數據集中識別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程”[1]。
數據挖掘的過程大體分為三個階段:數據準備、數據挖掘以及結果的解釋評估,可以參見圖1中給出的多處理階段過程模型。
1)數據準備
數據準備包括數據選取(Selection)、數據預處理(Preprocessing)和數據變換(Transformation)等工作。數據選取用來確定發現任務的操作對象,即目標數據(TargetData),根據用戶的需要從原始數據中抽取一部分數據。數據預處理把目標數據處理成便于挖掘的形式,一般包括去噪聲、缺值數據處理、消除重復記錄以及數據類型的轉換等操作。
2)數據挖掘
數據挖掘首先確定挖掘的任務,如分類、聚類、關聯規則發現,或序列模式發現等。然后選擇采用哪種挖掘算法,算法的選擇主要基于兩點考慮:一是針對數據本身的特點,采取相應的算法挖掘;二是針對用戶的需求(是獲取顯式的規則還是抽象的模型等)采取相應的算法挖掘。數據挖掘階段是數據挖掘過程的核心,目前的大多數研究也都是針對挖掘算法展開的。