2021-4-9 | 行業(yè)經(jīng)濟
一、煙草行業(yè)專利數(shù)據(jù)庫建設的意義及作用
專利信息匯聚著全人類智慧成果,據(jù)WIPO(WorldIntellectualPropertyOrganization世界知識產(chǎn)權組織)統(tǒng)計表明[1],世界上每年發(fā)明創(chuàng)造成果的90%-95%能在專利文獻中檢索到,而且有70%的技術內(nèi)容未在其它非專利文獻中發(fā)表過,若能運用好專利文獻,能節(jié)約40%的科研開發(fā)費用,同時少花60%的研究開發(fā)時間。專利信息不僅包含技術信息,還包含法律信息和經(jīng)濟情報[2]。每個企業(yè)的核心技術和開發(fā)項目基本都會反映在專利上,因此通過分析競爭對手的最新專利,可以洞悉競爭對手的技術研發(fā)動態(tài)、市場開發(fā)以及專利戰(zhàn)略,甚至了解整個企業(yè)的運營戰(zhàn)略。隨著信息技術的發(fā)展,專利信息應用也從最初的手工時代步入互聯(lián)網(wǎng)時代。目前網(wǎng)絡上不乏優(yōu)秀的專利數(shù)據(jù)庫,如歐洲專利局的EP專利數(shù)據(jù)庫(http://ep.espacenet.com/),該數(shù)據(jù)庫包含世界上七十多個國家和地區(qū)以及歐洲專利局、世界知識產(chǎn)權組織公開的專利[3]。但此類專利數(shù)據(jù)庫面向各個技術領域的用戶,包括所有行業(yè)的專利,所以專利檢索結果不可避免地出現(xiàn)大量不相關專利。另外,這些專利數(shù)據(jù)庫覆蓋范圍雖廣但未包括所有國家的專利數(shù)據(jù),用戶若需檢索不同國家的專利,往往需要到多個數(shù)據(jù)庫分別檢索。煙草行業(yè)專利數(shù)據(jù)庫包含的絕大部分專利是煙草相關技術的專利。該專利數(shù)據(jù)庫綜合了世界主要國家和地區(qū)的專利,解決了客戶針對不同國家的專利需到不同專利數(shù)據(jù)庫檢索的問題,降低了專利檢索的專業(yè)要求,使得專利檢索更加便捷。該數(shù)據(jù)庫可根據(jù)使用者的需求定制,既使用者關注的技術主題和重點企業(yè)的專利。用戶在這個數(shù)據(jù)庫中檢索,可排除雜質(zhì)專利的干擾,提高檢索效率。此外,煙草行業(yè)專利數(shù)據(jù)庫還設置了其它功能,如針對國外專利可翻譯專利標題,專利摘要,專利權利要求書;在檢索過程中,不但可以查看專利細節(jié),還可分析專利結果的整體情況,利用分析結果對檢索式做進一步調(diào)整,得到更準確的檢索結果。
二、煙草行業(yè)專利數(shù)據(jù)庫的建設思路與流程
(一)建設思路
專利數(shù)據(jù)庫的建設目的是幫助用戶提高工作效率,解決實際問題,因此衡量專利數(shù)據(jù)庫的最優(yōu)標準是使用率。建立煙草專利數(shù)據(jù)庫必須以用戶的需求為出發(fā)點,了解用戶的特征和具體需求。煙草行業(yè)專利數(shù)據(jù)庫的建設思路是根據(jù)煙草行業(yè)的特點,以用戶的需求為基本出發(fā)點,以現(xiàn)有的專利數(shù)據(jù)庫為數(shù)據(jù)源。
煙草專利數(shù)據(jù)庫的建設包含以下三個階段(見圖1):⒈確立煙草相關技術主題,以及各技術主題所包含的技術范圍;⒉確定檢索式,建立相應的技術平臺完成煙草專利數(shù)據(jù)的提取;⒊以已經(jīng)確定好的技術主題為單元,根據(jù)第二階段提取的數(shù)據(jù)建立專利數(shù)據(jù)庫,添加檢索的功能模塊。煙草行業(yè)專利數(shù)據(jù)庫由分布在不同部門各類技術人員使用。因此,在專利數(shù)據(jù)庫的建設中,要選擇便于部署、管理和維護的構架方式。煙草行業(yè)專利數(shù)據(jù)庫采用基于互聯(lián)網(wǎng)的構架(B/S構架,Browser/Server構架),用戶不需要部署客戶端軟件,通過網(wǎng)頁瀏覽器(如InternetExplorer、Firefox、Chrome等)即可訪問專利數(shù)據(jù)庫。專利數(shù)據(jù)庫進行軟件版本升級,專利數(shù)據(jù)進行更新,直接在服務器端完成,實現(xiàn)平滑升級更新和集中管理。
(二)建設流程
⒈確立技術主題
通過文獻調(diào)研、調(diào)查問卷結合專家咨詢等方式,擬訂了煙草專題數(shù)據(jù)庫包含的技術主題,這些技術主題不僅涵蓋了行業(yè)的整個生產(chǎn)鏈,還聚焦了當今煙草行業(yè)的熱點技術(見圖2)。
⒉提取專利數(shù)據(jù)
數(shù)據(jù)提取是一個從各行各業(yè)的專利數(shù)據(jù)庫中篩選煙草行業(yè)的專利的過程,稱為ETL(Extraction-Transformation-Loading),即數(shù)據(jù)的抽取、轉換和加載。這一過程對于分布在異構數(shù)據(jù)源中的專利數(shù)據(jù)進行抽取,并經(jīng)過整理和轉換,最終加載到數(shù)據(jù)倉庫中,作為下一步建立不同專題專利數(shù)據(jù)庫的基礎。專利信息是分散的,各國的知識產(chǎn)權數(shù)據(jù)為各國所有并在所有國的知識產(chǎn)權管理部門公開,查詢不同國家的專利,需要登陸相應國家的網(wǎng)站,進入不同的檢索頁面,采用不同的檢索策略,而檢索獲得的,也是按國家不同的檢索結果。因此,獲取不同來源的專利數(shù)據(jù),并進行轉換和加工,是建立煙草專利數(shù)據(jù)庫的基礎。
針對世界主要知識產(chǎn)權數(shù)據(jù)庫,煙草行業(yè)專利數(shù)據(jù)庫開發(fā)了一套分布式的自動化搜索和下載工具,并且針對不同的數(shù)據(jù)編寫了不同的轉換器,能夠定時從世界主要國家的專利數(shù)據(jù)庫中提取我們所需的煙草相關的專利數(shù)據(jù),并對這些數(shù)據(jù)進行整合,保存在數(shù)據(jù)庫服務器中,從而實現(xiàn)了專利的自動更新運轉(見圖3)。在數(shù)據(jù)倉庫中,為每一個專利設置了統(tǒng)一的數(shù)據(jù)字段。由于專利信息包含了技術、法律、經(jīng)濟等諸多信息,在專利數(shù)據(jù)字段定義時充分考慮了這一特點。對專利信息進行統(tǒng)一規(guī)范的定義,可以保證其檢索的準確性,從而保證后續(xù)專利分析結果的準確性。字段名稱的定義以專利信息行業(yè)通用稱謂的縮寫定義。
專利的標題、摘要和權利要求書體現(xiàn)的是技術信息,是重要的專利檢索要素之一,專利文獻當中的技術專業(yè)詞基本分布在標題,摘要和權利要求書中。在專利文獻中,代表同一意思的技術關鍵詞往往有多個,這里稱之為技術同義詞。在檢索過程中,漏掉一個技術同義詞的后果可能是漏檢一大批關鍵性專利,因此技術同義詞是一項重要的工作。技術同義詞形成的原因很多,如發(fā)明人技術用詞習慣、專利代理人的撰寫習慣、不同的外文翻譯等[4]。收集技術同義詞必須綜合多方面的信息。國際專利分類也體現(xiàn)了技術信息,是各國對專利進行分類的通用標準。在煙草專利數(shù)據(jù)庫的建設中,為了保證數(shù)據(jù)庫的準確性,必須涵蓋IPC分類。
專利法律狀態(tài)體現(xiàn)的是專利的法律信息,代表專利權的權屬情況,是技術借鑒和侵權規(guī)避的重要指標,因此必須提取。專利的申請人信息是專利經(jīng)濟信息的一個重要體現(xiàn)。專利申請人也是專利數(shù)據(jù)庫建設的要素之一,是企業(yè)結合市場競爭情報綜合得到的。實力雄厚的行業(yè)巨頭往往是一個行業(yè)各項技術的開創(chuàng)者,而且它們非常注重知識產(chǎn)權的保護,因此它們的專利代表各項技術的發(fā)展方向。從這些企業(yè)當前申請的專利信息中,可以挖掘出主要的技術路線,當前技術動向,關注的市場區(qū)域等情報。需要注意的是,企業(yè)在專利申請的時候所采用的名稱可能多種多樣,同時,由于行業(yè)內(nèi)經(jīng)常發(fā)生公司的收購兼并重組等情況,使得專利所有人的情況多變,故而需要充分了解主要申請人的情況,以獲取全面的專利情況。