中小銀行通常是指全國性商業(yè)銀行、區(qū)域性股份制商業(yè)銀行與城市商業(yè)銀行,比如城市銀行、農(nóng)商行等。近年來,隨著城市建設(shè)速度加快和信息技術(shù)產(chǎn)品更新迭代,中小銀行需要面對機(jī)房搬遷、系統(tǒng)架構(gòu)升級、系統(tǒng)遷移等棘手問題。
其中,系統(tǒng)遷移是中小銀行信息部門較為頭疼的工作,遷移失敗,輕則影響業(yè)務(wù)持續(xù)開展,重則造成系統(tǒng)故障,影響銀行的聲譽(yù)。日本知名的瑞穗銀行因系統(tǒng)遷移出現(xiàn)“大規(guī)模系統(tǒng)故障”,并造成了“數(shù)千臺 ATM 機(jī)‘吞食’銀行卡、部分網(wǎng)上銀行交易出現(xiàn)故障”等嚴(yán)重問題,就是一個(gè)非常慘痛的教訓(xùn)。
在國內(nèi),銀監(jiān)會對銀行業(yè)務(wù)連續(xù)性有非常嚴(yán)格的要求,根據(jù)銀監(jiān)會《商業(yè)銀行業(yè)務(wù)連續(xù)性監(jiān)管指引》(銀監(jiān)發(fā) [2011]104 號)及銀保監(jiān)會發(fā)布《關(guān)于開展中小銀行機(jī)構(gòu)業(yè)務(wù)連續(xù)性相關(guān)風(fēng)險(xiǎn)整治工作的通知》(銀保監(jiān)辦發(fā) [2019]221 號)等相關(guān)文件,要求銀行采取措施,減少因系統(tǒng)服務(wù)異常導(dǎo)致關(guān)鍵業(yè)務(wù)中斷,保障業(yè)務(wù)連續(xù)性。
二、面臨的挑戰(zhàn)
銀行啟動系統(tǒng)遷移的條件有很多,包括機(jī)房建設(shè)搬遷、系統(tǒng)版本升級合并等。在大規(guī)模系統(tǒng)遷移過程中,面臨主要問題如下:
經(jīng)驗(yàn)不足
對于沒有參與過大規(guī)模系統(tǒng)遷移的團(tuán)隊(duì),在實(shí)際遷移過程中,可能會存在人為操作失誤、遷移工具適配及功能完善、電力與網(wǎng)絡(luò)故障、數(shù)據(jù)報(bào)錯(cuò)等問題;由于經(jīng)驗(yàn)不足,可能導(dǎo)致問題解決的時(shí)間過長,影響業(yè)務(wù)的正常開展。
協(xié)調(diào)能力不強(qiáng)
立項(xiàng)之后,項(xiàng)目組需要協(xié)調(diào)內(nèi)外部人員進(jìn)行會議討論、測試環(huán)境搭建、模擬演練操作、技術(shù)人員現(xiàn)場支持等,對于部分中小銀行的團(tuán)隊(duì)而言,協(xié)調(diào)能力不強(qiáng)可能會拖慢項(xiàng)目進(jìn)度,問題得不到及時(shí)的解決。
工具適配不及時(shí)
銀行系統(tǒng)遷移工具部分自于外部技術(shù)供應(yīng)商,由于新舊系統(tǒng)之間存在差異,遷移工具如果沒有及時(shí)適配新系統(tǒng),可能會出現(xiàn)遷移失敗、數(shù)據(jù)不一致等問題。
時(shí)間窗口有限
系統(tǒng)遷移交割,通常會選擇在業(yè)務(wù)閑暇的夜間時(shí)段,但銀行服務(wù)是持續(xù)對外的,系統(tǒng)存在讀寫操作,這需要項(xiàng)目組在規(guī)定時(shí)間內(nèi)完成遷移系統(tǒng)的測試驗(yàn)證和數(shù)據(jù)一致性比較,否則可能會影響白天業(yè)務(wù)的開展。
三、項(xiàng)目案例實(shí)踐
在實(shí)際項(xiàng)目案例中,中小銀行新建機(jī)房是導(dǎo)致大規(guī)模系統(tǒng)遷移的重要原因。通常這種遷移僅限于新舊機(jī)房的遷移,并不過多地涉及到同城及異地災(zāi)備中心。本文接下來將列舉某銀行因機(jī)房搬遷導(dǎo)致大規(guī)模系統(tǒng)遷移的項(xiàng)目實(shí)踐案例。
該行業(yè)務(wù)系統(tǒng)由阿里云、EasyStack、VMware 虛擬化、物理機(jī)等多種異構(gòu)平臺組成,系統(tǒng)主機(jī)數(shù)量超過 1000 個(gè),從項(xiàng)目實(shí)際啟動到新機(jī)房系統(tǒng)投產(chǎn)成功,項(xiàng)目周期大概是 5 個(gè)月。
在系統(tǒng)正式遷移交割前,項(xiàng)目經(jīng)過了模擬演練—搭建測試環(huán)境—運(yùn)行測試—正式交割—測試驗(yàn)證等一系列環(huán)節(jié)。為了確保系統(tǒng)的安全性、可控性、可用性,運(yùn)行測試分階段對重點(diǎn)系統(tǒng)進(jìn)行遷移測試。所有系統(tǒng)的正式交割也根據(jù)遷移時(shí)間窗口的局限性,分批次進(jìn)行交割驗(yàn)證。
遷移項(xiàng)目涉及眾多系統(tǒng)和環(huán)節(jié),內(nèi)容難以逐一概述,下面通過部分重要系統(tǒng)遷移實(shí)踐,具體描述遷移過程。
文件及存儲層遷移
銀行業(yè)務(wù)系統(tǒng)擁有眾多的 FTP 文件系統(tǒng),由于遷移過程文件存在讀寫操作,因此項(xiàng)目支持團(tuán)隊(duì)采用字節(jié)級實(shí)時(shí)復(fù)制軟件將文件系統(tǒng)傳輸?shù)侥繕?biāo)端,并將變化數(shù)據(jù)同步過去;針對 NAS 存儲數(shù)據(jù),則通過 NAS 數(shù)據(jù)災(zāi)備軟件遷移到目標(biāo)端,保障文件系統(tǒng)及 NAS 數(shù)據(jù)的安全遷移。
操作系統(tǒng)層遷移
銀行存在大量的 VMware 虛擬機(jī),并且版本不一,針對這種情況,項(xiàng)目支持團(tuán)隊(duì)采用虛擬化備份軟件將不同版本的虛擬機(jī),成功遷移到新版本的 VMware 虛擬機(jī)上。同時(shí)針對少數(shù)云主機(jī)、物理機(jī)系統(tǒng),通過在線熱遷移軟件成功遷移到目標(biāo)端,實(shí)現(xiàn)異構(gòu)操作系統(tǒng)的智能化安全遷移。
數(shù)據(jù)庫系統(tǒng)層遷移
針對銀行大型結(jié)構(gòu)化數(shù)據(jù)庫系統(tǒng),項(xiàng)目支持團(tuán)隊(duì)通過結(jié)構(gòu)化數(shù)據(jù)同步軟件,將數(shù)據(jù)庫數(shù)據(jù)實(shí)時(shí)同步到目標(biāo)端,并進(jìn)行數(shù)據(jù)一致性比較,保障用戶的數(shù)據(jù)安全。
△ 新舊機(jī)房系統(tǒng)遷移架構(gòu)圖
項(xiàng)目所有的系統(tǒng)遷移安全、如期地完成,新機(jī)房在預(yù)期的時(shí)間內(nèi)成功啟動并對外提供服務(wù)。從前期的項(xiàng)目運(yùn)行測試,到系統(tǒng)正式交割,英方團(tuán)隊(duì)均在現(xiàn)場給予支持,服務(wù)能力獲得了用戶的高度認(rèn)可。
四、用戶價(jià)值
整個(gè)遷移項(xiàng)目歷經(jīng)可行性論證,多次測試驗(yàn)證遷移安全性,分批次交割驗(yàn)證等關(guān)鍵環(huán)節(jié),不僅實(shí)現(xiàn)了項(xiàng)目的預(yù)期目標(biāo),還提升了項(xiàng)目團(tuán)隊(duì)的實(shí)踐能力。同時(shí),通過多層次的數(shù)據(jù)復(fù)制技術(shù)產(chǎn)品,幫助用戶實(shí)現(xiàn)以下價(jià)值:
(1) 在生產(chǎn)業(yè)務(wù)不停的情況下,可實(shí)現(xiàn)存量數(shù)據(jù)和增量數(shù)據(jù)的快速遷移,保障數(shù)據(jù)一致性和安全性。
(2) 可支持異構(gòu)環(huán)境下系統(tǒng)的大規(guī)模遷移,支持虛擬化多版本系統(tǒng)的遷移,節(jié)省遷移時(shí)間和成本。
(3) 遷移過程智能化,對于整個(gè)遷移過程可以準(zhǔn)確預(yù)測;針對操作系統(tǒng)的遷移,只需保障操作系統(tǒng)一致,便可實(shí)現(xiàn)一鍵遷移,并可隨時(shí)暫停、回退。
(4) 遷移過程安全可靠,兩端數(shù)據(jù)保持一致性,遷移完成后新機(jī)房業(yè)務(wù)正常對外提供服務(wù)。
五、總結(jié)與展望
中小銀行的大規(guī)模系統(tǒng)遷移,對項(xiàng)目團(tuán)隊(duì)的挑戰(zhàn)非常大,對遷移技術(shù)產(chǎn)品的穩(wěn)定性、安全性、先進(jìn)性要求非常高。系統(tǒng)遷移成功,離不開團(tuán)隊(duì)嚴(yán)謹(jǐn)細(xì)致的工作態(tài)度和高水準(zhǔn)產(chǎn)品及技術(shù)的支持。未來,隨著新一代信息技術(shù)的不斷融合發(fā)展,以及各類業(yè)務(wù)系統(tǒng)的國產(chǎn)化應(yīng)用,系統(tǒng)遷移將會是銀行信息化工作的常態(tài)。與此同時(shí),我們看到行業(yè)用戶對系統(tǒng)遷移、數(shù)據(jù)復(fù)制的需求越來越多。高安全、低時(shí)延的遷移方案,不僅可以滿足各類企業(yè)的數(shù)據(jù)安全與業(yè)務(wù)連續(xù)性的要求,也是用戶實(shí)現(xiàn)數(shù)據(jù)價(jià)值挖掘、數(shù)據(jù)賦能業(yè)務(wù)發(fā)展的重要手段。