服務(wù)創造價值、存在造就未來
重慶石谷嚴格遵循以下流程進行數據庫系統安(ān)裝(zhuāng)配置工(gōng)作(zuò)。
圖二 數據庫系統安(ān)裝(zhuāng)流程圖
流程說明:
(1)數據庫協維人員根據數據庫要求,協助需求方評審,制定初步規劃。落實相關資源,并按需求方要求執行。
(2)數據庫協維人員進行安(ān)裝(zhuāng)調試,安(ān)裝(zhuāng)完畢之後測試。在此過程中(zhōng),系統協維人員給與必要的協助(創建帳号、賦予權限等)。
(3)系統協維人員在安(ān)裝(zhuāng)的服務(wù)器上修改服務(wù)器檔案,确保該服務(wù)器檔案反映了該服務(wù)器的最新(xīn)狀态。
(4)數據庫協維人員制定數據庫檔案,記錄新(xīn)安(ān)裝(zhuāng)的數據庫的狀态。
(5)測試沒有(yǒu)問題之後,該數據庫系統安(ān)裝(zhuāng)完畢,彙報相關人員及交付需求方使用(yòng)。
重慶石谷對數據庫日志(zhì)和對應主機日志(zhì)的巡檢工(gōng)作(zuò)制定了每日巡檢計劃,規定了巡檢工(gōng)作(zuò)的細粒度和頻率,數據庫協維工(gōng)程師依照巡檢計劃每天定時開展日志(zhì)檢查、告警日志(zhì)分(fēn)析、數據庫性能(néng)指标檢查、相關日志(zhì)清理(lǐ)等巡檢工(gōng)作(zuò)。
每日巡檢計劃模闆示例:
數據庫 | 數據庫日志(zhì) | 主機日志(zhì) | 性能(néng)指标 | 日志(zhì)清理(lǐ) | 結果分(fēn)析 | 執行人 |
核心庫 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16點/天 | |
務(wù)工(gōng)易 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16點/天 | |
中(zhōng)央信息 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16點/天 | |
IVR座席 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16點/天 | |
二線(xiàn)客服 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16點/天 | |
經分(fēn) | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16點/天 | |
百事易 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16點/天 | |
病蟲害 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16點/天 |
巡檢内容及報告模闆示例:
數據庫 | 數據庫日志(zhì) | 主機日志(zhì) | 監聽日志(zhì) | 空間檢查 | 結果分(fēn)析 |
核心庫 | alert_db.log | messages | listener.log | df -h | 16點/天 |
務(wù)工(gōng)易 | alert_db.log | messages | listener.log | df -h | 16點/天 |
中(zhōng)央信息 | alert_db.log | messages | listener.log | df -h | 16點/天 |
IVR座席 | alert_db.log | messages | listener.log | df -h | 16點/天 |
二線(xiàn)客服 | alert_db.log | messages | listener.log | df -h | 16點/天 |
經分(fēn) | alert_db.log | messages | listener.log | df -h | 16點/天 |
百事易 | alert_db.log | messages | listener.log | df -h | 16點/天 |
病蟲害 | alert_db.log | messages | listener.log | df -h | 16點/天 |
指标内容及報告模闆示例:
數據庫 | 表空間檢查 | TOPSQL | 當前會話 | 失效索引 | 無效對象檢查 |
核心庫 | 腳本 | awr報告 | 腳本 | 腳本 | 腳本 |
務(wù)工(gōng)易 | 腳本 | awr報告 | 腳本 | 腳本 | 腳本 |
中(zhōng)央信息 | 腳本 | awr報告 | 腳本 | 腳本 | 腳本 |
IVR座席 | 腳本 | awr報告 | 腳本 | 腳本 | 腳本 |
二線(xiàn)客服 | 腳本 | awr報告 | 腳本 | 腳本 | 腳本 |
經分(fēn) | 腳本 | awr報告 | 腳本 | 腳本 | 腳本 |
百事易 | 腳本 | awr報告 | 腳本 | 腳本 | 腳本 |
病蟲害 | 腳本 | awr報告 | 腳本 | 腳本 | 腳本 |
巡檢操作(zuò)方式示例:
ftp 192.168.180.62 oracle 用(yòng)戶登錄
在如下目錄 獲取當日目錄所有(yǒu)信息,然後發給相關負責人。
/home/oracle/rpt_pday/
drwxr-xr-x 2 oracle oinstall 4096 Mar 22 09:26 20120322
在檢查日志(zhì)時,查看有(yǒu)無“ORA-”,Error”,“Failed”等出錯信息,發現錯誤提示信息,根據錯誤進行分(fēn)析,判斷、處理(lǐ),事後對相關信息做備案,反饋相關人員。
要保持數據庫安(ān)全穩定運行,需要全面的巡檢和維護計劃,重慶石谷制定了長(cháng)期及特殊時期維護作(zuò)業計劃。
數據庫周期維護計劃表:
維護數據庫 | 維護日期 | ||||
維護記錄 | |||||
頻率 | 維護内容 | 備注 | |||
月度 |
| ||||
季度 |
| ||||
半年 | 1、數據庫安(ān)全補丁升級 2、對數據庫運行參數值檢查,性能(néng)評估、調整 | ||||
一年 | 1、對數據庫做一次全面健康檢查工(gōng)作(zuò) 2、根據本年度運行維護總結,提出下一年相關資源需求計劃 | ||||
數據庫日常運行過程中(zhōng),因某種原因導緻重大事件,為(wèi)了保證12582基地的可(kě)用(yòng)性,定制數據庫重大事件處理(lǐ)作(zuò)業計劃。
數據庫重大事件處理(lǐ)計劃表:
數據庫 | 維護日期 | |||
維護記錄 | ||||
事件 | 處理(lǐ)過程 | 備注 | ||
參數不對 | 檢查初始化參數文(wén)件是否正常 | |||
控制文(wén)件損壞 | 1.确保數據庫已經關閉,如果沒有(yǒu)用(yòng)下面的命令來關閉數據庫: racdbl>shutdown immediate; 2.查看初始化文(wén)件$ORACLE_BASE/admin/pfile/initORCL.ora,确定所有(yǒu)控制文(wén)件的路徑。 3.用(yòng)操作(zuò)系統命令将其它正确的控制文(wén)件覆蓋錯誤的控制文(wén)件。 4.用(yòng)下面的命令重新(xīn)啓動數據庫: racdbl >startup; 5.用(yòng)适當的方法進行數據庫全備份。 損壞所有(yǒu)的控制文(wén)件: 1.确保數據庫已經關閉,如果沒有(yǒu)用(yòng)下面的命令來關閉數據庫: racdbl >shutdown immediate; 2.從相應的備份結果集中(zhōng)恢複最近的控制文(wén)件。對于沒有(yǒu)采用(yòng)帶庫備份的點可(kě)以直接從磁帶上将最近的控制文(wén)件備份恢複到相應目錄;對于采用(yòng)帶庫備份的點用(yòng)相應的rman腳本來恢複最近的控制文(wén)件。 3.用(yòng)下面的命令來創建産(chǎn)生數據庫控制文(wén)件的腳本: racdbl >startup mount; racdbl >alter database backup controlfile to trace noresetlogs; 4.修改第三步産(chǎn)生的trace文(wén)件,将其中(zhōng)關于創建控制文(wén)件的一部分(fēn)語句拷貝出來并做些修改,使得它能(néng)夠體(tǐ)現最新(xīn)的數據庫結構。假設産(chǎn)生的sql文(wén)件名(míng)字為(wèi)createcontrol.sql. 注意: Trace文(wén)件的具(jù)體(tǐ)路徑可(kě)以在執行完第3步操作(zuò)後查$ORACLE_ BASE/admin/bdump/alert_ORCL.ora文(wén)件來确定。 5.用(yòng)下面命令重新(xīn)創建控制文(wén)件: racdbl >shutdown abort; racdbl >startup nomount; racdbl >@createcontrol.sql; 6.用(yòng)适當的方法進行數據庫全備份。 | |||
重做日志(zhì)文(wén)件損壞: | 數據庫的所有(yǒu)增、删、改都會記錄入重做日志(zhì)。如果當前激活的重做日志(zhì)文(wén)件損壞,會導緻數據庫異常關閉。非激活的重做日志(zhì)最終也會因為(wèi)日志(zhì)切換變為(wèi)激活的重做日志(zhì),所以損壞的非激活的重做日志(zhì)最終也會導緻數據庫的異常終止。在ipas/mSwitch中(zhōng)每組重做日志(zhì)隻有(yǒu)一個成員,所以在下面的分(fēn)析中(zhōng)隻考慮重做日志(zhì)組損壞的情況,而不考慮單個重做日志(zhì)成員損壞的情況。 确定損壞的重做日志(zhì)的位置及其狀态: 1.如果數據庫處于可(kě)用(yòng)狀态: select * from v$logfile; racdbl >select * from v$log; 2.如果數據庫處于已經異常終止: racdbl >startup mount; racdbl >select * from v$logfile; svrmgrl>select * from v$log; 其中(zhōng),logfile的狀态為(wèi)INVALID表示這組日志(zhì)文(wén)件出現已經損壞;log狀态為(wèi)Inactive:表示重做日志(zhì)文(wén)件處于非激活狀态;Active: 表示重做日志(zhì)文(wén)件處于激活狀态;Current:表示是重做日志(zhì)為(wèi)當前正在使用(yòng)的日志(zhì)文(wén)件。 損壞的日志(zhì)文(wén)件處于非激活狀态: 1.删除相應的日志(zhì)組: racdbl >alter database drop logfile group group_number; 2.重新(xīn)創建相應的日志(zhì)組: racdbl >alter database add log file group group_number (’log_file_descritpion’,…) size log_file_size; 損壞的日志(zhì)文(wén)件處于激活狀态且為(wèi)非當前日志(zhì): 1.清除相應的日志(zhì)組: racdbl>alter database clear unarchived logfile group group_number; 損壞的日志(zhì)文(wén)件為(wèi)當前活動日志(zhì)文(wén)件: 用(yòng)命令清除相應的日志(zhì)組: racdbl>alter database clear unarchived logfile group group_number; 如果清除失敗,則隻能(néng)做基于時間點的不完全恢複。 打開數據庫并且用(yòng)适當的方法進行數據庫全備份: racdbl >alter database open; 部分(fēn)數據文(wén)件損壞: 若損壞的數據文(wén)件屬于非system表空間,則數據庫仍然可(kě)以處于打開狀态可(kě)以進行操作(zuò),隻是損壞的數據文(wén)件不能(néng)訪問。這時在數據庫打開狀态下可(kě)以單獨對損壞的數據文(wén)件進行恢複。若是system表空間的數據文(wén)件損壞則數據庫系統會異常終止。這時數據庫隻能(néng)以Mount方式打開,然後再對數據文(wén)件進行恢複。可(kě)以通過查看數據庫日志(zhì)文(wén)件來判斷當前損壞的數據文(wén)件到底是否屬于system表空間。 |
上一篇:網絡設備運維技(jì )術方案
24小(xiǎo)時免費咨詢
請輸入您的聯系電(diàn)話,座機請加區(qū)号