一套核心业务数据库ORA-00600

近期,我们业务中一套核心数据库节点2发生自动重启,该数据库架构为3节点RAC+2节点DataGuard架构,虽然节点2重启并不会对实际业务产生数据库服务中断,但是该数据库承载业务的过于重要,看到故障告警时瞬间神经紧绷,不敢有丝毫懈怠。

数据库信息:

RAC 3节点,AIX6.1,11.2.0.4数据库版本

ORA600-1

 

我们从alert日志看到在出现了几次ORA-600后,LMS出现错误,数据库实例因RAC核心进程LMS终止,随后数据库自动重启,并且ORA-600错误重启之后不再出现。有意思的是,在看日志的过程中,想起此前这个数据库也出现过因LMS进程出现问题导致实例重启的印象,翻阅Alert后,在一年前的同期左右,发生了与本案例一模一样的故障现象。

经过分析数据库Trace与Call Stack,查阅Mos,该数据库报错命中数据库Bug 20675347(Doc ID 20675347.8)

ORA600-2

ORA600-3

 

分析该Patch Read Me后,该Patch为相对简单,并且先决条件较少,并且可以Rolling Patch滚动升级,为避免“每年一次”的自动重启,我们决定Apply 该Patch并密切关注该数据库状态,观察此Patch是否真正解决该问题。