一次诡异的CRS-2799: Failed to shut down resource ‘ora.crsd’ on ‘******’

昨日,因培训时演示需要,需要在测试数据库停止数据库集群CRS,但是执行./crsctl stop crs时,输出报出了 CRS-2795,CRS-4687,CRS-4000错误,如下图所示:

CRS-1

 

数据库实例,ASM磁盘组并没有完全成功卸载,只有VOTE磁盘组DISMOUNT

crs-21

 

Kiill ohas,oraagent,orarootagent,cssdagent,cssdmonitor重启未果,CRS组件异常,无法启动集群,分析集群日志与CRS日志后,在/agent/crsd/oraagent_ora11g/oraagent_ora11g.log中发现端倪:日志中报出了ORA-01017: invalid username/password; logon denied

crs-3

尝试登陆数据库实例与ASM实例查看状态:

crs-44

发现grid用户下sqlnet.ora配置中存在SQLNET.AUTHENTICATION_SERVICES=(NONE),禁用操作系统验证方式,采用数据库身份验证

crs-5

crs-6

 

注释掉此配置,集群重启正常。该问题MOS上给出了更加详细的解释(文档 ID 1681849.1):CRS通过操作系统认证方式连接ASM实例进行操作,SQLNET.AUTHENTICATION_SERVICES=none then a valid username and password is need to connect to ASM instance。