Durante o monitoramento de um servidor com Oracle Grid Infrastructure 19c , um incidente foi aberto automaticamente após o uso de e espaço em disco atingir níveis críticos no filesystem /u00
. A causa foi a geração contínua de arquivos de auditoria (.aud
).
Diagnóstico
A análise começou após alerta de uso elevado no mount point /u00
:
[root@lnx95orasp01 ~]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/vggrid-lvgrid 100G 95G 5G 95% /u00
Verificação do espaço utilizado pelo diretório de auditoria:
[root@lnx95orasp01 ~]# du -h /u00/app/grid/product/19.26/grid_home/rdbms/audit
48G /u00/app/grid/product/19.26/grid_home/rdbms/audit
O diretório continha milhões de arquivos .aud
, gerados automaticamente.
Exemplo de conteúdo:
[grid@lnx95orasp01 audit]$ cat +ASM_ora_3032_20250404172139240702926570.aud
Audit file /u00/app/grid/product/19.26/grid_home/rdbms/audit/+ASM_ora_3032_20250404172139240702926570.aud
Oracle Database 19c Enterprise Edition Release 19.0.0.0.0 - Production
Version 19.26.0.0.0
Build label: RDBMS_19.26.0.0.0DBRU_LINUX.X64_250110
ORACLE_HOME: /u00/app/grid/product/19.26/grid_home
System name: Linux
Node name: qlnbo-odmdb01
Release: 5.14.0-503.29.1.el9_5.x86_64
Version: #1 SMP PREEMPT_DYNAMIC Tue Feb 25 10:30:47 EST 2025
Machine: x86_64
Storage: ?
CLID: U
Instance name: +ASM
Instance number: 0 <none>
Database name: N/A
Database unique name: N/A
Database id: N/A
Database role: N/A
Redo thread mounted by this instance: 0 <none>
Oracle process number: 0
Unix process pid: 3032, image:
Fri Apr 4 17:21:39 2025 -03:00
LENGTH : '235'
ACTION :[7] 'CONNECT'
DATABASE USER:[1] '/'
PRIVILEGE :[6] 'SYSASM'
CLIENT USER:[4] 'grid'
CLIENT TERMINAL:[13] 'Not Available'
STATUS:[1] '0'
DBID:[0] ''
SESSIONID:[0] ''
USERHOST:[0] ''
CLIENT ADDRESS:[0] ''
ACTION NUMBER:[3] '100'
Verificação da causa
Checagem do parâmetro CHECK_INTERVAL
do recurso ora.asm
:
[root@lnx95orasp01 ~]# crsctl stat res ora.asm -p | grep ^CHECK_INTERVAL
CHECK_INTERVAL=1
Com esse valor, o Oracle verifica o status do ASM a cada segundo. A cada conexão, é gerado automaticamente um arquivo .aud
, mesmo que não haja erro.
Correção aplicada
Ajuste do intervalo de checagem para 60 segundos:
[root@lnx95orasp01 ~]# crsctl modify resource ora.asm -init -attr "CHECK_INTERVAL=60"
[root@lnx95orasp01 ~]#
[root@lnx95orasp01 ~]# crsctl stat res ora.asm -p | grep ^CHECK_INTERVAL
CHECK_INTERVAL=60
Com isso, a geração de arquivos caiu de milhares por hora para apenas um por minuto, ou seja, 60 por hora.
Contraponto (o que se perde ao aumentar o intervalo):
- Menor sensibilidade na detecção de falhas no ASM
É recomendável construir uma rotina automatizada de limpeza dos arquivos .aud
antigos, evitando novos alertas de uso de espaço. Também é possível usar o utilitário adrci
para auxiliar na limpeza.
#20250429 #DBASobrinho #GuinaNãoTinhaDó #BóBó #CaceteDeAgulha #OracleACE