Error RMAN-06172 recuperando del autobackup

En la entrada anterior  vimos como recuperar un spfile desde el backup con rman.

Desgraciadamente no siempre todo funciona a la primera, y , como Murphy nunca falla, el error inusual siempre tiene que tocarnos a nosotros. La teoría nos dice que  para recuperar un spfile o un controlfile de rman solamente hay que hacer

RMAN> restore spfile from autobackup;

Pero que ocurre si no funciona?

La recuperacion tanto del controlfile como del spfile puede complicarse si recibimos un RMAN-06172 . La salida del comando será algo similar a esto :

Starting restore at 28/09/12
allocatedchannel: ORA_DISK_1
channel ORA_DISK_1: sid=85 instance=pruebas devtype=DISK
recovery area destination: +DG_FRA
database name (ordatabaseuniquename) used for search: PRUEBAS
channel ORA_DISK_1: no autobackupsfound in the recovery area
channel ORA_DISK_1: looking for autobackup on day: 20120928
channel ORA_DISK_1: looking for autobackup on day: 20120927
channel ORA_DISK_1: looking for autobackup on day: 20120926
channel ORA_DISK_1: looking for autobackup on day: 20120925
channel ORA_DISK_1: looking for autobackup on day: 20120924
channel ORA_DISK_1: looking for autobackup on day: 20120923
channel ORA_DISK_1: looking for autobackup on day: 20120922
Channel ORA_DISK_1: no autobackup in 7 daysfound
RMAN-00571:   =================================
RMAN-00569: == ERROR MESSAGE STACK FOLLOWS
RMAN-00571: ===================================
RMAN-03002: failure of restorecommand at 09/28/2012 11:40:37
RMAN-06172: no autobackup found or  specified handle is not a valid copy or piece

Llegados a este punto lo primero que tenemos que comprobar es si reamente tenemos algún backup de nuestro spfile.

RMAN por defecto hace una copia de controlfile y spfile cada vez que se lleva a backup el tablespace system, así pues, si tenemos un backup válido en cinta de este tablespace deberemos de tener un backup del spfile.  Para consultar donde está esta backup, nos conectaremos desde  rman y ejecutaremos la consulta

RMAN >List backup;

Este comando nos volcará mucha información ordenada cronológicamente, con lo que nosotros tendremos que buscar en la parte inferior el registro del último día de backup donde esté el spfile.

El registro dirá algo como:

BS Key  Type LV SizeDeviceTypeElapsed Time Completion Time
------- ---- -- ---------- ----------- ------------ ---------------
797503  Incr 0  5.44G      SBT_TAPE    00:03:52     27/09/12
        BP Key: 797556   Status: AVAILABLE  Compressed: NO  Tag: TAG20120926T210038
Handle: intranet_backup<pruebas_8084:795042038:1>.dbf   Media:
List of Datafiles in backup set 797503
  File LV TypeCkp SCN    Ckp Time Name
  ---- -- ---- ---------- -------- ----
  1    0  Incr 139540429  26/09/12 +DG_DAT/pruebas/datafile/system.257.713298945
  2    0  Incr 139540429  26/09/12 +DG_DAT/pruebas/datafile/undotbs1.262.713298945
  3    0  Incr 139540429  26/09/12 +DG_DAT/pruebas/datafile/sysaux.261.713298945
  4    0  Incr 139540429  26/09/12 +DG_DAT/pruebas/datafile/undotbs2.264.713298947
  5    0  Incr 139540429  26/09/12 +DG_DAT/pruebas/datafile/users.345.713298947
  6    0  Incr 139540429  26/09/12 +DG_DAT/pruebas/datafile/pruebas.260.730901167

BS Key  Type LV SizeDeviceTypeElapsed Time Completion Time
------- ---- -- ---------- ----------- ------------ ---------------
797504Incr 0  15.00M     SBT_TAPE    00:00:06     27/09/12
        BP Key: 797557   Status: AVAILABLE  Compressed: NO  Tag: TAG20120926T210038
Handle:pruebas_backup<pruebas_8085:795042273:1>.dbf   Media:
  Control File Included: Ckp SCN: 139541276    Ckp time: 27/09/12
SPFILE Included: Modification time: 27/09/12

Aquí podemos ver como el 27 del 9 hicimos backup del tablespace system en el backupset 797504 lo que provoca que el RMAN haga backup de el SPFILE en el backupset  797504 en un fichero que el software de backup tiene identificado como  “pruebas_backup<pruebas_8085:795042273:1>.dbf”

Luego, si que tenemos respaldado el spfile.

¿Que hacemos ahora para recuperarlo?

Simplemente tendremos que ejecutar el comando de restauración indicando exactamente desde el fichero en el que queremos hacer la copia.

Vamos a rizar un poco mas el rizo y hagamos que la copia no esté ya en  la FRA,sino que el contenido ya está en cinta. Lo primero que tendremos que hacer es localizar un canal a cinta, para ello lo más sencillo es buscar el script de backup y copiar los parámteros específicos de  la línea del allocate channel .

En nuestro caso el resultado será :

allocate channel 'dev_0' type 'sbt_tape'   
parms 'ENV=(OB2BARTYPE=Oracle8,OB2APPNAME=pruebas,OB2BARLIST=pruebas_backup)';

Así pues, ya tenemos la línea que nos conectará con el software de backup, ahora tenemos que indicarle el nombre del fichero del cual queremos sacar el spfile, en nuestro caso hemos visto  que era  “pruebas_backup<pruebas_8085:795042273:1>.dbf” .

Con esto solamente nos queda hacer un bloque run de RMAN que nos recupere el spfile a una ubicación alternativa:

run {
allocate channel 'dev_0' type 'sbt_tape'
parms 'ENV=(OB2BARTYPE=Oracle8,OB2APPNAME=pruebas,OB2BARLIST=pruebas_backup)';
restore  spfile to '/tmp/spfile_restaurado_cinta.ora' from 'pruebas_backup<pruebas_8085:795042273:1>.dbf';
 }

Nos conectaremos a  nuestra base de datos target  y catálogo y ejecutamos nuestro bloque run,con el resultado:

run {
allocate channel 'dev_0' type 'sbt_tape'
parms 'ENV=(OB2BARTYPE=Oracle8,OB2APPNAME=pruebas,OB2BARLIST=pruebas_backup)';
restore  spfile to '/tmp/spfile_restaurado_cinta.ora' from 'pruebas_backup<pruebas_8085:795042273:1>.dbf';
}
3>allocatechannel 'dev_0' type 'sbt_tape'
parms 'ENV=(OB2BARTYPE=Oracle8,OB2APPNAME=pruebas,OB2BARLIST=pruebas_backup)';
4>restorespfileto '/tmp/spfile_restaurado_cinta.ora' from 'pruebas_backup<pruebas_8085:795042273:1>.dbf';
5> }
allocatedchannel: dev_0
channel dev_0: sid=147 instance=pruebas1 devtype=SBT_TAPE
channel dev_0: Data Protector A.06.11/PHSS_40470/PHSS_40471/DPSOL_00391/DPLNX_
Startingrestore at 28/09/12
channel dev_0: autobackupfound: pruebas_backup<pruebas_8085:795042273:1>.dbf
[Normal] From: OB2BAR_SBT_CHANNEL@server.local "pruebas"  Time: 09/28/12 12:29:09
Starting OB2BAR Restore: server.local:pruebas_backup<pruebas_8085:795042273:1>.dbf "Oracle8"
[Normal] From: OB2BAR_SBT_CHANNEL@server.local "pruebas"  Time: 09/28/12 12:29:09
Starting OB2BAR Restore: server.local:pruebas_backup<pruebas_8085:795042273:1>.dbf "Oracle8"
[Normal] From: OB2BAR_SBT_CHANNEL@server.local "pruebas"  Time: 09/28/12 12:29:10
Completed OB2BAR Restore: server.local:pruebas_backup<pruebas_8085:795042273:1>.dbf "Oracle8"
[Normal] From: OB2BAR_SBT_CHANNEL@server.local "pruebas"  Time: 09/28/12 12:29:10
Completed OB2BAR Restore: server.local:pruebas_backup<pruebas_8085:795042273:1>.dbf "Oracle8"
channel dev_0: SPFILE restorefromautobackup complete
Finishedrestore at 28/09/12
releasedchannel: dev_0
Recovery Manager complete..

Ahora solamente tenemos que buscar el fichero /tmp/spfile_restaurado_cinta.ora donde tenemos la imagen del  spfile recuperada del backup.

 

 

 

Recuperar un spfile borrado

Hoy vamos a ver algo tan sencillo como el recuperar un fichero spfile.

El spfile es la «nueva» version del fichero de configuracion de parametros texto de toda la vida llamado pfile. La principal ventaja que obtenemos con tener un fichero de configuración binario sobre un fichero de texto es que la instancia puede ir actualizando los cambios de configuración que llevas a cabo en la base de datos sin necesidad de tener que actualizarlo manualmente. Hemos de tener en cuenta que, con los nuevos modos de gestión de memoria la configuracion del tamaño de los distintos pooles ya no es estático, con lo que es necesario tener un fichero de datos actualizable si quieres mantener esa informacion en el siguiente arranque.

El fichero spfile es necesario en el momento en el que arrancas la instancia, pero no lo es para el funcionamiento de la base de datos, si  borras este fichero cuando la base de datos esta en funcionamiento todo funcionará correctamente, solamente tendremos errores cuando intentemos modificar algo del spfile, y los errorres que tendremos serán errores de localizacionde fichero del sistema operativo

ORA-01565: error al identificar el archivo '/opt/oracle/product/11.2.0.3/dbhome_1/dbs/spfileorcl.ora'
ORA-27037: no se ha podido obtener el estado del archivo
Linux-x86_64 Error: 2: No such file or directory
Additional information: 3

Pero la base de datos seguirá funcionando correctamente.

Para restaurar un spfile tenemos dos opciones:

1- Restauración desde RMAN

Rman hace una copia del controlfile y el spfile cada vez que llevas a cabo un backup del tablespace system.  Así pues, si hacemos backups full de nuestra base de datos, deberíamos de tener una copia del spfile en el backupset.

La recuperación del fichero es muy sencilla, simplemente hay que decirle que lo restaure del autobackup con el comando:

restore spfile from autobackup;

Si tenemos la base de datos en funcionamiento el comando fallará devolviendonos el error:

RMAN> restore spfile from autobackup;
Starting restore at 29/09/12
allocated channel: ORA_DISK_1
channel ORA_DISK_1: SID=156 device type=DISK
RMAN-00571: ===========================================================
RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============
RMAN-00571: ===========================================================
RMAN-03002: failure of restore command at 09/29/2012 21:58:30
RMAN-06564: must use the TO clause when the instance is started with SPFILE

la solución a este problema es muy sencilla,  vamos a engañar un poco a nuestra base de datos, vamos a recuperarlo a un lugar alternativo y luego lo moveremos con comandos del sistema operativo (o del asm).

RMAN> restore spfile to '?/dbs/spfile.backup' from autobackup;
Starting restore at 29/09/12
using channel ORA_DISK_1
recovery area destination: /opt/oracle/flash_recovery_area
database name (or database unique name) used for search: ORCL
channel ORA_DISK_1: restoring spfile from AUTOBACKUP /opt/oracle/flash_recovery_area/ORCL/autobackup/2012_09_29/o1_mf_s_795264706_86ffo3j0_.bkp
channel ORA_DISK_1: SPFILE restore from AUTOBACKUP complete
Finished restore at 29/09/12
RMAN> quit
$cd /opt/oracle/product/11.2.0.3/dbhome_1/dbs/
mv spfile.backup spfileorcl.ora

P.D en caso de que la instancia estuviese caída y no tuviesemos el spfile en el momento la base de datos deberá de estar en modo MOUNT

2-Creándolo a partir del alert.log

Cada vez que arrancamos y paramos la base de datos, toda la información del spfile es volcada en el fichero alert.log

Starting up:
Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - 64bit Production
  processes                = 150
  memory_target            = 1536M
  control_files            = "/opt/oracle/oradata/orcl/control01.ctl"
  control_files            = "/opt/oracle/flash_recovery_area/orcl/control02.ctl"
  db_block_size            = 8192
  compatible               = "11.2.0.0.0"
  db_recovery_file_dest    = "/opt/oracle/flash_recovery_area"
  db_recovery_file_dest_size= 3882M
  undo_tablespace          = "UNDOTBS1"
  remote_login_passwordfile= "EXCLUSIVE"
  db_domain                = ""
  dispatchers              = "(PROTOCOL=TCP) (SERVICE=orclXDB)"
  local_listener           = "LISTENER_ORCL"
  audit_file_dest          = "/opt/oracle/admin/orcl/adump"
  audit_trail              = "DB"
  db_name                  = "orcl"
  open_cursors             = 300
  diagnostic_dest          = "/opt/oracle"
.
.
.

Asimismo, tambien deja reflejados los cambios que hacemos si ejecutamos

SQL> alter system set undo_retention=9000;

Y luego miramos el alert, vemos que

ALTER SYSTEM SET undo_retention=9001 SCOPE=BOTH;

Con lo que, podremos  regenerar nuestro spfile creando un fichero de texto con estos valores  (fichero parameter file de texto clásico) , y despues ejecutando el comando.

create spfile from pfile='/tmp/init_SID.ora'

P.D  si la isntancia está levantada, aqui tendremos el mismo problema que cuando intentamos recuperar de RMAn con autobackup, con lo que tendremos que aplicar la misma solución, engañar a oracle desde el sistema operativo

create spfile='?/dbs/spfile.backup' from pfile='/tmp/initSID.ora'
cd $ORACLE_PRODUCT/dbs
mv spfile.backup spfileorcl.ora

 

 

 

 

 

Eventos de espera en disco I

Hoy vamos a hablar un poquito mas de ajuste de bases de datos.

Aplicando la lógica mas pura, si queremos que todo vaya fluido, lo primero que tendremos que prestar atencion a que es lo que nos está haciendo esperar. Así pues, una de las primeras cosas que tenemos que mirar para ajustar una base de datoslos eventos de espra que mas se producen.

Si generalizamos hasta lo evidente, podemos decir que Oracle puede tener problemas de cpu,memoria o disco (esperemos que sea un «o» en ved de un un «y» ) . En esta entrada vamos a dar una pequeña explicación de cuales son los eventos de espera en disco mas comunes.

  • log file sync
  • log file parallel write
  • db file scattered read
  • db file sequential read

log file sync

Cuando una sesion de usuario hace un commit, la información del redo de esta sesion debe de ser llevada al redo log file, este evento nos indica que estamos esperando a que el LGWR nos indique que esta información está guardada correctament en el redo log.
La aparicion de este evento en el «top ten» puede indicarnos un alto número de commits de aplicación.

log file parallel write

Este evento es muy similar al anterior, solamente que es parte normal del funcionamiento de oracle que lleva la informacion la informacion del redo a el redo log (el anterior lo causaba un commit)

db file sequential read

Este evento nos indica que la instancia está esperando una peticion de entrada/salida,esta lectura se está haciendo de bloques contiguos de disco (de ahí lo de sequential).
Por lo general suelen ser lecturas de bloques sueltos, y suele estar asociada a lecturas de filas indexadas

db file scattered read

Es similar a la anterior excepto que en este caso está a la espera de multiples bloques.
Habitualmente está asociada a Full scan tables. Este evento puede tener relaccion con el parámtro DB_FILE_MULTIBLOCK_READ_COUNT en el que indicamos a oracle el numero de bloques consecutivos a leer en una operacion de I/O para un full scan.

Una vez visto lo que quiere decirnos cada uno de estos 4 eventos,es facil entender el porque de que algunos de ellos esten en la parte alta de los eventos de espera de los informes de AWR .

Creando grupos de consumidores. A la caza del bloqueo II

Hasta el momento, en la entrada   A la caza del bloqueo I   teníamos  un  plan de recursos llamado NO_LOCKS que mataba aquellos procesos que estaban mas de 5 segundos bloqueando otra consulta. Este plan de consumidores no era muy util , ya que podía provocar estragos matando indiscriminadamente cualquier bloqueo de mas de 5 segundos, con lo que hoy daremos un paso mas para hacer de ese plan de recursos algo mas útil.

En esta entrada vamos a crear un grupo de consumidores, este grupo de consumidores nos permitirá afinar el perfil de los usuarios sobre los que queremos aplicar nuestro pal de recursos.

El grupo de consumidores lo vamos a llamar USER_NO_LOCK_ALLOW y lo crearemos de la siguiente manera:

BEGIN
 dbms_resource_manager.clear_pending_area();
 dbms_resource_manager.create_pending_area();
 dbms_resource_manager.create_consumer_group(
consumer_group =>'USER_NO_LOCK_ALLOW','Grupo de consumidores alos que no permitiremos bloqueos '
);
 dbms_resource_manager.submit_pending_area();
END;

 

Una vez tenemos nuestro grupo de consumidores creado, es el momento de decidir que usuarios queremos tener dentro de el y cuales no. Oracle 11g nos da muchas opciones para seleccionar este grupo de usuarios, algunas de ellas son:

Por esquema

Si quisieramos añadir a los usuarios del esquema «esquema1» a este grupo de consumidores usariamos el parámetro dbms_resource_manager.oracle_user  del paquete dbms_resource_manager

BEGIN
dbms_resource_manager.clear_pending_area();
dbms_resource_manager.create_pending_area();
dbms_resource_manager.set_consumer_group_mapping(
dbms_resource_manager.oracle_user,'esquema1','USER_NO_LOCK_ALLOW'
);
dbms_resource_manager.submit_pending_area();
 END;

Por maquina cliente

Supongamos que queramos aplicar incluir en nuestro grupo de consumidores solamente las sesiones que se ejecutan desde el servidor cliente «WORKGROUP\client1», para ello  usaríamos dbms_resource_manager.client_machine

BEGIN
dbms_resource_manager.clear_pending_area();
dbms_resource_manager.create_pending_area();
dbms_resource_manager.set_consumer_group_mapping(
dbms_resource_manager.client_machine,'WORKGROUP\MAQUINA1','USER_NO_LOCK_ALLOW'
);
dbms_resource_manager.submit_pending_area();
END;

Por programa

Para separar por programa usaremos la llamada dbms_resource_manager.client_program

BEGIN
dbms_resource_manager.clear_pending_area();
dbms_resource_manager.create_pending_area();
dbms_resource_manager.set_consumer_group_mapping(
dbms_resource_manager.client_program,'PROGRAMA1','USER_NO_LOCK_ALLOW'
);
dbms_resource_manager.submit_pending_area();
END;

Como podeis ver, las posibilidades son muy grandes, en esta entrada nos hemos centrado en capturar sesiones por parámetros de login, pero la funcion dbms_resource_manager.set_consumer_group_mapping permite también seleccionar usuarios por atributos de runtime-.

La lista de las opciones la podeis encontrar en la documentación del paquete
dbms_resource_manager.set_consumer_group_mapping, pero a groso modo se puede resumir en:
Login Attributes

  • oracle_user
  • service_name
  • client_os_user
  • client_program
  • client_machine

 Runtime Attributes

  • module_name
  • module_name_action
  • service_module
  • service_module_action

Ahora solamente nos quedará el incluir este grupo de consumidores en nuestro plan de recursos, indicándole que son los consumidores de este grupo a los que no se les debe permitir el bloquear al resto de los usuarios . Pero esto será en otra entrada.