一、 DBA工作概要:
1. 每天对ORACLE数据库的运行状态,日志文件,备份情况,数据库的空间使用情况,系统资源的使用情况进行检查,发现并解决问题。
2. 每周对数据库对象的空间扩展情况,数据的增长情况进行监控,对数据库做健康检查,对数据库对象的状态做检查。
3. 每月对表和索引等进行Analyze,检查表空间碎片,寻找数据库性能调整的机会,进行数据库性能调整,提出下一步空间管理计划。对ORACLE数据库状态进行一次全面检查。

二、 每天的工作
1. 确认所有的INSTANCE状态正常
登陆到所有数据库或例程,检测ORACLE后台进程:

$ps –ef | grep ora

2. 检查文件系统的使用(剩余空间)。如果文件系统的剩余空间小于25%,需删除不用的文件以释放空间。(51job使用的是裸设备,只需关注表空间和数据文件使用率即可)

$df –k

3. 检查日志文件和trace文件记录alert和trace文件中的错误,每天会有定时mail发送。

4. 检查数据库当日备份的有效性。
对RMAN备份方式:
检查第三方备份工具(hpdp)的备份日志以确定备份是否成功
omnidb -sess -last 2 #检查近2天的备份情况

5. 检查数据文件的状态记录状态不是“online”的数据文件,并做恢复。

Select file_name from dba_data_files where status=’OFFLINE’;

6. 检查表空间的使用情况

SELECT tablespace_name, max_m, count_blocks free_blk_cnt, sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS pct_free 
FROM ( SELECT tablespace_name,sum(bytes)/1024/1024 AS sum_m FROM dba_data_files GROUP BY tablespace_name), 
( SELECT tablespace_name AS fs_ts_name, max(bytes)/1024/1024 AS max_m, count(blocks) AS count_blocks, sum(bytes/1024/1024) AS sum_free_m FROM dba_free_space GROUP BY tablespace_name ) 
WHERE tablespace_name = fs_ts_name;

7. 检查剩余表空间

SELECT tablespace_name, sum ( blocks ) as free_blk , 
trunc ( sum ( bytes ) /(1024*1024) ) as free_m, 
max ( bytes ) / (1024) as big_chunk_k, count (*) as num_chunks 
FROM dba_free_space GROUP BY tablespace_name; 

8. 监控数据库性能
获取AWR或STATSPACK报表以及TOP时间点的SQL报告,并分析。

9. 检查数据库性能,记录数据库的cpu使用、IO、buffer命中率等等
使用vmstat,iostat,glance,top等命令

10. 日常出现问题的处理。

三、 每周的工作
1. 控数据库对象的空间扩展情况
根据本周每天的检查情况找到空间扩展很快的数据库对象,并采取相应的措施
– 删除历史数据
可参照数据删除备份的文档
– 扩表空间

alter tablespace add datafile ‘/dev/vgdb01/rtbs01_01’ size 2000M autoextend off;

– 调整数据对象的存储参数

next extent
pct_increase

注:老HP数据库为10g的ASSM表空间管理方式,可以不要。

2. 监控数据量的增长情况
根据本周每天的检查情况找到记录数量增长很快的数据库对象,并采取相应的措施
– 删除历史数据
可参照数据删除备份的文档
– 扩表空间

alter tablespace add datafile ‘/dev/vgdb01/rtbs01_01’ size 2000M autoextend off; 

3. 系统健康检查
检查以下内容:

spfile.ora
controlfile
redo log file
archiving
tablespace(system,temporary,tablespace fragment)
datafiles(autoextend,location)
object(number of extent,next extent, index)

4. 检查无效的数据库对象

SELECT owner, object_name, object_type FROM dba_objects WHERE status=’INVALID’;

5. 检查不起作用的约束

SELECT owner, constraint_name, table_name, 
constraint_type, status 
FROM dba_constraints 
WHERE status = 'DISABLED’ AND constraint_type = 'P';

6. 检查无效的trigger

SELECT owner, trigger_name, table_name, status 
FROM dba_triggers 
WHERE status = 'DISABLED’;

四、 每月的工作

1. Analyze Tables/Indexes/Cluster

analyze table estimate statistics sample 50 percent; 

可根据实际情况调整取样率,可考虑使用dbms_stats生成分析柱状图

2. 检查表空间和表的碎片
根据本月每周的检查分析数据库碎片情况,找到相应的解决方法
表空间碎片检查:

SELECT SUBSTR(ts.name, 1, 10) TSPACE,
       tf.blocks BLOCKS,
       SUM(f.length) FREE,
       COUNT(*) PIECES,
       MAX(f.length) BIGGEST,
       MIN(f.length) SMALLEST,
       ROUND(AVG(f.length)) AVERAGE
  FROM sys.fet$ F, sys.file$ TF, sys.ts$ TS
 WHERE ts.ts# = f.ts#
   AND ts.ts# = tf.ts#
 GROUP BY ts.name, tf.blocks
/

表的碎片检查:

select /*+ ordered */
 u.name || '.' || o.name table_name,
 lpad(decode(t.degree, 32767, 'DEFAULT', nvl(t.degree, 1)), 7) degree,
 substr(to_char(100 * t.rowcnt /
                (floor((p.value - 66 - t.initrans * 24) /
                       greatest(t.avgrln + 2, 11)) * t.blkcnt),
                '999.00'),
        2) || '%' density,
 1 new_free,
 99 - ceil((100 * (p.value - 66 - t.initrans * 24 -
           greatest(floor((p.value - 66 - t.initrans * 24) /
                                  greatest(t.avgrln + 2, 11)) - 1,
                            1) * greatest(t.avgrln + 2, 11)) /
           (p.value - 66 - t.initrans * 24))) new_used,
 ceil((t.blkcnt -
      t.rowcnt /
      floor((p.value - 66 - t.initrans * 24) / greatest(t.avgrln + 2, 11))) /
      m.value) reads_wasted
  from sys.tab$ t,
       (select value
          from sys.v_$parameter
         where name = 'db_file_multiblock_read_count') m,
       sys.obj$ o,
       sys.user$ u,
       (select value from sys.v_$parameter where name = 'db_block_size') p
 where t.tab# is null
   and t.blkcnt > m.value
   and t.chncnt = 0
   and t.avgspc > t.avgrln
   and ceil((t.blkcnt -
            t.rowcnt / floor((p.value - 66 - t.initrans * 24) /
                              greatest(t.avgrln + 2, 11))) / m.value) > 0
   and o.obj# = t.obj#
   and o.owner# != 0
   and u.user# = o.owner#
 order by 5 desc, 2
/

3. 寻找数据库性能调整的机会
比较每天对数据库性能的监控报告,确定是否有必要对数据库性能进行调整

4. 数据库性能调整
如有必要,进行性能调整。

5. 提出下一步空间管理计划
根据每周的监控,提出空间管理的改进方法。

Trackback

no comment untill now

Add your comment now

切换到手机版