暂无图片
数据库hang swap可用为0
我来答
分享
用户5935
2021-04-12
数据库hang swap可用为0
暂无图片 10M

数据库版本:11.2.0.4 standard
操作系统:redhat 7.4
内存:128G
sga:36G pga:12G
4.8日上午9.30分应用反馈数据库无法连接,多次登陆操作系统才可正常登陆,登陆后系统swap可用为0 memory可用为0
强制重启服务器后恢复正常。

部分aler告警
Thu Apr 08 09:22:16 2021
Archived Log entry 166388 added for thread 1 sequence 14509 ID 0xb1e39b16 dest 1:
Thu Apr 08 09:33:08 2021
Errors in file /u01/app/oracle/diag/rdbms/alps/alps/trace/alps_pmon_114626.trc (incident=880019):
ORA-00445: background process “S010” did not start after 120 seconds
Thu Apr 08 09:33:24 2021
Incident details in: /u01/app/oracle/diag/rdbms/alps/alps/incident/incdir_880019/alps_pmon_114626_i880019.trc
Thu Apr 08 09:35:58 2021

截取了 三天的sa日志,发现,从6号下午1:40开始 内存的%commit开始增加。直到8号9:30分达到72%。这个现象需要分析一下,是否是oracle占用的内存不释放?sa文件已经上传
6号9:30分
AM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact kbdirty
09:30:02 AM 404684 130787376 99.69 0 76824632 10563500 6.41 39926124 38182380 32

7号:9:30分
09:30:01 AM 428224 130763836 99.67 668 8619196 80213424 48.69 70418600 7593120 0
AM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact kbdirty

8号9:30分
09:30:47 AM 374396 130817664 99.71 0 903120 119546476 72.56 74040236 4027116 0

我来答
添加附件
收藏
分享
问题补充
16条回答
默认
最新
用户5935
上传附件:alert_alps.log
暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935
上传附件:alps_pmon_114626.trc
暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935
上传附件:alps_mmon_114660.trc
暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935
暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935
上传附件:sa07
暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935
上传附件:sa08
暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935
上传附件:sa06
暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935
上传附件:故障时top
暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935

由于当时没有部署监控工具,也没办法收集awr,麻烦各位专家给个调查的思路。谢谢!

暂无图片 评论
暂无图片 有用 0
打赏 0
黄伟波

oracle数据库的awr不是自带的吗

暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935

标准版没有的

暂无图片 评论
暂无图片 有用 1
打赏 0
你好我是李白

(1)已有文件分析
我看了你上传的sa文件内容,我发现一个现象,内存一直在持续消耗,并未有释放,增长到物理内存不够了,swap从7号上午8:30开始使用比例持续上升,直到8号9.20 swap耗尽,系统出问题。

(2)8号问题判断
根据上述现象,应该是有地方内存泄露了,至于哪儿内存泄漏了,由于标准版没有ash视图跟awr信息辅助判断,已经发生的这次问题没办法判断了。

(3)问题根因追溯
不过通过sa文件,你可以看看是不是现在也存在这个现象,内存一直在上升,如果现在还在持续上升,则可以现在监控系统各个进程内存使用,oracle内存使用,看看能不能定位到内存泄漏的部分。如果现在系统存在这个问题,尽早定位,因为等下次swap耗尽之时,就是下次系统崩溃之时。

暂无图片 评论
暂无图片 有用 1
打赏 0
李华

麻烦上传下osw 如果有的话, cat /proc/meminfo 也上传下

暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935

李老师您好:
cat /proc/meminfo
MemTotal: 131192056 kB
MemFree: 20229760 kB
MemAvailable: 77760296 kB
Buffers: 328 kB
Cached: 57496776 kB
SwapCached: 0 kB
Active: 1719380 kB
Inactive: 57047764 kB
Active(anon): 510316 kB
Inactive(anon): 870392 kB
Active(file): 1209064 kB
Inactive(file): 56177372 kB
Unevictable: 8312 kB
Mlocked: 8312 kB
SwapTotal: 33554428 kB
SwapFree: 33554428 kB
Dirty: 28 kB
Writeback: 0 kB
AnonPages: 1349976 kB
Mapped: 365036 kB
Shmem: 32912 kB
Slab: 687776 kB
SReclaimable: 481960 kB
SUnreclaim: 205816 kB
KernelStack: 30240 kB
PageTables: 60556 kB
NFS_Unstable: 0 kB
Bounce: 0 kB
WritebackTmp: 0 kB
CommitLimit: 73728632 kB
Committed_AS: 5581908 kB
VmallocTotal: 34359738367 kB
VmallocUsed: 659416 kB
VmallocChunk: 34291814396 kB
HardwareCorrupted: 0 kB
AnonHugePages: 8192 kB
CmaTotal: 16384 kB
CmaFree: 208 kB
HugePages_Total: 24826
HugePages_Free: 6938
HugePages_Rsvd: 6690
HugePages_Surp: 0
Hugepagesize: 2048 kB
DirectMap4k: 297116 kB
DirectMap2M: 8626176 kB
DirectMap1G: 126877696 kB

暂无图片 评论
暂无图片 有用 0
打赏 0
用户5935

当时没有部署osw

暂无图片 评论
暂无图片 有用 1
打赏 0
哇哈哈

这个现象需要分析一下,是否是oracle占用的内存不释放

暂无图片 评论
暂无图片 有用 0
打赏 0
回答交流
Markdown


请输入正文
提交
相关推荐
select 语句应该不会造成enq: TX - row lock contention 行锁?如果能造成,是在什么情况下能造成行锁,烦请指教。
回答 3
select...for update会造成
什么是Oracle的复合类型的变量?
回答 2
已采纳
既然谈到变量,那我们限定场景是PLSQL吧。应该是associativearray,nestedtable和varray三种类型吧,这三种也叫collectiontype,Oracle专家eSteve
请问:使用logminer可以把一个库的日志放在另一个测试环境去分析吗?
回答 4
已采纳
最好归档文件,然后一样分析,最好版本和OS一致
oracle关闭实例之后,内存并没有释放是什么原因呢?
回答 2
输入:freem,把结果复制过来看看。可能你看到的是缓存。
oracle的基数会影响到查询速度吗?
回答 4
已采纳
基数会影响优化器对cost的评估,最简单的就是比如一个查询:selectfromtestwhereid1andsex'male';  id和sex两个字段上都有单独的索引,而id列
如何分辨某个用户是从哪台机器登陆ORACLE的?
回答 1
已采纳
–使用sys执行createorreplacetriggeronlogontriggerafterlogonondatabasebegindbmsapplicationinfo.setclientin
Oracle19C EM不能正常显示监控数据
回答 1
是否为测试环境,sqlmonitor自动对SQL执行>5s的SQL进行捕获,你这个环境是否存在这样的SQL,如果不存在,正常。https://docs.oracle.com/cd/B283590
ORACLE 数据库RAC 一个节点主板故障了
回答 2
谢谢!
Oracle 用存储过程来删除数据,一次性删除300万数据用时1小时20分钟,效率低吗?
回答 4
已采纳
很低了。存储过程落地也是调用delete语句。而且一次大量delete通常要考虑好rede和undo,避免刷爆,非常危险的操作。。。建议将需要的数据通过createtablea1asselectfro
rac11g,领导上升级到最新版本,是哪个?怎么弄好些
回答 1
已采纳
那不是得上oracle19crac?
问题信息
请登录之后查看
附件列表
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~