一、内存总体分布
1.数据库总体内存使用分布:
select * from gs_total_memory_detail;
复制
当dynamic_used_memory大于max_dynamic_memory就会报内存不足。如果此时dynamic_used_memory小于max_dynamic_memory,而dynamic_peak_memory大于max_dynamic_memory表明曾经出现内存不足的情况。如果是other_used_memory较大,则只能通过更换Debug版本进一步定位。
如果dynamic_used_shrctx较大,则查询gs_shared_memory_detail视图,观察是哪个MemoryContext使用内存较多。
如果dynamic_used_shrctx不大,则查询gs_session_memory_detail视图, 观察是哪个MemoryContext使用内存较多。
openGauss=# select * from gs_total_memory_detail; nodename | memorytype | memorymbytes ----------+-------------------------+-------------- primary | max_process_memory | 12288 GUC参数设置的进程可使用内存大小 primary | process_used_memory | 466 进程实际使用的内存大小,同操作系统res primary | max_dynamic_memory | 8088 MemoryContext能够使用的内存大小 primary | dynamic_used_memory | 606 MemoryContext实际使用的内存大小 primary | dynamic_peak_memory | 617 MemoryContext使用的内存峰值 primary | dynamic_used_shrctx | 331 SharedMemoryContext能够使用的内存大小 primary | dynamic_peak_shrctx | 331 SharedMemoryContext实际使用的内存大小 primary | max_backend_memory | 348 SharedMemoryContext使用的内存峰值 primary | backend_used_memory | 1 primary | max_shared_memory | 3339 shared_buffers + 元数据 primary | shared_used_memory | 136 进程使用的共享内存大小 primary | max_cstore_memory | 512 cstore_buffers primary | cstore_used_memory | 0 primary | max_sctpcomm_memory | 0 primary | sctpcomm_used_memory | 0 primary | sctpcomm_peak_memory | 0 primary | other_used_memory | 0 primary | gpu_max_dynamic_memory | 0 process_used_memory - dynamic_used_memory - shared_used_memory - cstore_used_memory primary | gpu_dynamic_used_memory | 0 primary | gpu_dynamic_peak_memory | 0 primary | pooler_conn_memory | 0 primary | pooler_freeconn_memory | 0 primary | storage_compress_memory | 0 primary | udf_reserved_memory | 0 (24 rows)
复制
二、共享内存分布
1.共享内存的内存分布
SELECT contextname,
pg_size_pretty(sum(totalsize)) totalmem,
pg_size_pretty(sum(usedsize)) usedmem,
count(*) count
FROM gs_shared_memory_detail
GROUP BY contextname
ORDER BY totalmem DESC limit 20;
复制
三、session级别,连接内存等
1.查看连接数分布
select state,count(*) from pg_stat_activity group by state;
复制
2.各状态连接占用总内存情况
SELECT state,
pg_size_pretty(sum(totalsize))
FROM gs_session_memory_detail m, pg_stat_activity a
WHERE substring_inner(sessid, position('.'
IN sessid)+1)=a.sessionidgroup by state;
复制
3.session内存使用详情
SELECT contextname,
pg_size_pretty(sum(totalsize)),
pg_size_pretty(sum(freesize))
FROM gs_session_memory_detail
GROUP BY contextname
ORDER BY sum(totalsize) DESC limit 10;
复制
4.session中cacheplan内存占用情况
SELECT sessid, pg_size_pretty(sum(totalsize)) sess_cacheplan_sum, pg_size_pretty(sum(usedsize)) sess_cacheplan_used, count(*) count FROM gs_session_memory_detail WHERE contextname LIKE '%CachedPlan%' GROUP BY sessid ORDER BY 2 DESC limit 20;
复制
5.session中syscache占用情况
SELECT sessid, contextname, pg_size_pretty(sum(totalsize)) sess_cacheplan_sum, pg_size_pretty(sum(usedsize)) sess_cacheplan_used, count(*) count FROM gs_session_memory_detail WHERE contextname LIKE '%SessionCacheMemory%' GROUP BY sessid, contextname ORDER BY 2 DESC limit 20;
复制
6.根据openGauss线程资源的使用情况定位session连接
如下方式是先根据系统资源定位线程,然后根据线程找到对应openGauss数据库里的连接。
(1)想要根据资源占用找连接,建议用top命令查看线程id
top -H -p 数据库进程id
复制
查看到对应耗费资源较多的线程后,根据lwtid字段,找到对应的数据库连接
SELECT pid,
lwtid,
state,
now() - query_start query_duration,
wait_event, query
FROM pg_stat_activity a, dbe_perf.thread_wait_status s
WHERE a.pid=s.tid
AND lwtid=xxx;
复制
(2)也可用ps命令找到线程id,不过不方便看资源
ps -T -p 数据库进程id
复制
如果针对访问数据库的连接,可以筛选条件加上worker。因为一般访问openGauss的时候,连接的线程名为worker。
ps -T -p 进程id|grep worker
复制
然后再通过上述SQL查询线程对应的连接。
也可参考线程lwtid
https://www.modb.pro/db/448030
7.内存类型和query结合
SELECT substring_inner(sessid, position('.'
IN sessid)+1) AS sessid, sesstype, contextname, level, parent, pg_size_pretty(sum(totalsize)) AS totalsize, pg_size_pretty(sum(freesize)) AS freesize, pg_size_pretty(sum(usedsize)) AS usedsize, query
FROM gs_session_memory_detail m, pg_stat_activity a
WHERE substring_inner(sessid, position('.'
IN sessid)+1)=a.sessionid
GROUP BY sessid, sesstype, contextname, level, parent, query
ORDER BY totalsize desc;
复制
8.查找占用内存较多的连接
SELECT a.pid,
a.application_name,
a.client_addr,
a.datname,
a.usename,
pg_size_pretty(sum(usedsize)) AS usedsize,
pg_size_pretty(sum(totalsize)) AS totalsize, a.state, a.query
FROM gs_session_memory_detail s, pg_stat_activity a
WHERE substring_inner(sessid, position('.'
IN sessid) +1)= a.sessionid
AND usename <> 'omm'
AND pid !=pg_backend_pid()
GROUP BY pid, application_name, client_addr, datname, usename, state, query
ORDER BY sum(totalsize) desc;
复制
四、内存追踪功能(慎用)
openGauss提供一个内存追踪的功能,可以追踪当前正在使用的内存上下文的申请位置,能够比较方便的用来定位内存泄漏的问题。其主要由下面两个函数组成。
DBE_PERF.track_memory_context(cxtname text): 开关。入参为需要追踪的上下文名称。
DBE_PERF.track_memory_context_derail(): 查看正在追踪的上下文的细节。
用完后DBE_PERF.track_memory_context(cxtname text)函数需要空值入参,关闭内存追踪功能。
使用示例如下:
//根据内存视图中查到比较大的、可能存在内存泄漏的context,开启内存追踪,并重新执行相关作业 openGauss=# select dbe_perf.track_memory_context('SessionCacheMemoryContext'); track_memory_context ---------------------- t (1 row) //查看上下文的申请信息,能看到是在哪个文件的哪一行申请了多少长度。 openGauss=# select * from dbe_perf.track_memory_context_detail(); context_name | file | line | size ---------------------------+-------------+------+------ SessionCacheMemoryContext | list.cpp | 104 | 16 SessionCacheMemoryContext | tupdesc.cpp | 62 | 496 SessionCacheMemoryContext | list.cpp | 107 | 24 (3 rows) //关闭内存追踪功能。 openGauss=# select dbe_perf. track_memory_context(''); track_memory_context ---------------------- (1 row)
复制
评论




