SAP 监控和性能检查:使用 Tcodes 的完整教程
什么是系统监控?
系统监控是一项日常例行活动,本文档提供了服务器监控的系统分步程序。它概述了主动系统监控的技术方面和概念。其中一些是:
- 检查应用服务器。
- 监控整个系统的工作流程。
- 监控单个实例的工作流程。
- 监控锁定条目。
- CPU利用率
- 数据库中的可用空间。
- 监控更新过程。
- 监控系统日志。
- Buffer 统计学
其他一些包括:
- 监控批处理作业
- 假脱机请求监控。
- 打印请求数
- ABAP 转储分析。
- 数据库性能监视器。
- 数据库检查。
- 监控应用程序用户。
为什么要进行每日基本检查/系统监控?
我们如何监控 SAP 系统?
检查应用服务器(SM51)
此事务用于检查所有活动的应用程序服务器。
在这里您可以看到每个实例中配置了哪些服务或工作流程。
监控单个实例的工作流程 SM50
显示与特定实例相关的所有正在运行、等待、已停止和 PRIV 进程。在此步骤中,我们检查所有进程;进程状态应始终为等待或正在运行。如果任何进程处于等待或运行以外的状态,我们需要检查该特定进程并进行相应报告。
这笔交易显示了很多信息,例如:
- 工作流程状态(是否被占用)
- 如果工作进程正在运行,您可能能够在“操作”列中看到其采取的操作。
- 您可以查看正在处理哪个表
一些典型问题:
- 用户登录时间过长/无法登录/在线交易非常缓慢。这可能是由于 DIA 工作进程已充分利用。也可能是由于长时间运行的作业(时间列下的红色指示器)。如有必要,您可以通过选择作业然后转到“进程”>“取消无核心”来取消会话。这将取消作业并为其他用户/进程释放工作进程。
- 某些用户可能具有 PRIV 状态 原因 列。这可能是因为用户事务太大,需要更多内存。发生这种情况时,DIA 工作进程将由用户“拥有”,不会让其他用户使用。如果发生这种情况,请与用户核实,如果可能的话,将该作业作为后台作业运行。
- 如果 SPO 工作过程中有较长的打印作业,请调查问题。这可能是与打印服务器或打印机相关的问题。
监控整个系统的工作流程(SM66)
通过使用全局工作流程概览检查工作流程负载,我们可以快速调查系统性能问题的潜在原因。
监控所有活动实例上的工作负载 跨系统
使用全局工作流程概览屏幕,我们可以一目了然地看到:
- 各应用服务器的状态
- 它没有运行的原因
- 是否已重启
- CPU 和请求运行时间
- 已登录的用户及其登录的客户端
- 正在运行的报告
监控应用程序用户 (AL08 和 SM04)
此事务显示所有活跃实例的用户。
监控更新进程(SM13)
执行事务 SM13 并输入'*' 在 USER 字段中,点击 按钮。
如果没有长期待处理的更新记录或没有进行更新,则该队列将为空,如下面的屏幕截图所示。
但是,如果更新未激活,则查找以下信息:
- 更新是否有效?若无效,是否被系统或用户停用了?
- 点击
按钮并获取信息。
- 点击
按钮并获取以下信息:
- 点击
- 有更新取消吗?
- 是否有超过 10 分钟的待处理更新队列?
监控锁条目(SM12)
执行事务 SM12 并在用户名字段中输入‘*’
SAP 提供锁定机制,以防止其他用户更改您正在处理的记录。在某些情况下,锁定不会被释放。如果用户在能够释放锁定之前因网络问题而断线,则可能会发生这种情况。
这些旧锁需要清除,否则可能会阻止访问或更改记录。
我们可以使用锁统计来监控系统中设置的锁。我们只记录那些日期时间戳为前一天的锁条目。
监控系统日志(SM21)
我们可以使用日志来查明并纠正系统及其环境中发生的错误。
我们使用以下选择/选项检查前一天的日志:
- 输入日期和时间。
- 选择单选按钮问题和警告
- 按重新读取系统日志。
调音总结 (ST02)
步骤1: 转到 ST02 检查调谐摘要。
步骤2: 如果您看到任何红色值,请在 SWAPS 中双击相同的值。
步骤3: 在下面的屏幕中单击“当前参数”选项卡
步骤4: 记下值和配置文件参数
步骤5: 转至 RZ10(更改配置文件参数值)
步骤6: 保存更改。
步骤7: 重新启动服务器以使新的更改生效。
CPU 利用率 (ST06)
空闲 CPU 利用率必须为 60-65%,如果超过该值,则我们必须至少开始检查以下事项:
- 运行操作系统级命令 - top 并检查哪些进程占用了最多的资源。
- 转到 SM50 或 SM66。检查是否有任何长时间运行的作业或任何正在运行的长时间更新查询。
- 转到 SM12 并检查锁定条目
- 转到 SM13 并检查更新活动状态。
- 检查 SM21 中的错误。
ABAP 转储 (ST22)
我们在这里检查前一天的转储
假脱机请求监控 (SP01)
对于假脱机请求监控,执行 SP01 并选择如下:
这里我们只记录那些因问题而终止的请求。
监控批处理作业(SM37)
对于监控后台作业,执行 SM37 并选择如下:
- 在用户名和职位名称字段中输入‘*’
- 在工作状态中,选择:已安排、已取消、已发布和已完成的请求。
事务 RFC 管理 (SM58)
事务性 RFC(tRFC,最初也称为异步 RFC) 是一种异步通信方式,在RFC服务器中调用的函数模块只执行一次。
我们需要选择想要查看 tRFC 的显示时间段,然后在用户名字段中选择“*”以查看所有尚未正确执行或在队列中等待的调用。
QRFC 管理(出站队列-SMQ1)
我们应该在这里指定客户端名称,并查看是否有任何传出的 qRFC 处于等待或错误状态。
QRFC 管理(入站队列-SMQ2)
我们应该在这里指定客户端名称,并查看是否有任何传入的 qRFC 处于等待或错误状态。
数据库管理(DB02)
选择后 当前尺寸 在第一个屏幕上,我们进入下面的屏幕,它向我们展示了系统中所有表空间的当前状态。
如果任何表空间超过 95% 并且自动扩展处于关闭状态,那么我们需要添加一个新的数据文件,以使数据库不至于太满。
我们还可以确定表空间的历史记录。
我们可以在这里选择“月份”、“星期”或“天”来查看表空间中发生的变化。
我们可以通过分析这些值来判断表空间的增长情况。
数据库备份日志(DB12)
从此事务中,我们可以确定系统最后一次成功备份的时间。我们可以查看前一天的备份,看看一切是否正常。
我们还可以检查重做日志文件,看看重做日志备份是否成功。
快速 RevIEW
日常监控任务
- 关键任务
- SAP 系统
- 数据库
关键任务
没有 | 任务 | 交易 | 程序/备注 |
---|---|---|---|
1 | 检查 R/3 系统是否启动。 | 登录 R/3 系统 | |
2 | 检查每日备份是否执行无错误 | DB12 | 检查数据库备份。 |
SAP 系统
没有 | 任务 | 交易 | 程序/备注 |
---|---|---|---|
1 | 检查所有应用程序服务器是否已启动。 | SM51 | 检查所有服务器是否已启动。 |
2 | 检查工作流程(从SM51开始)。 | SM50 | 所有处于“正在运行”或“等待”状态的工作流程 |
3 | 全球工作流程概述 | SM66 | 检查没有工作进程运行超过 1800 秒 |
3 | 查找任何失败的更新(更新终止)。 | SM13 |
|
4 | 检查系统日志。 | SM21 | 将日期和时间设置为上次日志审查之前。检查:
|
5 | Rev查看已取消的作业。 | SM37 | 在用户 ID 中输入星号 (*)。验证所有关键作业是否成功。 |
6 | 检查“旧”锁。 | SM12 | 输入星号 (*) 作为用户 ID。 |
7 | 检查系统上的用户。 | SM04AL08 | Rev查看未知或不同的用户 ID 和终端。此任务应每天执行几次。 |
8 | 检查线轴问题。 | SP01 | 输入星号 (*) 表示创建者,查看已“进行中”超过一小时的假脱机作业。 |
9 | 检查作业日志 | SM37 | 检查:
|
10 | Rev查看并解决转储。 | ST22 | 查找过多的转储。查找具有不寻常性质的转储。 |
11 | Rev查看缓冲区统计信息。 | ST02 | 寻找交换。 |
数据库
没有 | 任务 | 交易 | 程序 / 备注 |
---|---|---|---|
1 | Rev查看错误日志以了解问题。 | ST04 | |
2 | 数据库增长缺失索引 | DB02 | 如果表空间使用率超过 90%,则向其中添加新数据文件,重建缺失索引 |
3 | 数据库统计日志 | DB13 |