博客
关于我
云计算之路-阿里云上:结合IIS日志分析“黑色30秒”问题
阅读量:422 次
发布时间:2019-03-06

本文共 1235 字,大约阅读时间需要 4 分钟。

今天,我需要处理一个关于“黑色30秒”问题的分析。根据之前的猜测,问题可能出在Requests Queued上升,原因是处理中的请求无法及时完成,导致客户端等待时间过长。今天,我打算结合IIS日志进行验证,以更准确地找出问题根源。

首先,我回顾了IIS日志中的time-taken指标。这个指标不仅记录了请求在服务器端的执行时间,还包括了响应内容从服务器发送到客户端的网络时间。从IIS 6.0开始,time-taken会包括网络时间。这意味着,当服务器发送大量数据给客户端时,尤其是在网络速度较慢的情况下,time-taken的值可能会比预期的大。

接着,我分析了性能监视器中的一个记录:13:47:13,耗时562ms的请求。由于time-taken包括了网络时间,这个请求的实际结束时间可能会比562ms更长。因此,我查看了IIS日志,发现对应的记录显示time-taken为2640ms,比Request Execution Time多了大约2秒。这表明,在ASP.NET将请求发送给客户端后,服务器还等待了2秒才能收到客户端的确认包。

这让我进一步思考:为什么会出现这么长的延迟?根据IIS日志中的描述,HTTP.sys在发送响应内容前会等待客户端确认接收最后一个数据包,或者等待客户端重置TCP连接。这可能意味着网络连接出现了问题,导致客户端无法及时确认接收,或者TCP连接被意外断开。

为了验证这个假设,我查看了其他相关指标。性能监视器显示,Requests Queued在高峰期急剧上升,这可能是由于处理中的请求无法及时完成,导致队列积压。Arrival Rate突降意味着客户端到达率下降,这可能与网络连接问题或客户端问题有关。CPU消耗突降也可能表明服务器在处理请求时遇到了性能瓶颈,可能是由于网络延迟或资源争夺。

此外,Current Connections在13:47:16达到了最高点,这可能表明有大量的连接请求在短时间内到达服务器,超过了处理能力,导致连接数激增。这种情况可能与网络连接的状态有关,例如,客户端或服务器端的连接被错误地保留,或者网络性能不佳,无法及时释放连接。

综合以上分析,我怀疑问题可能出在网络连接上。特别是在13:47:15,服务器可能在发送响应内容后,等待客户端确认接收,但客户端未能及时响应,导致time-taken延长。这可能是因为网络延迟、客户端连接问题,或者是TCP连接被意外断开的情况。

为了进一步排查,我计划检查网络连接的状态,查看是否有异常断开或连接被阻塞的情况。此外,还可以分析是否存在客户端连接问题,例如客户端是否处于缓慢或不稳定的网络环境中,或者客户端是否存在连接超时等问题。

总体来看,今天的分析让我对问题有了更深入的理解,即请求处理时间的延长可能与网络连接有关,特别是在客户端确认接收数据包方面。接下来,我需要与网络团队合作,检查网络连接的状态,并进行更多的排查,以确保问题能够得到根本性解决。

转载地址:http://oiekz.baihongyu.com/

你可能感兴趣的文章
ng 指令的自定义、使用
查看>>
nghttp3使用指南
查看>>
Nginx
查看>>
nginx + etcd 动态负载均衡实践(三)—— 基于nginx-upsync-module实现
查看>>
nginx + etcd 动态负载均衡实践(二)—— 组件安装
查看>>
nginx + etcd 动态负载均衡实践(四)—— 基于confd实现
查看>>
Nginx + Spring Boot 实现负载均衡
查看>>
Nginx + uWSGI + Flask + Vhost
查看>>
Nginx - Header详解
查看>>
nginx 1.24.0 安装nginx最新稳定版
查看>>
nginx css,js合并插件,淘宝nginx合并js,css插件
查看>>
Nginx gateway集群和动态网关
查看>>
Nginx Location配置总结
查看>>
Nginx Lua install
查看>>
Nginx upstream性能优化
查看>>
Nginx 中解决跨域问题
查看>>
nginx 代理解决跨域
查看>>
Nginx 动静分离与负载均衡的实现
查看>>
Nginx 反向代理 MinIO 及 ruoyi-vue-pro 配置 MinIO 详解
查看>>
nginx 反向代理 转发请求时,有时好有时没反应,产生原因及解决
查看>>