当前位置:首页 期刊杂志

浅谈WEB服务器性能瓶颈的分析方法

时间:2024-05-19

赵 攀 殷启超

(甘肃省兰州石化公司研究院,甘肃 兰州 730060)

在一个软件应用系统中,不管是C/S架构还是B/S架构,服务器都扮演着举足轻重的角色。它象一个交通系统的枢纽,所以系统对服务器的要求都非常高,而在实际工作中对服务器的测试目的就是为了能够找出服务器的性能瓶颈并进行优化。一个完整的服务器系统,是由硬件和软件共同组成的。软件和硬件是相辅相成的,只有做到“软硬兼施”才能更大的发挥服务器的性能,提高服务器的稳定性。一般的应用软件都是以系统软件为基础来运行的,而操作系统是系统软件中最基础、最核心的部分。当谈及“性能瓶颈”这个术语时,映入脑海的主要热点词汇就是中央处理器,内存和网络问题阻碍服务器性能。这些都是探寻性能瓶颈问题的主要方面,但是它们并非性能问题产生的唯一原因。

1 常见性能问题

1.1 中央处理器(CPU)

中央处理器是服务器的大脑,是进行计算和指令运行的所在。中央处理器可以处理数百万条计算和指令,但是当所运行的计算数量超出了中央处理器的容量就会导致性能问题。中央处理器所承受的计算负载数量超过75%时就将让整个系统运转缓慢。当系统负荷在短期内达到100%时,中央处理器需要一些空间来应付爆炸性的高峰。中央处理器负荷是导致性能瓶颈的主要原因之一。

1.2 内存(Memory)

当性能问题指向内存时,解决性能平静的共识就是增加更多的内存。不过这种做法只在短期内是有效的。因内存导致的性能瓶颈通常源于设计欠缺的软件(内存缺口)或者其他由内存反映出来的系统漏洞。解决内存性能问题的关键是在再增加更多的随机存储器之前找到性能症状的根源。内存使用情况可能是系统性能中最重要的因素。如果系统“页交换”频繁,说明内存不足。“页交换”是使用称为“页面”的单位,将固定大小的代码和数据块从 RAM移动到磁盘的过程,其目的是为了释放内存空间。尽管某些页交换使Windows 2003能够使用比 实际更多的内存,也是可以接受的,但频繁的页交换将降低系统性能。减少页交换将显著提高系统响应速度。

1.3 网络(NET)

网络往往被大家认为是一种常见的性能瓶颈来源,但是事实上并非如此。除非有一个网络组件发生硬件故障。所以在你怀疑“网络”性能出现问题的时候最好检查一下其它地方。网络上感知到的运行缓慢问题通常应该指CPU、内存、恶意软件、工作负载、系统文件等其他问题。撇开网络的吞吐总量以及响应速度不讲,在高负载的环境下,系统的突发传输速率是非常重要的。尽管通过单一的T1或T3传输速率提供的总带宽对一个特定的站点而言也许绰绰有余,但其最大的传输速率(T1下为1.5mbit/s,T3下为4.5mbit/s)也可能不足以应付系统的高峰传输负载。在用户访问的高峰期,某些站点也许根本无法访问。这样的站点在用户企图访问它时显得慢如蜗牛,而服务器自身却仍旧非常空闲。

2 问题分析

2.1 处理器分析

2.1.1 首先看SystemTotal Processor Time性能计数器的计数值

该计数器的值体现服务器整体处理器利用率,对多处理器的系统而言,该计数器提醒所有CPU的平均利用率。如果该值持续超过90%,则说明整个系统面临着处理器方面的瓶颈,需要通过增加处理器来提高性能。

2.1.2 其次查看每个CPU的ProcessorProcessor Time和ProcessorUser Time和ProcessorPrivileged Time

ProcessorUser Time是系统非核心操作消耗的CPU时间,如果该值较大,可以考虑是否能通过友好算法等方法降低这个值。如果该服务器是数据库服务器,ProcessorUser Time值大的原因很可能是数据库的排序或是函数操作消耗了过多的CPU时间,此时可以考虑对数据库系统进行优化。

2.1.3 研究系统处理器瓶颈

查看 SystemProcessor Queue Length计数器的值,当该计数器的值大于CPU数量的总数+1时,说明产生了处理器阻塞。在处理器的Process Time很高时,一般都随处理器阻塞,但产生处理器阻塞时,ProcessorProcess Time计数器的值并不一定很大,此时就必须查找处理器阻塞的原因。

2.2 内存分析方法

内存分析用于判断系统有无内存瓶颈,是否需要通过增加内存等手段提高系统性能表现。内存分析需要使用的计数器:Memory类别和Physical Disk类别的计数器。内存分析的主要方法和步骤:

2.2.1 首先查看MemoryAvailable Mbytes指标

如果该指标的数据比较小,系统可能出现了内存方面的问题,需要继续下面步骤进一步分析。

2.2.2 注意Pages/sec、Pages Read/sec和Page Faults/sec的值

操作系统会利用磁盘较好的方式提高系统可用内存量或者提高内存的使用效率。这三个指标直接反应了操作系统进行磁盘交换的频度。如果Pages/sec的计数持续高于几百,可能有内存问题。但Pages/sec值不一定就表明有内存问题,可能是运行使用内存映射文件的程序所致。Page Faults/sec说明每秒发生页面失效次数,页面失效次数越多,说明操作系统向内存读取的次数越多。此事需要查看Pages Read/sec的计数值,该计数器的阀值为5,如果计数值超过5,则可以判断存在内存方面的问题。

2.2.3 根据Physical Disk计数器的值分析性能瓶颈

对Physical Disk计数器的分析包括对Page Reads/sec和Disk Time及Aerage Disk Queue Length的分析。如果Pages Read/sec很低,同时Disk Time和Average Disk Queue Length的值很高,则可能有磁盘瓶颈。但是,如果队列长度增加的同时Pages Read/sec并未降低,则是内存不足。

2.3 网络分析方法

Network InterfaceBytes Total/sec为发送和接收字节的速率,可以通过该计数器值来判断网络链接速度是否是瓶颈,具体操作方法是用该计数器的值和目前网络的带宽进行相除,结果小于50%。在实际测试过程中可以使用IOMeter进行如下测量:

2.3.1 Max IO

为了得到完整的磁盘性能数据,可以测试512Bytes到512MBytes等多种数据块大小,并分别测试了100%读取操作或100%写入操作下的表现,测试随机率可以从0%-100%,用于检测磁盘子系统的最大输入输出能力。从所有的数据中,可以分别得到的数据指IOps(每秒操作数)以及MBps(传输速率)。

2.3.2 File Server

文件服务器应用在一个多用户或网络化的环境中专门用于文件的储存,恢复和管理。不同用户的访问形成了多线程,因此,其工作负载是随机性的。输入输出大小是可变的,取决于所操作的文件大小。读/写分布也是变化的。总的来说,一个频繁使用的多用户服务器应该采用较高的队列深度来模拟。

2.3.3 Web Server

网站服务器应用于处理多用户通过Internet或Intranet进行的访问。这些请求具有典型的随机性,并且在用户访问不同页面或视频应用时大量偏向于读请求。同样,一个访问频繁网站服务器也应该采用较高的队列深度来模拟。最后,测试读取尺寸从512Bytes到512KB不等,100%读取操作,随机率为100%,用于模拟Web服务器的性能。在实际的桌面环境中,小于4KB的块访问数量不少,但是由于操作系统的缓存的存在而具有一定的降低,主要的块大小基于4KB。

3 分析小结

影响web服务器性能的因素数之不尽,要限制这些因素发挥作用,只能充分发挥人们的创造性思维。用来发布不同类型页面的Web系统对硬件的要求也是不一样的。本文只是粗略地介绍了搭建一个Web服务器要考虑的因素,我希望它能帮助你更好地去理解这些系统要求。在这个基础之上,今后,我们还将发表一些文章,介绍一下在Web服务器环境下的Athlon系统、对称多处理(SMP)系统以及它们在Web环境下的性能表现。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!