第三方系统能耗分析实验

咱们今天就聊聊那个第三方系统能耗分析实验,主要是为了给后面系统优化找个数据支持。这年头企业对能效越来越看重,尤其是数据中心这种耗电大户。这次测试范围就是放在标准机柜里的一套完整业务系统,包含应用服务器、数据库服务器、网络设备和存储设备。为了看清楚它的能耗表现,我们在两种状态下测了,一种是典型工作负载,一种是峰值负载。 具体测了哪些东西呢?主要看系统总输入功率,也就是那个总供电回路的有功功率,用来了解整体耗电情况。还有功率动态变化,就是记录从空闲到峰值,中间负载变来变去时功率咋波动的。接着看电能消耗量,也就是一段时间里总共用了多少电。然后测功率因数,看电网资源利用得好不好。还有能效指标,比如单位业务吞吐量下的耗电量。最后看看设备表面温升,防止过热出问题。 为了把数据测准,我们用直接测量和模拟负载结合的方法。第一步先做个基准测试,系统开机后让它在没活儿干的状态下稳定跑30分钟,记录一下基础功耗。接下来是负载测试,用工具模拟用户访问压力,让并发量慢慢升到设计峰值,每个阶段至少跑满60分钟。在这个过程中用高精度功率分析仪一直盯着电压、电流这些数据,采样间隔不能超过1秒。同时还得同步记录系统的性能计数器,比如CPU利用率和吞吐量。到了峰值负载稳定的时候,再拿热像仪扫一下主要设备的表面温度,看看有没有潜在的过热风险。 这次用的仪器挺多:像FLUKE1735这样的高精度三相/单相功率分析仪;还有高性能负载生成服务器跟软件;FLIRE8这种红外热成像仪;数据记录系统也集成在了功率分析仪里;再加上温湿度计用来记录环境基准。 实验做完了总结一下,数据显示系统在典型负载下能效比是多少事务数/千瓦时,而且能耗跟负载增长不成线性关系。50%到80%的负载区间能效最好。不过我们也发现了一些问题:部分服务器单元在峰值时局部有点热点。所以建议企业关注轻负载下的耗电占比,考虑用虚拟化或者动态功耗管理来提效。 这次测试参考了很多国内外标准:GB/T30246.1-2013、ASHRAE Standard 90.4-2016、The Green Grid指标还有IEEE Std 2410-2020等等。希望能给大家的能效管理提供点实际参考,助力可持续发展。