轻量部署中小网络神器,RG-UNC AS网络管理平台首发会
预约直播
产品
< 返回主菜单
产品中心
产品

交换机

交换机所有产品
< 返回产品
交换机主页
交换机

无线

无线所有产品
< 返回产品
无线主页
无线

云桌面

云桌面产品方案中心
< 返回产品
云桌面主页
云桌面

安全

安全所有产品
< 返回产品
安全主页
安全

算力评测

提供测试脚本对算力单元、整机、计算柜进行PCI带宽及压力、功耗、推理、及训练测试等,帮助客户评估实际运行过程的运行成本,从而选择性价比更高的硬件配置。

项目咨询
算力评测

评测内容

性能评测
在推理和训练过程中,评测每秒处理的 tokens 及生成延迟
吞吐性能
TTFT首Token延迟
TPOT单个Token生成延迟
QPs每秒处理请求数
吞吐性能

*高吞吐量意味着更高效的计算能力,每秒可以生成的tokens数量多少

TTFT首Token延迟

*用户感受到的从发出请求到第1个token输出的延迟

TPOT单个Token生成延迟

*生成阶段单个 token 的生成时间,体现了单个用户感受到的生成速度

QPs每秒处理请求数

*每秒可同时处理的请求

基准测试

基准测试

使用基准测试数据集(如MMLU、GPQA、HumanEval、GSM-8K、MATH、BBH、CEval)评估LLM在NLP任务、常识推理、数学推理等任务中的性能及精度,指导模型改进及优化。
资源利用

资源利用

评估显存和主存的使用情况,确保模型在推理和训练过程中不会超出资源限制。
扩展性

扩展性

测试在多 GPU 或分布式环境下的性能扩展能力,评估系统在增加计算资源时性能的提升情况。
功耗

功耗

静态或实际运行过程的功耗,评估对服务器的显卡插槽的供电要求。

评测资源

使用VLLM、Deepspeed等开源工具对各类算力单元、整机、计算柜进行大语言模型(LLM)推理、训练测试。使用llm-evaluation-harness工具对大型语言模型(LLM)进行基准测试

返回顶部

收起
请选择服务项目
关闭咨询页
售前咨询 售前咨询
售前咨询
售后服务 售后服务
售后服务
意见反馈 意见反馈
意见反馈
更多联系方式