benchmark是什么？

所属分类：- AI

---
title: benchmark是什么？
date: 2026-02-10 15:29:01
categories:
- AI
- AI agent概念&术语
tags:
- benchmark
- 基准测试
---

“Benchmark”（中文常译为基准测试或性能基准）是一个用来衡量和比较系统、程序、硬件、算法或其他技术性能的标准或测试方法。

你可以把它想象成一场“标准化的比赛”：
比如，要比较两辆汽车谁跑得更快，不能一辆在平地上跑，另一辆在上坡跑——必须在相同的赛道、相同的规则下比赛，这个“标准比赛”就是一种 benchmark。

假设全班同学都做同一张数学试卷（题目一样、时间一样），最后看谁得分高。
这张试卷就是一个 benchmark —— 它公平地衡量了每个人的能力。

Benchmark 就是一把“尺子”，用来客观地量一量某个东西到底有多快、多准、多强。

无论是手机、显卡、AI 模型，还是数据库、网络速度，都可以通过 benchmark 来科学地比一比！

登录 找回密码