重新审视人工智能评估：超越人类比较

2026-03-31 · MIT Tech Review AI · 原文链接

多年来，人工智能的表现主要通过与人类能力的比较来评估。无论是棋类、复杂数学、编程还是写作，AI系统都被测试与单个个体在人类面前完成这些任务的表现。这种方法虽然吸引人，但往往简化了AI的真正潜力，因为它仅限于评估孤立挑战的简单答案。随着我们在这一领域的进步，建立新基准以反映AI的多面性至关重要，重点关注其独特优势和协作潜力，而不仅仅是与人类表现进行对比。采取更广泛的视角可能为AI技术的更有意义的进步铺平道路。