重新审视人工智能评估:超越人类比较

2026-03-31 · MIT Tech Review AI · 原文链接

多年来,人工智能的表现主要通过与人类能力的比较来评估。无论是棋类、复杂数学、编程还是写作,AI系统都被测试与单个个体在人类面前完成这些任务的表现。这种方法虽然吸引人,但往往简化了AI的真正潜力,因为它仅限于评估孤立挑战的简单答案。随着我们在这一领域的进步,建立新基准以反映AI的多面性至关重要,重点关注其独特优势和协作潜力,而不仅仅是与人类表现进行对比。采取更广泛的视角可能为AI技术的更有意义的进步铺平道路。