新DeepSWE DeepSWE,由 Datacurve 团队推出。它专门用于衡量前沿编码 Agent 在真实、长周期软件工程任务上的表现,被认为是当前最能区分顶级模型能力差异的评测平台之一。 120 实用工具# AI前沿# CodingAgent# DeepSWE