返回分享长文网闻录11天前97 阅读长文网闻录11天前97 阅读来源: user网录录读完Anthropic内部关于AI智能体评测的实践(Demystifying evals for AI agents)的几点想法0097