美国公司研发人工智能测试平台,可比较AI模型!
美国领英正在测试一项新的人工智能功能Crosscheck,该功能允许用户直接在平台上比较几种流行的人工智能模型。用户在Crosscheck中输入提示,并收到来自OpenAI、Anthropic和谷歌等公司的竞争AI模型生成的两种不同响应。用户选择最佳答案后,每个答案背后的模型都会显示出来。
据称,领英将这项服务描述为对人工智能模型的一种盲品测试。交叉检查仅适用于文本,但对问题数量没有限制。与此同时,领英与人工智能公司共享匿名用户数据,以深入了解模型在不同专业群体中的表现。该功能最初面向美国用户,并计划很快扩展到更多国家和免费用户。AI常识测试 AI测评体系
