OpenAI推出高难度基准测试BrowseComp，挑战AI上网搜索能力_币安交易所-币安交易平台-全球领先的数字货币交易平台

币安交易所官网

全球著名的数字资产交易平台,200W人的选择

上币安,10元买比特币，立即注册并获得高达100 USDT的奖励

OpenAI推出高难度基准测试BrowseComp，挑战AI上网搜索能力

2025-04-11 币安交易所

PANews4月11日消息，Open AI已开源全新基准测试BrowseComp，用于评估AI代理在互联网上查找难以获取信息的能力。该测试包含1266个极具挑战性的题目，设计初衷为模拟AI在复杂信息网络中的“在线寻宝”，强调答案难找但易验证。测试中问题涵盖影视、科技、历史等多个领域，难度显著高于现有如SimpleQA等测试。

据AIGC开放社区称，这个测试基准非常有难度，连Open AI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0，即便使用带浏览器功能的GPT-4o也只有1.9%。但Open AI最新发布的Agent模型DeepResearch准确率高达51.5%。

风险提示

登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

猜你喜欢

币安交易所手续费指南：充值、交易和提现费用详解！

如何查看和管理币安钱包资产，以及在钱包之间进行资金划转

自定义您的币安App设置和通知：详细步骤指南

如何在币安交易所设置双重身份验证（2FA）？新手必读！

美SEC主席：加密市场是欺诈重灾区，投资者并未获得重要信息披露

币安交易所身份认证指南：新手必读！

币安交易所

上币安,10元买比特币。认证用户,可获得高达100 USDT的奖励

本站为您提供币安交易所官网的注册地址、加密货币及区块链的科普文章以及行业资讯等内容.