更新:2026-05-29 17:55
编辑:梨盏
2026年5月29日凌晨,Anthropic正式发布ClaudeOpus4.8,至此ClaudeOpus4.8正式更新!让Claude变得更能干活了,判断力是它的最大突破!核心升级是写代码、用终端、操作电脑、处理知识工作、做金融分析。Opus4.8不是为“问答”而升级,而是为“代理执行”而升级。
ClaudeOpus软件手机APP版本可在https://m.lgsvs.com/app/1217.html中进行下载获取到最新安装包
在本周五也就是2026年5月29日凌晨,Anthropic正式发布了最新一代大模型ClaudeOpus4.8

新模型构建于Opus4.7基础之上,具备更敏锐的判断力,对自身进展的【诚实度】更高,并且能够比前一代模型更长时间地独立工作
简单来说,Opus4.8的核心升级是写代码、用终端、操作电脑、处理知识工作、做金融分析。更直白一点说,Opus4.8不是为“问答”而升级,而是为“代理执行”而升级。
这类软件的本质不是回答,而是行动。一个会行动的模型,最可怕的不是能力不足,而是能力不足却不知道自己不足,所以Opus4.8的提升点很重要,它更愿意指出不确定性,愿意在证据不足时停下来,等待你补充完整信息再去行动。Opus4.8让代码缺陷未经提醒通过的概率,比前代也低了很多
Anthropic对所有模型都进行了诚实性训练,例如训练它们避免做出那些无法提供佐证的断言。然而,AI模型普遍存在一个问题:它们有时会仓促下结论,尽管证据尚不充分,却依然自信地声称自己在工作中取得了进展。
Opus4.8更倾向于主动指出其工作中的不确定之处,且极少做出缺乏依据的断言。
Anthropic的内部评估结果也印证了这一点:数据显示,Opus4.8允许其编写的代码中存在缺陷却未加提示的概率,仅为其前代模型的四分之一左右。
评估结果还显示,Opus4.8出现【未对齐行为】(即偏离预期行为,例如欺骗用户或协助进行滥用操作)的发生率显著低于Opus4.7,且已达到Anthropic目前对齐效果最佳的模型ClaudeMythosPreview的同等水平。
网站声明:攻略文章为蓝光手游网所有,未经允许不得转载
复制本文链接