Anthropic公司在融资65亿美元后推出Claude Opus 4.8
另外: Wix 裁员1,000人 Amazon's tokenmaxxing 适得其反
Krishna 伦塔
2026 年 6 月 2 日
歡迎來到 Guru99份人工智能报告!
热门故事: 嗨朋友,本周人工智能领域最大的新闻并非关乎强大的力量,而是关乎诚信。与此同时,人工智能代理们正在交易股票、纠正自身错误,甚至撼动整个公司。以下内容信息量很大,让我们一起来看看吧。
🤖 隆重推出 Claude Opus 4.8:迄今为止功能最强大的型号
简讯:
Anthropic刚刚推出 克劳德作品 4.8该公司发布了迄今为止最强大的机型——就在同一天,它还宣布了一项大规模的…… 65亿美元融资 估值高达965亿美元。此次升级提升了代码编写和推理能力,但其最突出的特点却是令人耳目一新的人性化: 诚实.
- 这是 可能性降低四倍 放任代码缺陷而不被发现,并且更愿意 标志不确定性 而不是靠虚张声势蒙混过关。
- 质量的新标准 努力控制 让你决定克劳德的工作强度,在速度和深度之间进行权衡。
- 动态工作流程 让克劳德 Code 运行数百个并行子代理来处理大型项目,例如代码库范围的迁移。
- 价格保持不变: 每百万输入代币收费 5 美元,每百万输出代币收费 25 美元.
- 人种学派的挑衅 神话更智能的车型系列即将推出,“未来几周内”上市。
💡 你为什么要关心?
人工智能自信地 捏造事实 这是一个真正的问题。Opus 4.8 试图承认自己不知道的事情,这可能意味着…… 幻觉减少 对于依赖人工智能的人来说,这是更值得信赖的答案。
🚀 Robinhood 你刚刚把投资组合的控制权交给了人工智能。
简讯:
人工智能助手已经可以管理你的收件箱和日历了。现在 Robinhood 希望他们管理你的投资组合。这是新的。 “代理人交易” beta 版允许您将 AI 代理连接到专用帐户,设置预算,并让它们代表您买卖股票(WSJ,FT)。
- Robinhood 使用 MCP ——一种将人工智能工具与外部应用程序连接起来的标准——将代理连接到 专用交易账户.
- 代理商可以 分析投资组合,提出策略建议,并执行交易 在您设定的范围内。
- Robinhood 计划将业务拓展到股票以外的领域 期权、加密货币、期货、事件合约tracts 和预测市场.
- 金卡用户 也得到 虚拟卡允许助理在设定的限额内消费。
- 更大的转变:代理应用程序现在需要 权限、消费限额、审计日志和紧急开关 烤制而成。看看它怎么运作)
💡 你为什么要关心?
人工智能正在从 “帮我思考一下” 至 “代表我行事。” 一旦经纪人能够接触到真金白银,问题就不再是他是否能做到了。 也可以是 完成任务——如今这方面的答案大多是肯定的。真正的问题是: 可能会出什么问题如果你想尝试,请从小额预算开始,要求审批,并在移交更多控制权之前审查每一个步骤。
📉 Wix 人工智能和强势谢克尔重塑商业格局,裁员1,000人
简讯:
网站建设巨头 Wix 该公司将裁员约1,000人——约 20%的员工 - 在里面 这是该公司历史上最大规模的裁员。在一份公开发布的备忘录中,首席执行官阿维沙伊·亚伯拉罕将此举归因于两方面因素:以色列新谢克尔走强和……ping 围绕人工智能对公司进行重组。
- 员工人数下降 5,277 年至 4,200 年左右其中超过 60% 的团队成员位于以色列。
- A 激增的舍客勒 对于一家主要以美元赚取收入但大部分工资以谢克尔支付的公司来说,这推高了成本—— 结构挤压 更好的产品也无法解决问题。
- 阿布拉哈米称之为人工智能 这是自 20 世纪 70 年代以来公司构建方式的最大转变扁平化管理,并推出名为“Xengineer”和“人工智能原生角色”的人工智能角色Creator。
- Wix 加入 Meta, Cisco以及 Intuit 尽管该公司股价今年已下跌超过 50%,但仍将裁员与人工智能联系起来。
💡 你为什么要关心?
当一家帮助数百万用户构建网站的公司围绕人工智能进行重组时,传递的信息很明确:这不仅仅是新的工具——而是重塑。ping 谁被录用,谁的职位消失。
📊 Amazon“Tokenmaxxing”策略适得其反,因为员工游戏AI指标
简讯:
Amazon 它希望开发人员使用人工智能,于是开始根据代币使用情况对员工进行排名。结果如何?员工现在…… 在毫无意义的任务上浪费代币 只是为了攀升排行榜,把提高生产力变成了办公室里的数字游戏。
- Amazon 设定一个目标 80%以上的开发者 每周使用人工智能, trac今年通过员工排名实现国王模型和代币使用。
- 其内部工具 网爪 允许员工构建人工智能代理,这些代理可以部署代码、分类电子邮件并在公司软件中运行。
- 教职员 告诉 金融时报 产生的压力 “反常激励机制”, 有人浪费代币来提升自己的属性。
- Amazon 数字显示 不用于绩效考核此后,该公司限制了哪些人可以查看个人使用数据。
💡 你为什么要关心?
关键在于:代币计数器证明人工智能是 用过的并不是说工作没了 更好。 如 更多公司开始采用“代币最大化”策略 奖励 数量超过质量 只是培训员工如何优化记分牌。
🚀 OpenAI 刚刚开发出一款税务人工智能,它会不断自主学习,变得越来越智能。
简讯:
OpenAI 刚刚 分享了它如何构建“税务人工智能” ——一位能够起草复杂税务申报表并不断自学以提升自身能力的代理人。该团队与 Thrive Holdings 和会计网络 Crete 合作,运用了其 Codex 工具可以将会计师的更正转化为自动升级。
- 突破点不在于准确性,而在于…… 自我提升循环每次人工会计纠正错误时,系统都会记录下来, Codex 提出了一项经过测试的代码更改方案,以防止该问题再次发生。
- 结果很快就显现出来了——命中率达到了75%,从 六周内从 25% 增长到 86%,最终达到 选秀准确率高达 97%.
- 横过 30多家公司和约7,000份回报它将准备时间缩短了约三分之一,并将产量提高了约 50%。
- 棘手的部分并非简单的W-2表格,而是 杂乱的K-1年级学生资料、租赁时间表和电子表格 ——这是一项需要大量判断的工作,通常会占用会计师大量的时间。
💡 你为什么要关心?
人工智能能够从自身的错误中学习,而无需等待工程师进行修补,这暗示了“智能体”能够以多快的速度吸收熟练职业中繁琐、细节繁重的部分。
⚖️ 一个提示,每个人工智能:并排比较
在本指南中,您将学习如何使用 OpenRouter Fusion 同时测试多个 AI 模型对同一提示的响应。与其打开五个应用进行猜测,不如直接比较输出结果。 并排 并制作一份工作用的快速速查表。
一步步:
1. 创建一个 OpenRouter 帐户
可选 OpenRouter Fusion 并选择您希望如何为人工智能的使用付费—— OpenRouter 积分 or API密钥 你已经为此付费了。
2. 选择模型
在 Fusion 中,选择要比较的模型——我们测试过 电视剧4.7 与 通用技术 5.4 与 格罗克 ——然后跑 一次只提示一个基准测试问题,keeping 各个型号都一样。
3. 尝试提示
“您正在为一家拥有 20 名员工的 SaaS 公司提供建议,该公司正在考虑是否用异步书面更新取代每周一次的状态会议。请撰写一份建议备忘录,列出 3 项好处、3 项风险以及一个为期 2 周的实施计划。务必保持简洁实用。”
4. 比较结果
打开回复,阅读以下内容 并排分析并注意哪个模型表现最佳。在演示中,大约 10 比较 花费 40美分.
💡 专业提示
将您最常用的提示作为重复性基准——每当有新模型发布时就重新运行它们,因为对于特定任务,“最佳模型”会随着模型的更新而快速变化。持续记录哪个模型表现最佳。 胜 针对每种类型的任务,并依靠 OpenRouter 的 模型浏览器 称重 车资 和 速度 在进行更多消费之前,请先做好规划。随着时间的推移,这将演变成一份个性化的路线图,悄然为您节省金钱和避免不必要的猜测。
嘿!我是 Krishna 伦塔
创始人 Guru99.com主编兼技术专家
这封电子邮件转发给您了吗? 在这里免费注册.
