Anthropic社が65億ドルの資金調達後、Claude Opus 4.8を発売
ALSO: Wix 1,000人の雇用を削減、 Amazonトークン最大化が裏目に出る
Krishna ルンタ
2026 年 6 月 2 日
ようこそ! Guru99 AIレポート!
トップストーリー: こんにちは、友よ。今週のAIに関する最大の話題は、純粋なパワーではなく、誠実さについてだ。一方、エージェントたちは株式取引を行い、自らのミスを修正し、企業全体を揺るがしている。以下に多くの情報が詰まっているので、早速見ていこう。
🤖 クロード・オーパス4.8をご紹介します:これまでで最も高性能なモデル
簡単な概要:
Anthropicが発売されました クロード・オーパス4.8これまでで最もパワフルなモデルである 65億ドルの資金調達ラウンド 965億ドルの評価額で。今回のアップグレードはコーディングと推論能力を向上させるが、その際立った特徴は、驚くほど人間味あふれる点にある。 正直.
- 信じられないほどシンプル 4分の1の確率 コーディングの欠陥を見過ごし、 フラグの不確実性 虚勢を張って乗り切るのではなく。
- 新しい 努力管理 クロードの働き具合を自分で決めることができ、スピードと深さのトレードオフを考慮に入れることができます。
- 動的ワークフロー クロードに Code コードベース全体の移行といった大規模プロジェクトを処理するために、数百もの並列サブエージェントを実行します。
- 価格は据え置きです。 100万トークンあたり5ドル、100万トークンあたり25ドル.
- アントロピックが予告 神話さらに高度なモデルクラスが「今後数週間以内に」登場する予定です。
💡 なぜ気にする必要があるのか?
自信を持ってAI 事実を捏造する これは深刻な問題です。Opus 4.8が知らないことを認めようとする動きは、 幻覚の減少 そして、AIに頼るすべての人にとって、より信頼できる回答が得られるようになる。
🚀 Robinhood AIにポートフォリオの管理権限を委ねた
簡単な概要:
AIアシスタントはすでにあなたの受信トレイとカレンダーを管理しています。 Robinhood 彼らにあなたのポートフォリオを管理してもらいたいのです。これは新しいものです。 「エージェント取引」 beta では、AI エージェントを専用アカウントに接続し、予算を設定して、AI エージェントにあなたに代わって株式を売買させることができます (WSJ、FT)。
- Robinhood 使用されます MCP — AIツールを外部アプリに接続する標準 — エージェントをリンクするために 専用取引口座.
- エージェントはできます ポートフォリオを分析し、戦略を提案し、取引を実行する。 あなたが設定した範囲内で。
- Robinhood 株式以外の分野への拡大計画 オプション、暗号通貨、先物、イベントコングレスtracts、および予測市場.
- ゴールドカードユーザー また取得する 仮想カードアシスタントが設定された上限内で支出できるようにする。
- より大きな変化:エージェントアプリは今、 権限、支出制限、監査ログ、およびパニックスイッチ 焼き込まれている。無料体験はこちら)
💡 なぜ気にする必要があるのか?
AIは 「考えるのを手伝って」 〜へ 「私の代理として行動してください。」 エージェントが実際のお金に触れることができるようになると、問題はそれが できる そのタスクを実行する――最近では大抵はイエスだ。本当の問題は 何がうまくいかないのかもし試してみるなら、まずは少額の予算から始め、承認制を導入し、権限を委譲する前にすべての行動を精査するようにしてください。
📉 Wix AIとシェケル高がビジネスを再構築する中、1,000人の雇用を削減
簡単な概要:
ウェブサイト構築大手 Wix 約1,000人の従業員を解雇する 労働力の20% — の 史上最大規模の人員削減公開されたメモの中で、CEOのアビシャイ・アブラハミ氏は、この動きの理由として、イスラエル・シェケルの上昇と、ping AIを中心とした企業組織の再構築。
- 人員数は減少 5,277年から4,200年頃までチームの60%以上がイスラエルを拠点としている。
- A 急騰するシェケル 主にドルで収益を上げているが、給与のほとんどをシェケルで支払っている企業にとって、コストが膨らんでいる。 構造的圧迫 より良い製品でも解決できない問題。
- アブラハムはAIを呼んだ 1970年代以降、企業の構築方法における最大の変革管理職のフラット化と「Xengineer」や「AIネイティブの役割」と呼ばれるAIネイティブの役割の展開Creatorsの。」
- Wix Metaに参加します。 Cisco、そしてIntuit 同社は、株価が今年に入って50%以上下落しているにもかかわらず、人員削減をAIと結びつけている。
💡 なぜ気にする必要があるのか?
何百万ものウェブサイト構築を支援する企業がAIを中心に組織再編を行うとき、そのメッセージは率直だ。これは単なる新しいツールではなく、ping 誰が採用され、誰の役割が消滅するのか。
📊 AmazonスタッフのゲームAI指標によると、「トークンマキシング」が裏目に出る
簡単な概要:
Amazon 開発者にAIを使ってもらいたかったので、トークンの使用状況に基づいてスタッフのランキングを始めた。その結果は?従業員は今 無意味なタスクにトークンを浪費する 単にランキング上位を目指すためだけに、生産性向上をオフィスでの数字競争に変えてしまった。
- Amazon 目標を設定する 開発者の80%以上 AIを毎週使用する、 trac今年のスタッフランキングを通じたキングモデルとトークンの使用状況。
- 社内ツール メッシュクロー 従業員が、コードの展開、メールの分類、社内ソフトウェア全体での操作が可能なAIエージェントを構築できるようにする。
- スタッフ 言われ フィナンシャル·タイムズ 発生した圧力 「歪んだインセンティブ」 人々がトークンを無駄遣いして自分のステータスを水増ししている。
- Amazon 数字が示すように 業績評価には使用されませんそして、それ以降、個々の利用データを閲覧できるユーザーを制限している。
💡 なぜ気にする必要があるのか?
落とし穴はここにある。トークンカウンターはAIが 中古仕事がうまくいかなかったわけではない 優れたにつきましてはあまり気にしないでください。 より多くの企業が「トークンマックス」を採用、 報われる 質より量 従業員にスコアボードの数字を最適化するように訓練するだけだ。
🚀 OpenAIが、自律的に賢くなっていく税務AIを開発しました
簡単な概要:
OpenAIは 同社は「税務AI」をどのように構築したかを共有した。 ―複雑な税務申告書を作成し、その後、自ら学習して改善していくエージェント。Thrive Holdingsと会計ネットワークCreteと協力して、チームは Code会計士の修正を自動アップグレードに変換するツール。
- 画期的なのは精度ではなく、 自己改善ループ: 人間の会計担当者がエラーを修正するたびに、システムはそれを記録します。 Codexは、この問題の再発を防ぐための、テスト済みのコード変更案を提示する。
- 結果はすぐに現れた。フィールド精度75%のリターンは 6週間で25%から86%に増加最終的に ドラフト精度は最大97%.
- を越えて 30社以上の企業と約7,000件のリターン準備時間を約3分の1短縮し、処理能力を約50%向上させた。
- 厄介なのは単純なW-2ではなく 煩雑なK-1書類、賃貸スケジュール、そしてスプレッドシート ―通常、会計士の時間を費やす、判断力を要する業務。
💡 なぜ気にする必要があるのか?
エンジニアによる修正を待つことなく、自らのミスから学習するAIは、「エージェント」が熟練した職業における退屈で細かな部分をどれほど速く習得できるかを示唆している。
⚖️ 1つのプロンプトで、すべてのAIを並べて比較
このガイドでは、 OpenRouter Fusion 複数のAIモデルで同じプロンプトを一度にテストできます。5つのアプリを開いて推測するのではなく、出力結果を比較できます。 並んで そして、仕事用の簡単なカンニングペーパーを作成する。
ステップバイステップ:
1. OpenRouterアカウントを作成する
店は開いています OpenRouter Fusion AI の使用料の支払い方法を選択してください。 OpenRouterのクレジット or APIキー あなたは既に支払っています。
2. モデルを選択する
Fusionでは、比較したいモデルを選択します。 オーパス4.7 対 GPT5.4 対 グロク そして走る 一度に1つのベンチマークプロンプト、キーping どのモデルでも同一です。
3. プロンプトを試してみましょう
「あなたは、従業員20名のSaaS企業に対し、毎週の定例会議を非同期型の書面による進捗報告に置き換えるべきかどうかについて助言を行っています。3つのメリット、3つのリスク、そして2週間の実施計画を盛り込んだ推奨メモを作成してください。簡潔かつ実践的な内容にしてください。」
4. 結果を比較する
回答を開いて、 並列分析そして、どのモデルが最も優れたパフォーマンスを発揮するかをメモしてください。デモでは、おおよそ 10件の比較 周りの費用 40セント.
💡 プロのヒント
最もよく使うプロンプトを繰り返しベンチマークとして扱い、新しいモデルがリリースされるたびに再実行してください。モデルの更新に伴い、特定のタスクにおける「勝者」は急速に変化するためです。どのモデルが最適だったかを常に記録しておきましょう。 勝 タスクの種類ごとに、OpenRouter の機能を活用します。 モデルブラウザ 重さを量る ブランド and スピード さらなる支出をする前に、これを活用しましょう。時間が経つにつれて、これはあなた専用のルートマップとなり、お金と推測の両方を静かに節約してくれます。
やあ!私は Krishna ルンタ
創業者 Guru99.com編集長兼テクノロジー専門家
このメールはあなたに転送されましたか? こちらから無料でサインアップ.
