AI最新情報

GoogleのSmart PasteとGLM-5.1が示す開発AIの変化

記事バナー画像

POINT

  • GoogleはコピペをAIが自動補正する「Smart Paste」を社内展開し、提案の45%が受け入れられ、全社コードの1%超を生成している
  • GLM-5.1は「Long-Horizon Tasks(複数ステップにわたる長期タスク)」への対応を掲げ、AIエージェントが開発作業を継続実行する方向へシフトしている
  • この2つを重ねると、開発フローが「人が書く→AIが補正」から「AIが継続実行→人が判断」へと移行しつつある構造が見えてくる

コピペは手入力の4倍――Googleが着目した「見えない手間」

Googleの社内調査が明らかにした数字は、開発者の直感と一致する。コードの貼り付け操作は、手動入力より4倍の頻度で行われている。ほとんどのエンジニアはコピペを「作業の一部」として意識すらしないが、そこに毎日膨大な後処理が積み上がっている。

貼り付けた直後に何が起きるか。変数名の置き換え、インデントの修正、スタイルの統一、PythonからGoへのクロス言語翻訳。どれも数秒から数十秒の作業だが、1日に何十回と繰り返せば無視できないコストになる。Smart Paste: Automatically Fixing Copy/Paste for Google Developers はこの「貼り付け後の編集」を丸ごと自動化しようとした試みだ。深層学習で編集パターンを予測できることは以前から研究で示されていたが、Googleはそれを実際の開発環境に組み込み、反復改善を重ねてスケールさせた。研究ではなく、製品として動かした点が核心にある。

45%の受け入れ率が意味すること

Smart Pasteの提案は45%の確率で受け入れられた。GitHub Copilotのコード補完受け入れ率が業界的に20〜30%台で語られることを考えると、高い数字だ。ただし裏を返せば、55%は却下されている。AIが貼り付けの意図を読み違えたケースが半数以上あるわけで、現状では人間の確認が不可欠だ。

より注目すべきは規模の話だ。受け入れられた提案がGoogle全社で書かれたコードの1%超を占めるという事実は、単一機能としては異例の貢献率を示す。コピペという、これまで誰も「自動化の対象」と思っていなかった操作に介入するだけで、これだけのコード量を動かせる。日常業務の中に、まだ自動化されていない高頻度操作が隠れているという証拠でもある。

CursorやGitHub Copilotを使うエンジニアにとって、このアプローチは身近に映るはずだ。インライン補完ではなく「操作イベント(貼り付け)に反応して提案を出す」という設計は、次のIDEアップデートで自分のツールにも入ってくる可能性がある。

Smart Pasteの主要実績
コピペ頻度 4 手入力と比較して 提案受け入れ率 45% 受入 却下 却下は55% 全社コード貢献 1 %超 単一機能として異例の規模 コピペ頻度 4 手入力と比較して 45% 提案受け入れ率 受入 45% 却下 55% 人間の確認が不可欠 全社コード貢献 1 %超 単一機能として異例の規模
高い受け入れ率と異例のコード貢献規模を示している

GLM-5.1が示す「長期タスク」という次の戦場

Smart Pasteが「一瞬の操作」を自動化するなら、GLM-5.1: Towards Long-Horizon Tasks が向かうのは正反対の時間軸だ。Long-Horizon Tasks――複数のステップをまたいで数分から数時間かけて完遂するタスク――への対応を、GLM-5.1は開発の主軸に据えている。

Claude CodeやDevinが示したように、AIエージェントが「コードを書く→テストを走らせる→エラーを読む→修正する」という連鎖を自律的に回せるかどうかが、2025年以降のAI開発ツールの評価軸になりつつある。GLM-5.1はこの流れに乗る動きで、単発の質問応答ではなくタスクの完遂を目標とする設計思想を前面に出している。

現時点で詳細なベンチマーク数値は限られているが、「Long-Horizon」を製品名レベルで掲げること自体が、開発元ZhipuAIの技術的な賭けを示している。Hacker Newsでは362ポイントを集め105件のコメントが寄せられており、開発者コミュニティの関心は高い。

「貼り付け補正」と「長期タスク」を組み合わせると何が起きるか

挿絵

この2つのアプローチは、開発フローの異なるレイヤーを担う。Smart Pasteはミクロの操作単位に介入し、GLM-5.1系のエージェントはマクロのタスク単位を引き受ける。両方が成熟したとき、開発者の役割はどう変わるか。

現実的な近未来像はこうだ。エージェントがIssueを読んで実装を進め、途中で既存コードを参照しながら貼り付け、そのたびにSmart Paste的な補正が走る。人間が介入するのは方向性の確認と最終レビューだけ。コードを「書く」行為そのものへの関与が、どんどん薄くなっていく。

ただし、現状のSmart Pasteが55%の提案を却下されているように、エージェントも文脈の読み違いを起こす。エラーの発見と判断の委任をどう設計するかが、実務で使えるかどうかの分水嶺になる。Claude Codeで長期タスクを走らせた経験があるエンジニアなら、「エージェントが意図と違う方向に走り続ける」という痛みはすでに知っているはずだ。

まとめ

Smart PasteとGLM-5.1が示すのは、AI支援の粒度が「補完」から「操作単位の補正」と「タスク単位の遂行」へと分化しているという構造変化だ。Claude CodeやCursorを使うなら、今確認すべきは「自分の開発フローの中でどの操作が高頻度で繰り返されているか」。そこに次の自動化が入ってくる。そしてエージェントに任せる範囲が広がるほど、「どこで人間が判断を引き取るか」の設計が、開発者の本当の仕事になっていく。