Home / 2026 May


Yoshiya@kt3kMay 28, 2026

MCP って要するに dynamic に tool call (function calling) を足せるっていう話だから、やっぱり便利な気がする。

Coding Agent はまあ CLI 叩くで代用すれば良いかもしれないけど、Coding じゃない Agent は普通 CLI 叩くなんて許可されないので、MCP でカスタマイズするのがお行儀が良さそう。

MCP がワークしてなく感じるのは、Coding Agent に MCP を刺すのがイマイチ (そもそも Coding Agent は与えられてる裁量がデカすぎる) という話でしかなくて、一般の chatbot に合理的かつ dynamic に機能を足すプロトコルとして MCP は理にかなっていると思う。


Yoshiya@kt3kMay 26, 2026

ソースコード読まない派がひとしきり騒いだ後でソースコード読む派が大量に現れたので、やっぱり読む派の方が多そう


Yoshiya@kt3kMay 26, 2026

web ページのデザインの比較をしたい時に、agent に幾つか挙げさせて、その上で「全部ブラウザで開いて」って言って、ブラウザタブ8個とか開かせるのがすごい気持ち良い


Yoshiya@kt3kMay 26, 2026

日本の X の AI 界隈、ソースコードは読まないのが正みたいな方向に行ってるけど、普通に work しないと思う。

読んだ方が AI がやっている事を具体的に理解できる。読まないで挙動だけから判断してたら間接的にしか分からない。

読んでれば何か起きた時にすぐに気づける。読んでないと間違いに気づくのが遅れるし、間接的にしか分からないので、現象の切り分けの難易度が上がる。


Yoshiya@kt3kMay 25, 2026

https://deno.com/blog/v2.8#settimeout-and-setinterval

Deno 2.8、setTimeout と setInterval が Node の Timeout オブジェクトを返すようになってしまった。実害がありそうな breaking change で、とても微妙な気がする。

release note のコメント「breaking change だけど実質影響はない」みたいに書かれているけど、あまり調べた形跡がない。というかちゃんと調べたら大きい実害が発見されるはず (Record<string, number> に setTimeout の返り値入れてるとかあるはず)。だいたい WPT が落ちるようになる変更が実害じゃないという考え方がちょっとおかしい。



Yoshiya@kt3kMay 25, 2026

https://x.com/kenn/status/2058435100380209639

「ソースコードを1行も読まない」で「複雑性は管理する」っていうのはどういう事だろう。中身を読まないで挙動だけでみていたら中身が複雑かどうかは分からないのでは。

中身を一切見ないコーディングが vibe coding で、それではワークしないことが分かってきたので agentic engineering にシフトしようというのが今の流れのはず



Yoshiya@kt3kMay 18, 2026

grafana で初めて本格的なダッシュボード作ったけど、これって、複雑すぎる事象を無理やり GUI に落とし込んだ事で迷いの森のようになったアプリケーションという感じだ。Photoshop とか MS Office と同じ匂いがする。


Yoshiya@kt3kMay 18, 2026

codex をちょびちょび使ってるけど、何をやっているか、何を考えているかがすごく分かりやすい感じがする。モデルの違いというよりは、ハーネス側がうまく/丁寧に作られているような印象を受ける。


Yoshiya@kt3kMay 18, 2026

arxiv を引用しまくった「凄そうな記事」を誰でも一瞬で錬成できてしまう。技術記事の内容のインフレが起きてる


Yoshiya@kt3kMay 15, 2026

claude desktop から remote host 上で session 動かすようにしたらめちゃくちゃ快適だ。

claude の session 本体 (プロセス) が remote で動くようになるので、PC を閉じても session が動きぱなしになってくれる。尚且つ PC を開けたら自動で繋ぎに行ってくれる。

昨日まで remote 内の tmux 内で作業してたけど、それだと window 切り替え等が面倒で「今どこだっけ」の認知コストが高かった。claude desktop から繋げることで普通の chat AI 使う感覚で session に繋ぎ直せる。楽。

尚且つ、画面の表現力が上がって diff などが見やすいし、コピペとか、スクロールバックも terminal よりやりやすくて快適。


Yoshiya@kt3kMay 14, 2026

知識を問うスクリーニングはもはやほとんど意味がないような気がする。それは AI に聞けば全部すぐ分かる。

それよりもモチベーションとか好みとか趣向とか AI を使っても変えられない属性を見る方が重要な気がする。


Yoshiya@kt3kMay 14, 2026

Codex 使い始めてみた (とりあえずデスクトップアプリデフォルトのgpt-5.5 medium)。Claude Code (Opus 4.7) より何をやっているかの開示が多くて、安心してみていられる感じがする。

作業自体は少し Claude Code (Opus 4.7) より遅いような気がするけど、何となく丁寧に作業してくれている感じがする。Codex の方が良いエンジニアのマナーがハーネスに丁寧に埋め込まれているような印象。Claude Code は雑に頼むと作業が雑になるイメージがある。

ブランチの同じ状態に対して kt:simplify を掛けてみたら、Opus 4.7 の方が適切な改善点を見つけられたケースがあった。地頭自体は Opus 4.7 の方が上かもしれない


Yoshiya@kt3kMay 14, 2026

最近サプライチェーン攻撃が起きまくっているけど、アタッカー側が AI で脆弱性探してるから見つかりやすくなってるていうのはありそう。

で、ここまでサプライチェーン攻撃が起きると、そもそも誰が作ったか分からないエコシステムに乗るのが危ないという話になってくる (すでに昔からなってる) 訳で、今や AI に欲しい依存に等しい機能を都度作って貰えば、別にエコシステムに依存する必要がなくなるので、そもそもエコシステムの物をダイレクトにインストールして使うみたいな事がアンチパターン視されるようになるかもしれない。

実際、hono 使いたければ、hono を参考に hono と同じライブラリ書いて、っていうプロンプト (厳密には、どうやってポートするかもうちょっと指示した方が良さそう) をスキル化して回せば、公開レジストリに依存せずにそのライブラリを使うことが出来る。そしてサプライチェーンリスクが無くなる。


Yoshiya@kt3kMay 14, 2026

みんな(ソフトウェア業界)がすごい勢いで変わっている


Yoshiya@kt3kMay 13, 2026

Codex デスクトップアプリ初めて使った。めちゃくちゃ良い。今までターミナルで Agent 並べてたのは何だったんだという感じになった


Yoshiya@kt3kMay 11, 2026

自分のスキルが 0 に近い分野のことを AI にやらせても結局自分がボトルネックになってうまくいかない感じがする (自分がその分野の「当たり前」をキャッチアップすることにほとんどの時間が消費される)

ほとんどの作業をやるのが AI だとしても、AI にやらせることが自分が元々得意な事であった方が成果が出易い感じがする。

昔大企業に属していた時に、ソフトウェアを知ってるディレクターの開発チームと、知らないディレクターの開発チームでは、前者の方が圧倒的にパフォーマンスが良かったのと同じように、中で起こっていることを理解している人が指揮するのと、理解してない人が指揮するのではパフォーマンスが圧倒的に違う。


Yoshiya@kt3kMay 7, 2026

An argument against, or a note to, "Coding is solved".

If a target program can be described precisely in natural language, coding agents can write it for you.

If there is no natural language vocabulary to describe it, then you suddenly need to write that program in programming language.

--

Let's call the first category A software, and the 2nd B software.

What I've been always interested in is B software. I loved software engineering because it can find something extraordinay, amazing, which is undiscoverable without programming language vocabulary.

To me, software engineering is about exploring something which cannot be written by coding agents.


Yoshiya@kt3kMay 7, 2026

Coding is solved. https://www.lennysnewsletter.com/p/head-of-claude-code-what-happens

A bold claim. I partially agree with it in a sense that coding agents can now make an exact program when we can prompt it very clearly and exactly. If you can describe your program completely precisely, then you can let agents write it.

However such process isn't the only part of software creation.

I've been building bw, a 2d top down exploration game, for about 2 years. I have very picky preference about every detail of it. The process of making it is like process of paiting a large picture. I write a line of code, and get the feedback from it, and then evaluate it against my preferences. Sometimes take it, and sometimes discard it just like painters removing or keeping lines while drawing.

There are very complex and entangled correlation between code, result, and my preference in the creation of bw. I'm almost certain nobody can make a prompt to coding agents which produces the current state of bw. I actually already tried that and already failed. There's too much details and the amount I needed to ask to the coding agent was very close to (or maybe more than) what I need to write in programming language.


Yoshiya@kt3kMay 1, 2026

chappy, OS っていう単語をメチャクチャ比喩的に使ってくるな。何の学習データに引きずられてるんだろう


Yoshiya@kt3kMay 1, 2026

Claude Managed Agent って Claude Code 使える訳ではないのか