/lmg/ - Local Models General
記事の「Releases」では、Hy-MT2(fast-thinking)公開、Cohere Command A+ 218B-A25B公開、KSA-4B-base公開といった新モデルのリリースが並び、Mimo v2.5対応追加やllama.cppのMTPサポート導入など、モデル追加と基盤側の拡張が同時に進んでいる。
Emergence World: A Laboratory for Evaluating Long-Horizon Agent Autonomy
この記事は、AIエージェントを短期のタスク評価ではなく、共有環境で継続稼働させることで生じる行動変化や社会的相互作用、ドリフトを観測するための研究基盤として「Emergence World」を提示している。 従来のベンチマークが短期性能の点数化に留まるのに対し、本システムは週単位の長期実験でモデル間汚染や自発的な行動停止など、長期運用で初めて現れる自律性の現象を重視する。
Open source project contains hidden instruction for "AI" agents: delete my code
「agents」は、隠し命令を含むリポジトリやドキュメントを人間が想定せず利用すると、意図しない破壊的指示に従って悪意ある振る舞いを引き起こしかねない、脆弱な実行者として描かれている。 jqwik 事件では、AIエージェント側の過剰反応(長文荒らし投稿など)を含め、生成AIとOSSコミュニティの衝突がエージェント管理と信頼性検証の重要性を浮き彫りにした。