タグ

LLM

LLM に関連する記事をまとめています。

LLM アプリの観測性 — トークン・コスト・ハルシネーションを計測する

LLM アプリの観測性は 普通の Web アプリの観測性 + LLM 固有のメトリクス が必要です。トークン消費・コスト・レイテンシ・ハルシネーション率・ユーザー評価を OpenTelemetry ベースで計測し、改善のフィードバックループを回す設計を整理します。

Claude Opus 4.7 とは何か?2026年4月リリースの新モデル・xhigh・/ultrareview を整理

Anthropic は2026年4月16日に Claude Opus 4.7 をリリースしました。Opus 4.6 から 「難タスクのコーディング」 「Vision の解像度3倍」 「命令追従の厳密化」 が改善され、新しい 「xhigh」 努力レベルと Claude Code の 「/ultrareview」 コマンドが追加されています。価格据え置きでベンダー横断(Bedrock / Vertex / Foundry)対応。リリースの中身と実務インパクトを整理します。