サーバー プログラミング ソフトウェア 2026.05.22 82 ウォッチドッグとは — 止まったプロセスを検知して再起動させる「番犬」の仕組み ウォッチドッグ(watchdog)は元々「番犬」を意味する英語で、IT では「定期的に生存確認をして、応答が止まったら相手を強制的に再起動させる仕組み」を指します。ハードウェアタイマー、systemd、Kubernetes の liveness probe、Python の watchdog ライブラリなど、同じ名前で全く違うレイヤの仕組みが存在します。それぞれの役割と使い分けを整理します。 # 監視 # SRE # ウォッチドッグ
プログラミング ソフトウェア 2026.04.23 55 DORA指標とは?開発速度と安定性をどう見るのか DORA指標とは何かを、開発速度と安定性をどう見るかの基本として、デプロイ頻度、変更リードタイム、変更失敗率、復旧時間、リワーク率の考え方まで整理します。 # DevOps # 運用 # SRE
ソフトウェア セキュリティ 2026.04.23 59 インシデントコマンダーとは?障害対応で判断をまとめる役割 インシデントコマンダーとは何かを、障害対応で判断と役割分担をまとめる役割として、技術対応役との違い、必要な動き、小規模チームでの回し方まで整理します。 # 障害対応 # インシデント対応 # インシデントコマンダー