システムログを用いた障害検出のためのログリプレイヤの開発の試み
近年のシステムは様々なサーバ,ネットワーク機器,アプリケーション等のソフトウェアとインフラストラクチャ(インフラ),ままたはクラウドサービスが複雑さに関係しあうシステムが多い.このように複雑化する一方で,ソフトウェア,またはインフラ,クラウド等を環境に合わせて正常に設定する必要がある.しかし,設定項目が多すぎるため,設定ミスによる障害の発生や,更にどの機器に原因が発生したのかがわからない上に特定する事には多大なコストがかかる.複雑なシステムの障害を検出するための第1段階としてソフトとインフラをシームレスにリプレイするログリプレイヤのプロトタイプを開発した