2023/12/13 LAN接触不良 ダウン時刻、復旧時刻とも 時々断により明確では ありませんが、先週から 頻発していた模様です。
2023/12/4 不定期メンテナンス ダウン時刻:2023/12/4 00:00 復旧 時刻:2023/12/4 2:00 通常運用をするサーバーの引っ越しをしました。 Pentium J4205のシステムからCore i5 7300Uにのシステムに変更。
2023/7/12 システムダウン ダウン時刻:2023/7/12 15:10頃より後 復旧 時刻:2023/7/13 5:00 状況: 外部からのアクセス不可。 インターネット接続ルーター正常。 仮想環境サーバーマシンは通電中、HDDアクセス無し。 仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。 一旦、バックアップサーバで旧イメージによる代替運用に切り替えた後、故障サーバーの再構築を行い復旧。 但し直近数日分の投稿については、復旧後に再登録を行った関係で投稿日が7/13になりました。 詳細原因は不明です。 当時豪雨と、近隣での落雷が発生していました。 また、PC電源の電圧環境切り替えが、なぜか230V側になってました。(よく今まで動いていたものです。)不思議です。 気付くきっかけになったのは、SSDをレスキュー用のHDDに交換した時にスピンドルモーターが回らなくて、マザーボードのBIOS設定画面でCPU電圧など見ましたら、5Vも12Vも僅かに低い値でした。まさかと思いながらも電源ユニットを見て115V側になっていなかった事に気づきました。動いていたのが不思議です。 当然電源を抜いて、115V側にして、再起動させて見ましたら、レスキュー様に用意したHDDは正常にモーターが回り、認識できました。
2023/5/25 システムダウン ダウン時刻:2023/5/25 16:22頃より後 復旧 時刻:2023/5/26 17:31 2023/5/26 システムがダウンしている事を14:30頃に発見。 状況: 外部からのアクセス不可。 インターネット接続ルーター正常。 仮想環境サーバーマシンは通電中、HDDアクセス無し。 仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。 仮想環境マシンの再起動にて回復。 仮想環境マシンの強制停止と電源完全遮断を実施。 仮想環境マシンへの通電開始。電源ONシーケンスを実施。 仮想環境の再起動を実施し、各仮想マシンの起動後順次復旧。 システムの自動アップデートでエラーを検出したログが残されていました。 2023/3/7 システムダウン ダウン時刻:2023/3/7 01:08頃より後 復旧 時刻:2023/3/7 04:54 2023/3/7 システムがダウンしている事を04:30頃に発見。 状況: 外部からのアクセス不可。 インターネット接続ルーター正常。 仮想環境サーバーマシンは通電中、HDDアクセス無し。 仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。 仮想環境マシンの再起動にて回復。 仮想環境マシンの強制停止と電源完全遮断を実施。 仮想環境マシンへの通電開始。電源ONシーケンスを実施。 仮想環境の再起動を実施し、各仮想マシンの起動後順次復旧。 詳細については解析中。 先月先々月の15日のサーバーダウンとの関連は不明。 2023/2/15 システムダウン ダウン時刻:2023/2/15 11:00頃より後 復旧 時刻:2023/2/15 16:15 2023/2/15 システムがダウンしている事を16:00頃に発見。 状況: 外部からのアクセス不可。 インターネット接続ルーター正常。 仮想環境サーバーマシンは通電中、HDDアクセス無し。 仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。 仮想環境マシンの再起動にて回復。 仮想環境マシンの強制停止と電源完全遮断を実施。 仮想環境マシンへの通電開始。電源ONシーケンスを実施。 仮想環境の再起動を実施し、各仮想マシンの起動後順次復旧。 詳細については解析中。 先月15日のサーバーダウンとの関連は不明。
2023/1/15 システムダウン ダウン時刻:2023/1/12 9:00頃より後 復旧 時刻:2023/1/15 03:20頃 2023/1/15 2:00頃システムがダウンしている事を発見。 状況: 外部からのアクセス不可。 インターネット接続ルーター過負荷状態。 ルーターへのpingに対し、応答遅延3秒前後。 ルーターへのログインが困難。 仮想環境サーバーマシンは通電中、HDDアクセス無し。 仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。 ルーターの再起動を2度行い、過負荷が若干改善。 仮想環境マシンの強制停止と電源完全遮断を実施。 仮想環境マシンへの通電開始。電源ONシーケンスを実施。 仮想環境の再起動を実施し、各仮想マシンの起動後順次復旧。 具体的なシステムダウン発生時刻は不明 詳細については解析中。
2022/12/16 冷却FANの不調(唸り)対処 作業開始:2022/12/16 14:00頃 作業終了:2022/12/16 16:00頃 予備機に切り替えてから 修理を行い、修理完了後 切り戻しを行いました。 ※電源のFANにグリスを塗る予定でしたが、 PC電源に内蔵されていた冷却ファンは 「WAN CIONGLI DC 12V Cooling FAN」と言うタイプで、シールの裏に FANの軸にアクセスするサポーティング キャプの穴が存在せず、仕方なくFANの フレームとフィンの隙間にスプレー式の シリコングリスを少量吹き付けました。 音もなく回っていますが、暫くは注視 していきたいと思っています。
2022/8/6 システムのメンテナンスと更新 ダウン:2022/08/06 10:00頃 復 旧:2022/08/06 23:00頃 作業中も外部からのアクセスに応答できる様にしていましたが、コピーや圧縮やファイル転送の負荷が大きくて、応答がかなり遅れる症状があったと思います。
2022/7/4 システムクラッシュ
ダウン:2022/07/04 22:00頃
復 旧:2022/07/05 13:00頃
2022/07/04 22:00頃、外部よりログインを試みる動きを発見。
いつものことなので、
WEBアクセスのフロントエンドを受け持つサーバのファイアウォールに
該当IPアドレスからのアクセスを拒否する設定をしました。
そして、そのWebアクセスを受け付けるフロントエンドサーバーをリブート
しかし、シャットダウンも、リブートも出来ない状況に。
そこで、
仮想マシン環境自体をシャットダウンして、再起動することにしました。
しかし、シャットダウンが出来ません。
コンソールも反応がなくなりました。
仕方なく、強制電源OFFを行いました。
リブートさせると、ストレージのエラーが多発してました。
いつもなら、数分FSCK等して立ち上がってくるのですが、今回はだめでした。
5年くらい前から使っている、中古で入手したSSDです。
何度もリブートさせましたが、メンテナンスモードから先に進めません。
油断してました。日々バックアップをしていませんでした。
直近のバックアップは、2022年6月7日でした。
一先ず、
外付けSSDをUSBに繋いでマウントし、VM達の最新のバックアップを保存。
なんとか、最新の動作中の仮想マシンイメージも救出したかったのですが、
私の力量では出来ませんでした。
仕方なくPROXMOXの直近のバージョンをクリーンインストールしました。
バックアップしてあった、2022年6月7日のデータから再スタート。
2022年の6月7日 から、7月4日迄の間に投稿した内容や、
頂いていたコメント、ログが消えました。
ネットワーク環境を実験的に、かなりぐちゃぐちゃに弄っていた事や、
Proxmoxの内部を実験的に少しいじっていた事や
中古で入手したSSDの劣化や
強制電源OFFのタイミング等の何処か、
そう言う事の複合的な物が有ったのかも知れません。
2021/10/16 サーバー系のメンテナンス
10/15 10:00〜10/16 13:15まで、サーバ系メンテナンスにて
サーバーに繋がらない状態でした。
具体的には、DNSを弄っていて不調になり、
その影響でなのか?、操作端末の挙動が怪しくなりました。
その時、同時に、リバースプロキシーも操作していた事も有り、
リバースプロキシーのサーバーの設定もおかしくなったのか?
当方のサイトへのアクセスが重くなりました。
原因の切り分けをするため、一旦インターネットへの回線を切断し
その後、回線を接続しましたが、切断していた時間が数時間に及んだ
為か?、それまで長期に渡り使っていたIPアドレスはリリースされ、
それに変わり新たなIPアドレスが割り当てられて、再接続されました。
DNSサーバー、リバースプロキシーサーバーについては、過去のバックアップ
から復旧させました。
ファイアウォールの設定が、過去の状態に戻りますので、最新のインシデント
ログを元に、ファイアウォールの再設定を行いました。
2021/8/6 通信回線系のメンテナンス
18:00〜23:35まで、通信系メンテナンスにて
サーバーに繋がらない状態でした。
2020/6/30 サーバーメンテナンス
15:40〜23:35まで、ストレージ調整及び
インジケータパーツ交換、基盤システム
バージョンアップにて、サーバーの切り替え
切り戻しを複数回行いました。
2020/4/18 瞬断によるサーバーダウン
12:40〜13:35までサーバーがダウンしました。
当時、雷鳴と伴に小豆大の雹を伴う激しい降雨発生していました。
そのため、雷雨による電源の瞬断が原因だったと思われます
2020/01/07 一日サーバー停止
adminアカウントへのクラッキングを受け
11月22日のバックアップから復旧。
ブルート・フォース・アタックの疑いもありますが、
一応は対抗措置を取っていましたので、
ソーシャルエンジニアリングか、盗聴の可能性が高いかと思います。
一見、何らの被害も確認できませんでしたが、念のため、運用中の
インスタンスは削除し、バックアップからリストアしました。
WordPressの投稿日時もデータベースに反映されるのですが、
11月22日以降の投稿を2020/1/7に再インプットしたため、
データベース上1/7の日付で登録されました。
苦肉の策としまして、当初の投稿日を投稿記事の冒頭に記載しました。
2019/12/21 一日サーバー停止
電力系設備と空調設備のメンテナンスにて
2017/06/21 自宅停電
2017/06/20 自宅停電
2017/06/17 自宅停電
2017/06/16 ストレージパンク(写真アップロード超過)
2017/10/23 台風21号による停電 (2017/10/22 22:49頃発生 – 18:25 復旧 )
※当配電区域は23日の正午までに停電が復旧しましたが、 電力回復後システムアップデート等のメンテナンスを 実施した為、18:25に完全復旧致しました。
2017/10/24 昨日の停電の余波(と思われる)にて18:00頃〜22:00頃
※出掛けていたため、復旧までに時間がかりました。
2017/10/27 20:30頃復旧
※出掛けていたため、復旧までに時間がかりました。
参考:停電情報