最近のサーバーダウン記録

2023/12/13 LAN接触不良
     ダウン時刻、復旧時刻とも
     時々断により明確では
     ありませんが、先週から
     頻発していた模様です。
2023/12/4 不定期メンテナンス
     ダウン時刻:2023/12/4 00:00
     復旧 時刻:2023/12/4 2:00
通常運用をするサーバーの引っ越しをしました。
Pentium J4205のシステムからCore i5 7300Uにのシステムに変更。
      
2023/7/12 システムダウン
     ダウン時刻:2023/7/12 15:10頃より後
     復旧 時刻:2023/7/13 5:00

       状況:
          外部からのアクセス不可。
          インターネット接続ルーター正常。
          仮想環境サーバーマシンは通電中、HDDアクセス無し。
          仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。

       一旦、バックアップサーバで旧イメージによる代替運用に切り替えた後、故障サーバーの再構築を行い復旧。
但し直近数日分の投稿については、復旧後に再登録を行った関係で投稿日が7/13になりました。
詳細原因は不明です。
当時豪雨と、近隣での落雷が発生していました。
また、PC電源の電圧環境切り替えが、なぜか230V側になってました。(よく今まで動いていたものです。)不思議です。
気付くきっかけになったのは、SSDをレスキュー用のHDDに交換した時にスピンドルモーターが回らなくて、マザーボードのBIOS設定画面でCPU電圧など見ましたら、5Vも12Vも僅かに低い値でした。まさかと思いながらも電源ユニットを見て115V側になっていなかった事に気づきました。動いていたのが不思議です。
当然電源を抜いて、115V側にして、再起動させて見ましたら、レスキュー様に用意したHDDは正常にモーターが回り、認識できました。
2023/5/25 システムダウン
     ダウン時刻:2023/5/25 16:22頃より後
     復旧 時刻:2023/5/26 17:31

       2023/5/26 システムがダウンしている事を14:30頃に発見。
       状況:
          外部からのアクセス不可。
          インターネット接続ルーター正常。
          仮想環境サーバーマシンは通電中、HDDアクセス無し。
          仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。

       仮想環境マシンの再起動にて回復。
        仮想環境マシンの強制停止と電源完全遮断を実施。
        仮想環境マシンへの通電開始。電源ONシーケンスを実施。
        仮想環境の再起動を実施し、各仮想マシンの起動後順次復旧。

              システムの自動アップデートでエラーを検出したログが残されていました。

2023/3/7 システムダウン
     ダウン時刻:2023/3/7 01:08頃より後
     復旧 時刻:2023/3/7 04:54

       2023/3/7 システムがダウンしている事を04:30頃に発見。
       状況:
          外部からのアクセス不可。
          インターネット接続ルーター正常。
          仮想環境サーバーマシンは通電中、HDDアクセス無し。
          仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。

       仮想環境マシンの再起動にて回復。
        仮想環境マシンの強制停止と電源完全遮断を実施。
        仮想環境マシンへの通電開始。電源ONシーケンスを実施。
        仮想環境の再起動を実施し、各仮想マシンの起動後順次復旧。

       詳細については解析中。
       先月先々月の15日のサーバーダウンとの関連は不明。

2023/2/15 システムダウン
     ダウン時刻:2023/2/15 11:00頃より後
     復旧 時刻:2023/2/15 16:15

       2023/2/15 システムがダウンしている事を16:00頃に発見。
       状況:
          外部からのアクセス不可。
          インターネット接続ルーター正常。
          仮想環境サーバーマシンは通電中、HDDアクセス無し。
          仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。

       仮想環境マシンの再起動にて回復。
        仮想環境マシンの強制停止と電源完全遮断を実施。
        仮想環境マシンへの通電開始。電源ONシーケンスを実施。
        仮想環境の再起動を実施し、各仮想マシンの起動後順次復旧。

       詳細については解析中。
       先月15日のサーバーダウンとの関連は不明。
       
2023/1/15 システムダウン  
     ダウン時刻:2023/1/12 9:00頃より後
     復旧 時刻:2023/1/15 03:20頃

       2023/1/15 2:00頃システムがダウンしている事を発見。
       状況:
          外部からのアクセス不可。
          インターネット接続ルーター過負荷状態。
          ルーターへのpingに対し、応答遅延3秒前後。
          ルーターへのログインが困難。
          仮想環境サーバーマシンは通電中、HDDアクセス無し。
          仮想環境サーバーマシン及び各仮想マシンへのpingに応答なし。

       ルーターの再起動を2度行い、過負荷が若干改善。
       仮想環境マシンの強制停止と電源完全遮断を実施。
       仮想環境マシンへの通電開始。電源ONシーケンスを実施。
       仮想環境の再起動を実施し、各仮想マシンの起動後順次復旧。

       具体的なシステムダウン発生時刻は不明
       詳細については解析中。
2022/12/16 冷却FANの不調(唸り)対処
     作業開始:2022/12/16 14:00頃
     作業終了:2022/12/16 16:00頃

       予備機に切り替えてから
       修理を行い、修理完了後
       切り戻しを行いました。

 ※電源のFANにグリスを塗る予定でしたが、
   PC電源に内蔵されていた冷却ファンは
 「WAN CIONGLI DC 12V Cooling 
   FAN」と言うタイプで、シールの裏に
  FANの軸にアクセスするサポーティング
  キャプの穴が存在せず、仕方なくFANの
  フレームとフィンの隙間にスプレー式の
  シリコングリスを少量吹き付けました。
  音もなく回っていますが、暫くは注視
  していきたいと思っています。
2022/8/6 システムのメンテナンスと更新 
      ダウン:2022/08/06 10:00頃
      復 旧:2022/08/06 23:00頃

作業中も外部からのアクセスに応答できる様にしていましたが、コピーや圧縮やファイル転送の負荷が大きくて、応答がかなり遅れる症状があったと思います。

      
2022/7/4 システムクラッシュ  
      ダウン:2022/07/04 22:00頃
      復 旧:2022/07/05 13:00頃

      2022/07/04 22:00頃、外部よりログインを試みる動きを発見。
      いつものことなので、
      WEBアクセスのフロントエンドを受け持つサーバのファイアウォールに
      該当IPアドレスからのアクセスを拒否する設定をしました。
      そして、そのWebアクセスを受け付けるフロントエンドサーバーをリブート
      しかし、シャットダウンも、リブートも出来ない状況に。
      そこで、
      仮想マシン環境自体をシャットダウンして、再起動することにしました。
      しかし、シャットダウンが出来ません。
      コンソールも反応がなくなりました。
      仕方なく、強制電源OFFを行いました。
      リブートさせると、ストレージのエラーが多発してました。
      いつもなら、数分FSCK等して立ち上がってくるのですが、今回はだめでした。
      5年くらい前から使っている、中古で入手したSSDです。
      何度もリブートさせましたが、メンテナンスモードから先に進めません。
      油断してました。日々バックアップをしていませんでした。
      直近のバックアップは、2022年6月7日でした。
      一先ず、
      外付けSSDをUSBに繋いでマウントし、VM達の最新のバックアップを保存。
      なんとか、最新の動作中の仮想マシンイメージも救出したかったのですが、
      私の力量では出来ませんでした。
      仕方なくPROXMOXの直近のバージョンをクリーンインストールしました。
      バックアップしてあった、2022年6月7日のデータから再スタート。
      2022年の6月7日 から、7月4日迄の間に投稿した内容や、
      頂いていたコメント、ログが消えました。

      ネットワーク環境を実験的に、かなりぐちゃぐちゃに弄っていた事や、
      Proxmoxの内部を実験的に少しいじっていた事や
      中古で入手したSSDの劣化や
      強制電源OFFのタイミング等の何処か、
      そう言う事の複合的な物が有ったのかも知れません。
      

2021/10/16 サーバー系のメンテナンス
      10/15 10:00〜10/16 13:15まで、サーバ系メンテナンスにて
      サーバーに繋がらない状態でした。
      具体的には、DNSを弄っていて不調になり、
      その影響でなのか?、操作端末の挙動が怪しくなりました。
      その時、同時に、リバースプロキシーも操作していた事も有り、
      リバースプロキシーのサーバーの設定もおかしくなったのか?
      当方のサイトへのアクセスが重くなりました。
      原因の切り分けをするため、一旦インターネットへの回線を切断し
      その後、回線を接続しましたが、切断していた時間が数時間に及んだ
      為か?、それまで長期に渡り使っていたIPアドレスはリリースされ、
      それに変わり新たなIPアドレスが割り当てられて、再接続されました。
      DNSサーバー、リバースプロキシーサーバーについては、過去のバックアップ
      から復旧させました。
      ファイアウォールの設定が、過去の状態に戻りますので、最新のインシデント
      ログを元に、ファイアウォールの再設定を行いました。
2021/8/6 通信回線系のメンテナンス
      18:00〜23:35まで、通信系メンテナンスにて
      サーバーに繋がらない状態でした。
2020/6/30 サーバーメンテナンス
      15:40〜23:35まで、ストレージ調整及び
     インジケータパーツ交換、基盤システム
     バージョンアップにて、サーバーの切り替え
     切り戻しを複数回行いました。
2020/4/18 瞬断によるサーバーダウン
      12:40〜13:35までサーバーがダウンしました。
      当時、雷鳴と伴に小豆大の雹を伴う激しい降雨発生していました。
      そのため、雷雨による電源の瞬断が原因だったと思われます
2020/01/07 一日サーバー停止
      adminアカウントへのクラッキングを受け
      11月22日のバックアップから復旧。
      ブルート・フォース・アタックの疑いもありますが、
      一応は対抗措置を取っていましたので、
      ソーシャルエンジニアリングか、盗聴の可能性が高いかと思います。
      一見、何らの被害も確認できませんでしたが、念のため、運用中の
      インスタンスは削除し、バックアップからリストアしました。
      WordPressの投稿日時もデータベースに反映されるのですが、
      11月22日以降の投稿を2020/1/7に再インプットしたため、
      データベース上1/7の日付で登録されました。
      苦肉の策としまして、当初の投稿日を投稿記事の冒頭に記載しました。

2019/12/21 一日サーバー停止
      電力系設備と空調設備のメンテナンスにて

2017/06/21 自宅停電
2017/06/20 自宅停電
2017/06/17 自宅停電
2017/06/16 ストレージパンク(写真アップロード超過)
2017/10/23 台風21号による停電  (2017/10/22 22:49頃発生 – 18:25 復旧 )

              ※当配電区域は23日の正午までに停電が復旧しましたが、
                電力回復後システムアップデート等のメンテナンスを
                実施した為、18:25に完全復旧致しました。

2017/10/24 昨日の停電の余波(と思われる)にて18:00頃〜22:00頃

              ※出掛けていたため、復旧までに時間がかりました。

2017/10/27 20:30頃復旧

              ※出掛けていたため、復旧までに時間がかりました。
参考:停電情報