きゅあったーメンテナンスでの話

前略

鴉河雛です

というわけで、きゅあったーメンテナンスでのことをまとめておきます。

長時間かかった原因

まず、Docker側で問題が発生しました

前々回のメンテナンスでDockerの容量不足に陥った際に対策をとっていたため、問題ないと判断していましたが、

docker-compose buildの際に一時フォルダに12GBのファイルが作成され、SSDの空き容量が空になりました。

その復旧として、Dockerの削除・再インストールを行い時間がかかってしまいました。

また、docker-compose buildが2時間以上かかる異常な状態となっていたため、余計に時間がかかっています。

次に、buildが終わった後のmigrateで処理が終わらない現象が発生しました

権限のアップデートで2時間近く動かない状態が続いたため、処理を中断。

v1.6.1へアップデートしてから(作業はv1.6.0へのアップデートだったが作業中にv1.6.1がリリースされた)

再度実施するが状況は改善せず、仕事が控えているため就寝せねばならず一旦サービスを停止する形になりました。

復旧に向けて

当初、v1.5.1に戻す予定でしたがDockerの問題が残っていたため、急遽Dockerを使わない方針に変更しました。

Dockerを使わないことで復旧することはできましたが、Redisを初期化したことによりホームTLは消えてしまいました。

今後ホームは直らないと思われますので、ご了承ください。

現在の問題

一時的に購読が切れているリモートユーザが存在していましたが、現在は直っていると思われます(対象のリモートユーザが投稿すれば直っているか確認できます)

OStatusとActivityPubで重複してしまっているユーザがいる

対策を調査中ですが、影響はなさそうです。

その他重大なエラーは発生していません。

とりあえず急ぎの共有です