funini.com
自由研究
耐故障処理 (Fault Torelance System)
No.
5
Distributed System
Fault Tolerance
簡単なデモ
1)
一定間隔で値をファイルに記録
死んだらログを読んで処理継続
2)
親プロセスと子プロセスが存在
子が死んだら親が子を立ち上げる
3)
別プロセッサから
ps
の出力を監視
プロセスが死んだら、
rsh
で立ち上げる