Per i piloti in voli di linea ed il personale al lavoro nelle centrali nucleari è norma il prendere parte a simulazioni di emergenze, così da imparare a conoscere le procedure monitorare i tempi di risposta ed creare una sorta di bagaglio culturale in caso di emergenza.
Allo stesso modo dovremmo preparare i nostri team.
Implementare uno scenario più o meno disastroso con lo scopo di testare tutte le procedure di recovery per garantire che, in caso di vero disastro, saremo pronti a reagire con sangue freddo ed in maniera quasi automatica.
L’unica maniera per arrivare a questi risultati è semplicemente il farlo, ed allenarsi a rispondere alle emergenze così da assimilare le procedure ed in un certo modo “automatizzare” il nostro comportamento escludendo l’emotività del momento.
Un geniale esempio di come applicare queste tecniche in IT viene da Netflix, il colosso dello streaming, che ha predisposto un team ed una suite di programmi con il solo scopo di creare problemi.
L’idea di base è proprio quella di prendersi dei rischi calcolati nello scollegare risorse dalla piattaforma di produzione, per capire se le automazioni e ed i team predisposti alle emergenze siano capaci di reagire in tempi ottimali.
Estratto da:
Do You Even DevOps? – Un manuale di sopravvivenza ad una metodologia non convenzionale di Matteo Castellani