Facebookov neuspjeh pokazuje zašto se ne bismo trebali oslanjati na njega za sve

Sadržaj:

Facebookov neuspjeh pokazuje zašto se ne bismo trebali oslanjati na njega za sve
Facebookov neuspjeh pokazuje zašto se ne bismo trebali oslanjati na njega za sve
Anonim

Ključni podaci za van

  • Tehnički problemi Facebooka bili su nesretni, ali problem bi vjerojatno bio riješen mnogo brže da se nije oslanjao na toliko međusobno povezanih sustava.
  • Ne postoji način da se kvarovi sustava potpuno spriječe, ali postoje načini da ih smanjite.
  • Posjedovanje rezervnih planova kada (a ne ako, kada) sustav zakaže može napraviti razliku između 'iritantnog' i 'katastrofalnog.'
Image
Image

Nedavni debakl na Facebooku pokazuje kako su međusobno povezani sustavi osuđeni na neuspjeh i zašto ih ne bismo trebali koristiti za sve.

Gubitak Facebooka, WhatsAppa i Instagrama na nekoliko sati u ponedjeljak bio je neugodan, štetan za tvrtke, au nekim slučajevima i gotovo katastrofalan. Prema Facebooku, sve je to zbog promjena konfiguracije njegovih usmjerivača koji koordiniraju mrežu.

To je razumno objašnjenje, ali činjenica da jedna takva pogreška može zaustaviti ne samo Facebook nego i druge sustave u vlasništvu Facebooka je pomalo alarmantna.

Jedna pogrešna promjena konfiguracije usmjerivača uzrokovala je potpuni prestanak rada više usluga, pa čak i VR slušalica. Povrh toga, prema vlastitom priznanju Facebooka, to je također imalo kaskadni učinak na način na koji podatkovni centri kompanije komuniciraju, dovodeći sve njihove usluge do zaustavljanja.

"Oslanjanje na međusobno povezane sustave nosi sa sobom inherentni rizik od kvara sustava ili čak usluge", rekao je Francesco Altomare, viši tehnički inženjer prodaje u GlobalDotsu, u intervjuu e-poštom za Lifewire, "Kako bi se suprotstavile ovom zastrašujućem riziku, tvrtke koriste načelo SRE (System Reliability Engineering), kao i druge alate, koji se svi bave različitim razinama redundancije ugrađene u svaki sloj infrastrukture sustava."

Image
Image

Što može poći po zlu

Vrijedi napomenuti da kada takav sustav zakaže, obično je potrebna savršena oluja stvari koje idu po zlu. Manje je kao kula od karata koja čeka da padne, a više kao otvoreni toplinski ispušni otvor na svemirskoj postaji veličine malog mjeseca.

Većina tvrtki poduzima korake kako bi osigurala da se jedina stvar koja bi sve bacila u kaos nikada ne dogodi - ali bez obzira na to, može se dogoditi.

"Neočekivani kvarovi dio su poslovanja i mogu nastati kao rezultat nemara radnika, grešaka u mreži pružatelja internetskih usluga ili čak problema s uslugama pohrane u oblaku", rekla je Sally Stevens, suosnivačica FastPeopleSearcha, u intervju e-poštom.

"…Sve dok se provode potrebni koraci za zaštitu sustava-kao što su sigurnosne kopije, usmjerivač na licu mjesta i višeslojni pristup-ovi su kvarovi vrlo malo vjerojatni." Iako čak i s vojskom sigurnosnih uređaja, i dalje je moguće da osovina zakaže.

Ako sustav koji kontrolira stvari kao što su primarni oblici kontakta, uređaji, vrata itd. zakaže, rezultati mogu biti značajni. Od blagih neugodnosti do potpune katastrofe, ovisno o tome koliko se pojedinci i tvrtke oslanjaju na sve to.

Image
Image

"Također postoji rizik da hakeri uđu u sustav s bilo kojeg od najmanje zaštićenih uređaja, kao što su hladnjaci i tosteri za pećnice," dodao je Stevens, "što bi moglo dovesti do krađe podataka i ransomwarea."

Kako se možemo pripremiti

Ne postoji način da se zajamči da sustav nikada neće zakazati, ali postoje koraci koji se mogu poduzeti kako bi se smanjila vjerojatnost kvara ili lakše rješavalo kvar. Idealna bi bila kombinacija dvaju pristupa koji spajaju zaštitu od greške i protumjere s planovima za nepredviđene situacije i pričuvnim sustavima.

"Za uklanjanje ovih opasnosti koje stvaraju proizvodi i usluge trećih strana kojima se učinkovito rukuje, uloge i dužnosti u vezi s upravljanjem rizikom trećih strana moraju biti strogo istaknute," rekla je Daniela Sawyer, osnivačica i glavna tehnološka direktorica FindPeopleFast, u intervjuu e-poštom, "Da bi napredovali u ovom novom okruženju, menadžeri rizika moraju shvatiti bitne dijelove tako sofisticiranog ekosustava."

Ono što se dogodilo s Facebookom, WhatsAppom i Instagramom bilo je nesretno, ali također, nadamo se, otvorilo je oči. Ljudi koji se oslanjaju na međusobno povezane sustave moraju shvatiti da prava stvar koja krene po zlu može poremetiti sve. I moraju se uvesti mjere (ili pažljivo ispitati i poboljšati) kako bi se takvi poremećaji učinili manje vjerojatnim i manje utjecajnim.

U slučaju Facebooka, njegov problem nisu bili problemi s usmjerivačem, već to što je gotovo cijeli njegov ekosustav bio povezan sa svim ostalim. Dakle, s padom Facebooka (usluge), Facebook (tvrtka) je morao potrošiti mnogo više vremena i energije na jednostavno organiziranje i rješavanje problema. Da nije koristio tako duboko ukorijenjen, međusobno povezan sustav ili da nije imao rezervne planove za rješavanje takvog ispada, vjerojatno bi bilo potrebno mnogo manje vremena za popravak.

Preporučeni: