Надали Марк Зукърбърг чете коментарите, които хората оставят в публикациите му във Facebook. Но ако ги прочете, ще му отнеме приблизително 145 дена, без да спи, за да премине през пороя от коментари, оставени за него, след като се извини за срива на услугите миналата седмица.

„Съжалявам за прекъсването днес”, обяви основателят и изпълнителен директор на Facebook, след като миналият понеделник почти шест часа липсваха Facebook, WhatsApp и Instagram. Компанията посочи като причина рутинна работа по поддръжката. Инженерите били написали команда, която неволно изключила центровете за данни на Facebook.

Около 827 000 души са отговорили на извиненията на Зукърбърг. Съобщенията варират от забавните: „Беше ужасно, трябваше да говоря със семейството си”, до смутеното: „Занесох телефона си в сервиза, мислейки, че е счупен”, разказва BBC. Повечето обаче изразяват разстройване и яд: „Не можете да изключите всичко едновременно. Въздействието е безпрецедентно”. Мнозина искат компенсация за смущенията в бизнеса им.

Това, което вече е ясно, е колко много милиарди хора са разчитали на услугите на социалната мрежа – не само за забавление, но и за важна комуникация и търговия. Ясно е и, че това далеч не е еднократна ситуация: експертите предполагат, че масовите прекъсвания стават все по-чести и по-опустошителни.

„Едно от нещата, които видяхме през последните няколко години, е колко много разчитаме на малък брой мрежи и компании за доставяне на големи части от интернет съдържанието”, казва Люк Дерикс, главен технически директор в Down Detector. „Когато един от тях или няколко имат проблем, той засяга не само самите тях, но и стотици хиляди други услуги”.

Facebook се използва от много бизнеси, а наред с това служи и за влизане в други уеб услуги и приложения. Всички те също не можеха да се използват, защото не можеха да вземат логин данните от Facebook профилите.

Дерикс и неговият екип в Down Detector следят уеб услугите и сайтовете за прекъсвания. Шефът казва, че широко разпространените прекъсвания, засягащи големите услуги, стават все по-чести и все по-сериозни.

„Когато Facebook има проблем, той оказва голямо въздействие върху интернет, но и върху икономиката като цяло – и върху обществото. Милиони или потенциално стотици милиони хора просто седят и чакат един малък екип в Калифорния да поправи нещо. Това е интересно явление”, коментира Дерикс. Но не е първото от този вид.

Значителни сривове

Преди „грешка при конфигурирането” да свали Facebook, Instagram и WhatsApp за близо 6 часа, имаше и други големи сривове в последно време:

Юли 2021: Над 48 услуги, включително Airbnb, Expedia, Home Depot и Salesforce, бяха изключени за около час след грешка в системата за домейн-имена (DNS) при компанията за доставка на съдържание Akamai. То последва подобно прекъсване в компанията месец по-рано;

Юни 2021: Amazon, Reddit, Twitch, Github, Shopify, Spotify, няколко новинарски сайтове бяха блокирани за около час, след като неизвестен досега бъг бе задействан случайно от клиент на доставчика на облачни изчисления;

Декември 2020: Gmail, YouTube, Google Drive и други услуги на Google паднаха едновременно за около 90 минути, след като компанията заяви, че е срещнала „проблем с вътрешната квота за съхранение”;

Ноември 2020: Технически проблем в едно от съоръженията на Amazon Web Service във Вирджиния, САЩ, засегна хиляди онлайн услуги на трети страни за няколко часа, предимно в Северна Америка.

Март 2019: Facebook, Instagram и WhatsApp се сринаха или бяха сериозно прекъснати за около 14 часа след „промяна в конфигурацията на сървъра”. Други сайтове, включително Tinder и Spotify, които използват Facebook за логване, също бяха засегнати.

Човешки грешки

Неизбежно при подобно голямо прекъсване на услугите много хора се притесняват, че то е резултат от някаква кибератака. Но експертите предполагат, че по-често проблемът се дължи на по-обикновени причини и най-вече на човешка грешка. А тези причини се усложняват от начина, по който интернет е изграден, в това число от сложен набор от остарели и неудобни системи.

Интернет изследователят професор Бил Бюканън е съгласен с тази теза: „Интернет не е мащабната разпределена мрежа, която DARPA някога се е опитала да проектира и изгради и която би могла да издържи на ядрен удар. Протоколите, които използва, са основно такива, които са изготвени още когато се свързвахме към мейнфрейм компютри от „глупави” терминали. Един-единствен проблем в основната му инфраструктура може да доведе до разбиване на всичко”.

Професор Бюканън казва, че могат да се направят подобрения, за да стане по-устойчива глобалната мрежа, но че много от основите ѝ ще си останат такива, каквито са – за добро или лошо.

„Като цяло системите работят и не можете просто да изключите определени протоколи на интернет за един ден, за да се опитате да ги преработите”, казва той. Професорът смята, че трябва да подобрим начина, по който използваме интернет за съхранение и споделяне на данни, в противен случай рискуваме по-масови прекъсвания в бъдеще.

Бюканън твърди, че интернет е станал твърде централизиран, т.е. в много случаи твърде много данни идват от един източник. Тази тенденция трябва да бъде спряна. Това може да стане чрез системи, които имат множество възли, обяснява той, така че никой отказ не може да попречи на дадена услуга да работи.

Поуките

Това е момент, в който от нас зависи дали ще използваме случая по градивен начин – или не. Въпреки че значителните прекъсвания на интернет услуги засягат живота и бизнеса на много потребители, тези потребители могат в крайна сметка да помогнат за подобряване на устойчивостта на интернет и на включените в него уеб услуги.

Така например, Forbes изчислява, че Facebook е загубил 66 млн. долара по време на шестчасовото прекъсване – заради поевтиняване на акциите или оттегляне на рекламодатели от сайта. Този вид загуба вероятно ще насочи съзнанието на висшите ръководители към предотвратяване на повторение на инцидента.

„Те загубиха огромна сума пари през този ден – не само в цената на акциите си, но и в оперативните си приходи”, според Дерикс. „И ако погледнете прекъсванията, причинени от мрежи за доставка на съдържание като Fastly и Cloudflare, те също загубиха огромен брой клиенти заради конкуренцията. Затова мисля, че тези оператори ще правят всичко възможно, за да поддържат всичко онлайн”.

Коментари