Πώς μια μόνο εταιρεία έριξε ένα τεράστιο τμήμα του διαδικτύου την περασμένη Τρίτη

ΑΠΕ-ΜΠΕ

Η επιδιόρθωση σφαλμάτων έγινε λιγότερο από οκτώ ώρες αργότερα.

του Chris Morris

Πολλά πράγματα έχουν «γκρεμίσει» το Διαδίκτυο στο παρελθόν. Η κυκλοφορία του iPhone 6. Η πρόκληση για το ice bucket challenge. Η πατατοσαλάτα στο Kickstarter. Αλλά την Τρίτη, τα πράγματα έφτασαν σε ένα εντελώς νέο επίπεδο.

Ένα σφάλμα στην εταιρεία cloud-computing Fastly έριξε γρήγορα πολλούς από τους μεγαλύτερους ιστότοπους του διαδικτύου, όπως της Amazon, του Reddit, του Spotify, του Twitch, του BBC, του CNN και των New York Times. Και όλα φαίνεται να οφείλονται στις ενέργειες ενός ατόμου.

Ενώ πολλοί θεωρούσαν ότι η διακοπή προκλήθηκε από χάκερ, η Fastly λέει ότι τα προβλήματα προέκυψαν λόγω αλλαγής των ρυθμίσεων χρήστη της υπηρεσίας που έγινε από έναν ανώνυμο πελάτη. Αυτό προκάλεσε ένα σοβαρό σφάλμα που κρύβεται σε μια ενημέρωση λογισμικού που κυκλοφόρησε η Fastly στις 6 Μαΐου. Και αυτό το σφάλμα είχε ως αποτέλεσμα την κατάρρευση που προκάλεσε το 85% του δικτύου της εταιρείας να βγάλει σφάλματα.

Δεν αποτελεί έκπληξη το γεγονός ότι η Fastly δεν προσδιορίζει το άτομο που έκανε την αλλαγή των ρυθμίσεων της υπηρεσίας.

Η εταιρεία αναφέρει ότι έκανε κάποιες διορθώσεις για να αποτρέψει την επανεμφάνιση της κατάστασης και θα κάνει έναν εσωτερικό έλεγχο για να καταλάβει γιατί δεν βρήκε το σφάλμα στις δικές της δοκιμές. Θα πραγματοποιηθεί επίσης πλήρης ανάλυση του συμβάντος.

«Παρόλο που υπήρχαν συγκεκριμένες συνθήκες που προκάλεσαν αυτή τη διακοπή, θα έπρεπε να το έχουμε προβλέψει», δήλωσε ο Nick Rockwell, ανώτερος αντιπρόεδρος μηχανικής και υποδομών της Fastly, σε μια ανάρτηση ιστολογίου. «Παρέχουμε υπηρεσίες κρίσιμης σημασίας και αντιμετωπίζουμε οποιαδήποτε ενέργεια που μπορεί να προκαλέσει ζητήματα στις υπηρεσίες μας με τη μέγιστη ευαισθησία και προτεραιότητα. Ζητούμε συγγνώμη από τους πελάτες μας και από όσους βασίζονται σε αυτούς για τη διακοπή και ευχαριστούμε ειλικρινά την κοινότητα για την υποστήριξή της».

Η Fastly λέει ότι εντόπισε τη διακοπή μέσα σε ένα λεπτό από την εμφάνισή της και είχε δημιουργήσει αντίγραφα ασφαλείας στο 95% του δικτύου της που επαναλειτούργησε εντός 49 λεπτών. Η επιδιόρθωση σφαλμάτων έγινε λιγότερο από οκτώ ώρες αργότερα.