Παροδική διακοπή κεντρικών υπηρεσιών του ΚΗΔ - Ετήσια άσκηση ετοιμότητας

Έναρξη προβλήματος: 25-07-2023 13:00
Λήξη προβλήματος: 25-07-2023 16:25
Κατάσταση δελτίου: Κλειστό
Τύπος δελτίου: Προγραμματισμένη Εργασία
Καταγράφων τεχνικός ΜΨΔ: Γεώργιος Πάλλας
Χρόνος αποκατάστασης: 3 ώρες, 25 λεπτά
Αποκατάσταση από: Κέντρο Ηλεκτρονικής Διακυβέρνησης
Τρέχουσα σοβαρότητα: Κύριο σύστημα παραγωγής εκτός λειτουργίας που επηρεάζει όλους τους χρήστες

30-06-2023 11:27 - Αρχική περιγραφή δελτίου

Την Τρίτη 25 Ιουλίου στις 13:00, το Κέντρο Ηλεκτρονικής Διακυβέρνησης (ΚΗΔ) προγραμματίζει την ετήσια άσκηση ετοιμότητας, κατά την οποία θα υπάρξει πλήρης διακοπή λειτουργίας των κεντρικών πληροφοριακών υποδομών που βρίσκονται στο πρωτεύον κέντρο δεδομένων (datacenter) του ΚΗΔ. Τέτοιου είδους ασκήσεις εκτελούνται από όλες τις παραγωγικές μονάδες πληροφοριακών υποδομών και είναι απαραίτητες για να επιβεβαιωθεί η καλή λειτουργία των εφεδρικών συστημάτων σε περιπτώσεις πραγματικής ανάγκης.

---

Τι αναμένεται να παρατηρήσουν οι χρήστες:

Κατά τη στιγμή έναρξης της άσκησης, στις 25/7 13:00, θα υπάρξει παροδική διακοπή μεγάλου μέρους των παρεχόμενων από το ΚΗΔ υπηρεσιών. Οι χρήστες θα πρέπει να μεριμνήσουν για την έγκαιρη αποθήκευση της δουλειάς τους, την ειδοποίηση συνεργατών τους σε τυχόν τηλεδιασκέψεις που συμμετέχουν κλπ. Ενδεικτικά αναφέρονται μερικές βασικές υπηρεσίες: τηλεφωνία, Internet, mail, εφαρμογές γραμματειών, Remote Desktop, VPN, WiFi.

Καθώς μετά τη στιγμή της διακοπής θα αρχίσουν να ενεργοποιούνται τα εφεδρικά συστήματα, η τηλεφωνία και το Internet αναμένεται να αποκατασταθούν μέσα σε 2-4 λεπτά. Στη συνέχεια, μέχρι τις 13:30 αναμένεται να έχουν αποκατασταθεί και οι περισσότερες λοιπές υπηρεσίες. Το πλάνο προβλέπει ότι μέχρι τις 15:30 η παροχή όλων των υπηρεσιών θα γίνεται μέσω των εφεδρικών συστημάτων. Στις 15:30 θα αρχίσει η επαναλειτουργία των πρωτευόντων συστημάτων και θα ξεκινήσει η μετάβαση των υπηρεσιών από τα εφεδρικά προς τα πρωτεύοντα, η οποία μέχρι τις 17:00 θα έχει ολοκληρωθεί. Δεσμεύουμε ωστόσο όλο το παράθυρο μέχρι τις 18:00 ώστε να περιλάβουμε και την περίπτωση απροόπτων.

Είναι αναμενόμενο εντός όλου του διαστήματος 13:00 - 17:00 να εμφανιστεί προσωρινή αστάθεια στις υπηρεσίες και μικροδιακοπές. Ζητούμε την κατανόησή σας!

---

Τι θα πρέπει να προσέξουν/κάνουν οι διαχειριστές εικονικών μηχανών (VM):

* Όλες οι εικονικές μηχανές που φιλοξενούνται στις υποδομές του ΚΗΔ πρέπει είτε να έχουν ήδη ρυθμιστεί να λαμβάνουν δικτυακές ρυθμίσεις μέσω DHCP είτε να έχουν ρυθμισμένους στατικά τουλάχιστον 2 από τους 3 DNS servers 155.207.0.31, 155.207.0.32, 155.207.0.33.
* Οποιοδήποτε πρόβλημα τύχει να παρουσιαστεί κατά την εκκίνηση (π.χ. έλεγχος filesystem) θα πρέπει να αντιμετωπιστεί από τον διαχειριστή της εικονικής μηχανής.
* Οι εικονικές μηχανές των οποίων θα διακοπεί παροδικά η λειτουργία, θα επανέλθουν από την εφεδρική υποδομή σε διάστημα λίγων δεκάδων λεπτών, αλλά με τυχαία σειρά. Επιπλέον, ανάλογα με την εφαρμογή που εκτελούν, σε κάποιες περιπτώσεις ο διαχειριστής πρέπει να παρέμβει για να επανεκκινήσει εικονικές μηχανές που πρέπει να εκκινήσουν τελευταίες.
* Σε κάθε περίπτωση, προτείνουμε σε όσους και όσες έχουν υπό την διαχείριση τους εικονικές μηχανές στο vc.it.auth.gr να προβούν σε έλεγχο καλής λειτουργίας των υπηρεσιών τους κατά τη διάρκεια και μετά τη λήξη της άσκησης.

25-07-2023 16:43 - Κλείσιμο δελτίου

H άσκηση ετοιμότητας ολοκληρώθηκε σύμφωνα με τον ανακοινωμένο προγραμματισμό.



Μετά την απώλεια των υποδομών του πρωτεύοντος κέντρου δεδομένων στις 13:00, αρχικά υπήρξε αποκατάσταση των συνδέσεων δικτύου μέσω των εφεδρικών γραμμών σε 1 λεπτό. Η τηλεφωνία επίσης επανήλθε μέσα στο πρώτο λεπτό.



Στη συνέχεια, ξεκίνησαν να ενεργοποιούνται οι υπηρεσίες από τα εφεδρικά συστήματα και μέχρι τις 14:00 όλες οι κύριες υπηρεσίες είχαν επανέλθει σε λειτουργία.



Οι υπηρεσίες συνέχισαν να λειτουργούν σταθερά για το επόμενο διάστημα, ωστόσο έχοντας περιστασιακές καθυστερήσεις στην απόκρισή τους.



Στις 15:17 άρχισαν να επανέρχονται οι υποδομές στο πρωτεύον κέντρο δικτύου και το προσωπικό του ΚΗΔ ξεκίνησε τις διαδικασίες επαναφοράς στην κανονική κατάσταση, οι οποίες ολοκληρώθηκαν μέχρι τις 16:25.

Επεξήγηση σοβαρότητας:

Πρόβλημα που επηρεάζει όλους τους χρήστες του ΑΠΘ, είτε στη σύνδεσή τους με το Internet, είτε στη χρήση βασικών κεντρικών υπηρεσιών. Αν η επίλυση εξαρτάται από τη ΜΨΔ και το πρόβλημα παρουσιαστεί εντός των ωρών που υπάρχει παρακολούθηση των προσφερομένων υπηρεσιών (08:00-16:00), διατίθεται όλο το απαραίτητο ανθρώπινο δυναμικό για την ταχύτερη αποκατάσταση του προβλήματος, ακόμα και εκτός ωραρίου.

Μετάβαση στο περιεχόμενο