Khi một trang web hoặc dịch vụ web không khả dụng trực tuyến hoặc không hoạt động đủ tốt để người dùng cuối hoàn thành nhiệm vụ thì trang web đó được coi là đang ngừng hoạt động .
Mặc dù hầu hết các trang web và dịch vụ web đều cố gắng đạt được thời gian ngừng hoạt động bằng không, nhưng thời gian ngừng hoạt động là không thể tránh khỏi. Ngay cả những gã khổng lồ như Google và Facebook cũng thỉnh thoảng gặp phải tình trạng ngừng hoạt động. Mặc dù công nghệ đã được cải tiến và các nhà cung cấp có sẵn hệ thống để giúp loại bỏ thời gian ngừng hoạt động, nhưng các trường hợp không lường trước được vẫn gây ra thời gian ngừng hoạt động.
Mục lục
Downtime là gì?
Thời gian ngừng hoạt động là một thuật ngữ chủ quan giống như thời gian hoạt động ngược lại của nó . Trong những ngày đầu của Internet, thời gian ngừng hoạt động thường có nghĩa là người dùng cuối không thể truy cập được một trang web. Ngày nay những gì tạo nên Downtime phức tạp hơn. Hầu hết đều coi trang web hoặc dịch vụ ngừng hoạt động nếu người dùng cuối không thể hoàn thành nhiệm vụ của họ. Ví dụ: một trang web thương mại điện tử sẽ ngừng hoạt động nếu người dùng cuối không thể đặt một mặt hàng vào giỏ hàng của họ. Trên thực tế, khách truy cập sẽ dễ tha thứ hơn cho một trang web bị ngừng hoạt động hoàn toàn so với một trang web có chức năng bị hỏng. Hiệu suất kém cũng có thể rơi vào tình trạng ngừng hoạt động nếu nó ảnh hưởng đến khả năng đạt được mục tiêu của người dùng cuối.
Tìm hiểu thêm: Hiểu hơn về những thiệt hại do Downtime, Outages và Failures gây ra (P1)
Điều gì gây ra Downtime?
Nhiều thứ có thể gây ra thời gian ngừng hoạt động cho nhà cung cấp. Một số nguyên nhân nằm trong tầm kiểm soát của nhà cung cấp như bảo trì theo lịch trình, nhưng các trường hợp ngừng hoạt động khác thì không. Mỗi tình huống là duy nhất, nhưng hầu hết các nguyên nhân đều thuộc các loại sau.
Lỗi của con người
Như trong mọi việc, khi có sự cố xảy ra, nguyên nhân cốt lõi thường dẫn đến một sai sót duy nhất do một cá nhân hoặc một nhóm mắc phải. Một thay đổi mã dường như vô hại sẽ ảnh hưởng đến một thứ khác mà không xuất hiện trong quá trình kiểm tra hồi quy, một hệ thống được chuyển sang trạng thái ngoại tuyến khi lẽ ra không nên như vậy hoặc mục nhập DNS được cập nhật không chính xác chỉ là một vài ví dụ về cách con người góp phần vào thời gian ngừng hoạt động của trang web . Sự cố ngừng hoạt động lớn của AWS vào đầu năm 2017 là một ví dụ thực tế về việc một lỗi đơn giản như lỗi đánh máy có thể gây ra thời gian ngừng hoạt động, không chỉ ảnh hưởng đến Amazon Web Services mà còn đánh sập nhiều trang web lớn.
Lỗi thiết bị
Thiết bị bị hao mòn và hỏng hóc, còn thiết bị mới thì hỏng hóc mà không báo trước. Bảo trì đúng cách và dự phòng phần cứng là cách duy nhất để giảm thiểu thời gian ngừng hoạt động do phần cứng. Trong một ví dụ khác của Amazon , gã khổng lồ thương mại điện tử đã gặp phải sự cố ngừng hoạt động ảnh hưởng đến hầu hết châu Âu vào năm 2010. Mặc dù người ta nghi ngờ rằng tin tặc đã đánh sập trang web, nhưng sau đó Amazon tiết lộ rằng thời gian ngừng hoạt động là do dữ liệu của họ bị lỗi phần cứng. trung tâm.
Tấn công độc hại
Tin tặc luôn khám phá những cách mới thông minh để xâm nhập và phá hoại hoạt động kinh doanh. Một phương pháp phổ biến là tấn công từ chối dịch vụ phân tán (DDoS). Các cuộc tấn công từ chối dịch vụ cố gắng áp đảo các máy chủ bằng các yêu cầu. Các yêu cầu đến đồng thời và lặp đi lặp lại từ nhiều vị trí gây ra tình trạng quá tải trên máy chủ web của mục tiêu. Trên thực tế, việc chặn các yêu cầu hợp pháp sẽ khiến trang web bị sập. Các cuộc tấn công khác bao gồm đầu độc bộ đệm DNS trong đó tin tặc xâm nhập vào bộ đệm của trình phân giải Hệ thống tên miền (DNS) và thay đổi địa chỉ IP thành địa chỉ cho phép chúng khai thác người dùng của trang web, do đó, trên thực tế, trang web được nhắm mục tiêu đã ngừng hoạt động . Các cuộc tấn công khác liên quan đến chứng chỉ SSL và phần mềm độc hại.
Làm thế nào để các trang web tránh được thời gian ngừng hoạt động?
Khi nói đến phần cứng, các công ty sử dụng tính năng dự phòng để đảm bảo rằng hệ thống dự phòng luôn sẵn sàng trong trường hợp mất điện, bộ cân bằng tải và trung tâm dữ liệu giúp duy trì hiệu suất. Dịch vụ Giám sát tổng hợp theo dõi các trang web, máy chủ, API và ứng dụng web để biết tình trạng ngừng hoạt động, hiệu suất và chức năng, đồng thời dịch vụ giám sát sẽ cảnh báo cho nhóm hỗ trợ khi mọi thứ không hoạt động bình thường.
Giám sát thời gian hoạt động
Còn được gọi là giám sát tính khả dụng và giám sát trang web , giám sát thời gian hoạt động là loại giám sát tổng hợp sử dụng mạng máy tính ( điểm kiểm tra ) để gửi yêu cầu, ping và kết nối với trang web và máy chủ. Những màn hình cơ bản này kiểm tra mã phản hồi và thời gian phản hồi rồi báo cáo kết quả lại cho dịch vụ giám sát. Nếu xảy ra lỗi hoặc phản hồi mất nhiều thời gian hơn chỉ định, dịch vụ giám sát có thể đưa ra cảnh báo hoặc dịch vụ giám sát có thể xác thực lỗi từ một điểm kiểm tra khác trước khi phát ra âm thanh cảnh báo.
Nội dung có sự tham khảo từ Bizfly Cloud và các nguồn khác.
Bizfly Cloud – Cung cấp dịch vụ điện toán đám mây tốt nhất tại Việt Nam
Vận hành bởi VCcorp
Địa chỉ: Số 1 Nguyễn Huy Tưởng, P. Thanh Xuân Trung, Q. Thanh Xuân, TP Hà Nội.
Tham khảo: https://bizflycloud.vn/