Liệu có tái diễn sự cố tê liệt hệ thống máy tính do lỗi phần mềm bảo mật như đã xảy ra vào chiều thứ Sáu?

Mass IT outage hits companies and infrastructure around the world

Travelers check a self-service kiosk at the Jetstar domestic departures terminal at Melbourne Airport, Melbourne, Australia, 20 July 2024. Companies and institutions around the world have been affected on 19 July by a major computer outage in systems running Microsoft Windows linked to a faulty CrowdStrike cyber-security software update. According to CrowdStrike’s CEO, the issue has been identified, isolated and a fix has been deployed. EPA/JAMES ROSS AUSTRALIA AND NEW ZEALAND OUT Source: AAP / JAMES ROSS/EPA

Get the SBS Audio app

Other ways to listen

Có thể phải mất đến hai tuần để Úc có thể giải quyết hoàn toàn sự cố công nghệ máy tính toàn cầu diễn ra vào chiều thứ Sáu, 19/7. Microsoft cho biết có tới 8,5 triệu thiết bị sử dụng hệ điều hành của hãng bị ảnh hưởng do ngừng hoạt động, nguyên nhân là do bản cập nhật phần mềm bị lỗi từ CrowdStrike. Sự cố này cho thấy hệ quả của một thế giới trở nên quá phụ thuộc vào máy tính qua phân tích của các nhà chuyên môn.


Anton Enus cho biết Bản tin Tin tức Thế giới của SBS mà ông trình bày vào buổi tối Thứ Sáu ngày 19 tháng 7 không giống bất cứ điều gì ông đã làm trong bốn thập kỷ phát sóng vì các hệ thống máy tính đáng tin cậy thông thường đã bị lỗi - không chỉ đối với SBS mà còn đối với nhiều hệ thống truyền thông trên khắp thế giới.

Một bản cập nhật tự động của công ty phần mềm CrowdStrike của Hoa Kỳ đã bị lỗi và làm ngưng hoạt động hàng triệu máy tính trên khắp thế giới, gây ra sự hỗn loạn cho ngành vận tải, bán lẻ, truyền thông và nhiều lĩnh vực khác.

Microsoft cho biết chưa đến 2% máy tính chạy phần mềm Windows bị ảnh hưởng - vậy tại sao vấn đề lại lan rộng đến vậy?

Phó giáo sư Mark Gregory đến từ khoa kỹ thuật của Đại học RMIT:

"1,8% máy tính đó là của các tập đoàn và các đại khách hàng và họ là những người ảnh hưởng phần lớn đến cuộc sống của chúng ta. Họ là ngân hàng, hãng hàng không, các dịch vụ quan trọng và các tổ chức khác. Và điều chúng tôi biết là cập nhật bị lỗi khiến tất cả các máy tính đó bị tê liệt và ngưng hoạt động."

Sự cố ngừng hoạt động là do một bản cập nhật duy nhất được CrowdStrike tự động triển khai, một công cụ bảo mật được nhiều tổ chức lớn sử dụng để chặn phần mềm độc hại và các cuộc tấn công mạng.

Lỗi này khiến máy tính Windows hiển thị cái gọi là 'Blue Screen of Death' Màn hình xanh chết chóc', khi hệ thống khởi động của máy tính bị mắc kẹt trong cái mà các chuyên gia gọi là a 'recovery boot loop' đây là tình trạng máy tính đang khởi động tự khởi động lại và bị kẹt trong đó.

Nó cũng tấn công Azure Cloud của Microsoft, một trong những nhà cung cấp chính cloud computing (điện toán đám mây), khiến hệ thống này bị lỗi những dẫn đến nhiều sự cố khác trên khắp thế giới.

Tiến sĩ David Glance là giám đốc Trung tâm Thực hành Bảo mật và Phần mềm tại Đại học Tây Úc nói với SBS News rằng vấn đề đáng ở đây đó là người dùng rất vui vẻ khi để CrowdStrike đảm nhiệm chuyện bảo mật mà không cần bỏ công kiểm tra và can thiệp để cân bằng.

"Tôi nghĩ mọi người đã trở nên tự mãn khi tin rằng chúng ta có thể tin tưởng các công ty như CrowdStrike sẽ làm điều đúng đắn. Và rõ ràng đây là một thất bại lớn từ phía họ. Và bây giờ thì tôi tò mò muốn biết sau chuyện này liệu có vụ kiện tụng nào xảy ra không bởi vì lỗi này là hoàn toàn của họ vì đã phát hành thứ gì đó mà không có thử nghiệm thích hợp."

Tom Worthington là giảng viên danh dự của Trường Máy tính thuộc Đại học Quốc gia Úc (School of Computing at the Australian National University) nói rằng ông rất ngạc nhiên khi CrowdStrike không phát hiện ra lỗi trong bản cập nhật bảo mật của họ trước khi nó được tung ra cho hàng triệu máy tính trên khắp thế giới.

"Đó là một phương pháp phát triển phần mềm thông thường mà chúng tôi dạy cho sinh viên đại học: anh không đi từ sửa nó đến phát hành nó cho tất cả khách hàng của mình. Anh trải đi qua một số giai đoạn thử nghiệm. Và dù biết rằng không có cách nào bạn có thể loại hoàn toàn bỏ mọi vấn đề có thể xảy ra với phần mềm, những điều này thỉnh thoảng sẽ xảy ra, nhưng anh phải bảo đảm rằng nó không làm tê liệt mọi thứ."

Ông Worthington cho biết nếu toàn bộ hoạt động kinh doanh của ai đó phụ thuộc vào một sản phẩm phần mềm cụ thể đang hoạt động thì họ cần bảo đảm có các lựa chọn thay thế trong phòng hờ.

Phó giáo sư Gregory cho biết vụ việc là hậu quả của việc thực hiện an ninh lỏng lẻo.

"Nó cho thấy các lỗi quan trọng và nó cũng nêu bật các quy trình kỹ thuật kém: các bản cập nhật đã không thử nghiệm đầy đủ trước khi được đưa ra. Nghĩ đến việc điều này xảy ra vào năm 2024 thật đáng sợ vì những khả năng gây ra những thiệt hại đáng kể, không chỉ đối với những thứ như hãng hàng không và ngân hàng, mà còn đối với các bệnh viện cũng như các hệ thống và thiết bị chăm sóc quan trọng."

Tiến sĩ Glance cho biết các tổ chức thường chỉ dựa vào các nhà cung cấp phần mềm duy nhất, vì vậy nếu có sự cố xảy ra với phần mềm đó thì sẽ không có bản sao lưu.

Ông nói rằng một sản phẩm phần mềm càng phổ biến thì càng có nhiều khả năng xảy ra bất kỳ lỗi nào sẽ gây ra hậu quả nghiêm trọng.

"Một trong những điều cần cân nhắc đó là mọi người tìm kiếm phần mềm để sử dụng mà không quan trọng phần mềm đó là gì. Phần mềm phổ biến nhất và được sử dụng rộng rãi nhất không nhất thiết luôn là lựa chọn tốt trong tương lai. Vì điều này và cũng là để có sự đa dạng như như chúng tôi đã nói trước đó, mọi người cần có khả năng thực hiện các biện pháp phòng ngừa đối với các cập nhật tự động từ và cũng như đối với sự tin tưởng vào bên thứ ba."

Các công ty lớn rất vui khi sử dụng CrowdStrike vì việc tiêu chuẩn hóa mang lại một số lợi ích: hệ thống tương thích với mọi ngành; nó giúp họ vận hành hiệu quả; và số lượng lớn nhân viên biết cách làm việc với phần mềm đó.

Tom Worthington đồng ý rằng sẽ không khôn ngoan nếu chỉ dựa vào một nhà cung cấp duy nhất, cho dù họ có nổi tiếng đến đâu.

"Bởi vì về cơ bản, chúng ta rất dễ rơi vào cảm giác an toàn tự mãn khi các hệ thống hoạt động rất đáng tin cậy. Như chúng tôi đã nói, nếu bạn chỉ mua từ nhà cung cấp chính và mọi người sử dụng ổn thỏa thì không sao, nhưng nếu mọi người mua sản phẩm của họ và sau đó bạn gặp vấn đề và mọi người gặp vấn đề thì sao?"

Tom Worthington cho biết các doanh nghiệp phải luôn bảo đảm rằng họ có một số loại hệ thống thay thế để sử dụng.

Ông nói điều quan trọng là - chuẩn bị cho những tình huống.

"Điều mọi người cần làm là xem xem họ có hệ thống dự phòng sử dụng phần mềm khác nhau không - đối với một doanh nghiệp nhỏ, nó có thể là một động tác đơn giản là bạn xem xét xem có thể điều hành doanh nghiệp của mình trên điện thoại thông minh nếu máy tính tiền hay máy tính để bàn không hoạt động không? Hoặc là bạn có thể là sử dụng cách làm việc thủ công không? Đối với một công ty hay tập đoàn lớn, bạn xem xét là mình có nhiều mạng truyền thông từ các nhà cung cấp khác nhau không? Bạn có bản sao lưu của phần mềm không? bạn có thể quay lại phiên bản mà bạn biết là đang hoạt động không? Và những thứ như bạn có thông tin liên hệ cho nhân viên vào cuối tuần không và bạn đã trả tiền cho họ để họ có mặt nhanh chóng và khắc phục những vấn đề này chưa?"

Vào năm 2023, Ủy ban Thương mại Liên bang Hoa Kỳ đã đưa ra lời kêu gọi lấy ý kiến của công chúng về các hoạt động kinh doanh liên quan đến điện toán đám mây.

Microsoft nhấn mạnh rằng sự cạnh tranh là “rất năng động và có tính cạnh tranh”.

Nhưng công ty đối thủ Google nhấn mạnh rằng các hạn chế cấp phép của Microsoft đã ngăn cản khách hàng trong việc lựa chọn một cách hiệu quả bất kỳ nhà cung cấp đám mây nào khác, ngoài dịch vụ đám mây của họ.

Mark Gregory cho biết ông đã kêu gọi Chính phủ Úc thực hiện các tiêu chuẩn hiệu suất tối thiểu (minimum performance standards) đối với các tập đoàn công nghệ.

"Úc là một quốc gia thuộc thế giới thứ ba khi nói đến công nghệ, viễn thông và IT. Chúng ta cần thoát khỏi lối suy nghĩ của thế giới thứ ba này. Những gì chúng ta có là luật pháp và quy định phù hợp với thế kỷ 20. Nó không phù hợp với thế kỷ hiện tại. Trong chính phủ, chúng ta có suy nghĩ rằng các tập đoàn sẽ làm điều đúng đắn cho quốc gia khi chúng ta biết rằng họ không làm như vậy."

Và Tiến sĩ Glance có lời cảnh báo cho tất cả mọi người:

"Không, tôi không nghĩ đây là một sự kiện riêng lẻ và tôi nghĩ rằng mọi người tốt hơn hết là tự bảo vệ mình trước những chuyện như vậy, và tôi cũng nghĩ rằng là họ chỉ cần khôn ngoan hơn trong cách vận hành cơ sở hạ tầng IT và an ninh mạng của mình."

Nhưng sự cố ngày thứ Sáu ngày 19/7 đã chứng minh, một lỗi duy nhất có thể ảnh hưởng ra khắp thế giới chỉ trong vài phút.E RNF

Share