Sui Foundation xác nhận mainnet Sui bị “đứng” ngày 14/01 do lỗi hiếm trong logic commit của cơ chế đồng thuận, khiến mạng tự dừng như một biện pháp an toàn để tránh chốt trạng thái không nhất quán.
Sự cố kéo dài khoảng 6 giờ và khiến giao dịch bị timeout, nhưng thiết kế ưu tiên an toàn đã ngăn rủi ro fork hoặc đảo ngược giao dịch, đồng thời vẫn phục vụ truy vấn đọc ở trạng thái đã được chứng thực gần nhất.
- Mainnet Sui tự dừng để tránh finalized state không nhất quán do divergence trong xử lý đồng thuận của validator.
- Không có fork trạng thái được chứng thực, không rollback giao dịch đã chứng thực và tiền người dùng không gặp rủi ro.
- Sui Foundation lên kế hoạch cải tiến phát hiện checkpoint lệch và tự động hóa công cụ khôi phục để rút ngắn thời gian phục hồi.
Divergence đồng thuận khiến Sui kích hoạt cơ chế dừng an toàn
Sự cố đến từ một lỗi edge-case trong logic commit của đồng thuận, khiến các validator tạo ra kết quả đồng thuận khác nhau, từ đó không thể chứng thực checkpoint và buộc mạng dừng để đảm bảo nhất quán.
The Foundation cho biết nguyên nhân gốc là một bug hiếm trong consensus commit logic, liên quan cách xử lý các giao dịch xung đột dưới một số điều kiện garbage-collection nhất định.
Hệ quả là các validator khác nhau suy diễn ra các “consensus outputs” khác nhau và cố gắng thực thi những candidate checkpoint không tương thích, làm xuất hiện divergence ngay ở lớp đồng thuận thay vì ở lớp thực thi giao dịch.
Khi validator phát hiện hơn một phần ba lượng stake đang ký một checkpoint digest khác, quá trình chứng thực checkpoint trở nên bất khả thi. Thay vì tiếp tục tiến trình và có nguy cơ chốt trạng thái sai, các validator đã dừng để tránh finalized state không nhất quán.
Sui Foundation nhấn mạnh đây là “chế độ lỗi” được thiết kế sẵn cho nhóm vấn đề này, tức hệ thống ưu tiên dừng an toàn thay vì đánh đổi bằng fork hoặc các bất nhất không thể đảo ngược.
Trong bối cảnh theo dõi rủi ro vận hành của các mạng L1, nhà giao dịch có thể quan sát biến động tâm lý thị trường qua thị trường phái sinh (funding, OI, thanh lý) để đánh giá phản ứng ngắn hạn; một số công cụ và góc nhìn như vậy thường được tổng hợp trong hệ sinh thái giao dịch như BingX mà không cần gắn với một con số cụ thể từ sự cố.
Sự cố kéo dài khoảng 6 giờ và làm giao dịch bị timeout
Gián đoạn diễn ra khoảng 6 giờ, trong thời gian đó validator không thể chứng thực checkpoint mới, khiến việc gửi giao dịch bị timeout khi mạng ưu tiên đảm bảo an toàn.
Theo mô tả của Foundation, divergence nội bộ trong xử lý đồng thuận của validator là yếu tố kích hoạt. Khi checkpoint không thể được chứng thực, mạng không thể tiến hành xác nhận trạng thái mới, nên các giao dịch gửi lên không được đưa vào tiến trình hoàn tất và bị timeout.
Trong lúc dừng thực thi, mạng vẫn ưu tiên duy trì các đảm bảo về safety và consistency. Điều này phản ánh lựa chọn kiến trúc quen thuộc của nhiều blockchain: khi gặp rủi ro bất nhất trạng thái, dừng tiến trình thường “ít tệ hơn” so với việc tiếp tục và tạo ra hậu quả khó đảo ngược.
Không có fork, không rollback, không thất thoát tiền người dùng
Sui khẳng định không có fork trạng thái được chứng thực, không rollback giao dịch đã chứng thực và tiền người dùng không gặp rủi ro trong suốt thời gian mạng bị dừng.
Sui nhấn mạnh sự cố không xuất phát từ nghẽn mạng, khối lượng giao dịch, hay mối đe dọa bên ngoài. Các điểm chính được nêu gồm:
- Không có certified state forks.
- Không có certified transactions bị rollback.
- Tiền người dùng không bao giờ ở trạng thái rủi ro.
- Các đảm bảo về an toàn và nhất quán của mạng được giữ nguyên.
Dù việc thực thi giao dịch tạm dừng trong “incident window”, các thao tác đọc (read operations) vẫn tiếp tục phục vụ trạng thái đã được chứng thực gần nhất. Cách vận hành này giúp ứng dụng và người dùng vẫn nhận dữ liệu nhất quán, tránh tình huống mỗi node trả về một trạng thái khác nhau.
Sui lên kế hoạch giảm thời gian khôi phục bằng cải tiến phát hiện và tool vận hành
Sui Foundation sẽ bổ sung cơ chế phát hiện checkpoint bất nhất nhanh hơn và tự động hóa công cụ cho operator để dọn dẹp trạng thái lệch, đồng thời mở rộng kiểm thử đồng thuận nhằm tái tạo lỗi và xác thực bản vá trước khi triển khai.
Nhóm cải tiến được đề cập tập trung vào hai mục tiêu: rút ngắn thời gian phát hiện sự lệch checkpoint và giảm thao tác thủ công khi cần làm sạch “divergent internal state”. Điều này nhắm trực tiếp vào “recovery time” nếu kịch bản tương tự lặp lại.
Ngoài ra, Foundation cho biết sẽ mở rộng kiểm thử chuyên biệt cho lớp đồng thuận, để có thể tái tạo tình huống edge case và kiểm định bản sửa một cách đáng tin cậy trước khi đưa lên mainnet, giảm nguy cơ tái phát do khác biệt giữa môi trường test và thực tế.
Foundation kết luận rằng dù gây gián đoạn, sự cố đã cho thấy kiến trúc ưu tiên an toàn của Sui hoạt động đúng như thiết kế: dừng để bảo toàn nhất quán, thay vì tiếp tục khi điều kiện chứng thực checkpoint không còn đảm bảo.
Những câu hỏi thường gặp
Vì sao Sui mainnet lại tự dừng thay vì tiếp tục xử lý giao dịch?
Vì các validator phát hiện dấu hiệu checkpoint digest bị ký khác nhau vượt ngưỡng an toàn (hơn một phần ba stake), nên việc chứng thực checkpoint mới trở nên bất khả thi. Mạng dừng để tránh finalized state không nhất quán, thay vì tiếp tục và có nguy cơ fork hoặc bất nhất không thể đảo ngược.
Sự cố ngày 14/01 kéo dài bao lâu và ảnh hưởng gì đến người dùng?
Sui Foundation cho biết sự gián đoạn kéo dài khoảng 6 giờ. Trong thời gian đó, việc gửi giao dịch có thể bị timeout do không chứng thực được checkpoint mới, nhưng các thao tác đọc vẫn phục vụ trạng thái đã được chứng thực gần nhất.
Có xảy ra fork, rollback hay mất tiền người dùng trong sự cố không?
Không. Sui khẳng định không có certified state forks, không có certified transactions bị rollback và tiền người dùng không gặp rủi ro. Các đảm bảo an toàn và nhất quán của mạng được giữ nguyên trong suốt sự cố.
Nguyên nhân kỹ thuật cốt lõi của sự cố là gì?
Nguyên nhân là một bug edge-case trong logic commit của cơ chế đồng thuận, ảnh hưởng đến cách xử lý giao dịch xung đột dưới một số điều kiện garbage-collection. Điều này khiến các validator suy diễn khác nhau về kết quả đồng thuận và tạo checkpoint không tương thích.
Sui sẽ làm gì để giảm nguy cơ lặp lại và rút ngắn thời gian phục hồi?
Sui Foundation dự kiến cải thiện tốc độ phát hiện checkpoint bất nhất, tăng tự động hóa công cụ cho operator để dọn trạng thái lệch, và mở rộng kiểm thử chuyên biệt cho đồng thuận để tái tạo lỗi và xác thực bản vá trước khi triển khai.















