Ngày 18 tháng 2, DeepSeek công bố ra mắt NSA (Cơ chế Chú ý Rời rạc), một công nghệ tương thích cao với phần cứng và hỗ trợ đào tạo bản địa, được thiết kế để đạt tới tốc độ cực nhanh trong việc đào tạo bối cảnh dài và lý giải. Nhờ vào thiết kế tối ưu cho phần cứng hiện đại, NSA giảm đáng kể chi phí tiền huấn luyện trong khi đồng thời tăng tốc lý giải mà không làm ảnh hưởng đến hiệu suất của mô hình.
Theo giới thiệu chính thức, NSA có hiệu suất vượt trội trên các tiêu chuẩn phổ biến, nhiệm vụ ngữ cảnh dài, và lý giải dựa trên hướng dẫn, với hiệu suất tương đương hoặc tốt hơn so với mô hình chú ý đầy đủ. Công nghệ này mang lại giải pháp hiệu quả, tiết kiệm cho các ứng dụng đòi hỏi thời gian xử lý bối cảnh lớn mà không phải hy sinh hiệu suất.
Thông tin này phục vụ cho việc cung cấp thông tin thị trường và không cấu thành dưới dạng tư vấn đầu tư.