DeepSeek-V4 preview được phát hành và mã nguồn đã được mở
Phiên bản preview của DeepSeek-V4 đã được công bố với cửa sổ ngữ cảnh tăng lên 1 MB, cùng các cơ chế KV Cache sliding window và nén để giảm áp lực tính toán và bộ nhớ.
Nâng cấp chính của DeepSeek-V4
Model mới được mô tả là cải thiện hiệu suất trong suy luận chuỗi dài và xử lý tác vụ phức tạp, đồng thời vận hành ổn định và hiệu quả hơn.
Hạ tầng cần thích ứng với yêu cầu mới
Dù năng lực tác nhân được nâng lên, mô hình cũng đặt ra thêm yêu cầu cho hạ tầng triển khai. Huawei cho biết DCS AI của hãng đã được tích hợp và tối ưu để thích ứng sâu với DeepSeek-V4 ở cấp hệ thống.
Tổng kết
DeepSeek-V4 preview đã được mở mã nguồn với nhiều cải tiến về ngữ cảnh và hiệu năng, trong khi bài toán hạ tầng triển khai cũng trở thành phần cần theo dõi.





