Bạn chắc đã nghe về câu chuyện AI lớn nhất đang chiếm lĩnh tin tức toàn cầu tuần này — DeepSeek R1.
Theo tất cả các thông tin, có vẻ như có một mô hình AI mới của Trung Quốc được xây dựng với tổng chi phí 16,95 USD mà có chất lượng tương đương với các mô hình hàng nghìn tỷ USD của OpenAI, mặc dù nó được tạo ra bởi các thiếu niên, những người đã ghép sáu bộ xử lý Intel Pentium lại với nhau, dùng pin khoai tây để cung cấp năng lượng và yêu cầu nó từ chối trả lời các câu hỏi về Quảng trường Thiên An Môn.
Kết quả của câu chuyện phóng đại này — mặc dù có thành tựu đáng ngạc nhiên nhưng đã bị thổi phồng — các nhà đầu tư đổ xô bán tháo các cổ phiếu AI của Hoa Kỳ bị đánh giá cao cùng với mọi Token trong danh mục tiền điện tử không liên quan của tôi.
Bạn có thể đã đọc hàng triệu bài viết về điều này, vì vậy dưới đây là một số điểm thú vị mà chúng tôi tìm thấy về DeepSeek:
1. Chi phí của DeepSeek bị hiểu sai
Dù DeepSeek có chi phí bao nhiêu, đồng ý chung là nó lớn hơn nhiều so với chi phí đào tạo 5,6 triệu USD cho v3 mà các phương tiện truyền thông luôn nêu bật. (R1 chỉ việc phiên bản lập luận được xây dựng trên nền tảng v3).
Thông tin gần đây cho thấy chi phí đào tạo cho các công ty AI của Hoa Kỳ thực sự thấp hơn nhiều so với dự đoán. Giám đốc điều hành của Anthropic, Dario Amodei đã nói trong một bài viết trên blog: “DeepSeek không làm được điều một mô hình trung bình như Claude 3,5 Sonnet của chúng tôi thực hiện với chi phí vài chục triệu USD để đào tạo.”
Ông cho rằng tin tức thực sự là “DeepSeek đã tạo ra mô hình gần tương đương với các mô hình của Hoa Kỳ 7-10 tháng trước đó, với chi phí ít hơn đáng kể (nhưng không đạt tỷ lệ được đề xuất).”
Tuy nhiên, có xác nhận rằng DeepSeek có thể chi gần như không gì cho an ninh mạng, bởi vì các nhà nghiên cứu bảo mật từ Wiz đã tìm thấy hơn 1 triệu bản ghi của nó, bao gồm dữ liệu người dùng, các bài nộp prompt và khóa API,