Đến năm 2025, lĩnh vực robot sẽ giải quyết các thách thức kéo dài về kiến trúc mô hình và huấn luyện, tạo tiền đề để các công ty AI tự tin đầu tư thu thập dữ liệu quy mô lớn.
Nhận định này được Andrew Kang, đối tác Mechanism Capital, nêu trong một bài đăng trên nền tảng X ngày 2/1, nhấn mạnh tiến bộ ở công nghệ thu thập dữ liệu, hiểu chất lượng dữ liệu và cách xây dựng dữ liệu.
- Robot 2025: tháo gỡ vấn đề kiến trúc và huấn luyện mô hình.
- Figure, Dyna, PI: tỷ lệ thành công trên 99% nhờ RL mới.
- 2026: dữ liệu entity AI dự kiến tăng quy mô 100 lần.
Robot và dữ liệu: điểm rơi 2025
Đến 2025, các nút thắt cốt lõi về kiến trúc mô hình và huấn luyện trong robot được cho là sẽ được xử lý, kéo theo làn sóng đầu tư thu thập dữ liệu quy mô lớn.
Andrew Kang cho rằng tiến bộ không chỉ nằm ở mô hình, mà còn ở các lớp hạ tầng dữ liệu: công nghệ thu thập dữ liệu, khả năng hiểu chất lượng dữ liệu và kỹ thuật xây dựng dữ liệu (data formulation). Khi những phần này trưởng thành, các công ty AI sẽ có cơ sở để chi mạnh cho việc thu thập dữ liệu ngoài đời thực.
Ở lớp ứng dụng, Figure, Dyna và PI được nhắc đến như các ví dụ đạt tỷ lệ thành công trên 99% trong nhiều kịch bản triển khai thực tế, nhờ tận dụng các kỹ thuật reinforcement learning (RL) đổi mới. Mốc trên 99% cho thấy RL có thể góp phần làm ổn định hiệu năng trong môi trường thật, từ đó thúc đẩy nhu cầu dữ liệu đa dạng và có giám sát tốt hơn.
Bộ nhớ, định vị và cú hích dữ liệu đến 2026
Các đột phá về công nghệ bộ nhớ được mô tả là đã phá vỡ memory wall, mở đường cho các cơ chế bộ nhớ khi suy luận và định vị tốt hơn.
NVIDIA ReMember được nêu là dùng memory-based navigation; trong khi đó Titans và MIRAS đạt test-time memory. Theo lập luận trong bài, một Virtual Localization Model (VLM) tốt hơn sẽ giúp Virtual Localization Arrays (VLAs) có năng lực hiểu không gian mạnh hơn, đồng thời cải thiện quy trình gán nhãn và xử lý dữ liệu để tăng throughput đáng kể.
Đến 2025, thị trường được kỳ vọng bắt đầu cảm nhận các hiệu ứng từ quy mô dữ liệu, gồm zero-shot capability mapping, visual strength sensitivity và general physics reasoning. Sau đó, đến 2026, quy mô dữ liệu entity AI được dự báo sẽ mở rộng 100 lần, hàm ý giai đoạn tăng tốc mạnh về cả thu thập lẫn khai thác dữ liệu cho robot/AI.




