Theo báo cáo ngày 10 tháng 2, mô hình thử nghiệm VideoWorld đã được đề xuất chung bởi đội ngũ Doubao Big Model, Đại học Giao thông Bắc Kinh, và Đại học Khoa học và Công nghệ Trung Quốc. Khác với các mô hình đa phương tiện phổ biến như Sora, DALL-E, và Midjourney, VideoWorld là mô hình đầu tiên trong ngành có khả năng nhận thức thế giới mà không cần đến các mô hình ngôn ngữ.
Hiện tại, mã và mô hình của dự án đã được mã nguồn mở. Đây là một bước tiến vượt bậc trong lĩnh vực phát triển mô hình trí tuệ nhân tạo, mang lại nhiều tiềm năng ứng dụng vượt trội. Nội dung này nhằm cung cấp thông tin thị trường và không cấu thành lời khuyên đầu tư.