Ngày 11 tháng 4, một báo cáo đã công bố rằng OpenAI đã ra mắt một bộ tiêu chuẩn mới mang tên BrowseComp. Đây là một công cụ để đánh giá khả năng của các tác nhân AI trong việc tìm kiếm thông tin khó tiếp cận trên Internet. Bộ tiêu chuẩn này bao gồm 1.266 câu hỏi hết sức thách thức, được thiết kế để mô phỏng cuộc “săn tìm kho báu online” trong mạng lưới thông tin phức tạp. Điểm đặc biệt là những câu hỏi này khó tìm nhưng dễ để kiểm chứng. Chúng phủ sóng nhiều lĩnh vực như phim ảnh, truyền hình, công nghệ và lịch sử, khó hơn nhiều so với các bài kiểm tra hiện có như SimpleQA.

Theo cộng đồng mở AIGC, mức độ khó của bài kiểm tra là rất cao. Ngay cả các mô hình GPT-4o và GPT-4.5 của chính OpenAI cũng chỉ đạt độ chính xác 0,6% và 0,9%, gần như bằng 0. Ngay cả khi sử dụng GPT-4o với chức năng trình duyệt, độ chính xác cũng chỉ đạt 1,9%. Tuy vậy, mô hình tác nhân mới nhất của OpenAI, Deep Research, đạt độ chính xác lên tới 51,5%.

Xem thêm: Gần 1 triệu nhà đầu tư coin TRUMP lỗ cộng dồn 3,81 tỷ USD

Thông tin này chỉ nhằm cung cấp thông tin thị trường và không cấu thành lời khuyên đầu tư.

Tuyên bố miễn trừ: Bài viết này chỉ nhằm mục đích cung cấp thông tin dưới dạng blog cá nhân, không phải là khuyến nghị đầu tư. Nhà đầu tư cần tự nghiên cứu kỹ lưỡng trước khi đưa ra quyết định và chúng tôi không chịu trách nhiệm đối với bất kỳ quyết định đầu tư nào của bạn.

Theo Nghị quyết số 05/2025/NQ-CP ngày 09/09/2025 của Chính phủ về việc thí điểm triển khai thị trường tài sản số tại Việt Nam, TinTucBitcoin.com hiện chỉ cung cấp thông tin cho độc giả quốc tế và không phục vụ người dùng tại Việt Nam cho đến khi có hướng dẫn chính thức từ cơ quan chức năng.

BrowseComp: Thử thách siêu khó cho AI trên Internet

BÀI VIẾT CÙNG DANH MỤC

Cá voi Bitcoin ngủ đông 7 tháng chuyển 16.400 BTC, hơn 1 tỷ USD

ETF spot SOL ghi nhận dòng tiền ròng 2,82 triệu USD tuần qua

HKEX ra mắt hợp đồng tương lai trái phiếu chính phủ RMB 5 năm

ETF XRP giao ngay ghi nhận dòng tiền ròng 14,86 triệu USD tuần qua

Nga khám xét sàn tiền số, bắt hàng chục nhân viên vụ trộm

BTC giảm dưới 63.000 USD, giảm 0,24% trong ngày

Ví Bitcoin ngủ đông 4 năm chuyển 730 Bitcoin trị giá 46,12 triệu USD

ETF HYPE ghi nhận dòng tiền ròng chảy ra 14,7459 triệu USD tuần qua

ETF Bitcoin giao ngay ghi nhận rút ròng 61,53 triệu USD tuần qua

Morgan Stanley: Chứng khoán Hàn Quốc còn tăng 36% sau rung lắc

Tin Nhanh