Machine Learning (ML) đã có sự tiến bộ đáng kể trong những năm gần đây và đã tìm thấy nhiều ứng dụng trong các lĩnh vực khác nhau. Đúng không? Nó có thể được sử dụng cho – Xử lý ảnh, Nhận dạng giọng nói, Chơi trò chơi ‘Go’ và gần đây hơn là để khám phá kháng sinh.
Chúng ta có rất nhiều ứng dụng thú vị sử dụng ML bây giờ. Ý tôi là bất chấp những điểm thành công tuyệt vời này, vẫn có nhiều vấn đề trong Machine Learning. Đây là nơi mà Zero Knowledge Machine Learning bước vào.
Zero Knowledge Machine Learning (zkML) là một giao thức kết hợp giữa machine learning và chứng minh không cần biết (ZKP). ZKP là một công cụ mật mã mà một bên (một bên chứng minh) có thể chứng minh rằng họ có thể đảm bảo một điều gì đó là đúng mà không cần phải tiết lộ bất kỳ thông tin nào khác. Kết hợp điều này với ML sẽ có nghĩa là chúng ta có thể tạo ra đầu ra mà không tiết lộ dữ liệu nhạy cảm được sử dụng trong dữ liệu huấn luyện và cũng đảm bảo tính phân cấp và độ chính xác của tính toán.
Như bạn biết, zkML hoạt động bằng cách huấn luyện các mô hình machine learning trên dữ liệu phân tán trên các nút khác nhau trong một mạng lưới phân cấp. Và sau đó, những nút này có thể tạo ra các chứng minh không cần biết về dữ liệu của họ. Về cơ bản, sau này những chứng minh này cho phép các nút xác nhận rằng dữ liệu đó là đúng mà không tiết lộ dữ liệu nhạy cảm chính nó.
Trong bài viết này chúng ta sẽ phân tích chi tiết về Zero Knowledge Machine Learning (zkML)
Tóm tắt về Machine Learning
Chúng ta đang chứng kiến sự tiếp tục tiến hóa trong các trường hợp sử dụng của công nghệ blockchain trong các ngành công nghiệp khác nhau. Chúng ta sẽ thảo luận về một trong những phát triển hứa hẹn nhất, với mục tiêu làm cách mạng hóa các ngành công nghiệp khác nhau trong việc bảo vệ dữ liệu (đặc biệt là dữ liệu nhạy cảm như hồ sơ sức khỏe).
Zero-knowledge machine learning giúp chúng ta đảm bảo chứng minh về tính toàn vẹn tính toán thay vì chỉ dựa vào sự tin tưởng.
Vâng, ở đầu tôi đã đề cập rằng machine learning có nhiều vấn đề khác nhau được giải quyết và giải quyết bởi zkML. Vấn đề mà tôi sẽ nói về trong bài viết này là vấn đề tính toàn vẹn trong machine learning.
Hạn chế của Machine Learning là gì?
Nếu tôi phải định nghĩa về machine learning, tôi sẽ giải thích như sau: machine learning cơ bản là khả năng của máy tính học và thích nghi từ dữ liệu một cách độc lập để các mô hình máy tính này có thể mô phỏng hoặc thể hiện “hành vi thông minh của con người”.
ML được biết đến là một lĩnh vực con của AI (trí tuệ nhân tạo) và có các ứng dụng từ việc cá nhân hóa dòng feed Facebook hoặc Instagram của bạn dựa trên các hoạt động và tương tác của bạn, hoặc quyết định các quảng cáo xuất hiện trên Youtube hoặc sử dụng dữ liệu từ các giao dịch mua sắm trực tuyến trước đó và lịch sử tìm kiếm của bạn để thích nghi và giới thiệu các sản phẩm được đề xuất cho bạn.
Đó là một giải thích cơ bản. Bây giờ đến một giải thích phức tạp hơn về machine learning. Điều quan trọng là phải hiểu rõ nó là gì để chúng ta có thể nói về các hạn chế của nó.
Trí tuệ nhân tạo đã trải qua các giai đoạn khác nhau để được gọi là “hệ thống mô hình chuyên gia” hoặc “neural nets” và đối với chúng ta, những người theo dõi tiền điện tử sống dưới mỏi đá, chúng ta cần hiểu rõ điều trí tuệ nhân tạo có thể làm để không để nó trở nên không ổn định.
Machine learning là cách sử dụng trí tuệ nhân tạo để thực hiện các nhiệm vụ phức tạp với sự chạm vào của con người. Nó đã liên kết với:
- Máy tính hiểu ngôn ngữ tự nhiên được viết và nói của con người, để những máy tính này không chỉ có thể phản hồi lại mà còn có thể dịch qua các ngôn ngữ. Đợi đã nghĩ gì? Vâng, tương tự như Siri trên iPhone hoặc trợ lý nhà (như Alexa).
- Sau đó, bạn biết có các chương trình máy tính được lấy cảm hứng từ con người trong đó, bạn biết nó được tạo thành từ nhiều đơn vị xử lý đơn giản kết nối như mạng nhện phải không? Và sau đó, bằng cách cung cấp dữ liệu huấn luyện cho các mạng nhện này, các chương trình này có thể học nhận diện các mẫu để tạo ra các suy luận/dự đoán của riêng chúng (vâng, tôi đang chắc chắn giải thích về mạng neural).
- Và ML cũng liên quan đến deep learning, trong đó cơ bản là máy móc có thể lọc qua hàng núi thông tin và tìm ra điều quan trọng như cách nhận diện một khuôn mặt trong một bức ảnh.
Từ giải thích ngắn gọn này, bạn có thể hiểu được rằng machine learning có các trường hợp sử dụng trong các xe tự lái, chatbot, hoặc các mô hình ngôn ngữ lớn như ChatGPT hoặc Gemini (trước đây là Bard), hoặc các ứng dụng chuyển văn bản thành hình ảnh như DALL-E hoặc Midjourney, và thậm chí là các quyết định quan trọng như về cho vay, điểm tín dụng hoặc thậm chí là quyết định bảo lãnh và những vấn đề tương tự.
Đối với những người mới bắt đầu trong thế giới tiền điện tử, việc quan trọng là phải biết rằng với các mô hình máy học, bạn cần tin tưởng (giả định) vào một số điều để có được các câu trả lời/đầu ra đáng tin cậy từ chúng, và đó là:
- Dữ liệu đầu vào có chính xác và không bị làm lộn và có riêng tư trong trường hợp cần thiết không?
- Mô hình máy học có tính toán đầu ra một cách chính xác và có ai đó làm lộn với mô hình không, nói cách khác, nó có tuân thủ các nguyên tắc về sự chính xác, tính toàn vẹn và sự riêng tư không?
- Cuối cùng và rõ ràng là đầu ra hoặc câu trả lời mà chúng ta nhận được có chính xác theo dữ liệu đầu vào không và có riêng tư nếu cần thiết không?
Bây giờ bạn sẽ hỏi vấn đề đặt ra ở đâu trong trí tuệ nhân tạo. Sau khi thảo luận một cách chi tiết về cách hoạt động của nó, chúng ta có thể đồng ý rằng khó nhìn thấy chính xác làm thế nào machine learning đến với các câu trả lời của nó.
Đây là điều mà nhà nghiên cứu nổi tiếng Daniel Kang nêu bật bằng cách nói rằng các mô hình machine learning thường bị che giấu sau các API đóng cửa hoặc như các mã bí mật để truy cập vào một chương trình.
Vâng, để bảo vệ quyền riêng tư của người dùng, các công ty như Twitter (hiện được đổi tên thành X) hoặc OpenAI đã không công bố các trọng số mô hình như bạn biết, Elon Musk’s X đã công bố mã nguồn mở cho thuật toán “For you” timeline nhưng không công bố chi tiết về cách nó diễn ra.
By the way, một lý do khác là các mô hình machine learning này là như bí mật thương mại cho các công ty như bạn biết, họ đầu tư rất nhiều thời gian và tài nguyên để huấn luyện chúng – điều này cuối cùng mang lại cho họ lợi thế cạnh tranh so với những người khác.
Hãy cùng phân tích rủi ro về niềm tin và quyền riêng tư với ML
Khi sử dụng các mô hình ngôn ngữ machine learning như ChatGPT 3.5/4, bạn thường đưa cho nó một số thông tin dưới dạng prompts và TIN tưởng rằng nó sẽ đưa ra câu trả lời bạn đang tìm kiếm mà không tiết lộ các dữ liệu nhạy cảm bạn đã cung cấp hoặc bạn biết không tiết lộ bất kỳ chi tiết riêng tư nào về chính mô hình.
Nhưng hãy để tôi nói cho bạn biết rằng có khả năng có rủi ro về quyền riêng tư trong quá trình suy luận. Đúng, những điều này có thể là “Cuộc tấn công Phát hiện tư cách hội viên” hoặc “Cuộc tấn công Nghịch đảo Mô hình”. Đó là những gì bạn hỏi? Hãy để đồng nghiệp của bạn giải thích.
- Vậy nên hãy nói một tên tấn công/vi rút đang cố gắng đoán xem HỒ SƠ y tế của BẠN đã được sử dụng để huấn luyện một mô hình machine learning bảo hiểm sức khỏe – điều này có thể xảy ra chỉ bằng cách phân tích đầu ra của mô hình bạn biết.
- Hoặc bạn biết một người dùng độc hại có thể tạo ra những prompt cụ thể nhất để lừa mô hình tiết lộ những phần nhỏ của dữ liệu huấn luyện của nó.
Đây là nơi mà công nghệ machine learning không cần biết thông tin đến để giải quyết những lo ngại về quyền riêng tư này.
Zero Knowledge Proof + Machine Learning = zkML: Nó giải quyết các vấn đề về tính toàn vẹn như thế nào?
Các nhà nghiên cứu như Yupeng Zhang, được đánh giá cao trong lĩnh vực nghiên cứu liên quan đến các chứng minh không bằng chứng, tính toán đa bên an toàn và ứng dụng của chúng trong machine learning và zkML, đã đưa ra rất nhiều đề xuất đáng suy nghĩ cho chúng ta. Cụ thể, trong một trong các Hội thảo An ninh mạng của Monash, Zhang đã nhanh chóng đề cập đến những lo ngại về machine learning mà chúng ta đã thảo luận trước đó. Chính xác hơn, chúng là:
- Khả năng tái tạo
- Sự hợp lệ
- Công bằng
Sau đó, chúng ta được giới thiệu đến giải pháp mật mã để xác minh/kiểm chứng đầu ra của machine learning mà không tiết lộ mô hình cơ bản – đó là Zero Knowledge Proof (ZKP).
Chứng minh ZK cho phép ai đó chứng minh rằng họ biết một điều gì đó là đúng mà không tiết lộ chi tiết. Ở đây, trong tình huống này, ZK có nghĩa là zkSNARKS (Biện pháp chứng minh không bằng chứng tóm gọn không tương tác). Tôi biết điều này là quá nhiều, vậy chúng ta hãy phân tích nó, được không?
Tôi rất vui khi tìm thấy điều này trong bài báo nghiên cứu zk-SNARKs: Một Giới Thiệu Nhẹ Nhàng bởi Anca Nitulescu mà tôi sẽ chia sẻ bên dưới.
Bạn biết zk-SNARKS là một loại cụ thể của chứng minh không bằng chứng để chúng ta chứng minh tính toàn vẹn của đầu ra hoặc câu trả lời từ các tính toán lớn. Nó có những đặc điểm sau:
- Tóm gọn: zk-SNARKS cung cấp kích thước chứng minh nhỏ.
- Không tương tác: Vậy điều gì phân biệt với các chứng minh không bằng chứng truyền thống là nó không yêu cầu các vòng tương tác giữa người chứng minh và người xác minh.
- Biện pháp: SNARKs được coi là an toàn chỉ cho những người chứng minh có tài nguyên tính toán hạn chế, vì vậy bạn biết điều này cơ bản là người chứng minh có đủ sức mạnh tính toán có thể đánh lừa người xác minh bằng các tuyên bố không đúng.
Kết hợp hệ thống SNARK với kiến thức không biết dẫn đến điều này thú vị khi chứng minh được thực hiện mà không tiết lộ bất kỳ bước trung gian nào hoặc thông tin nhạy cảm nào về quá trình tính toán.
Về cơ bản những gì xảy ra là:
Người chứng minh có thể là một công ty hoặc máy chủ chứng minh tuyên bố về dữ liệu bí mật như mô hình học máy thông qua tính toán công khai mà sau này người xác minh là những người như chúng ta, người dùng cuối có thể xác thực mà không cần truy cập vào mô hình ML.
Cuối cùng, chúng ta đạt được Zero Knowledge Machine Learning
zkML đang chứng tỏ mình là một công nghệ mới nổi mà mọi người đều nói về việc cải thiện trạng thái của AI/ML.
Khi chúng ta nói về việc kết hợp hai công nghệ của kiến thức không biết và máy học, điều mà chúng ta ám chỉ là zKML cho phép mô hình máy học học từ dữ liệu được cung cấp mà không cần tiết lộ vì lý do quyền riêng tư và an ninh.
Nhưng làm thế nào để làm điều này? Vâng, dữ liệu được phân tán trên các nút khác nhau theo cách phi tập trung bằng cách sử dụng đó mà các mô hình máy học được huấn luyện. Các sổ cái phân tán này (nút) tạo ra các chứng minh kiến thức không biết liên quan đến dữ liệu của họ, điều này về cơ bản dẫn đến việc các nút xác minh đầu ra/câu trả lời mà không tiết lộ chi tiết về dữ liệu chính nó.
Toàn bộ quy trình zkML này giải quyết vấn đề tin cậy cơ bản và tạo ra bằng chứng đủ để chỉ ra rằng kết quả của một phép tính là đúng mà không tiết lộ các đầu vào ẩn. Điều này cũng cho phép người dùng như bạn và tôi xác minh rằng một công ty (như OpenAI) đang sử dụng mô hình mà họ tuyên bố và hoạt động theo cách họ quảng cáo.
Vâng, SevenX Ventures giải thích hình ảnh trên theo các giai đoạn sau:
- Các đầu vào và tham số mô hình (công thức toán học mà ML được huấn luyện trên) có thể được ẩn và hàm mật mã (ví dụ như băm) được công bố cho phép xác minh tính xác thực của dữ liệu.
- Ở giai đoạn arithmetization, tất cả, mô hình ML được chuyển đổi thành mạch toán học cuối cùng xác minh mô hình chính nó.
- Sau đó, như chúng ta đã thảo luận ở trên, các nguyên tắc zk-SNARKS được sử dụng để tạo ra bằng chứng cho rằng mô hình machine learning đang hoạt động theo cách mà nó được giả định và quan trọng hơn là không tiết lộ bất kỳ mô hình hoặc dữ liệu cơ bản nào được sử dụng để huấn luyện nó.
- Cuối cùng, đầu ra và bằng chứng được xác minh bởi người xác minh.
Vậy một số ứng dụng hữu ích của zkML có thể là các kết quả như điểm tín dụng mà không tiết lộ dữ liệu của các cơ quan tín dụng, các mạng máy học phi tập trung và việc huấn luyện mô hình an toàn ngoại tuyến với xác minh on-chain.
ZkML – The Next Big Narrative in AI
It's bit complex to understand for many.
I'll break down it for you in the simplest way possible 🧵
— hitesh.eth (@hmalviya9) February 24, 2024
Các trường hợp sử dụng thực tế của zkML trong thế giới WEB3
Chúng ta đã học được rằng Zero-Knowledge Proofs là một công cụ mạnh mẽ và kết hợp với các kỹ thuật máy học, chúng giải quyết một số thách thức liên quan đến quyền riêng tư của dữ liệu. Không gian Web3 dựa trên công nghệ blockchain chạy trên những nguyên tắc mà bảo mật và phi tập trung. Việc tích hợp các kỹ thuật AI/ML với công nghệ blockchain có thể đóng vai trò rất quan trọng trong Thế giới Web3, phải không?
AI & ML cung cấp cách tăng cường trải nghiệm người dùng trong không gian phi tập trung với các tính năng như cá nhân hóa tự động hóa mượt mà và nhiều hơn nữa. Tuy nhiên, việc tích hợp các phương pháp ML trong khi duy trì bảo mật và quyền riêng tư của dữ liệu trong môi trường web3 có thể gặp khó khăn. Đây là nơi mà các bằng chứng zkML vào cuộc như một yếu tố thay đổi trò chơi.
Khi chúng ta nói về ứng dụng của các mô hình zkML trong thế giới Web3, nó mang lại lợi ích hai chiều:
- Bảo vệ Quyền Riêng tư của Mô Hình: zkML đảm bảo rằng các tham số nội bộ và cách thức hoạt động của mô hình ML (hãy nghĩ về nó như một công thức phức tạp) vẫn được giữ bí mật. Lúc này, bảo vệ tài sản của người dùng.
- Xác minh Thực hiện Mô Hình: Bạn có thể tin tưởng rằng mô hình ML đã xử lý dữ liệu của bạn một cách chính xác mà không cần phải tin tưởng vào ứng dụng chính nó. Điều này xây dựng sự minh bạch và niềm tin.
Bây giờ chúng ta sẽ xem xét chi tiết vào các lĩnh vực khác nhau trong web3 mà ZK+ML hoạt động. Bạn đã sẵn sàng chưa?
Lĩnh vực DeFi (Tài chính phi tập trung)
Trong phạm vi đánh giá rủi ro
Các nền tảng DeFi có thể sử dụng các mô hình trí tuệ nhân tạo và máy học để đánh giá khả năng trả nợ và ngăn chặn các hoạt động gian lận một cách chính xác. Công nghệ blockchain cung cấp một sổ cái an toàn và minh bạch cho phép các mô hình ML này truy cập vào dữ liệu lịch sử. Tất cả điều này có thể được thực hiện với sự riêng tư khi zkML được sử dụng.
Ví dụ, các nền tảng DeFiChain như DeFiChain có thể sử dụng các kỹ thuật zkML để xác minh tính chính xác của các mô hình trí tuệ nhân tạo được sử dụng trong phát hiện gian lận và đánh giá rủi ro tín dụng mà không tiết lộ bất kỳ dữ liệu người dùng nào. Điều này tuân thủ theo nguyên tắc phi tập trung và giảm bớt khó khăn trong việc đánh giá rủi ro tín dụng không cần phép.
DeFiChain cũng có thể sử dụng zk-SNARKs để tạo ra các chứng minh mật mã cho việc các mô hình trí tuệ nhân tạo của họ tạo ra các đánh giá rủi ro chính xác. Điều này có thể được thực hiện mà không tiết lộ các hoạt động nội bộ của mô hình như các hệ số trong hồi quy logistic hoặc cây quyết định trong rừng ngẫu nhiên (các phương pháp được sử dụng bởi họ). Điều này đảm bảo cho người dùng rằng các mô hình đang hoạt động chính xác.
Trong lĩnh vực quản lý tài sản
Quản lý tài sản phi tập trung cung cấp một cơ hội cho người dùng đầu tư vào các chiến lược được cung cấp bởi trí tuệ nhân tạo với blockchain đảm bảo việc thực thi an toàn của các chiến lược này. Nó cũng cung cấp các giao dịch minh bạch và không thể sửa đổi, từ đó tăng cường niềm tin của người dùng.
RockyBot hoặc Rockefeller bot của Modulus Labs, bot giao dịch hoàn toàn phi tập trung đầu tiên trên thế giới, sử dụng trí tuệ nhân tạo/máy học cho quản lý tài sản một cách tuyệt vời. Nó sử dụng kỹ thuật zkSNARKs để chứng minh rằng các quyết định giao dịch của bot phù hợp với các dự đoán được thực hiện bởi mô hình RNN/LSTM được huấn luyện (Mạng nơ-ron Hồi quy (RNN), Mạng LSTM (Long Short-Term Memory)). Điều này được thực hiện mà không tiết lộ các trọng số hoặc kết nối cụ thể trong mạng nơ-ron, từ đó đảm bảo rằng bot đang hoạt động như dự kiến.
Gamefi
Sử dụng tác nhân AI trong trò chơi
Blockchain cho phép phát triển các trò chơi có thể được chứng minh là công bằng và không thể can thiệp, nơi các đại lý trí tuệ nhân tạo có thể được sử dụng làm đối thủ. Điều này nhất định đảm bảo cho người chơi rằng trí tuệ nhân tạo hoạt động như dự kiến và tạo ra một trải nghiệm chơi game cân bằng và an toàn hơn, bạn biết đấy.
Loving the Win/Draw/Loss indicator bar in the Chess World Cup.
If only Chess24/Chess.com could switch to Leela for evaluations; so we could have draw % during the games, and not just in the opening phase. pic.twitter.com/zxFPo1dGT3
— Thomas Ahle (@thomasahle) August 23, 2023
Bây giờ nói về nơi mà zkML được sử dụng trong các trò chơi, tôi nghĩ rằng trong các trò chơi như Leela Chess Zero (do Modulus Labs phát triển) để xác minh rằng các đối thủ trí tuệ nhân tạo không bị thao túng, bạn biết đấy.
Phân tích dữ liệu trò chơi và cá nhân hóa trong trò chơi
Với blockchain, điều quan trọng là công nghệ này cho phép lưu trữ và quản lý dữ liệu của người chơi một cách an toàn và cho phép các nhà phát triển trò chơi sử dụng trí tuệ nhân tạo để tạo ra những trải nghiệm cá nhân hóa. Trong thực tế, các phần thưởng và nội dung trong trò chơi có thể được tạo ra dành riêng cho sở thích cá nhân của từng người chơi dựa trên phân tích dữ liệu. Tất cả điều này vẫn đảm bảo sự riêng tư của người dùng, phải không?
SocialFi
Bằng chứng về tính nhân văn và xác minh danh tính
Cho phép tôi kể bạn nghe rằng các nền tảng SocialFi có thể sử dụng blockchain để xác minh danh tính một cách an toàn và phi tập trung. Đúng vậy! Bạn biết đấy! Điều này bao gồm việc áp dụng các giải pháp được cung cấp bởi trí tuệ nhân tạo như nhận dạng khuôn mặt hoặc nhãn mắt để đảm bảo sự riêng tư của người dùng thông qua các kỹ thuật như ZKP.
Để cho bạn một ví dụ về điều này sẽ là các dự án nổi tiếng như Worldcoin làm việc theo các khái niệm của zkML. Làm thế nào?
Vâng, Worldcoin sử dụng zk-SNARKs (như chúng ta đã thảo luận trước đó) để chứng minh rằng mô hình nhận dạng nhãn mắt của họ đã xác định một cá nhân duy nhất, mà không tiết lộ các đặc điểm cụ thể được trích xuất từ nhãn mắt hoặc các tham số nội bộ của mô hình.
Hệ thống đề xuất và quản lý nội dung được cá nhân hóa
Ồ, có lẽ không ngạc nhiên nếu tôi nói rằng các nền tảng SocialFi tận dụng trí tuệ nhân tạo để cá nhân hóa dòng thời gian và các đề xuất cho người dùng. Khi nào phi tập trung lại hữu ích ở đây bạn tự hỏi? Vâng, blockchain có thể đảm bảo tính công bằng và minh bạch của các thuật toán này và vì vậy nó cố gắng ngăn chặn sự can thiệp.
Những gì chúng ta thực sự muốn tìm hiểu ở đây là rằng SocialFi + zkML được kết hợp để xác minh rằng các thuật toán đề xuất (như sắp xếp dòng thời gian) hoạt động như dự kiến mà không tiết lộ các chi tiết cơ bản của mô hình.
Tuy nhiên, nó không chỉ dừng lại ở đó. Sự kết hợp này cũng có thể được sử dụng để lưu trữ và chuyển thông tin nhạy cảm như dữ liệu tài chính hoặc y tế, bạn biết đấy.
Tổng kết
Tóm lại, chúng ta có thể đồng ý rằng đã có một sự bùng nổ thông tin về zero knowledge machine learning. Ban đầu, chúng ta bắt đầu bằng cách giải quyết các vấn đề về tính toàn vẹn với ML bằng cách hiểu cách nó hoạt động để giới thiệu tại sao lại cần có một công nghệ như chứng minh không có kiến thức để can thiệp phải không?
Chúng ta đã xác định rằng zkML đảm bảo việc tạo ra đầu ra/câu trả lời mà không tiết lộ dữ liệu huấn luyện nhạy cảm và điều này cơ bản là để cho người dùng cuối cùng thưởng thức trái ngọt của phi tập trung và bảo mật dữ liệu. Nhưng không chỉ thế. Chúng ta có sự đảm bảo về tính toàn vẹn tính toán và môi trường minh bạch nơi trí tuệ nhân tạo và machine learning tồn tại cùng nhau. Và có, chúng ta đã chứng minh điều này bằng một số ứng dụng thực tế trong web3.