
Hàng loạt giá đỡ máy chủ hiện đại trong trung tâm dữ liệu được chiếu sáng bằng đèn xanh © iStock
Các nhà nghiên cứu tại EPFL đã phát triển một phần mềm mới – hiện đã được tách ra thành một công ty khởi nghiệp – giúp loại bỏ nhu cầu gửi dữ liệu đến các dịch vụ đám mây của bên thứ ba khi sử dụng trí tuệ nhân tạo để hoàn thành một tác vụ. Điều này có thể thách thức mô hình kinh doanh của các tập đoàn công nghệ lớn.
Việc sử dụng trí tuệ nhân tạo cho các công việc hàng ngày đã phát triển nhanh chóng trong ba năm qua. Các mô hình AI ngày càng hữu ích trong việc xử lý dữ liệu nhạy cảm như hồ sơ bệnh nhân, yêu cầu của khách hàng hoặc bất kỳ tài liệu mật nào liên quan đến công việc.
Mỗi khi trí tuệ nhân tạo (AI) được yêu cầu thực hiện một tác vụ, truy vấn bắt đầu cục bộ trên máy tính của người dùng và sau đó được gửi lên “đám mây”, nơi AI tạo ra câu trả lời bằng cách sử dụng phần cứng mạnh mẽ, một quá trình được gọi là suy luận. Câu trả lời cuối cùng được gửi trở lại máy tính cục bộ của người dùng.
Hiện nay, người ta sử dụng khả năng xử lý dữ liệu khổng lồ để thực hiện điều này, đòi hỏi các trung tâm dữ liệu khổng lồ, vốn cũng cần thiết để huấn luyện các mô hình AI, chẳng hạn như ChatGPT, Gemini và Claude. Điều này có nghĩa là cả quá trình suy luận và huấn luyện hiện đang gần như hoàn toàn do các tập đoàn công nghệ lớn kiểm soát.
Cắm và chạy: Trí tuệ nhân tạo phân tán được đơn giản hóa.
Mới đây, các nhà nghiên cứu Gauthier Voron, Geovani Rizk và Rachid Guerraoui từ Phòng thí nghiệm Điện toán Phân tán (DCL) thuộc Trường Khoa học Máy tính và Truyền thông của EPFL đã phát hành phần mềm mới cho phép người dùng tải xuống các mô hình AI mã nguồn mở và sử dụng chúng cục bộ, không cần đến điện toán đám mây để trả lời câu hỏi hoặc hoàn thành nhiệm vụ.
Phần mềm mới, có tên gọi Anyway Systems , điều phối và kết hợp các máy phân tán trên mạng cục bộ thành một cụm máy chủ tại chỗ. Nó sử dụng các kỹ thuật tự ổn định mạnh mẽ để tối ưu hóa việc sử dụng phần cứng cục bộ, trái ngược với quan niệm phổ biến rằng cần các trung tâm dữ liệu khổng lồ để triển khai các mô hình AI.
Hệ thống có thể được cài đặt chỉ trong nửa giờ trên mạng lưới các máy cục bộ mà không có dữ liệu nào rời khỏi mạng, đảm bảo tính riêng tư và chủ quyền. Một mô hình AI rất lớn như GPT-120B, mô hình mở mới nhất và lớn nhất từ OpenAI, có thể được tải xuống và triển khai trên Anyway Systems chỉ trong vài phút, chỉ cần tối đa 4 máy với 1 GPU thông thường mỗi máy (có giá khoảng 2300 CHF mỗi máy), thay vì một thiết bị rack chuyên dụng đắt tiền (có giá khoảng 100.000 CHF), điều mà trước đây được cho là cần thiết để chạy một mô hình AI.
“Trong nhiều năm, người ta tin rằng không thể có các mô hình ngôn ngữ quy mô lớn và các công cụ AI mà không cần nguồn lực khổng lồ, và rằng quyền riêng tư dữ liệu, chủ quyền và tính bền vững chỉ là nạn nhân của điều này, nhưng thực tế không phải vậy và các phương pháp thông minh hơn, tiết kiệm hơn là hoàn toàn khả thi”, Giáo sư Rachid Guerraoui, người đứng đầu DCL, cho biết.
Quyền riêng tư, chủ quyền và tính bền vững
Khi dữ liệu của người dùng được gửi lên đám mây, sẽ nảy sinh những câu hỏi quan trọng về bảo mật và quyền riêng tư, đặc biệt là liệu dữ liệu đó có được sử dụng để huấn luyện hoặc cải thiện các mô hình AI hay không. Ngoài ra, việc phụ thuộc vào các nhà cung cấp dịch vụ đám mây toàn cầu lớn cho các dịch vụ AI cũng đặt ra câu hỏi về chủ quyền AI vì nó chuyển giao quyền kiểm soát các tài sản quốc gia quan trọng—dữ liệu, thuật toán và cơ sở hạ tầng—từ một thực thể trong nước sang các tập đoàn xuyên quốc gia.
Hơn nữa, sức mạnh tính toán khổng lồ cần thiết để trả lời các truy vấn AI trên đám mây – ước tính rằng suy luận chiếm từ 80 đến 90% sức mạnh tính toán liên quan đến AI – đang thúc đẩy sự mở rộng nhanh chóng của các trung tâm dữ liệu khổng lồ dành cho AI, tiêu thụ một lượng năng lượng và nước khổng lồ .
“Anyway Systems nổi bật về khả năng suy luận nhưng nó cũng có thể giúp giảm bớt tài nguyên cần thiết cho việc huấn luyện,” Guerraoui giải thích. Thử nghiệm thí điểm đã cho thấy rằng khi một mô hình được tải xuống và chạy trên các máy cục bộ phân tán thay vì trên một đám mây khổng lồ, chúng ta có thể mất một chút độ trễ – tức là thời gian phản hồi lại một lời nhắc – nhưng không hề ảnh hưởng đến độ chính xác.”
Từ blockchain đến trí tuệ nhân tạo?
“Chúng tôi khẳng định Anyway Systems đơn giản, có khả năng mở rộng và an toàn,” Guerraoui tiếp tục. Các phiên bản trước đó của thuật toán Anyway đã được DCL phát triển nhiều năm trước, nơi các nhà nghiên cứu từ lâu đã tập trung vào điện toán phân tán, khả năng chịu lỗi, tối ưu hóa và bảo mật.
Các thuật toán trước đây của DCL là những giải pháp hiện có cho các thách thức khác đối với các công nghệ như blockchain và tiền điện tử. Ba năm trước, Guerraoui và các đồng nghiệp đã nảy ra ý tưởng áp dụng các kỹ thuật tự ổn định vào trí tuệ nhân tạo, và nhận thấy đây là sự kết hợp gần như hoàn hảo.
“Là một phòng thí nghiệm, chúng tôi có thể là đơn vị duy nhất nghiên cứu về điện toán phân tán mạnh mẽ và học máy cùng nhau, cả về lý thuyết lẫn thực tiễn, và chúng tôi đã tập trung vào việc sử dụng các kỹ thuật tự ổn định cho trí tuệ nhân tạo. Chúng đã hiệu quả! Chúng tôi nghĩ, hãy tiếp tục tối ưu hóa và chúng hoạt động thậm chí còn tốt hơn, kết quả gần như quá tốt đến mức khó tin”, Guerraoui nói.
Hướng tới tương lai – Trí tuệ nhân tạo của riêng bạn tại nhà
Anyway Systems gần đây đã được chọn là một trong sáu dự án đầu tiên nhận được tài trợ từ chương trình Startup Launchpad AI Track – do UBS tài trợ , chương trình tài trợ đầu tiên tại Thụy Sĩ dành riêng cho trí tuệ nhân tạo (AI). Được lựa chọn từ hơn 50 đề xuất, các dự án này đang nhận được tài trợ và hỗ trợ chuyên biệt để đẩy nhanh quá trình phát triển từ nguyên mẫu đến khi sẵn sàng ra thị trường.
Phần mềm đã vượt qua giai đoạn nguyên mẫu và hiện đang được thử nghiệm tại các công ty và cơ quan hành chính trên khắp Thụy Sĩ, bao gồm cả EPFL. Những người dùng đầu tiên hiện đang đánh giá những sự đánh đổi về tốc độ, độ chính xác và chất lượng.
“ Anotherwise Systems đại diện cho một công nghệ thú vị và hấp dẫn, tối ưu hóa việc sử dụng tài nguyên đồng thời đảm bảo an ninh và chủ quyền dữ liệu, và có thể là yếu tố thay đổi cuộc chơi trong lĩnh vực trí tuệ nhân tạo,” Giáo sư David Atienza, phó chủ tịch phụ trách các trung tâm nghiên cứu và nền tảng công nghệ tại EPFL, cho biết. “Cách tiếp cận bền vững của nó hoàn toàn phù hợp với nhu cầu của các nền tảng điện toán tiên tiến của EPFL và sẽ đóng vai trò then chốt trong việc định hình quỹ đạo phát triển trí tuệ nhân tạo trong tương lai tại EPFL, hướng tới việc tiêu thụ ít tài nguyên hơn với việc triển khai các mô hình LLM mới như Apertus .”
Hiện tại, Anyway Systems chưa thể hoạt động trên một máy tính để bàn hoặc máy tính xách tay duy nhất tại nhà, nhưng lịch sử ngành điện toán cho thấy việc tối ưu hóa thường diễn ra rất nhanh chóng.
“Điện thoại của bạn chứa một lượng thông tin khổng lồ mà vài năm trước đây không thể tưởng tượng nổi, và giờ đây bạn có thể làm mọi thứ trên đó. Nó có thể đánh bại cả 100 nhà vô địch cờ vua giỏi nhất cùng một lúc, trong khi chiếc máy tính cần thiết để đánh bại Kasparov lại khổng lồ. Lịch sử cho thấy đây là xu hướng tất yếu. Điều chúng tôi muốn nói là chúng ta sẽ có thể làm mọi thứ tại chỗ về mặt trí tuệ nhân tạo. Chúng ta có thể tải xuống phần mềm trí tuệ nhân tạo mã nguồn mở mà mình lựa chọn, tùy chỉnh nó cho phù hợp với nhu cầu của mình, và chính chúng ta, chứ không phải các tập đoàn công nghệ lớn, mới là người làm chủ mọi thứ,” Guerraoui kết luận.
Hỏi & Đáp
Anyway Systems và Google AI Edge có những điểm khác biệt gì?
Google AI Edge được thiết kế để chạy trên điện thoại di động với các mô hình nhỏ và cụ thể do Google tạo ra, mỗi người dùng chạy một mô hình bị giới hạn bởi khả năng của điện thoại. Không có điện toán phân tán để cho phép triển khai các mô hình AI lớn và mạnh mẽ tương tự được nhiều người dùng trong cùng một tổ chức chia sẻ một cách có khả năng mở rộng và chịu lỗi. Hệ thống Anyway có thể xử lý hàng trăm tỷ tham số chỉ với một vài GPU.
Anyway Systems khác biệt như thế nào so với các giải pháp khác cho phép người dùng chạy LLM cục bộ như Llama hoặc msty.ai?
Hầu hết các phương pháp này giúp triển khai mô hình trên một máy duy nhất, vốn là nguồn gây lỗi duy nhất. Để triển khai các mô hình mạnh mẽ nhất, họ cần mua và đầu tư vào các máy móc rất đắt tiền, về cơ bản là cùng loại máy mà bạn sẽ tìm thấy trong trung tâm dữ liệu. Do đó, nếu bạn chỉ có một máy tính thông thường, các giải pháp được đề cập sẽ hữu ích cho việc triển khai các mô hình nhỏ. Nếu bạn có nhiều máy tính thông thường, bạn không thể kết hợp chúng một cách hiệu quả với các giải pháp được đề cập để triển khai một mô hình lớn, và ngay cả khi có thể, nó cũng cần một nhóm để quản lý và bảo trì hệ thống. Hệ thống Anyway thực hiện điều này một cách minh bạch, mạnh mẽ và tự động. Việc một máy bị lỗi, rời khỏi hoặc tham gia mạng đều được hệ thống Anyway xử lý một cách minh bạch, ngoại trừ một thay đổi nhỏ về độ trễ (thời gian phản hồi yêu cầu).
Các mô hình AI liên tục được cải tiến và cập nhật, vậy những cải tiến này được phản ánh như thế nào ở cấp độ địa phương?
Vì hệ thống Anyway cho phép triển khai bất kỳ mô hình AI mã nguồn mở nào cục bộ, việc cung cấp dữ liệu cục bộ và nhạy cảm cho nó trở nên hoàn toàn an toàn và được chấp nhận, trao lại quyền kiểm soát cho người dùng.
