#Sựkiệnngàyhômnao #AI #Minecraft
Nhóm nhà nghiên cứu AI đã thành công trong việc xây dựng một bot Minecraft thông qua việc sử dụng GPT-4 trong quá trình thử và sai để tự viết mã cho mình. Bot này mang tên Du hành và là một ví dụ về “tác nhân hiện thân” – một AI có khả năng tự di chuyển và hành động tự do trong môi trường mô phỏng hoặc thực tế.
Minecraft được xem là một nơi tốt để thử nghiệm các giải pháp như vậy, vì nó là một đại diện gần đúng của thế giới thực, có các quy tắc và vật lý đơn giản và dễ hiểu, nhưng cũng đủ phức tạp và cởi mở để có nhiều thứ để hoàn thành hoặc thử.
Với việc sử dụng GPT-4, Du hành đã vượt trội hơn rất nhiều so với các bot khác, có khả năng tìm thấy nhiều thứ hơn, học nhiều kỹ năng hơn và khám phá một khu vực rộng lớn hơn nhiều. Tuy nhiên, sự thành công này đòi hỏi những nỗ lực lớn hơn để viết mã hữu ích và sử dụng GPT-4 thay vì GPT-3.5.
Nghiên cứu này không chỉ là cho vui hay cho người chơi Minecraft, mà còn có ý nghĩa quan trọng trong việc tìm ra các phương pháp mà các mô hình AI đơn giản có thể tự cải thiện dựa trên “kinh nghiệm” của chúng. Điều này sẽ đóng vai trò quan trọng trong phát triển các rô-bốt giúp chúng ta trong công việc và cuộc sống hàng ngày.
Nguồn: https://techcrunch.com/2023/06/02/this-ai-used-gpt-4-to-become-an-expert-minecraft-player/
Các nhà nghiên cứu AI đã xây dựng một bot Minecraft có thể khám phá và mở rộng khả năng của nó trong thế giới mở của trò chơi — nhưng không giống như các bot khác, bot này về cơ bản đã viết mã của riêng mình thông qua thử và sai và rất nhiều của các truy vấn GPT-4.
Được gọi là Du hành, hệ thống thử nghiệm này là một ví dụ về “tác nhân hiện thân”, một AI có thể di chuyển và hành động tự do và có mục đích trong môi trường mô phỏng hoặc thực tế. Trợ lý cá nhân loại AI và chatbot không thực sự phải làm công việc, chứ đừng nói đến việc điều hướng một thế giới phức tạp để hoàn thành công việc đó. Nhưng đó chính xác là những gì một robot gia đình có thể sẽ làm trong tương lai, vì vậy có rất nhiều nghiên cứu về cách chúng có thể làm điều đó.
Minecraft là một nơi tốt để thử nghiệm những thứ như vậy bởi vì nó là một đại diện rất (rất) gần đúng của thế giới thực, với các quy tắc và vật lý đơn giản và dễ hiểu, nhưng cũng đủ phức tạp và cởi mở để có nhiều thứ để hoàn thành hoặc thử. Trình mô phỏng được xây dựng có mục đích cũng rất tuyệt, nhưng chúng có những hạn chế riêng.
Của tôiDojo là một khung mô phỏng được xây dựng xung quanh Minecraft, vì bạn không thể đặt một AI ngẫu nhiên vào đó và mong nó hiểu tất cả những khối và lợn này đang làm gì. Những người tạo ra nó (rất trùng lặp với nhóm Du hành) đã tổng hợp các video trên YouTube về trò chơi, bản ghi, bài viết trên wiki và rất nhiều bài đăng trên Reddit từ r/minecraft, cùng với các dữ liệu khác, để người dùng có thể tạo hoặc tinh chỉnh mô hình AI về họ. Nó cũng cho phép những mô hình đó được đánh giá ít nhiều khách quan bằng cách xem chúng làm tốt như thế nào những việc như xây hàng rào quanh một con lạc đà không bướu hoặc tìm và khai thác kim cương.
nhà du hành vượt trội trong các nhiệm vụ này, hoạt động tốt hơn nhiều so với mô hình duy nhất khác gần đó, AutoGPT. Nhưng họ có một cách tiếp cận tương tự: sử dụng GPT-4 để viết mã của riêng họ khi họ thực hiện.
Thông thường, bạn chỉ cần đào tạo một mô hình trên tất cả dữ liệu Minecraft tốt đó và hy vọng nó tìm ra cách chiến đấu với bộ xương khi mặt trời lặn. Tuy nhiên, Voyager bắt đầu tương đối ngây thơ và khi gặp phải mọi thứ trong trò chơi, nó có một cuộc trò chuyện nội bộ nhỏ với GPT-4 về những gì nó nên làm và làm như thế nào.
Ví dụ, giả sử màn đêm buông xuống và những bộ xương đó xuất hiện. Đặc vụ có một ý tưởng chung về điều này, nhưng nó tự hỏi, một người chơi giỏi trò chơi này sẽ làm gì khi có quái vật ở gần? Chà, GPT-4 nói rằng, nếu bạn muốn khám phá thế giới một cách an toàn, bạn sẽ muốn chế tạo và trang bị một thanh kiếm, sau đó dùng nó đập vào bộ xương mà không bị trúng đòn. Và ý thức chung về những việc cần làm được chuyển thành các mục tiêu cụ thể: thu thập đá và gỗ, chế tạo một thanh kiếm tại bàn chế tạo, trang bị cho nó và chiến đấu với một bộ xương.
Làm xong những việc đó thì được nhập vào thư viện kỹ năng chung để sau này khi có nhiệm vụ “đi sâu vào hang tìm quặng sắt” thì không phải học đánh lại từ đầu. Nó vẫn sử dụng GPT, nhưng GPT-3.5 rẻ hơn và nhanh hơn, cho nó biết các kỹ năng phù hợp nhất với một tình huống nhất định — vì vậy, nó không cố khai thác bộ xương và chiến đấu với quặng.
Nó tương tự như một tác nhân như AutoGPT, khi đối mặt với một giao diện mà nó chưa biết, phải tự học cách điều hướng nó để đạt được mục tiêu. Nhưng Minecraft là một môi trường sâu hơn nhiều so với những gì nó từng giải quyết, vì vậy một tác nhân đặc biệt như Du hành sẽ làm tốt hơn nhiều. Nó tìm thấy nhiều thứ hơn, học nhiều kỹ năng hơn và khám phá một khu vực rộng lớn hơn nhiều so với các bot khác.
Thật thú vị mặc dù có lẽ không có gì đáng ngạc nhiên, GPT-4 đã vượt qua GPT-3.5 (tức là ChatGPT) khi nói đến việc tạo mã hữu ích. Một thử nghiệm thay thế cái trước bằng cái sau đã khiến tác nhân gặp khó khăn ngay từ đầu, thậm chí có thể theo nghĩa đen, và không cải thiện được. Có thể không rõ ràng khi nói chuyện với hai người mẫu rằng một người thông minh hơn nhiều, nhưng sự thật là bạn không cần phải đặc biệt thông minh để tiếp tục một cuộc trò chuyện có vẻ thông minh (hãy hỏi tôi làm sao tôi biết). Viết mã khó hơn nhiều và GPT-4 là một bản cập nhật lớn ở đó.
Mục đích của nghiên cứu này không phải dành cho những người chơi Minecraft lỗi thời mà là để tìm ra các phương pháp mà các mô hình AI tương đối đơn giản có thể tự cải thiện dựa trên “kinh nghiệm” của họ, vì không có từ nào tốt hơn. Nếu chúng ta muốn có rô-bốt giúp chúng ta trong nhà, bệnh viện và văn phòng, thì chúng sẽ cần học và áp dụng những bài học đó vào các hành động trong tương lai.
Bạn có thể đọc thêm về Voyager ngay tại đây.
[ad_2]