MIT đã giới thiệu một phương pháp mới để huấn luyện robot, lấy cảm hứng từ mô hình ngôn ngữ lớn. Thay vì dựa vào dữ liệu tập trung tiêu chuẩn, phương pháp này sử dụng một quy mô lớn hơn, bắt chước kho thông tin khổng lồ của các mô hình ngôn ngữ lớn. Việc này giúp robot học được các kỹ năng mới một cách nhanh chóng và hiệu quả.
#MIT #robot #môhìnhngônngữ #huấnluyện #kỹnăngmới
MIT tuần này giới thiệu một mẫu mới để huấn luyện robot. Thay vì tập hợp dữ liệu tập trung tiêu chuẩn được sử dụng để dạy cho robot các nhiệm vụ mới, phương pháp này có quy mô lớn hơn, bắt chước kho thông tin khổng lồ được sử dụng để đào tạo các mô hình ngôn ngữ lớn (LLM).
Các nhà nghiên cứu lưu ý rằng việc học bắt chước – trong đó tác nhân học bằng cách theo dõi một cá nhân thực hiện một nhiệm vụ – có thể thất bại khi đưa ra những thử thách nhỏ. Đây có thể là những thứ như ánh sáng, khung cảnh khác hoặc chướng ngại vật mới. Trong những tình huống đó, robot đơn giản là không có đủ dữ liệu để rút ra nhằm thích ứng.
Nhóm đã xem xét các mô hình như GPT-4 để tìm ra cách tiếp cận dữ liệu mạnh mẽ để giải quyết vấn đề.
Lirui Wang, tác giả chính của bài báo mới cho biết: “Trong lĩnh vực ngôn ngữ, tất cả dữ liệu chỉ là những câu. “Trong lĩnh vực robot, do tính không đồng nhất trong dữ liệu, nếu bạn muốn huấn luyện trước theo cách tương tự, chúng tôi cần một kiến trúc khác.”
Nhóm đã giới thiệu một kiến trúc mới có tên là Máy biến áp tiền huấn luyện không đồng nhất (HPT), kết hợp thông tin từ các cảm biến khác nhau và các môi trường khác nhau. Sau đó, một máy biến áp được sử dụng để tập hợp dữ liệu vào các mô hình huấn luyện. Máy biến áp càng lớn thì đầu ra càng tốt.
Sau đó, người dùng nhập thiết kế, cấu hình robot và công việc họ muốn thực hiện.
Phó giáo sư CMU David Held cho biết: “Ước mơ của chúng tôi là có một bộ não robot phổ quát mà bạn có thể tải xuống và sử dụng cho robot của mình mà không cần đào tạo gì cả”. “Mặc dù chúng tôi chỉ mới ở giai đoạn đầu, nhưng chúng tôi sẽ tiếp tục nỗ lực và hy vọng việc mở rộng quy mô sẽ dẫn đến bước đột phá trong các chính sách về robot, giống như đã làm với các mô hình ngôn ngữ lớn”.
Nghiên cứu này được thành lập một phần bởi Viện nghiên cứu Toyota. Năm ngoái tại TechCrunch Disrupt, TRI ra mắt phương pháp huấn luyện robot qua đêm. Gần đây hơn, nó đã đạt được một quan hệ đối tác mang tính bước ngoặt sẽ hợp nhất nghiên cứu học tập robot của mình với phần cứng Boston Dynamics.