Viết lại: “Mô hình ngôn ngữ lớn cần đến ‘giới hạn’ để tối ưu hóa hiệu suất?”

#Thử_thách_BabyLM: Chatbot trí tuệ nhân tạo có thể tốt hơn nếu không quá lớn

Trong lĩnh vực chatbot trí tuệ nhân tạo, các mô hình ngôn ngữ lớn như ChatGPT và Bard thường được coi là tốt hơn với khả năng tạo ra văn bản gốc và đàm thoại vượt trội. Tuy nhiên, việc tạo ra các mô hình AI quá lớn và tối ưu đang gây ra nhiều lo ngại. Một số công ty lớn như Google, Meta, OpenAI và Microsoft sở hữu sức mạnh xử lý rất lớn và có thể kiểm soát toàn bộ công nghệ.

Bên cạnh đó, việc tạo ra các mô hình ngôn ngữ lớn hơn đồng nghĩa với việc chúng khó hiểu và được mô tả là “hộp đen”. Thật vậy, nếu như AI quá lớn thì sẽ đối diện với nhiều rủi ro và có thể không phù hợp với mục tiêu của con người.

Thách thức BabyLM là một dự án có mục tiêu đưa các mô hình ngôn ngữ đến gần hơn với sự hiểu biết của con người. Thử thách này kêu gọi các nhóm tạo các mô hình ngôn ngữ sử dụng các tập dữ liệu nhỏ hơn một phần mười nghìn so với các mô hình ngôn ngữ lớn tiên tiến nhất được sử dụng. Một mô hình mini thành công sẽ có khả năng tương thích hơn với con người và dễ tiếp cận hơn.

Tuy các mô hình ngôn ngữ lớn hiện nay là các mạng thần kinh được thiết kế để dự đoán từ tiếp theo trong một câu hoặc cụm từ nhất định. Tuy nhiên, chúng vẫn còn rất khác biệt so với cơ thể, đời sống xã hội và cảm giác của con người. Vì vậy, để hiểu cách hoạt động của tâm trí con người, các nhà khoa học đang nghiên cứu thử thách BabyLM này với hy vọng đưa ra các mô hình ngôn ngữ gần giống với các mô hình cao cấp nhưng lại nhỏ hơn rất nhiều.

Nguồn: https://www.nytimes.com/2023/05/30/science/ai-chatbots-language-learning-models.html

Khi nói đến chatbot trí tuệ nhân tạo, lớn hơn thường tốt hơn.

Các mô hình ngôn ngữ lớn như ChatGPT và Bard, tạo ra văn bản gốc, đàm thoại, sẽ cải thiện khi chúng được cung cấp nhiều dữ liệu hơn. Mỗi ngày, các blogger truy cập internet để giải thích cách những tiến bộ mới nhất — một ứng dụng tóm tắt‌ ‌các bài báo, podcast do AI tạo ra, một mô hình tinh chỉnh có thể trả lời bất kỳ câu hỏi nào liên quan đến bóng rổ chuyên nghiệp — sẽ “thay đổi mọi thứ”.

Nhưng việc tạo ra AI lớn hơn và có nhiều khả năng hơn đòi hỏi sức mạnh xử lý mà ít công ty sở hữu, và ngày càng có nhiều lo ngại rằng một nhóm nhỏ, bao gồm Google, Meta, OpenAI và Microsoft, sẽ kiểm soát gần như toàn bộ công nghệ.

Ngoài ra, các mô hình ngôn ngữ lớn hơn khó hiểu hơn. Chúng thường được mô tả là “hộp đen”, ngay cả bởi những người thiết kế chúng và những nhân vật hàng đầu trong lĩnh vực này. đã bày tỏ sự khó chịu ‌mục tiêu của ‌AI.A.I. cuối cùng có thể không phù hợp với mục tiêu của chúng ta. Nếu lớn hơn thì tốt hơn, nó cũng đục hơn và độc quyền hơn.

Vào tháng 1, một nhóm các học giả trẻ làm việc trong lĩnh vực xử lý ngôn ngữ tự nhiên – nhánh của AI tập trung vào việc hiểu ngôn ngữ – đã đưa ra một thách thức nhằm cố gắng đảo ngược mô hình này. Nhóm đã kêu gọi các nhóm tạo các mô hình ngôn ngữ chức năng ‌sử dụng các tập dữ liệu có kích thước nhỏ hơn một phần mười nghìn so với các mô hình ngôn ngữ lớn tiên tiến nhất được sử dụng. Một mô hình mini thành công sẽ có khả năng gần giống như các mô hình cao cấp nhưng nhỏ hơn nhiều, dễ tiếp cận hơn và ‌tương thích hơn với con người. Dự án được gọi là Thử thách BabyLM.

Leave a Reply

Your email address will not be published. Required fields are marked *