“Những mô hình ngôn ngữ lớn hoàn hảo hơn nếu không quá khổ?”

#ThửTháchBabyLM: Mô hình ngôn ngữ AI có thể gần hơn với sự hiểu biết của con người?
Các mô hình ngôn ngữ lớn như GPT-3 và Chinchilla đang được phát triển để dự đoán từ tiếp theo trong một câu hoặc cụm từ nhất định. Tuy nhiên, việc tạo ra các AI lớn hơn và có nhiều khả năng đòi hỏi sức mạnh xử lý mà ít công ty sở hữu, và không ít lo ngại rằng một nhóm nhỏ sẽ kiểm soát toàn bộ công nghệ. Hơn nữa, các mô hình ngôn ngữ lớn hơn cũng khó hiểu hơn và thường được mô tả là “hộp đen”.
Trong bối cảnh này, Thử thách BabyLM được đưa ra để đảo ngược mô hình này. Thử thách này kêu gọi các nhóm đào tạo các mô hình ngôn ngữ chức năng sử dụng các tập dữ liệu nhỏ hơn nhằm đạt được một mô hình nhỏ hơn nhưng gần giống với các mô hình cao cấp và có thể tiếp cận dễ dàng hơn. Điều này mang lại cơ hội cho các nhà nghiên cứu để hiểu sâu hơn về quá trình ngôn ngữ của con người. Tuy nhiên, các mô hình ngôn ngữ AI vẫn còn rất khác biệt với con người, và việc tạo ra những mô hình nhỏ hơn và hiệu quả hơn vẫn còn là một thử thách lớn đối với các nhà khoa học máy tính. #AI #NgônNgữTựNhiên #AI_Language_Models

Nguồn: https://www.nytimes.com/2023/05/30/science/ai-chatbots-anguage-learning.html

Khi nói đến chatbot trí tuệ nhân tạo, lớn hơn thường tốt hơn.

Các mô hình ngôn ngữ lớn như ChatGPT và Bard, tạo ra văn bản gốc, đàm thoại, sẽ cải thiện khi chúng được cung cấp nhiều dữ liệu hơn. Mỗi ngày, các blogger truy cập internet để giải thích cách những tiến bộ mới nhất — một ứng dụng tóm tắt‌ ‌các bài báo, podcast do AI tạo ra, một mô hình tinh chỉnh có thể trả lời bất kỳ câu hỏi nào liên quan đến bóng rổ chuyên nghiệp — sẽ “thay đổi mọi thứ”.

Nhưng việc tạo ra AI lớn hơn và có nhiều khả năng hơn đòi hỏi sức mạnh xử lý mà ít công ty sở hữu, và ngày càng có nhiều lo ngại rằng một nhóm nhỏ, bao gồm Google, Meta, OpenAI và Microsoft, sẽ kiểm soát gần như toàn bộ công nghệ.

Ngoài ra, các mô hình ngôn ngữ lớn hơn khó hiểu hơn. Chúng thường được mô tả là “hộp đen”, ngay cả bởi những người thiết kế chúng và những nhân vật hàng đầu trong lĩnh vực này. đã bày tỏ sự khó chịu ‌mục tiêu của ‌AI.A.I. cuối cùng có thể không phù hợp với mục tiêu của chúng ta. Nếu lớn hơn thì tốt hơn, nó cũng đục hơn và độc quyền hơn.

Vào tháng 1, một nhóm các học giả trẻ làm việc trong lĩnh vực xử lý ngôn ngữ tự nhiên – nhánh của AI tập trung vào việc hiểu ngôn ngữ – đã đưa ra một thách thức nhằm cố gắng đảo ngược mô hình này. Nhóm đã kêu gọi các nhóm tạo các mô hình ngôn ngữ chức năng ‌sử dụng các tập dữ liệu có kích thước nhỏ hơn một phần mười nghìn so với các mô hình ngôn ngữ lớn tiên tiến nhất được sử dụng. Một mô hình mini thành công sẽ có khả năng gần giống như các mô hình cao cấp nhưng nhỏ hơn nhiều, dễ tiếp cận hơn và ‌tương thích hơn với con người. Dự án được gọi là Thử thách BabyLM.

Leave a Reply

Your email address will not be published. Required fields are marked *