Falcon 3 của UAE: Thách thức lãnh đạo nguồn mở với mô hình AI nhỏ

Điểm chuẩn của Falcon 3
Chính phủ UAE đã công bố ra mắt Falcon 3, một dòng mô hình ngôn ngữ nhỏ (SLM) nguồn mở, thách thức các nhà lãnh đạo nguồn mở trong bối cảnh nhu cầu về các mô hình AI nhỏ tăng cao. Falcon 3 được thiết kế để chạy hiệu quả trên cơ sở hạ tầng dựa trên GPU đơn, nhẹ, với bốn kích cỡ mô hình từ 1B đến 10B. Sự phát triển của Falcon 3 đến trong thời điểm nhu cầu về SLM đang tăng cao, với tính hiệu quả, khả năng chi trả và khả năng triển khai trên các thiết bị có nguồn lực hạn chế.

#Falcon3 #AI #SLM #FalconPlayground #TII #UAE Nguồn: https://venturebeat.com/ai/uaes-falcon-3-challenges-open-source-leaders-amid-surging-demand-for-small-ai-models/

Tham gia các bản tin hàng ngày và hàng tuần của chúng tôi để có những cập nhật mới nhất và nội dung độc quyền về phạm vi phủ sóng AI hàng đầu trong ngành. Tìm hiểu thêm


Chính phủ UAE hỗ trợ Viện đổi mới công nghệ (TII) đã công bố ra mắt Falcon 3, một dòng mô hình ngôn ngữ nhỏ (SLM) nguồn mở được thiết kế để chạy hiệu quả trên cơ sở hạ tầng dựa trên GPU đơn, nhẹ.

Falcon 3 có bốn kích cỡ mô hình – 1B, 3B, 7B và 10B – với các biến thể cơ bản và hướng dẫn, hứa hẹn dân chủ hóa quyền truy cập vào các khả năng AI nâng cao cho các nhà phát triển, nhà nghiên cứu và doanh nghiệp. Theo bảng xếp hạng Ôm Mặt, các mô hình này đã hoạt động tốt hơn hoặc gần giống với các đối tác nguồn mở phổ biến trong lớp quy mô của chúng, bao gồm cả Llama của Meta và người dẫn đầu danh mục Qwen-2.5.

Sự phát triển đến vào thời điểm nhu cầu về SLMvới ít tham số hơn và thiết kế đơn giản hơn LLM, đang phát triển nhanh chóng nhờ tính hiệu quả, khả năng chi trả và khả năng triển khai trên các thiết bị có nguồn lực hạn chế. Chúng phù hợp với nhiều ứng dụng trong các ngành, như dịch vụ khách hàng, chăm sóc sức khỏe, ứng dụng di động và IoT, trong đó LLM thông thường có thể quá tốn kém về mặt tính toán để hoạt động hiệu quả. Theo Định giá báo cáothị trường dành cho những mẫu xe này dự kiến ​​sẽ tăng trưởng với tốc độ CAGR gần 18% trong 5 năm tới.

Falcon 3 mang đến điều gì?

Được đào tạo trên 14 nghìn tỷ mã thông báo — nhiều hơn gấp đôi so với phiên bản tiền nhiệm Falcon 2 — dòng Falcon 3 sử dụng kiến ​​trúc chỉ dành cho bộ giải mã với sự chú ý đến truy vấn được nhóm để chia sẻ các tham số và giảm thiểu mức sử dụng bộ nhớ cho bộ nhớ đệm khóa-giá trị (KV) trong quá trình suy luận. Điều này cho phép vận hành nhanh hơn và hiệu quả hơn khi xử lý các tác vụ dựa trên văn bản đa dạng.

Về cốt lõi, các mô hình này hỗ trợ bốn ngôn ngữ chính — tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha và tiếng Bồ Đào Nha — và được trang bị cửa sổ ngữ cảnh 32K, cho phép chúng xử lý các dữ liệu đầu vào dài, chẳng hạn như các tài liệu có nhiều từ ngữ.

“Falcon 3 rất linh hoạt, được thiết kế cho cả mục đích chung và nhiệm vụ chuyên biệt, mang lại sự linh hoạt cao độ cho người dùng. Mô hình cơ sở của nó hoàn hảo cho các ứng dụng tổng hợp, trong khi biến thể hướng dẫn vượt trội trong các nhiệm vụ đàm thoại như dịch vụ khách hàng hoặc trợ lý ảo,” TII lưu ý trên trang của mình. trang web.

Theo bảng xếp hạng trên Hugging Face, trong khi cả bốn mẫu Falcon 3 đều hoạt động khá tốt thì phiên bản 10B và 7B mới là những ngôi sao của chương trình, đạt được kết quả tiên tiến về lý luận, hiểu ngôn ngữ, làm theo hướng dẫn, viết mã và toán học.

Trong số các mẫu thuộc loại kích thước tham số 13B, phiên bản 10B và 7B của Falcon 3 vượt trội so với các đối thủ, bao gồm Gemma 2-9B của GoogleLlama của Meta 3.1-8B, Mistral-7Bvà Yi 1,5-9B. Chúng thậm chí còn vượt qua người dẫn đầu danh mục Qwen 2,5-7B của Alibaba ở hầu hết các điểm chuẩn — chẳng hạn như MUSR, MATH, GPQA và IFEval — ngoại trừ MMLU, đây là bài kiểm tra để đánh giá mức độ hiểu và xử lý ngôn ngữ của các mô hình ngôn ngữ của con người.

Điểm chuẩn của Falcon 3
Điểm chuẩn của Falcon 3

Triển khai trên các ngành

Với các mẫu Falcon 3 hiện có sẵn trên ôm mặtTII hướng tới mục tiêu phục vụ nhiều đối tượng người dùng, cho phép triển khai AI hiệu quả về mặt chi phí mà không gặp trở ngại về mặt tính toán. Với khả năng xử lý các tác vụ cụ thể, tập trung vào miền với thời gian xử lý nhanh, các mô hình này có thể hỗ trợ nhiều ứng dụng khác nhau ở biên và trong môi trường nhạy cảm về quyền riêng tư, bao gồm chatbot dịch vụ khách hàng, hệ thống đề xuất được cá nhân hóa, phân tích dữ liệu, phát hiện gian lận, chẩn đoán chăm sóc sức khỏe, tối ưu hóa chuỗi cung ứng và đào tạo.

Viện cũng có kế hoạch mở rộng dòng Falcon hơn nữa bằng cách giới thiệu các mẫu xe có khả năng đa phương thức. Những mẫu xe này dự kiến ​​sẽ ra mắt vào khoảng tháng 1 năm 2025.

Đáng chú ý, tất cả các mô hình đã được phát hành theo Giấy phép TII Falcon 2.0, giấy phép dựa trên Apache 2.0 dễ dãi với chính sách sử dụng được chấp nhận nhằm khuyến khích phát triển và triển khai AI có trách nhiệm. Để giúp người dùng bắt đầu, TII cũng đã ra mắt Falcon Playground, một môi trường thử nghiệm nơi các nhà nghiên cứu và nhà phát triển có thể thử các mô hình Falcon 3 trước khi tích hợp chúng vào ứng dụng của họ.

[ad_2]

Leave a Reply

Your email address will not be published. Required fields are marked *