Microsoft cho ra mắt mô hình AI mới: Sức mạnh lớn trong gói nhỏ

Microsoft đã ra mắt các mô hình AI mới với hiệu suất cao được đóng gói trong các gói nhỏ, giúp giảm thiểu yêu cầu sức mạnh tính toán. Mô hình Phi-4, bao gồm Phi-4-Multimodal và Phi-4-mini, với số tham số thấp nhưng vượt trội về hiệu suất so với các mô hình cùng kích thước. #MicrosoftAI #Phi-4 #AIefficiency. Đọc thêm về xe-tai-nguyen-chuyen-doi-phi-4-cua-microsoft-mang-lai-tri-thong-minh-tien-tien- o #VentureBeat ngày hôm nay. Nguồn: https://venturebeat.com/ai/microsofts-new-phi-4-ai-models-pack-big-performance-in-small-packages/

Tham gia các bản tin hàng ngày và hàng tuần của chúng tôi để cập nhật mới nhất và nội dung độc quyền về bảo hiểm AI hàng đầu trong ngành. Tìm hiểu thêm


Microsoft đã giới thiệu một lớp mới các mô hình AI hiệu quả cao, xử lý văn bản, hình ảnh và lời nói đồng thời trong khi yêu cầu sức mạnh tính toán ít hơn đáng kể so với các hệ thống hiện có. Mới Mô hình Phi-4được phát hành ngày hôm nay, đại diện cho một bước đột phá trong việc phát triển các mô hình ngôn ngữ nhỏ (SLM) cung cấp các khả năng được dành riêng trước đây cho các hệ thống AI lớn hơn nhiều.

Phi-4-Multimodalmột mô hình chỉ với 5,6 tỷ tham số và Phi-4-minivới 3,8 tỷ thông số, vượt trội so với các đối thủ cạnh tranh có kích thước tương tự và thậm chí phù hợp hoặc vượt quá hiệu suất của các mô hình hai lần kích thước của chúng trên các nhiệm vụ nhất định, theo Microsoft Báo cáo kỹ thuật.

Các mô hình này được thiết kế để trao quyền cho các nhà phát triển có khả năng AI tiên tiến, theo ông Weizhu Chen, phó chủ tịch, AI thế hệ tại Microsoft. Cấm Phi-4-Multimodal, với khả năng xử lý lời nói, tầm nhìn và văn bản đồng thời, mở ra những khả năng mới để tạo ra các ứng dụng nhận thức sáng tạo và bối cảnh.

Thành tích kỹ thuật đến vào thời điểm các doanh nghiệp đang ngày càng tìm kiếm các mô hình AI có thể chạy trên phần cứng tiêu chuẩn hoặc tạibờ rìaTrực tiếp – trực tiếp trên các thiết bị chứ không phải trong các trung tâm dữ liệu đám mây – để giảm chi phí và độ trễ trong khi duy trì quyền riêng tư dữ liệu.

Cách Microsoft xây dựng một mô hình AI nhỏ làm tất cả

Những gì bộ Phi-4-Multimodal Ngoài ra là cuốn tiểu thuyết của nó “Hỗn hợp của LorasKỹ thuật, cho phép nó xử lý văn bản, hình ảnh và đầu vào lời nói trong một mô hình duy nhất.

Bằng cách tận dụng hỗn hợp của LORAS, Phi-4-Multimodal mở rộng khả năng đa phương thức trong khi giảm thiểu sự can thiệp giữa các phương thức, thì đó là Tài liệu nghiên cứu trạng thái. Cách tiếp cận này cho phép tích hợp liền mạch và đảm bảo hiệu suất nhất quán trong các nhiệm vụ liên quan đến văn bản, hình ảnh và lời nói/âm thanh.

Sự đổi mới cho phép mô hình duy trì khả năng ngôn ngữ mạnh mẽ của mình trong khi thêm thị lực và nhận dạng giọng nói mà không bị suy giảm hiệu suất thường xảy ra khi các mô hình được điều chỉnh cho nhiều loại đầu vào.

Mô hình đã tuyên bố vị trí hàng đầu trên Hố trí bảng điều khiển khuôn mặt Openasr Với tỷ lệ lỗi từ là 6,14%, vượt trội hơn các hệ thống nhận dạng giọng nói chuyên dụng như Whisperv3. Nó cũng thể hiện hiệu suất cạnh tranh về các nhiệm vụ tầm nhìn như lý luận toán học và khoa học với hình ảnh.

AI nhỏ gọn, tác động lớn: Phi-4-Mini đặt ra các tiêu chuẩn hiệu suất mới

Mặc dù kích thước nhỏ gọn của nó, Phi-4-mini Thể hiện các khả năng đặc biệt trong các nhiệm vụ dựa trên văn bản. Microsoft báo cáo mô hình của các mô hình kích thước tương tự và vượt trội với các mô hình lớn hơn hai lần lớn hơn trên các tiêu chuẩn hiểu ngôn ngữ khác nhau.

Đặc biệt đáng chú ý là hiệu suất của mô hình về các nhiệm vụ toán học và mã hóa. Theo Tài liệu nghiên cứuTiết Phi 4-Mini bao gồm 32 lớp máy biến áp với kích thước trạng thái ẩn 3.072, và kết hợp sự chú ý truy vấn của nhóm để tối ưu hóa việc sử dụng bộ nhớ để tạo bối cảnh dài.

Trên Điểm chuẩn toán học GSM-8KPHI-4-Mini đạt được điểm 88,6%, vượt trội so với hầu hết các mô hình tham số 8 tỷ, trong khi trên điểm chuẩn toán học, nó đạt 64%, cao hơn đáng kể so với các đối thủ có kích thước tương tự.

Đối với điểm chuẩn toán học, mô hình vượt trội so với các mô hình có kích thước tương tự với tỷ suất lợi nhuận lớn, đôi khi hơn 20 điểm. Nó thậm chí còn vượt trội so với điểm số của các mô hình lớn hơn hai lần, các báo cáo kỹ thuật ghi chú.

Triển khai biến đổi: Hiệu quả trong thế giới thực của Phi trong hành động

Dung tíchmột công cụ trả lời AI giúp các tổ chức thống nhất các bộ dữ liệu khác nhau, đã tận dụng gia đình PHI để nâng cao hiệu quả và độ chính xác của nền tảng của họ.

Steve Frederickson, người đứng đầu sản phẩm có công suất, cho biết trong một tuyên bốTừ các thí nghiệm ban đầu của chúng tôi, điều thực sự gây ấn tượng với chúng tôi về PHI là độ chính xác đáng chú ý của nó và dễ triển khai, ngay cả trước khi tùy chỉnh. Kể từ đó, chúng tôi đã có thể tăng cường cả độ chính xác và độ tin cậy, trong khi duy trì hiệu quả chi phí và khả năng mở rộng mà chúng tôi có giá trị ngay từ đầu.

Công suất báo cáo tiết kiệm chi phí 4,2 lần so với quy trình công việc cạnh tranh trong khi đạt được kết quả định tính tương tự hoặc tốt hơn cho các nhiệm vụ tiền xử lý.

AI không giới hạn: Các mẫu Phi 4 của Microsoft mang đến trí thông minh nâng cao ở bất cứ đâu

Trong nhiều năm, sự phát triển của AI đã được thúc đẩy bởi một triết lý đơn lẻ: lớn hơn là tốt hơn. Nhiều tham số hơn, mô hình lớn hơn, nhu cầu tính toán lớn hơn. Nhưng các mô hình PHI-4 của Microsoft thách thức giả định đó, chứng minh rằng sức mạnh không chỉ là về quy mô mà đó là về hiệu quả.

Phi-4-MultimodalPhi-4-mini Được thiết kế không phải cho các trung tâm dữ liệu của gã khổng lồ công nghệ, nhưng đối với thế giới thực, nơi mà sức mạnh tính toán bị hạn chế, các mối quan tâm về quyền riêng tư là tối quan trọng và AI cần phải làm việc liền mạch mà không cần kết nối liên tục với đám mây. Những mô hình này là nhỏ, nhưng chúng mang trọng lượng. Phi-4-Multimodal tích hợp lời nói, tầm nhìn và xử lý văn bản vào một hệ thống duy nhất mà không hy sinh độ chính xác, trong khi Phi-4-Mini cung cấp toán học, mã hóa và hiệu suất lý luận ngang bằng với các mô hình hai lần kích thước của nó.

Đây không chỉ là làm cho AI hiệu quả hơn; Đó là về việc làm cho nó dễ tiếp cận hơn. Microsoft đã định vị Phi-4 để áp dụng rộng rãi, cung cấp cho nó thông qua Azure AI FoundryThì Ôm khuôn mặtDanh mục API NVIDIA. Mục tiêu rất rõ ràng: AI không bị khóa đằng sau phần cứng đắt tiền hoặc cơ sở hạ tầng khổng lồ, nhưng một cơ sở hạ tầng có thể hoạt động trên các thiết bị tiêu chuẩn, ở rìa mạng và trong các ngành công nghiệp nơi tính toán sức mạnh là khan hiếm.

Masaya Nishimaki, một giám đốc của Công ty TNHH Công ty Headwaters của công ty Nhật Bản, nhìn thấy sự tác động trực tiếp. AI AI thể hiện hiệu suất nổi bật ngay cả trong các môi trường có kết nối mạng không ổn định hoặc nơi bảo mật là tối quan trọng, ông nói trong một tuyên bố. Điều đó có nghĩa là AI có thể hoạt động trong các nhà máy, bệnh viện, phương tiện tự trị, nơi yêu cầu trí thông minh thời gian thực, nhưng nơi các mô hình dựa trên đám mây truyền thống bị thiếu.

Tại cốt lõi của nó, Phi-4 đại diện cho một sự thay đổi trong suy nghĩ. AI không chỉ là một công cụ cho những người có máy chủ lớn nhất và các túi sâu nhất. Đó là một khả năng, nếu được thiết kế tốt, có thể hoạt động ở bất cứ đâu, cho bất cứ ai. Điều mang tính cách mạng nhất về Phi-4 không phải là những gì nó có thể làm, đó là nơi nó có thể làm điều đó.

Leave a Reply

Your email address will not be published. Required fields are marked *