Công nghệ Granit IBM 3.2: Lý thuyết mới nâng cao hiệu suất AI hỗn hợp

Granit IBM 3.2 bổ sung lý luận nâng cao cho AI hỗn hợp của nó

Granit IBM 3.2 đang thêm vào lý luận nâng cao cho AI hỗn hợp của mình. Điều này đồng nghĩa với việc cải thiện khả năng giải quyết các vấn đề phức tạp và tăng cường hiệu suất của các mô hình ngôn ngữ lớn. #IBM #AI #GranitIBM3.2 #Lýluậnnângcao #Sựkiệnngàyhômniày

Nguồn: https://www.zdnet.com/article/ibm-granite-3-2-adds-enhanced-reasoning-to-its-ai-mix/

Granit IBM 3.2 bổ sung lý luận nâng cao cho AI hỗn hợp của nó

IBM/ZDNet

Trong phần bổ sung mới nhất của họ vào họ các mô hình ngôn ngữ lớn (LLM), IBM đã tiết lộ đá granit 3.2. Bản phát hành mới này tập trung vào việc cung cấp nhỏ, hiệu quả, thực tế Trí tuệ nhân tạo (AI) Giải pháp cho các doanh nghiệp.

IBM đã tiếp tục cập nhật dòng Granit LLMS của mình với tốc độ nhanh chóng. Bản phát hành cuối cùng của nó, Đá granit 3.1xuất hiện vào cuối năm 2024. Phiên bản đó về cơ bản là một bản cập nhật. Mô hình mới này, tuy nhiên, thêm thử nghiệm Chuỗi suy nghĩ (COT) khả năng lý luận cho túi thủ thuật của nó.

Cũng: Hầu hết các công nhân Hoa Kỳ chưa sử dụng AI tại nơi làm việc. Nghiên cứu này cho thấy một lý do tại sao

Lý do COT là một kỹ thuật AI tiên tiến cho phép các LLM phá vỡ các vấn đề phức tạp thành các bước hợp lý. Quá trình này có nghĩa là để bắt chước các quá trình lý luận giống con người. Về lý thuyết, phương pháp này giúp tăng cường đáng kể khả năng của LLM để xử lý các nhiệm vụ cần có nhiều bước, tính toán và ra quyết định.

Cụ thể, IBM COT sử dụng Tối ưu hóa ưu tiên suy nghĩ Khung giúp tăng cường lý luận trên một phổ rộng của các nhiệm vụ theo hướng dẫn. Không giống như các phương pháp học tập củng cố truyền thống tập trung chủ yếu vào các nhiệm vụ dựa trên logic, TPO cho phép cải thiện hiệu suất lý luận được cải thiện mà không phải hy sinh hiệu quả của nhiệm vụ chung. Cách tiếp cận này giúp giảm thiểu sự đánh đổi hiệu suất phổ biến được thấy trong các mô hình khác chuyên về lý luận.

Vì vậy, điều này tiến lên có ý nghĩa gì đối với bạn và tôi? IBM giải thích rằng nếu bạn nghĩ về việc đưa ra một lời nhắc của AI Chatbot, một quy trình gọi là “nhanh chóng chuỗi“, Bạn nhận được một câu trả lời cụ thể. Ví dụ, với việc nhanh chóng đánh xích câu hỏi” Bầu trời có màu gì? “, Bạn nên nhận được câu trả lời” màu xanh “.

“Tuy nhiên, nếu được yêu cầu giải thích 'Tại sao bầu trời xanh?' Sử dụng COT nhắc nhởAI trước tiên sẽ xác định ý nghĩa của 'màu xanh' (một màu chính), sau đó suy luận rằng bầu trời xuất hiện màu xanh do sự hấp thụ của các màu khác bởi khí quyển. Phản hồi này cho thấy khả năng của AI để xây dựng một đối số logic, “hoặc sự xuất hiện mà LLM đang lý luận về một câu trả lời.

Cũng: 15 cách AI đã tiết kiệm thời gian cho tôi tại nơi làm việc – và cách tôi dự định sử dụng nó ngay bây giờ

COT có sẵn trong các phiên bản Granit 8b và 2b. Các nhà phát triển có thể chuyển đổi lý luận trên hoặc tắt theo chương trình. Tùy chọn này cho phép các doanh nghiệp tối ưu hóa các tài nguyên tính toán dựa trên độ phức tạp của nhiệm vụ. Rốt cuộc, đôi khi bạn muốn biết bầu trời như thế nào nếu không có bất kỳ chi tiết khoa học nào. Cách tiếp cận này, các tuyên bố của IBM, cho phép mô hình 8B cạnh tranh với hiệu suất của các mô hình lớn hơn nhiều, chẳng hạn như Claude 3.5 sonnetGPT-4O về các nhiệm vụ lý luận toán học phức tạp.

IBM cũng đã giới thiệu một mô hình ngôn ngữ tầm nhìn hai tỷ (VLM) mới, được thiết kế đặc biệt cho các nhiệm vụ hiểu biết về tài liệu. Sự phát triển này không phải là, như trước tiên bạn có thể nghĩ, một chức năng đồ họa. Thay vào đó, VLM có nghĩa là để cải thiện khả năng hiểu tài liệu của Granit. IBM đã sử dụng nguồn mở của nó Bộ công cụ làm việc Để xử lý 85 triệu tệp PDF và tạo ra 26 triệu cặp câu hỏi tổng hợp để tăng cường khả năng của VLM để xử lý các quy trình công việc nặng tài liệu phức tạp

Trong khi Các công ty AI khác dường như có vấn đề an toànIBM vẫn coi an toàn là chức năng hàng đầu. Granit Guardian 3.2mới nhất trong bộ mô hình an toàn AI của IBM, cung cấp phát hiện rủi ro nâng cao trong các lời nhắc và phản hồi. Phiên bản cập nhật này duy trì hiệu suất trong khi giảm 30%kích thước mô hình, giới thiệu tính năng “niềm tin bằng lời nói” mới để đánh giá rủi ro nhiều sắc thái hơn.

Cũng: Openai cuối cùng đã tiết lộ GPT-4.5. Đây là những gì nó có thể làm

Các doanh nghiệp cũng có thể quan tâm đến khả năng dự báo nâng cao của đá granit. Mới TinyTimeMixers (TTM) Các mô hình với các tham số phụ 10m có thể chạy dự báo dài hạn lên đến hai năm trong tương lai. Những mô hình này rất hữu ích cho phân tích xu hướng trong tài chính, kinh tế và quản lý chuỗi cung ứng. Những mô hình này có thể không giúp bạn lắp ráp đội hình bóng chày tưởng tượng của mình, nhưng cho họ thời gian.

Như trước đây, IBM là nhất AI thân thiện với nguồn mở công ty. Tất cả các mẫu Granit 3.2 đều có sẵn theo giấy phép Apache 2.0 trên Ôm khuôn mặt. Một số mô hình có sẵn trên các nền tảng, bao gồm IBM Watsonx.aiThì OllamaThì Sao chépLM Studio. Cách tiếp cận mở này phù hợp với chiến lược của IBM để làm cho AI dễ tiếp cận hơn và hiệu quả về chi phí cho các doanh nghiệp.

Như Sriram Raghavan, IBM AI Research VP, nhấn mạnh: “Thời đại tiếp theo của AI là về hiệu quả, hội nhập và tác động trong thế giới thực-nơi các doanh nghiệp có thể đạt được kết quả mạnh mẽ mà không cần chi tiêu quá mức cho tính toán.”


Leave a Reply

Your email address will not be published. Required fields are marked *