GPT-4.5: Sự chính xác và kiến thức tiên tiến giúp tiết kiệm chi phí của doanh nghiệp

Việc phát hành OpenAI GPT-4.5 đã gây ra một số tranh cãi về chi phí của nó, nhưng vẫn có người đánh giá cao độ chính xác và kiến thức mà mô hình này mang lại. Với khả năng học hỏi vượt trội và khả năng xử lý tài liệu kinh doanh tốt hơn, GPT-4.5 được cho là phù hợp với nhiều trường hợp sử dụng trong thế giới doanh nghiệp. Tuy nhiên, vấn đề của nó vẫn đặt ra câu hỏi liệu giá trị mà nó mang lại có xứng đáng với chi phí không. #GPT45 #OpenAI #DoanhNghiệp #ChínhXác #KiếnThức #ChiPhí #MôHìnhAI Nguồn: https://venturebeat.com/ai/gpt-4-5-for-enterprise-do-its-accuracy-and-knowledge-justify-the-cost/

Tham gia các bản tin hàng ngày và hàng tuần của chúng tôi để cập nhật mới nhất và nội dung độc quyền về bảo hiểm AI hàng đầu trong ngành. Tìm hiểu thêm


Việc phát hành Openai GPT-4.5 đã có phần đáng thất vọng, với nhiều người chỉ ra mức giá điên rồ của nó (đắt hơn khoảng 10 đến 20 lần so với Claude 3.7 Sonnet và 15 đến 30 lần tốn kém hơn GPT-4O).

Tuy nhiên, cho rằng đây là mô hình không hợp lý lớn nhất và mạnh nhất của Openai, đáng để xem xét các điểm mạnh của nó và các lĩnh vực mà nó tỏa sáng.

Kiến thức và sự liên kết tốt hơn

Có rất ít chi tiết về kiến ​​trúc hoặc tập luyện của mô hình, nhưng chúng tôi có một ước tính sơ bộ rằng nó đã được đào tạo với tính toán nhiều hơn 10 lần. Và, mô hình này lớn đến mức Openai cần phải trải đều đào tạo trên nhiều trung tâm dữ liệu để hoàn thành trong một thời gian hợp lý.

Các mô hình lớn hơn có năng lực lớn hơn để học kiến ​​thức thế giới và sắc thái của ngôn ngữ con người (cho rằng chúng có quyền truy cập vào dữ liệu đào tạo chất lượng cao). Điều này thể hiện rõ trong một số số liệu được trình bày bởi nhóm Openai. Ví dụ, GPT-4.5 có thứ hạng cao kỷ lục trên PersonQA, một chuẩn mực đánh giá ảo giác trong các mô hình AI.

Các thí nghiệm thực tế cũng cho thấy GPT-4.5 tốt hơn so với các mô hình đa năng khác ở lại đúng với các sự kiện và theo hướng dẫn sử dụng.

Người dùng đã chỉ ra rằng các phản hồi của GPT-4.5 cảm thấy nhận thức được tự nhiên và bối cảnh hơn so với các mô hình trước đó. Khả năng của nó để làm theo hướng dẫn giai điệu và phong cách cũng đã được cải thiện.

Sau khi phát hành GPT-4.5, nhà khoa học AI và đồng sáng lập Openai Andrej Karpathy, người đã có quyền truy cập sớm vào mô hình, nói Anh ấy mong đợi (ED) sẽ thấy sự cải thiện trong các nhiệm vụ không nặng về lý do và tôi sẽ nói đó là những nhiệm vụ nhiều hơn EQ (trái ngược với IQ) liên quan và bị tắc nghẽn bởi kiến ​​thức, sáng tạo, hiểu biết, hiểu biết chung, v.v.

Tuy nhiên, đánh giá chất lượng viết cũng rất chủ quan. Trong một cuộc khảo sát mà Karpathy đã chạy trên các lời nhắc khác nhau, hầu hết mọi người đều thích các phản ứng của GPT-4O hơn GPT-4.5. Anh ta đã viết trên x: Những người kiểm tra độ cao đang nhận thấy cấu trúc mới và độc đáo nhưng những người có phần thấp đang áp đảo cuộc thăm dò. Hoặc chúng ta chỉ là ảo giác mọi thứ. Hoặc những ví dụ này chỉ là không tuyệt vời. Hoặc nó thực sự khá gần và đây là kích thước mẫu quá nhỏ. Hoặc tất cả những điều trên.

Xử lý tài liệu tốt hơn

Trong các thí nghiệm của nó, hộp, có Tích hợp GPT-4.5 Trong hộp AI Studio Sản phẩm của nó, đã viết rằng GPT-4.5 là đặc biệt mạnh mẽ cho các trường hợp sử dụng doanh nghiệp, trong đó độ chính xác và tính toàn vẹn là nhiệm vụ quan trọng. Thử nghiệm của chúng tôi cho thấy GPT-4.5 là một trong những mô hình tốt nhất có sẵn cả về điểm số của chúng tôi và khả năng xử lý nhiều câu hỏi AI khó nhất mà chúng tôi đã tìm thấy.

Trong các đánh giá nội bộ của mình, Box đã tìm thấy GPT-4.5 chính xác hơn đối với các nhiệm vụ trả lời câu hỏi tài liệu doanh nghiệp-vượt trội so với GPT-4 ban đầu khoảng 4 điểm phần trăm trong bộ thử nghiệm của họ.

Nguồn: Hộp

Các bài kiểm tra của Box cũng chỉ ra rằng GPT-4.5 đã xuất sắc trong các câu hỏi toán học được nhúng trong các tài liệu kinh doanh, mà các mô hình GPT cũ thường phải vật lộn. Ví dụ, tốt hơn là trả lời các câu hỏi về các tài liệu tài chính yêu cầu lý luận về dữ liệu và thực hiện các tính toán.

GPT-4.5 cũng cho thấy hiệu suất được cải thiện trong việc trích xuất thông tin từ dữ liệu phi cấu trúc. Trong một thử nghiệm liên quan đến việc trích xuất các trường từ hàng trăm tài liệu pháp lý, GPT-4,5 chính xác hơn 19% so với GPT-4O.

Lập kế hoạch, mã hóa, đánh giá kết quả

Với kiến ​​thức thế giới được cải thiện, GPT-4.5 cũng có thể là một mô hình phù hợp để tạo ra các kế hoạch cấp cao cho các nhiệm vụ phức tạp. Các bước bị hỏng sau đó có thể được bàn giao cho các mô hình nhỏ hơn nhưng hiệu quả hơn để xây dựng và thực hiện.

Theo Nghiên cứu chòm saoTrong thử nghiệm ban đầu, GPT-4.5 dường như cho thấy khả năng mạnh mẽ trong lập kế hoạch và thực hiện tác nhân, bao gồm quy trình mã hóa nhiều bước và tự động hóa nhiệm vụ phức tạp.

GPT-4.5 cũng có thể hữu ích trong các tác vụ mã hóa đòi hỏi kiến ​​thức nội bộ và bối cảnh. GitHub bây giờ cung cấp Truy cập hạn chế Đối với mô hình trong Trợ lý mã hóa Copilot và ghi chú rằng GPT-4.5, thực hiện hiệu quả với các lời nhắc sáng tạo và cung cấp các câu trả lời đáng tin cậy cho các truy vấn kiến ​​thức che khuất.

Với kiến ​​thức thế giới sâu sắc hơn, GPT-4.5 cũng phù hợp vớiLlm-as-a-JudgeNhiệm vụ của người Viking, trong đó một mô hình mạnh đánh giá đầu ra của các mô hình nhỏ hơn. Ví dụ, một mô hình như GPT-4O hoặc O3 có thể tạo ra một hoặc một số câu trả lời, lý do qua giải pháp và truyền câu trả lời cuối cùng cho GPT-4.5 để sửa đổi và tinh chỉnh.

Nó có giá trị giá không?

Tuy nhiên, với chi phí khổng lồ của GPT-4.5, rất khó để biện minh cho nhiều trường hợp sử dụng. Nhưng điều đó không có nghĩa là nó sẽ vẫn như vậy. Một trong những xu hướng liên tục Chúng ta đã thấy trong những năm gần đây là chi phí suy luận giảm mạnh và nếu xu hướng này áp dụng cho GPT-4.5, thì đáng để thử nghiệm nó và tìm cách đặt sức mạnh của nó để sử dụng trong các ứng dụng doanh nghiệp.

Điều đáng chú ý là mô hình mới này có thể trở thành cơ sở cho các mô hình lý luận trong tương lai. Mỗi Karpathy: Hãy nhớ rằng GPT4.5 chỉ được đào tạo với việc xử lý trước, được giám sát và RLHF (học củng cố từ phản hồi của con người), vì vậy đây chưa phải là một mô hình lý luận. Do đó, việc phát hành mô hình này không thúc đẩy khả năng mô hình chuyển tiếp trong trường hợp lý luận là rất quan trọng (toán học, mã, v.v.) Có lẽ, OpenAI giờ đây sẽ tìm cách đào tạo thêm với việc học củng cố trên mô hình GPT-4.5 để cho phép nó suy nghĩ và đẩy khả năng mô hình trong các lĩnh vực này.

Leave a Reply

Your email address will not be published. Required fields are marked *