GPT-4.5: Mô hình AI tiên tiến hay chỉ là “lẻ”? Bí ẩn về giá cả đã hé lộ

Các chuyên gia trong ngành cho biết rằng GPT-4.5 của Openai là một mô hình “lẻ”, không phải là một mô hình biên giới. Tuy nhiên, câu hỏi về giá cả của nó đã được đặt ra. #GPT45 #Openai #AI #NgàyHômNay Theo thông tin từ Openai, GPT-4.5 được công bố gần đây và có hiệu suất tính toán hơn so với các mô hình trước đó. Mặc dù không phải là một mô hình biên giới nhưng GPT-4.5 vẫn mang lại sự chu đáo giống con người hơn. #GPT45 #AIStudio Các nhà quan sát trong ngành đã thấy GPT-4.5 là một động thái thú vị từ Openai, mặc dù đã giảm bớt kỳ vọng về khả năng của mô hình. #Openai #AI #GPT45 Những suy nghĩ chi tiết về GPT-4.5 từ Andrej Karpathy cho thấy sự mong đợi và tiềm năng của mô hình trong công nghệ AI. #AndrejKarpathy #GPT45 #AI Giám đốc điều hành Box, Aaron Levie, cho biết công ty đã sử dụng GPT-4.5 để trích xuất dữ liệu và siêu dữ liệu từ nội dung doanh nghiệp phức tạp. #Box #AaronLevie #GPT45 Câu hỏi về giá cả của GPT-4.5 đã được đặt ra, khi người dùng đặt câu hỏi về hiệu suất và chi phí của mô hình. #Openai #GPT45 #Cost Gary Marcus và Clement Delangue đã đưa ra nhận xét về GPT-4.5, nhấn mạnh về việc đặt giá cả của mô hình. #GaryMarcus #ClementDelangue #GPT45 Những lời nhận xét và phản hồi về GPT-4.5 từ cộng đồng người dùng và chuyên gia cho thấy sự quan tâm và quan ngại về việc đặt giá của mô hình. #Feedback #GPT45 #CommunityConcerns Nguồn: https://venturebeat.com/ai/industry-observers-say-gpt-4-5-is-an-odd-model-question-its-price/

Tham gia các bản tin hàng ngày và hàng tuần của chúng tôi để cập nhật mới nhất và nội dung độc quyền về bảo hiểm AI hàng đầu trong ngành. Tìm hiểu thêm


Openai có đã công bố việc phát hành GPT-4.5Giám đốc điều hành Sam Altman trước đây đã nói sẽ là lần cuối cùng không suy nghĩ (COT) người mẫu.

Công ty cho biết mô hình mới, không phải là một mô hình biên giới, nhưng vẫn là mô hình ngôn ngữ lớn lớn nhất (LLM), với hiệu quả tính toán hơn. Altman nói rằng, mặc dù GPT-4.5 không có lý do giống như các dịch vụ mới của Openai khác O1 hoặc O3-Mini, mô hình mới này vẫn mang đến sự chu đáo giống con người hơn.

Các nhà quan sát trong ngành, nhiều người trong số họ đã có quyền truy cập sớm vào mô hình mới, đã tìm thấy GPT-4.5 là một động thái thú vị từ Openai, làm giảm bớt những kỳ vọng của họ về những gì mô hình sẽ có thể đạt được.

Giáo sư Wharton và nhà bình luận AI Ethan Mollick đã đăng trên phương tiện truyền thông xã hội rằng GPT-4.5 là một mô hình rất kỳ quặc và thú vị của người Hồi giáo, anh ấy lưu ý rằng nó có thể trở nên lười biếng trong các dự án phức tạp, mặc dù là một nhà văn mạnh mẽ.

Người đồng sáng lập Openai và cựu Trưởng Tesla AI Andrej Karpathy lưu ý rằng GPT-4.5 khiến anh nhớ khi GPT-4 xuất hiện và anh nhìn thấy tiềm năng của người mẫu. Trong a Đăng lên xKarpathy nói rằng, trong khi sử dụng GPT 4.5, thì mọi thứ đều tốt hơn một chút và thật tuyệt vời, nhưng cũng không chính xác theo những cách tầm thường để chỉ ra.

Tuy nhiên, Karpathy đã cảnh báo rằng mọi người không nên mong đợi tác động cách mạng từ mô hình vì nó không thúc đẩy khả năng mô hình trong trường hợp lý luận là quan trọng (toán học, mã, v.v.).

Suy nghĩ ngành chi tiết

Đây là những gì Karpathy đã nói về lần lặp GPT mới nhất trong một bài viết dài trên X:

Phạm viHôm nay đánh dấu việc phát hành GPT4.5 của Openai. Tôi đã mong chờ điều này trong ~ 2 năm, kể từ khi GPT4 được phát hành, bởi vì bản phát hành này cung cấp một phép đo định tính về độ dốc cải thiện mà bạn nhận được từ việc tính toán trước khi tính toán (ví dụ chỉ đơn giản là đào tạo một mô hình lớn hơn). Mỗi 0,5 trong phiên bản là tính toán tiền xử lý khoảng 10 lần. Bây giờ, hãy nhớ lại rằng GPT1 hầu như không tạo ra văn bản mạch lạc. GPT2 là một món đồ chơi bối rối. GPT2.5 đã bị bỏ qua trực tiếp vào GPT3, điều này thậm chí còn thú vị hơn. GPT3.5 đã vượt qua ngưỡng cửa, nơi nó đủ để thực sự vận chuyển như một sản phẩm và châm ngòi cho khoảnh khắc Chatgpt của Openai. Và đến lượt GPT4 cũng cảm thấy tốt hơn, nhưng tôi sẽ nói rằng nó chắc chắn cảm thấy tinh tế.

Tôi nhớ là một phần của một hackathon đang cố gắng tìm các lời nhắc cụ thể trong đó GPT4 vượt trội so với 3.5. Chúng chắc chắn đã tồn tại, nhưng các ví dụ rõ ràng và cụ thể của Dunk Dunk rất khó tìm. Đó là tất cả mọi thứ chỉ tốt hơn một chút nhưng theo một cách khuếch tán. Sự lựa chọn từ đã sáng tạo hơn một chút. Hiểu về sắc thái trong lời nhắc đã được cải thiện. Sự tương tự có ý nghĩa hơn một chút. Mô hình là một chút hài hước hơn. Kiến thức và hiểu biết thế giới đã được cải thiện ở các cạnh của các lĩnh vực hiếm. Ảo giác là ít thường xuyên hơn một chút. Những rung cảm chỉ tốt hơn một chút. Cảm giác như nước dâng lên tất cả các thuyền, nơi mọi thứ được cải thiện nhẹ 20%. Vì vậy, với kỳ vọng đó là tôi đã đi vào thử nghiệm GPT4.5, mà tôi đã có quyền truy cập trong vài ngày và đã thấy tính toán trước gấp 10 lần so với GPT4. Và tôi cảm thấy như, một lần nữa, tôi đang ở cùng một hackathon 2 năm trước. Mọi thứ đều tốt hơn một chút và nó tuyệt vời, nhưng cũng không chính xác theo những cách tầm thường để chỉ ra. Tuy nhiên, điều đó thật thú vị và thú vị khi một phép đo định tính khác về một độ dốc nhất định của khả năng xuất hiện miễn phí cho một mô hình lớn hơn.

Hãy nhớ rằng GPT4.5 chỉ được đào tạo với việc xử lý trước, được giám sát và RLHF, vì vậy đây chưa phải là một mô hình lý luận. Do đó, việc phát hành mô hình này không đẩy khả năng mô hình chuyển tiếp trong các trường hợp lý luận là rất quan trọng (toán học, mã, v.v.). Trong những trường hợp này, đào tạo với RL và có được tư duy là vô cùng quan trọng và hoạt động tốt hơn, ngay cả khi nó nằm trên đỉnh của một mô hình cơ sở cũ hơn (ví dụ: khả năng GPT4ish hoặc lâu hơn). Tình trạng của nghệ thuật ở đây vẫn là O1 đầy đủ. Có lẽ, Openai giờ đây sẽ tìm cách đào tạo thêm với việc học củng cố trên đỉnh GPT4.5 để cho phép nó suy nghĩ và đẩy khả năng mô hình trong các lĩnh vực này.

TUY NHIÊN. Chúng tôi thực sự mong đợi sẽ thấy một sự cải thiện trong các nhiệm vụ không lý do nặng nề, và tôi sẽ nói đó là những nhiệm vụ nhiều hơn EQ (trái ngược với IQ) liên quan và bị tắc nghẽn bởi EG World Kiến thức, Sáng tạo, Làm cho tương tự, Hiểu biết chung, Humor, v.v.

Vì vậy, bên dưới, tôi nghĩ sẽ rất vui khi làm nổi bật 5 lời nhắc hài hước/thú vị để kiểm tra các khả năng này và tổ chức chúng thành một tương tác LM LM Lite, ngay tại đây trên X, sử dụng kết hợp hình ảnh và thăm dò ý kiến ​​trong một chủ đề. Đáng buồn thay, X không cho phép bạn đưa cả hình ảnh và cuộc thăm dò trong một bài đăng, vì vậy tôi phải thay thế các bài đăng cung cấp hình ảnh (hiển thị lời nhắc và hai câu trả lời một từ 4 và một từ 4.5), và cuộc thăm dò, nơi mọi người có thể bỏ phiếu nào tốt hơn. Sau 8 giờ, tôi sẽ tiết lộ danh tính của mô hình nào. Hãy xem điều gì sẽ xảy ra 🙂Phạm vi

Suy nghĩ của Giám đốc điều hành Box về GPT-4.5

Những người dùng ban đầu khác cũng thấy tiềm năng trong GPT-4.5. Giám đốc điều hành hộp Aaron Levie nói trên x rằng công ty của ông đã sử dụng GPT-4.5 để giúp trích xuất dữ liệu và siêu dữ liệu có cấu trúc từ nội dung doanh nghiệp phức tạp.

Phạm viCác đột phá AI chỉ tiếp tục đến. Openai vừa công bố GPT-4.5 và chúng tôi sẽ cung cấp cho khách hàng hộp sau ngày hôm nay trong hộp AI Studio.

Chúng tôi đã thử nghiệm GPT4.5 ở chế độ truy cập sớm với hộp AI cho các trường hợp sử dụng dữ liệu không có cấu trúc doanh nghiệp nâng cao và đã thấy kết quả mạnh mẽ. Với hộp AI Enterprise Eval, chúng tôi kiểm tra các mô hình chống lại nhiều kịch bản khác nhau, như chính xác Q & A, khả năng lý luận và nhiều hơn nữa. Cụ thể, để khám phá các khả năng của GPT-4.5, chúng tôi tập trung vào một lĩnh vực chính có tiềm năng đáng kể về tác động của doanh nghiệp: trích xuất dữ liệu có cấu trúc hoặc trích xuất siêu dữ liệu, từ nội dung doanh nghiệp phức tạp.

Tại Box, chúng tôi đánh giá nghiêm ngặt các mô hình trích xuất dữ liệu bằng nhiều bộ dữ liệu cấp doanh nghiệp. Một bộ dữ liệu quan trọng mà chúng tôi tận dụng là Cuad, bao gồm hơn 510 hợp đồng pháp lý thương mại. Trong bộ dữ liệu này, Box đã xác định 17.000 trường có thể được trích xuất từ ​​nội dung phi cấu trúc và đánh giá mô hình dựa trên việc trích xuất một cảnh cho các trường này (đây là thử nghiệm khó nhất của chúng tôi, trong đó mô hình chỉ có cơ hội trích xuất tất cả các siêu dữ liệu trong một lần vượt qua so với thực hiện nhiều lần thử). Trong các thử nghiệm của chúng tôi, GPT-4.5 đã trích xuất chính xác 19 điểm phần trăm hơn các trường một cách chính xác so với GPT-4O, làm nổi bật khả năng cải thiện của nó để xử lý dữ liệu hợp đồng sắc thái.

Tiếp theo, để đảm bảo GPT-4.5 có thể xử lý các yêu cầu của nội dung doanh nghiệp trong thế giới thực, chúng tôi đã đánh giá hiệu suất của nó đối với một bộ tài liệu nghiêm ngặt hơn, bộ thử thách của Box. Chúng tôi đã chọn một tập hợp các hợp đồng pháp lý phức tạp-những hợp đồng có nội dung đa phương thức, thông tin và độ dài mật độ cao vượt quá 200 trang-để thể hiện một số kịch bản khó khăn nhất mà khách hàng của chúng tôi phải đối mặt. Trong bộ thách thức này, GPT-4.5 cũng luôn vượt trội so với GPT-4O trong việc trích xuất các trường chính với độ chính xác cao hơn, thể hiện khả năng vượt trội của nó để xử lý các tài liệu pháp lý phức tạp và sắc thái.

Nhìn chung, chúng tôi thấy kết quả mạnh mẽ với GPT-4.5 cho dữ liệu doanh nghiệp phức tạp, sẽ mở khóa thậm chí nhiều trường hợp sử dụng hơn trong doanh nghiệp.Phạm vi

Câu hỏi về giá cả và tầm quan trọng của nó

Ngay cả khi người dùng sớm thấy GPT-4.5 có thể hoạt động-mặc dù hơi lười biếng-họ đã đặt câu hỏi về việc phát hành của nó.

Chẳng hạn, nhà phê bình Openai nổi tiếng Gary Marcus đã gọi GPT-4.5 là một người khác không có gì trên Bluesky.

Nóng Take: GPT 4.5 là một không có gì; GPT-5 vẫn tưởng tượng. • Dữ liệu mở rộng không phải là luật vật lý; Khá nhiều thứ tôi nói với bạn là sự thật. • Tất cả các BS về GPT-5 mà chúng tôi đã nghe trong vài năm qua: Không đúng. • Các fanboy như Cowen sẽ đổ lỗi cho người dùng, nhưng kết quả không phải là những gì họ đã hy vọng.

Gary Marcus (@garymarcus.bsky.social) 2025-02-27T20: 44: 55.115z

Ôm khuôn mặt CEO Clement Delangue nhận xét Đó là nguồn gốc nguồn đóng cửa của GPT4.5 làm cho nó trở thành meh meh.

Tuy nhiên, nhiều người lưu ý rằng GPT-4.5 không liên quan gì đến hiệu suất của nó. Thay vào đó, mọi người đặt câu hỏi tại sao Openai sẽ Phát hành một mô hình quá đắt rằng nó gần như bị cấm sử dụng nhưng không mạnh mẽ như các mô hình khác của nó.

Một người dùng nhận xét về X:Vì vậy, bạn đang nói với tôi GPT-4.5 có giá trị cao hơn O1 nhưng nó không hoạt động tốt trên điểm chuẩn. Làm cho nó có ý nghĩa. ”

Khác Người dùng x đặt ra các lý thuyết rằng chi phí mã thông báo cao có thể là ngăn chặn các đối thủ cạnh tranh như Deepseek, để chưng cất mô hình 4.5.

Deepseek trở thành một đối thủ cạnh tranh lớn với Openai vào tháng 1, với lãnh đạo ngành công nghiệp Tìm lý do DeepSeek-R1 có khả năng như Openai-nhưng giá cả phải chăng hơn.

[ad_2]

Leave a Reply

Your email address will not be published. Required fields are marked *