Bí mật về GPT-4.5: Openai hé lộ khả năng phi thường của công nghệ này

Hình ảnh bìa GPT-4.5

Openai cuối cùng đã tiết lộ GPT-4.5, mô hình không suy nghĩ cuối cùng của công ty. GPT-4.5 hứa hẹn mang lại trải nghiệm cải thiện tổng thể với ít ảo giác hơn, liên kết mạnh mẽ hơn với ý định kịp thời của người dùng, và cải thiện trí tuệ cảm xúc. Mô hình được đào tạo bằng các kỹ thuật giám sát mới và truyền thống như tinh chỉnh được giám sát và học củng cố từ phản hồi của con người.

GPT-4.5 đã được ra mắt trong một sự kiện livestream của Openai, với mục tiêu cung cấp một cải tiến đáng kể từ các mô hình trước đó. Mô hình này đã được so sánh với các tiêu chuẩn chất lượng như AIME 2024 và GPQA Diamond, và vượt trội so với các mô hình trước đó như GPT-4O và O3-mini.

Đặc biệt, GPT-4.5 đã được đánh giá là chính xác hơn và ít ảo giác hơn so với các mô hình trước đó. Các tính năng nâng cao nhất của Chatgpt được tích hợp vào mô hình, tạo ra một trải nghiệm trực quan và tự nhiên hơn cho người dùng.

Công chúng được trấn an rằng GPT-4.5 được xem là đủ an toàn để phát hành, với các biện pháp kiểm tra mô hình và kỹ thuật giám sát mới để tăng cường độ an toàn. Mô hình đang trong bản xem trước cho các người dùng Pro, và sẽ được mở rộng cho các người dùng Plus và Enterprise trong thời gian tới.

#Openai #GPT45 #Ra_Mắt #Cải_Tạo #AIModel #Trí_TuệCảm_Xúc

Nguồn: https://www.zdnet.com/article/openai-finally-unveils-gpt-4-5-heres-what-it-can-do/

Hình ảnh bìa GPT-4.5

Openai

Đầu tháng này, Giám đốc điều hành Openai Sam Altman chia sẻ một lộ trình Đối với các mô hình sắp tới của nó, GPT-4.5 và GPT-5. Trong X Post, Altman đã chia sẻ rằng GPT-4.5, có tên mã Orion trong nội bộ, sẽ là mô hình không suy nghĩ cuối cùng của nó. Ngoài ra, các chi tiết của mô hình vẫn là một bí ẩn – cho đến ngày hôm nay.

GPT-4.5 đã ra mắt

Vào sáng thứ năm, Openai đáng ngại tuyên bố sẽ tổ chức một livestream Trong 4,5 giờ, một gợi ý về mô hình mới nhất và lớn nhất của nó. Trong thời gian phát trực tiếp, Openai tiết lộ GPT-4,5 Trong một bản xem trước nghiên cứu, mà công ty tuyên bố là “mô hình lớn nhất và hiểu biết nhất.”

Openai cho biết người dùng nên trải nghiệm cải thiện tổng thể khi sử dụng GPT-4.5, có nghĩa là ít ảo giác hơn, liên kết mạnh mẽ hơn với ý định kịp thời của họ và cải thiện trí tuệ cảm xúc. Nhìn chung, các tương tác với mô hình sẽ cảm thấy trực quan và tự nhiên hơn so với các mô hình trước đó, chủ yếu là do kiến ​​thức sâu sắc hơn và sự hiểu biết theo ngữ cảnh được cải thiện.

Cũng: Các mô hình lý luận của Openai vừa có hai bản cập nhật hữu ích

Học tập không giám sát – làm tăng kiến ​​thức và trực giác từ – và lý luận là hai phương pháp thúc đẩy các cải tiến của mô hình. Mặc dù mô hình này không cung cấp lý luận chuỗi suy nghĩ, mà Openai O1 Mô hình lý luận thực hiện, nó vẫn sẽ cung cấp một mức độ lý luận cao hơn với ít độ trễ hơn và các cải tiến khác, chẳng hạn như nhận thức về cue xã hội.

Ví dụ, trong bản demo, Chatgpt được yêu cầu xuất ra một văn bản truyền tải thông điệp về sự ghét bỏ trong khi chạy GPT-4.5 và O1. Phiên bản O1 mất nhiều thời gian hơn một chút và chỉ đưa ra một phản hồi, điều này rất coi trọng bản ghi nhớ ghét và nghe có vẻ hơi khắc nghiệt. Mô hình GPT-4.5 cung cấp hai phản hồi khác nhau, một phản ứng nhẹ hơn và một phản hồi nghiêm trọng hơn. Không đề cập rõ ràng đến sự ghét bỏ; Thay vào đó, họ bày tỏ sự thất vọng về cách “người dùng” chọn cách cư xử.

Tương tự, khi cả hai mô hình được yêu cầu cung cấp thông tin về một chủ đề kỹ thuật, GPT-4.5 đã cung cấp một câu trả lời chảy tự nhiên hơn, so với đầu ra có cấu trúc hơn của O1. Cuối cùng, GPT-4.5 có nghĩa là cho các nhiệm vụ hàng ngày trên nhiều chủ đề khác nhau, bao gồm viết và giải quyết các vấn đề thực tế.

Cũng: Cách sử dụng Sora của Openai để tạo các video do AI tạo ra tuyệt đẹp

Để đạt được những cải tiến này, mô hình đã được đào tạo bằng cách sử dụng các kỹ thuật giám sát mới cũng như các kỹ thuật truyền thống, chẳng hạn như tinh chỉnh được giám sát (SFT) và học củng cố từ phản hồi của con người (RLHF).

Trong buổi phát trực tiếp, Openai đã thực hiện một chuyến đi xuống làn nhớ, hỏi tất cả các mô hình trong quá khứ của nó, bắt đầu với GPT-1, để trả lời câu hỏi, “Tại sao nước mặn?” Như mong đợi, mọi mô hình tiếp theo đã đưa ra một câu trả lời tốt hơn so với trước đây. Yếu tố phân biệt cho GPT-4.5 là cái mà Openai gọi là “tính cách tuyệt vời” của nó, điều này làm cho phản ứng nhẹ hơn, trò chuyện hơn và hấp dẫn hơn để đọc bằng cách sử dụng các kỹ thuật như ám chỉ.

Mô hình tích hợp với một số tính năng nâng cao nhất của Chatgpt, bao gồm tìm kiếm, vải và tải lên tệp và hình ảnh. Nó sẽ không có sẵn trong các tính năng đa phương thức như chế độ thoại, video và chia sẻ màn hình. Trong tương lai, Openai cho biết họ có kế hoạch chuyển đổi giữa các mô hình trở thành một trải nghiệm liền mạch hơn mà không dựa vào người chọn mô hình.

Điểm chuẩn

Tất nhiên, nó sẽ không phải là một bản phát hành mô hình mà không đi sâu vào điểm chuẩn. Trên một số điểm chuẩn chính được sử dụng để đánh giá các mô hình này, bao gồm toán học cạnh tranh (AIME 2024), các câu hỏi khoa học cấp tiến sĩ (GPQA Diamond) và SWEbch được xác minh (mã hóa), GPT-4.5 vượt trội so với GPT-4O, mô hình đa năng trước đó.

Điểm chuẩn GPT-4,5

Openai

Cũng: Muốn mặc định Safari của bạn để Chatgpt để tìm kiếm? Đây là cách làm điều đó

Đáng chú ý nhất, khi so sánh với Openai o3-mini -Mô hình lý luận được ra mắt gần đây của Openai, được dạy để suy nghĩ trước khi nó nói-GPT-4.5 đã gần hơn rất nhiều so với GPT-4O đã làm, thậm chí vượt qua O3-mini trong các điểm chuẩn Kim cương Swe-Lancer (mã hóa) và MMMLU (đa ngôn ngữ).

Một mối quan tâm lớn khi sử dụng các mô hình AI tổng quát là khuynh hướng của chúng đối với ảo giác hoặc bao gồm thông tin không chính xác trong các phản hồi. Hai đánh giá ảo giác khác nhau, độ chính xác đơn giản và ảo giác đơn giản, cho thấy GPT-4.5 chính xác hơn và bị ảo giác ít hơn GPT-4O, O1 và O3-Mini.

Độ chính xác đơn giản và tỷ lệ ảo giác đơn giản

Openai

Kết quả đánh giá so sánh với người thử nghiệm ở người cho thấy GPT-4.5 là mô hình thích hợp hơn so với GPT-4O. Đặc biệt, những người thử nghiệm của con người thích nó qua các truy vấn hàng ngày, chuyên nghiệp và sáng tạo.

Bảo vệ

Như mọi khi, Openai đã trấn an công chúng rằng các mô hình được coi là đủ an toàn để được phát hành, kiểm tra căng thẳng mô hình và chi tiết các kết quả này trong Thẻ hệ thống. Công ty cũng nói thêm rằng với mỗi bản phát hành mới và tăng khả năng mô hình, có những cơ hội để làm cho các mô hình an toàn hơn. Vì lý do đó, với bản phát hành GPT-4.5, công ty đã kết hợp các kỹ thuật giám sát mới với RLHF.

Có sẵn

GPT-4.5 đang trong bản xem trước nghiên cứu cho người dùng Pro, có thể truy cập thông qua trình chọn mô hình trên web, di động và máy tính để bàn. Nếu bạn không muốn bỏ ra 200 đô la cho một thuê bao Pro, OpenAI đã chia sẻ, nó sẽ bắt đầu tung ra GPT-4,5 đến Plus và người dùng nhóm vào tuần tới, và sau đó cho người dùng Enterprise và EDU vào tuần sau.

Cũng: Nghiên cứu sâu của Openai có thể giúp bạn tiết kiệm hàng giờ làm việc – và bây giờ sẽ rẻ hơn rất nhiều

Altman chia sẻ trên x Mục tiêu đó là khởi chạy mô hình cho cả người dùng Pro và cộng với người dùng cùng một lúc, nhưng đó là một “mô hình khổng lồ, đắt tiền”. Ông nói thêm rằng kể từ khi công ty hết GPU, họ sẽ thêm hàng chục ngàn GPU vào tuần tới và cuộn mô hình ra cộng với.

Mô hình cũng đang được xem trước cho các nhà phát triển trên tất cả các tầng sử dụng được trả tiền trong API hoàn thành trò chuyện, API trợ lý và API Batch, theo OpenAI.


Leave a Reply

Your email address will not be published. Required fields are marked *