Mô hình AI o1 của OpenAI: Không chỉ hiểu mà còn tạo lợi thế cho cộng đồng mở

Mô hình o1 của OpenAI không thể hiện được tư duy, tạo lợi thế cho nguồn mở. OpenAI đã mở ra một mô hình lý luận mới trong các mô hình ngôn ngữ lớn (LLM) với o1 mô hình gần đây đã có một bản nâng cấp lớn. Tuy nhiên, trong khi OpenAI dẫn đầu mạnh mẽ về các mô hình lý luận, nó có thể mất đi một số điểm so với đối thủ nguồn mở đang nổi lên nhanh chóng.

Các mô hình như o1, đôi khi được gọi là mô hình lý luận lớn (LRM), sử dụng các chu kỳ tính toán theo thời gian suy luận bổ sung để “suy nghĩ” nhiều hơn, xem lại phản hồi và sửa câu trả lời của chúng. Điều này cho phép họ giải quyết các vấn đề lý luận phức tạp mà LLM cổ điển gặp khó khăn và khiến chúng đặc biệt hữu ích cho các nhiệm vụ như mã hóa, toán học và phân tích dữ liệu.

Tuy nhiên, trong những ngày gần đây, các nhà phát triển đã thể hiện những phản ứng trái chiều đối với o1, đặc biệt là sau khi phát hành bản cập nhật. Một số người đã đăng các ví dụ về việc o1 hoàn thành được những nhiệm vụ đáng kinh ngạc trong khi những người khác thì có. bày tỏ sự thất vọng qua những phản ứng khó hiểu của mô hình. Các nhà phát triển đã gặp phải đủ loại vấn đề từ việc thực hiện những thay đổi phi logic đối với mã hoặc bỏ qua các hướng dẫn.

Bí mật xung quanh chi tiết o1:

Một phần của sự nhầm lẫn là do tính bí mật của OpenAI và từ chối hiển thị chi tiết về cách thức hoạt động của o1. Nước sốt bí mật đằng sau sự thành công của LRM là các mã thông báo bổ sung mà mô hình tạo ra khi đạt được phản hồi cuối cùng, được gọi là “chuỗi suy nghĩ” hoặc “chuỗi lý luận” của mô hình. Ví dụ: nếu bạn nhắc LLM cổ điển tạo mã cho một tác vụ, nó sẽ ngay lập tức tạo mã. Ngược lại, LRM sẽ tạo ra các mã thông báo lý luận để kiểm tra vấn đề, lập kế hoạch cấu trúc mã và tạo ra nhiều giải pháp trước khi đưa ra câu trả lời cuối cùng.

o1 ẩn quá trình suy nghĩ và chỉ hiển thị phản hồi cuối cùng cùng với thông báo hiển thị thời gian mô hình suy nghĩ và có thể là cái nhìn tổng quan về quá trình suy luận. Điều này một phần là để tránh làm lộn xộn phản hồi và mang lại trải nghiệm mượt mà hơn cho người dùng. Nhưng quan trọng hơn, OpenAI coi chuỗi lý luận là bí mật thương mại và muốn gây khó khăn cho các đối thủ cạnh tranh trong việc sao chép khả năng của o1.

Chi phí đào tạo các mô hình mới tiếp tục tăng và tỷ suất lợi nhuận không theo kịp, điều này đang thúc đẩy một số phòng thí nghiệm AI trở nên bí mật hơn để mở rộng vị trí dẫn đầu. Ngay cả nghiên cứu của Apollo, đã làm đội đỏ của người mẫu không được cấp quyền truy cập vào chuỗi lý luận của nó.

Sự thiếu minh bạch này đã khiến người dùng đưa ra đủ kiểu suy đoán, trong đó có cáo buộc OpenAI làm suy giảm mô hình để cắt giảm chi phí suy luận.

Các mô hình nguồn mở hoàn toàn minh bạch:

Mặt khác, các lựa chọn thay thế nguồn mở như của Alibaba Qwen với câu hỏi và Marco-o1 hiển thị chuỗi lý luận đầy đủ của các mô hình của họ. Một lựa chọn khác là DeepSeek R1 không phải là nguồn mở nhưng vẫn tiết lộ các mã thông báo lý do. Việc xem chuỗi lý do cho phép các nhà phát triển khắc phục sự cố của lời nhắc và tìm cách cải thiện phản hồi của mô hình bằng cách thêm hướng dẫn bổ sung hoặc ví dụ trong ngữ cảnh.

Khả năng hiển thị quá trình lập luận đặc biệt quan trọng khi bạn muốn tích hợp phản hồi của mô hình vào các ứng dụng và công cụ mong đợi kết quả nhất quán. Hơn nữa, việc kiểm soát mô hình cơ bản là rất quan trọng trong các ứng dụng doanh nghiệp. Các mô hình tư nhân và giàn giáo hỗ trợ chúng, chẳng hạn như các biện pháp bảo vệ và bộ lọc kiểm tra đầu vào và đầu ra của chúng, liên tục thay đổi. Mặc dù điều này có thể mang lại hiệu suất tổng thể tốt hơn nhưng nó có thể làm hỏng nhiều lời nhắc và ứng dụng được xây dựng dựa trên chúng. Ngược lại, các mô hình nguồn mở trao toàn quyền kiểm soát mô hình cho nhà phát triển, đây có thể là một lựa chọn mạnh mẽ hơn cho các ứng dụng doanh nghiệp, trong đó hiệu suất thực hiện các tác vụ rất cụ thể quan trọng hơn các kỹ năng chung.

QwQ và R1 vẫn đang ở phiên bản xem trước và o1 dẫn đầu về độ chính xác và dễ sử dụng. Và đối với nhiều mục đích sử dụng, chẳng hạn như đưa ra các lời nhắc đặc biệt chung và các yêu cầu một lần, o1 vẫn có thể là một lựa chọn tốt hơn các lựa chọn thay thế nguồn mở.

Nhưng cộng đồng nguồn mở nhanh chóng bắt kịp các mô hình riêng tư và chúng ta có thể mong đợi nhiều mô hình hơn sẽ xuất hiện trong những tháng tới. Chúng có thể trở thành một giải pháp thay thế phù hợp trong đó khả năng hiển thị và kiểm soát là rất quan trọng.

#OpenAI #môhìnho1 #AI #ngônngữlớn #LRM #LLM #suyluận #mãhóa #toánhọc #phântíchdữliệu #minhbạch #nguồnmở #Alibaba #Qwen #Marco-o1 #DeepSeekR1 #sựthấtvọng #bímật #môhình #Apollo #độichínhxác #dễsửdụng #cộngđồngnguồnmở Nguồn: https://venturebeat.com/ai/heres-how-openai-o1-might-lose-ground-to-open-source-models/

Tham gia các bản tin hàng ngày và hàng tuần của chúng tôi để có những cập nhật mới nhất và nội dung độc quyền về phạm vi phủ sóng AI hàng đầu trong ngành. Tìm hiểu thêm


OpenAI đã mở ra một mô hình lý luận mới trong các mô hình ngôn ngữ lớn (LLM) với o1 mô hìnhgần đây đã có một bản nâng cấp lớn. Tuy nhiên, trong khi OpenAI dẫn đầu mạnh mẽ về các mô hình lý luận, nó có thể mất đi một số điểm so với đối thủ nguồn mở đang nổi lên nhanh chóng.

Các mô hình như o1, đôi khi được gọi là mô hình lý luận lớn (LRM), sử dụng các chu kỳ tính toán theo thời gian suy luận bổ sung để “suy nghĩ” nhiều hơn, xem lại phản hồi và sửa câu trả lời của chúng. Điều này cho phép họ giải quyết các vấn đề lý luận phức tạp mà LLM cổ điển gặp khó khăn và khiến chúng đặc biệt hữu ích cho các nhiệm vụ như mã hóa, toán học và phân tích dữ liệu.

Tuy nhiên, trong những ngày gần đây, các nhà phát triển đã thể hiện những phản ứng trái chiều đối với o1, đặc biệt là sau khi phát hành bản cập nhật. Một số người đã đăng các ví dụ về việc o1 hoàn thành được những nhiệm vụ đáng kinh ngạc trong khi những người khác thì có. bày tỏ sự thất vọng qua những phản ứng khó hiểu của mô hình. Các nhà phát triển đã gặp phải đủ loại vấn đề từ việc thực hiện những thay đổi phi logic đối với mã hoặc bỏ qua các hướng dẫn.

Bí mật xung quanh chi tiết o1

Một phần của sự nhầm lẫn là do tính bí mật của OpenAI và từ chối hiển thị chi tiết về cách thức hoạt động của o1. Nước sốt bí mật đằng sau sự thành công của LRM là các mã thông báo bổ sung mà mô hình tạo ra khi đạt được phản hồi cuối cùng, được gọi là “chuỗi suy nghĩ” hoặc “chuỗi lý luận” của mô hình. Ví dụ: nếu bạn nhắc LLM cổ điển tạo mã cho một tác vụ, nó sẽ ngay lập tức tạo mã. Ngược lại, LRM sẽ tạo ra các mã thông báo lý luận để kiểm tra vấn đề, lập kế hoạch cấu trúc mã và tạo ra nhiều giải pháp trước khi đưa ra câu trả lời cuối cùng.

o1 ẩn quá trình suy nghĩ và chỉ hiển thị phản hồi cuối cùng cùng với thông báo hiển thị thời gian mô hình suy nghĩ và có thể là cái nhìn tổng quan về quá trình suy luận. Điều này một phần là để tránh làm lộn xộn phản hồi và mang lại trải nghiệm mượt mà hơn cho người dùng. Nhưng quan trọng hơn, OpenAI coi chuỗi lý luận là bí mật thương mại và muốn gây khó khăn cho các đối thủ cạnh tranh trong việc sao chép khả năng của o1.

Chi phí đào tạo các mô hình mới tiếp tục tăng và tỷ suất lợi nhuận không theo kịp, điều này đang thúc đẩy một số phòng thí nghiệm AI trở nên bí mật hơn để mở rộng vị trí dẫn đầu. Ngay cả nghiên cứu của Apollo, đã làm đội đỏ của người mẫukhông được cấp quyền truy cập vào chuỗi lý luận của nó.

Sự thiếu minh bạch này đã khiến người dùng đưa ra đủ kiểu suy đoán, trong đó có cáo buộc OpenAI làm suy giảm mô hình để cắt giảm chi phí suy luận.

Các mô hình nguồn mở hoàn toàn minh bạch

Mặt khác, các lựa chọn thay thế nguồn mở như của Alibaba Qwen với câu hỏiMarco-o1 hiển thị chuỗi lý luận đầy đủ của các mô hình của họ. Một lựa chọn khác là DeepSeek R1không phải là nguồn mở nhưng vẫn tiết lộ các mã thông báo lý do. Việc xem chuỗi lý do cho phép các nhà phát triển khắc phục sự cố của lời nhắc và tìm cách cải thiện phản hồi của mô hình bằng cách thêm hướng dẫn bổ sung hoặc ví dụ trong ngữ cảnh.

Khả năng hiển thị quá trình lập luận đặc biệt quan trọng khi bạn muốn tích hợp phản hồi của mô hình vào các ứng dụng và công cụ mong đợi kết quả nhất quán. Hơn nữa, việc kiểm soát mô hình cơ bản là rất quan trọng trong các ứng dụng doanh nghiệp. Các mô hình tư nhân và giàn giáo hỗ trợ chúng, chẳng hạn như các biện pháp bảo vệ và bộ lọc kiểm tra đầu vào và đầu ra của chúng, liên tục thay đổi. Mặc dù điều này có thể mang lại hiệu suất tổng thể tốt hơn nhưng nó có thể làm hỏng nhiều lời nhắc và ứng dụng được xây dựng dựa trên chúng. Ngược lại, các mô hình nguồn mở trao toàn quyền kiểm soát mô hình cho nhà phát triển, đây có thể là một lựa chọn mạnh mẽ hơn cho các ứng dụng doanh nghiệp, trong đó hiệu suất thực hiện các tác vụ rất cụ thể quan trọng hơn các kỹ năng chung.

QwQ và R1 vẫn đang ở phiên bản xem trước và o1 dẫn đầu về độ chính xác và dễ sử dụng. Và đối với nhiều mục đích sử dụng, chẳng hạn như đưa ra các lời nhắc đặc biệt chung và các yêu cầu một lần, o1 vẫn có thể là một lựa chọn tốt hơn các lựa chọn thay thế nguồn mở.

Nhưng cộng đồng nguồn mở nhanh chóng bắt kịp các mô hình riêng tư và chúng ta có thể mong đợi nhiều mô hình hơn sẽ xuất hiện trong những tháng tới. Chúng có thể trở thành một giải pháp thay thế phù hợp trong đó khả năng hiển thị và kiểm soát là rất quan trọng.

[ad_2]

Leave a Reply

Your email address will not be published. Required fields are marked *