Các nhà khoa học đang chìm đắm trong dữ liệu. Với hàng triệu tài liệu nghiên cứu được xuất bản mỗi năm, ngay cả những chuyên gia tận tâm nhất cũng phải vật lộn để cập nhật những phát hiện mới nhất trong lĩnh vực của họ.
Một hệ thống trí tuệ nhân tạo mới, được gọi là OpenScholar, hứa hẹn sẽ viết lại các quy tắc về cách các nhà nghiên cứu tiếp cận, đánh giá và tổng hợp tài liệu khoa học. Được xây dựng bởi Viện AI Allen (Ai2) và Đại học Washington, OpenScholar kết hợp các hệ thống truy xuất tiên tiến với mô hình ngôn ngữ được tinh chỉnh để cung cấp các câu trả lời toàn diện, dựa trên trích dẫn cho các câu hỏi nghiên cứu phức tạp.
#OpenScholar #AI #Nguồnmở #GPT4o #Nghiêncứukhoahọc OpenScholar: AI nguồn mở vượt trội hơn GPT-4o trong nghiên cứu khoa học. Những nhà nghiên cứu đã công bố rằng đây là bản phát hành mở đầu tiên của một quy trình hoàn chỉnh dành cho trợ lý khoa học LM. Sự cởi mở của OpenScholar không chỉ là quan điểm triết học mà còn là lợi thế thực tế, giúp tiết kiệm chi phí và dân chủ hóa quyền truy cập vào công cụ AI mạnh mẽ cho các tổ chức nhỏ, phòng thí nghiệm thiếu vốn và các nhà nghiên cứu ở các nước đang phát triển. Tuy nhiên, OpenScholar cũng đối mặt với hạn chế về kho dữ liệu hạn chế và cần thiết phải kết hợp nội dung truy cập đóng một cách có trách nhiệm trong tương lai.
Phương pháp khoa học mới đã đến khi AI trở thành đối tác nghiên cứu của bạn. OpenScholar đặt ra những câu hỏi quan trọng về vai trò của AI trong khoa học và nhấn mạnh rằng công cụ AI như OpenScholar nhằm tăng cường chứ không phải thay thế chuyên môn của con người. Mặc dù có hạn chế, OpenScholar vẫn là bước ngoặt quan trọng trong lĩnh vực điện toán khoa học, cho thấy khả năng xử lý, hiểu và tổng hợp tài liệu khoa học với độ chính xác gần như con người.
#OpenScholar #AInguồnmở #GPT4o #nghiên cứukhoa học #AIđối tác nghiên cứu OpenScholar: AI nguồn mở vượt trội hơn GPT-4o trong nghiên cứu khoa học. #openscholar #AI #nghiêncứu #khoahọc #nguồnmở #GPT4o Hôm nay, tôi muốn chia sẻ với các bạn về OpenScholar – một công cụ AI nguồn mở vượt trội hơn GPT-4o trong nghiên cứu khoa học. OpenScholar không chỉ giúp các nhà nghiên cứu tạo ra các bài báo chất lượng mà còn giúp họ quản lý dữ liệu và tương tác với cộng đồng nghiên cứu một cách hiệu quả.
Với OpenScholar, việc truy cập thông tin và tìm kiếm tài liệu khoa học trở nên dễ dàng hơn bao giờ hết. Công cụ này sử dụng công nghệ AI để phân tích, tổ chức và hiển thị thông tin một cách logic và hợp lý, giúp người dùng tiết kiệm thời gian và nâng cao hiệu suất làm việc.
Nếu bạn đang làm việc trong lĩnh vực nghiên cứu khoa học, hãy trải nghiệm OpenScholar ngay hôm nay để cảm nhận sự tiện lợi và hiệu quả mà công cụ này mang lại. #OpenScholar #AInguồnmở #nghiêncứukhoahọc Nguồn: https://venturebeat.com/ai/openscholar-the-open-source-a-i-thats-outperforming-gpt-4o-in-scientific-research/
Tham gia các bản tin hàng ngày và hàng tuần của chúng tôi để có những cập nhật mới nhất và nội dung độc quyền về phạm vi phủ sóng AI hàng đầu trong ngành. Tìm hiểu thêm
Các nhà khoa học đang chìm đắm trong dữ liệu. Với hàng triệu tài liệu nghiên cứu được xuất bản mỗi năm, ngay cả những chuyên gia tận tâm nhất cũng phải vật lộn để cập nhật những phát hiện mới nhất trong lĩnh vực của họ.
Một hệ thống trí tuệ nhân tạo mới, được gọi là OpenScholarhứa hẹn sẽ viết lại các quy tắc về cách các nhà nghiên cứu tiếp cận, đánh giá và tổng hợp tài liệu khoa học. Được xây dựng bởi Viện AI Allen (Ai2) và Đại học WashingtonOpenScholar kết hợp các hệ thống truy xuất tiên tiến với mô hình ngôn ngữ được tinh chỉnh để cung cấp các câu trả lời toàn diện, dựa trên trích dẫn cho các câu hỏi nghiên cứu phức tạp.
“Tiến bộ khoa học phụ thuộc vào khả năng của các nhà nghiên cứu trong việc tổng hợp khối tài liệu đang phát triển,” các nhà nghiên cứu của OpenScholar viết trong giấy của họ. Nhưng khả năng đó ngày càng bị hạn chế bởi lượng thông tin khổng lồ. Họ lập luận rằng OpenScholar đưa ra một con đường phía trước – một con đường không chỉ giúp các nhà nghiên cứu điều hướng lượng tài liệu tràn ngập mà còn thách thức sự thống trị của các hệ thống AI độc quyền như OpenAI GPT-4o.
Cách bộ não AI của OpenScholar xử lý 45 triệu tài liệu nghiên cứu trong vài giây
Cốt lõi của OpenScholar là một mô hình ngôn ngữ tăng cường truy xuất, khai thác vào kho dữ liệu của hơn 45 triệu tài liệu học thuật truy cập mở. Khi một nhà nghiên cứu đặt câu hỏi, OpenScholar không chỉ tạo ra phản hồi từ kiến thức được đào tạo trước, như các mô hình như GPT-4o thường làm. Thay vào đó, nó tích cực truy xuất các tài liệu liên quan, tổng hợp các phát hiện của họ và tạo ra câu trả lời dựa trên các nguồn đó.
Khả năng duy trì “nền tảng” trong văn học hiện thực là điểm khác biệt chính. Trong các thử nghiệm sử dụng điểm chuẩn mới được gọi là Học giảQABenchđược thiết kế đặc biệt để đánh giá hệ thống AI về các câu hỏi khoa học mở, OpenScholar đã xuất sắc. Hệ thống đã thể hiện hiệu suất vượt trội về tính xác thực và độ chính xác của trích dẫn, thậm chí còn vượt trội hơn nhiều so với các mô hình độc quyền lớn hơn nhiều như GPT-4o.
Một phát hiện đặc biệt đáng lo ngại liên quan đến xu hướng tạo ra các trích dẫn bịa đặt của GPT-4o—ảo giác, theo cách nói của AI. Khi được giao nhiệm vụ trả lời các câu hỏi nghiên cứu y sinh, GPT-4o đã trích dẫn các bài báo không tồn tại trong hơn 90% trường hợp. Ngược lại, OpenScholar vẫn bám chắc vào các nguồn có thể kiểm chứng được.
Việc căn cứ vào các giấy tờ có thật, được lấy ra là cơ bản. Hệ thống này sử dụng những gì các nhà nghiên cứu mô tả là “vòng suy luận tự phản hồi” và “liên tục tinh chỉnh kết quả đầu ra của mình thông qua phản hồi ngôn ngữ tự nhiên, giúp cải thiện chất lượng và kết hợp thông tin bổ sung một cách thích ứng.”
Ý nghĩa của nó đối với các nhà nghiên cứu, nhà hoạch định chính sách và lãnh đạo doanh nghiệp là rất đáng kể. OpenScholar có thể trở thành một công cụ thiết yếu để tăng tốc khám phá khoa học, cho phép các chuyên gia tổng hợp kiến thức nhanh hơn và tự tin hơn.
Bên trong trận chiến David vs. Goliath: AI nguồn mở có thể cạnh tranh với Big Tech không?
Sự ra mắt của OpenScholar diễn ra vào thời điểm hệ sinh thái AI ngày càng bị thống trị bởi các hệ thống độc quyền, khép kín. Các mô hình như OpenAI GPT-4o và Anthropic’s Claude cung cấp những khả năng ấn tượng, nhưng chúng đắt tiền, không rõ ràng và không thể tiếp cận được đối với nhiều nhà nghiên cứu. OpenScholar lật ngược mô hình này bằng cách sử dụng nguồn mở hoàn toàn.
Nhóm OpenScholar đã phát hành không chỉ mã cho mô hình ngôn ngữ mà còn cho toàn bộ đường ống thu hồimột chuyên ngành Mô hình 8 tỷ tham số được tinh chỉnh cho các nhiệm vụ khoa học và kho dữ liệu của các bài báo khoa học. Các nhà nghiên cứu đã viết trong báo cáo của họ: “Theo hiểu biết của chúng tôi, đây là bản phát hành mở đầu tiên của một quy trình hoàn chỉnh dành cho trợ lý khoa học LM – từ dữ liệu đến công thức đào tạo đến các điểm kiểm tra mô hình”. bài đăng trên blog công bố hệ thống.
Sự cởi mở này không chỉ là một quan điểm triết học; đó cũng là một lợi thế thực tế. Kích thước nhỏ hơn và kiến trúc hợp lý của OpenScholar làm cho nó tiết kiệm chi phí hơn nhiều so với các hệ thống độc quyền. Ví dụ, các nhà nghiên cứu ước tính rằng OpenScholar-8B vận hành rẻ hơn 100 lần so với GiấyQA2một hệ thống đồng thời được xây dựng trên GPT-4o.
Hiệu quả chi phí này có thể dân chủ hóa quyền truy cập vào các công cụ AI mạnh mẽ cho các tổ chức nhỏ hơn, các phòng thí nghiệm thiếu vốn và các nhà nghiên cứu ở các nước đang phát triển.
Tuy nhiên, OpenScholar không phải là không có hạn chế. Kho dữ liệu của nó bị hạn chế đối với các tài liệu truy cập mở, loại bỏ các nghiên cứu có tường phí thống trị một số lĩnh vực. Hạn chế này, mặc dù cần thiết về mặt pháp lý, có nghĩa là hệ thống có thể bỏ lỡ những phát hiện quan trọng trong các lĩnh vực như y học hoặc kỹ thuật. Các nhà nghiên cứu thừa nhận khoảng trống này và hy vọng các lần lặp lại trong tương lai có thể kết hợp nội dung truy cập đóng một cách có trách nhiệm.
Phương pháp khoa học mới: Khi AI trở thành đối tác nghiên cứu của bạn
các Dự án OpenScholar đặt ra những câu hỏi quan trọng về vai trò của AI trong khoa học. Mặc dù khả năng tổng hợp văn học của hệ thống rất ấn tượng nhưng nó không phải là không thể sai lầm. Trong các đánh giá của chuyên gia, các câu trả lời của OpenScholar được ưa thích hơn các câu trả lời do con người viết trong 70% thời gian, nhưng 30% còn lại nêu bật các lĩnh vực mà mô hình còn thiếu sót—chẳng hạn như không trích dẫn các bài báo nền tảng hoặc chọn ít nghiên cứu mang tính đại diện hơn.
Những hạn chế này nhấn mạnh một sự thật rộng lớn hơn: Các công cụ AI như OpenScholar nhằm mục đích tăng cường chứ không phải thay thế chuyên môn của con người. Hệ thống này được thiết kế để hỗ trợ các nhà nghiên cứu bằng cách xử lý nhiệm vụ tổng hợp tài liệu tốn nhiều thời gian, cho phép họ tập trung vào việc diễn giải và nâng cao kiến thức.
Các nhà phê bình có thể chỉ ra rằng sự phụ thuộc của OpenScholar vào các tài liệu truy cập mở sẽ hạn chế tiện ích tức thời của nó trong các lĩnh vực có tính rủi ro cao như dược phẩm, nơi phần lớn nghiên cứu bị khóa sau các bức tường trả phí. Những người khác cho rằng hiệu suất của hệ thống tuy mạnh mẽ nhưng vẫn phụ thuộc rất nhiều vào chất lượng dữ liệu được truy xuất. Nếu bước truy xuất không thành công, toàn bộ quy trình có nguy cơ tạo ra kết quả dưới mức tối ưu.
Nhưng ngay cả với những hạn chế của nó, OpenScholar vẫn thể hiện một bước ngoặt trong lĩnh vực điện toán khoa học. Trong khi các mô hình AI trước đó gây ấn tượng với khả năng tham gia vào cuộc trò chuyện, OpenScholar chứng tỏ một điều cơ bản hơn: khả năng xử lý, hiểu và tổng hợp tài liệu khoa học với độ chính xác gần như con người.
Những con số kể một câu chuyện hấp dẫn. Mô hình 8 tỷ tham số của OpenScholar hoạt động tốt hơn GPT-4o trong khi có mức độ nhỏ hơn. Nó sánh ngang với các chuyên gia về con người về độ chính xác của trích dẫn trong đó các AI khác có tỷ lệ thất bại là 90%. Và có lẽ đáng chú ý nhất là các chuyên gia thích câu trả lời của nó hơn câu trả lời của đồng nghiệp của họ.
Những thành tựu này cho thấy chúng ta đang bước vào một kỷ nguyên mới của nghiên cứu được hỗ trợ bởi AI, trong đó nút thắt trong tiến bộ khoa học có thể không còn là khả năng xử lý kiến thức hiện có mà là khả năng đặt câu hỏi phù hợp của chúng ta.
Các nhà nghiên cứu đã phát hành tất cả mọi thứ—mã, mô hình, dữ liệu và công cụ—đánh cược rằng sự cởi mở sẽ đẩy nhanh tiến độ hơn là giữ những đột phá của họ đằng sau cánh cửa đóng kín.
Khi làm như vậy, họ đã trả lời được một trong những câu hỏi cấp bách nhất trong quá trình phát triển AI: Liệu các giải pháp nguồn mở có thể cạnh tranh với hộp đen của Big Tech không?
Có vẻ như câu trả lời đang ẩn giấu rõ ràng trong số 45 triệu tờ báo.