Google đang phát triển ‘Jarvis’ AI có thể điều khiển trình duyệt web của bạn
Google có thể sắp sửa giới thiệu một trợ lý trí tuệ nhân tạo có thể vận hành trình duyệt web để giúp người dùng tự động hóa các công việc hàng ngày. Báo cáo từ The Information cho biết công ty đang làm việc trên một “computer-using agent” dưới mã dự án Jarvis, và nó có thể sẵn sàng để được xem trước ngay trong tháng 12.
Theo các nguồn tin đã nói chuyện với The Information, Jarvis “phản hồi vào những lệnh của một người bằng cách chụp ảnh màn hình máy tính của họ thường xuyên, và diễn giải những bức ảnh trước khi thực hiện hành động như click vào một nút hoặc gõ vào một trường văn bản.”
Jarvis được cho là làm việc chỉ với trình duyệt web – đặc biệt là Chrome – để hỗ trợ cho các công việc thông thường như nghiên cứu, mua sắm và đặt vé máy bay. Điều này đến trong bối cảnh khi Google tiếp tục mở rộng khả năng của công nghệ Gemini AI của mình, mô hình thế hệ tiếp theo dự kiến sẽ được tiết lộ vào tháng 12, như báo cáo từ The Verge. Gemini Live, trợ lý trò chuyện AI của Google, vừa đã hỗ trợ thêm hàng chục ngôn ngữ mới trong tháng này, và tích hợp Gemini đã gần đây đã xuất hiện trong Google Meet, Photos và các ứng dụng khác.
Thông tin về Jarvis đến chỉ vài ngày sau khi Anthropic giới thiệu một tính năng tương tự nhưng có vẻ rộng lớn hơn cho công nghệ Claude AI của mình, mà họ nói đã được trang bị các kỹ năng máy tính để nó có thể “sử dụng một loạt các công cụ tiêu chuẩn và chương trình phần mềm được thiết kế cho con người”. Điều này đã có sẵn trong phiên bản beta công khai.
#AI #Google #Jarvis #GeminiAI #Vietnamese
Google may be close to unveiling an AI agent that can operate a web browser to help users automate everyday tasks. reports that the company is working on a “computer-using agent” under the codename Project Jarvis, and it may be ready to be previewed as soon as December. According to sources that spoke to The Information, Jarvis “responds to a person’s commands by capturing frequent screenshots of what’s on their computer screen, and interpreting the shots before taking actions like clicking on a button or typing into a text field.”
Jarvis is reportedly made to work only with web browsers — particularly Chrome — to assist with common tasks like research, shopping and booking flights. It comes as Google continues to expand the capabilities of its Gemini AI, the next-gen model of which is expected to be revealed in December, as reported by . Gemini Live, Google’s AI chatbot, this month, and Gemini integration has recently made it to , and other applications.
The news of Jarvis comes days after but seemingly more expansive feature for its Claude AI, which it says has been equipped with computer skills so it can “use a wide range of standard tools and software programs designed for people.” That’s available now in a public beta.
[ad_2]