Google Bard không đáng kỳ vọng như đã hứa – ngay cả sau các bản cập nhật mới nhất #GoogleBard #Chatbot
Google đã cập nhật lại chatbot trí tuệ nhân tạo Bard của mình vào tuần trước với một bản cải tiến lớn, cho phép người dùng truy cập từ các sản phẩm phổ biến nhất như Gmail, Docs, Drive, Maps, YouTube và nhiều hơn nữa. Cập nhật này lý thuyết rằng Bard của Google có lợi thế hơn ChatGPT, một nhà lãnh đạo thị trường do OpenAI và Microsoft chung tay phát triển. Cùng nhau, công cụ tìm kiếm của Google và các ứng dụng khác có tầm ảnh hưởng lớn hơn rất nhiều so với các ứng dụng văn phòng phổ biến của Microsoft.
Việc giới thiệu Bard Extensions, trong lý thuyết, là một đường đi mưu trí. Hãy tưởng tượng trợ lý trí tuệ nhân tạo của bạn không chỉ nói ra các sự thật từ cơ sở dữ liệu được huấn luyện theo hàng tỷ thông số cạnh tranh với những gì ChatGPT đề xuất, mà còn thu thập dữ liệu cá nhân thời gian thực từ các dịch vụ của Google. Ý tưởng về việc Bard đào qua Gmail hoặc Google Drive của tôi để cung cấp các câu trả lời cụ thể về ngữ cảnh nghe có vẻ như đọc từ trang sách của đồng tác giả William Gibson. Nhưng đây là nơi mà chúng tôi gặp rắc rối.
Trong tuần kể từ khi tôi thông báo về thông báo, tôi đã có cơ hội thử nghiệm tính năng mới này. Rất tiếc, trong thực tế, tôi thấy Bard là một sự thất vọng ở nhiều mức độ. Nó không thực hiện được cam kết cốt lõi của nó khi tích hợp tốt với các ứng dụng của Google và thường xuyên có những phản ứng không chính xác hoặc vô lý. Nó cũng thiếu sự sáng tạo và linh hoạt như GPT-4 của OpenAI (Nó cũng không có tính cách hoặc sự hài hước, mặc dù một số người dùng có thể không phản đối vấn đề đó). Bard không thực sự đáp ứng được mong đợi.
Vấn đề xuyên tâm của vấn đề nằm trong mô hình ngôn ngữ của trí tuệ nhân tạo, PaLM 2, điều khiển các khả năng mới của Bard. Giống như tất cả các mô hình ngôn ngữ khác, PaLM 2 là một sản phẩm của dữ liệu huấn luyện. Về cơ bản, nó chỉ có thể tạo ra các câu trả lời dựa trên nội dung nó được cung cấp. Theo một báo cáo của CNBC, PaLM 2 được huấn luyện với khoảng 340 tỷ thông số. So với đó, GPT-4 được đồn đoán được huấn luyện với một bộ dữ liệu rất lớn gồm 1,8 nghìn tỷ thông số. Điều này có nghĩa là GPT-4 có quyền truy cập vào nhiều thông tin và kiến thức hơn PaLM 2, điều này có thể giúp nó tạo ra văn bản có liên quan và thú vị hơn.
Tôi đã thử nghiệm cường độ của những khả năng mới của Bard bằng cách thử hàng chục yêu cầu tương tự như những gì Google quảng cáo trong buổi ra mắt tuần trước. Ví dụ, tôi đã yêu cầu Bard tìm ra các điểm chính từ một tài liệu trong Docs và tạo một bản tóm tắt email. Bard đáp lại bằng cách nói “Tôi không có đủ thông tin” và từ chối hiển thị bất kỳ tài liệu nào từ Google Drive của tôi. Sau đó, nó tóm tắt không tốt một tài liệu khác và tạo một email không thể sử dụng cho tôi.
Một ví dụ khác: tôi yêu cầu Bard tìm cho tôi những ưu đãi tốt nhất về chuyến bay từ San Francisco đến Los Angeles trên Google Flights. Trò chuyện đáp lại bằng cách gửi cho tôi một email giải thích cách tìm kiếm thủ công vé máy bay trên Google Flights.
Hiệu suất của Google Bard cũng không mấy khả quan khi tôi cố gắng sử dụng nó cho các nhiệm vụ sáng tạo, như viết một bài hát hoặc một kịch bản. Bard hoặc bỏ qua đầu vào của tôi hoặc tạo ra nội dung nhạt nhẽo và buồn tẻ thiếu bất kỳ tính sáng tạo hoặc sự đặc biệt nào. Bard cũng thiếu mọi tùy chọn điều chỉnh mức độ sáng tạo của nó, khác với GPT-4, có một dây quay cho phép người dùng kiểm soát mức độ phiêu lưu hoặc bảo thủ của đầu ra.
Điều duy nhất đáng khen của Bard là nó có tính năng tích hợp cho phép người dùng kiểm tra lại câu trả lời của nó thông qua Tìm kiếm Google. Bằng cách nhấp vào nút “Google” sau một trong những yêu cầu, người dùng có thể xem xem câu trả lời của Bard có so sánh với kết quả từ Tìm kiếm Google. Bard sau đó làm nổi bật các phần của đầu ra của nó có thể sai hoặc sai lệch. Tính năng này hữu ích để giảm thiểu những cái mê trong quá trình và lỗi, nhưng nó cũng làm lộ ra Bard không đáng tin cậy và không đáng tin cậy như thế nào.
Vì sao điều này quan trọng? Bởi vì Google là một trong những công ty hàng đầu trong thế giới công nghệ và sáng tạo và nó có ảnh hưởng rất lớn đến cách mọi người truy cập và sử dụng thông tin. Sản phẩm và dịch vụ của Google được hàng tỷ người sử dụng hàng ngày và chúng đã tạo ra cách chúng ta giao tiếp, học tập, làm việc và chơi game. Nếu Google muốn vượt trội so với cạnh tranh và duy trì danh tiếng là một ngôi sao lĩnh vực trí tuệ nhân tạo, nó cần làm tốt hơn Bard.
Bard không chỉ là một chatbot; nó là một phản ánh của tầm nhìn và giá trị của Google. Nó được cho là một trợ lý có thể giúp người dùng với các nhiệm vụ khác nhau và nâng cao năng suất và sáng tạo của họ. Nhưng Bard thất bại đáng kể trong tất cả những điều đó. Nó không hữu ích; nó thường làm người ta thất vọng.
Bard 2.0 đã đến, nhưng nó chưa tốt. Cho đến nay, ít nhất là như vậy. Có lẽ mô hình “Gemini” sắp tới của Google sẽ là giải pháp mà họ đang tìm kiếm. Nhưng cho đến khi đó, tôi khuyên bạn nên tin tưởng GPT-4 cho hầu hết công việc của bạn. GPT-4 của OpenAI có thể không hoàn hảo, nhưng nó vượt trội hơn Bard về chức năng, độ tin cậy, sáng tạo và cá nhân.
Nhiệm vụ của VentureBeat là trở thành một “thị trấn kỹ thuật số” cho những người quyết định kỹ thuật để tìm hiểu về công nghệ doanh nghiệp mang tính chất biến đổi và tiến hành giao dịch. Khám phá thông tin tóm tắt của chúng tôi.
Head over to our on-demand library to view sessions from VB Transform 2023. Register Here
Google revamped its artificially intelligent chatbot Bard last week in a major overhaul that now gives users access to it from some of its most popular products including Gmail, Docs, Drive, Maps, YouTube, and more. The update theoretically gives Google’s Bard an advantage over ChatGPT, which is the market leader pushed jointly by OpenAI and Microsoft. Together, Google’s search engine and other apps have massively more reach than even Microsoft’s popular Office apps.
The introduction of Bard Extensions is, in theory, a stroke of brilliance. Imagine your AI assistant not just reciting facts from a knowledge base trained on billions of parameters competitive to what ChatGPT offers, but additionally pulling live personalized data from your Google services. The idea of Bard rifling through my Gmail or Google Drive to provide context-specific responses sounds like something pulled from the pages of a William Gibson novel. But here’s where we hit a snag.
In the week since I reported the announcement, I’ve had a chance to play around with the new offering. Unfortunately, in practice, I find Bard to be a disappointment on many levels. It fails to deliver on its core promise of integrating well with Google apps, and often produces inaccurate or nonsensical responses. It also lacks the creativity and versatility of OpenAI’s GPT-4 (It also has no personality or sense of humor, although some users might not take issue with that). Bard badly falls short of expectations.
The crux of the problem lies in the AI’s underlying model, PaLM 2, which powers Bard’s new capabilities. Like all language models, PaLM 2 is a product of its training data. In essence, it can only generate responses based on the content it has been fed. According to a CNBC report, PaLM 2 is trained on about 340 billion parametersl. By comparison, GPT-4 is rumored to be trained on a massive dataset of 1.8 trillion parameters. This means that GPT-4 has access to more information and knowledge than PaLM 2, which may help it generate more relevant and interesting texts.
Event
VB Transform 2023 On-Demand
Did you miss a session from VB Transform 2023? Register to access the on-demand library for all of our featured sessions.
Falling short of expectations
I stress-tested Bard’s new capabilities by trying dozens of prompts that were similar to the ones advertised by Google in last week’s launch. For example, I asked Bard to pull up the key points from a document in Docs and create an email summary. Bard responded by saying “I do not have enough information” and refused to pull up any documents from my Google Drive. It later poorly summarized another document and drafted an unusable email for me.
Another example: I asked Bard to find me the best deals on flights from San Francisco to Los Angeles on Google Flights. The chat responded by drafting me an email explaining how to search manually for airfare on Google Flights.

Bard’s performance was equally dismal when I tried to use it for creative tasks, such as writing a song or a screenplay. Bard either ignored my input or produced bland and boring content that lacked any originality or flair. Bard also lacks any option to adjust its creativity level, unlike GPT-4, which has a dial that allows the user to control how adventurous or conservative the output is.
The only redeeming feature of Bard is that it has a built-in feature that allows users to double-check its answers via Google Search. By clicking the “Google It” button after a prompt, users can see how Bard’s response compares to the results from Google Search. Bard then highlights the parts of its output that could be false or misleading. This feature is handy for reducing hallucinations and errors, but it also exposes how unreliable and untrustworthy Bard is.
Why does this matter? Because Google is one of the leading companies in the world of technology and innovation, and it has a huge influence on how people access and use information. Google’s products and services are used by billions of people every day, and they shape how we communicate, learn, work, and play. If Google wants to stay ahead of the competition and maintain its reputation as a leader in AI, it needs to do better than Bard.
Bard is not just a chatbot; it is a reflection of Google’s vision and values. It is supposed to be an assistant that can help users with various tasks and enhance their productivity and creativity. But Bard fails on all these counts. It is not helpful; it is generally very frustrating.
Bard 2.0 is here, but it stinks. So far, at least. Maybe Google’s upcoming model “Gemini” will be the fix it’s looking for. But until then, I recommend relying on GPT-4 for the bulk of your work tasks. OpenAI’s GPT-4 may not be perfect either, but it is far superior to Bard in terms of functionality, reliability, creativity, and personality.
VentureBeat’s mission is to be a digital town square for technical decision-makers to gain knowledge about transformative enterprise technology and transact. Discover our Briefings.
[ad_2]