Google Gemini AI: Có gì mới lạ ở đây thực sự?

Gemini tells a presenter that he is free when Sabrina Carpenter comes to town

Google Gemini AI: Điều gì mới mẻ ở đây?

Người tiêu dùng và nhà đầu tư đã chán ngấy với sự hót hòn họt về trí tuệ nhân tạo, và Google biết điều đó.

“Đã có quá nhiều lời hứa, quá nhiều ‘sắp tới’, và không đủ sự hữu ích trong thế giới thực khi nói đến trí tuệ nhân tạo,” Phó Chủ tịch cấp cao của Google, Rick Osterloh, nói tại sự kiện “Made by Google” giới thiệu các điện thoại Pixel mới tại Mountain View vào thứ Ba. “Đó là lý do tại sao hôm nay, chúng ta đang trở nên thực tế… chúng ta sẽ trả lời câu hỏi lớn nhất mà mọi người đặt ra về trí tuệ nhân tạo, trí tuệ nhân tạo có thể làm gì cho tôi?”

Vậy, liệu Google đã đáp ứng được lời hứa đó hay không? Khi bạn bỏ hết các âm mưu của buổi diễn thuyết – sự xuất hiện của các ngôi sao, thuật ngữ về “Đơn vị Xử lý Tensor”, thông số kỹ thuật của điện thoại Pixel, tầm nhìn về những gì Gemini có thể làm trong tương lai – điều gì mới lạ về trải nghiệm Android ở đây? Và liệu bất kỳ điều nào trong đó đủ tư cách trở thành ứng dụng chính?

Dưới đây là một danh sách đầy đủ về mọi thứ mà sự kiện kéo dài 90 phút đã cung cấp trong các bản demo thực tế. Sự hữu ích trong thế giới thực, nói cách khác, chứ không phải là quảng cáo hoặc lời hứa.

1. “Gemini có thể kiểm tra lịch Google của bạn để xem bạn có rảnh vào một buổi hòa nhạc tương lai, dựa trên một tấm poster.”

Thiền sư Dave Citron có lẽ không vui khi sản phẩm Google này buộc phải kêu gọi “linh hồn demo” và chuyển điện thoại trước khi Gemini thực sự hiển thị một câu trả lời để “kiểm tra lịch của tôi và xem tôi rảnh vào khi cô ấy đến San Francisco trong năm nay” (“cô ấy” là nghệ sĩ Sabrina Carpenter; Citron vừa gửi một tấm poster của buổi hòa nhạc của cô ấy cho Gemini).

“Sabrina Carpenter đến San Francisco vào ngày 9 tháng 11 năm 2024”, cuối cùng Gemini đã trả lời. “Tôi không thấy bất kỳ sự kiện nào trên lịch của bạn vào thời gian đó.”

Việc AI đọc văn bản trong một hình ảnh và hiểu ngữ cảnh không mới. Phần tiện ích lịch đã có, và đây là điều có lợi cho Google. Lý thuyết, Apple Intelligence cũng sẽ làm cùng một điều khi ra mắt.

Những bản demo tiếp theo của Citron cho thấy cách Gemini có thể viết thư cho một chủ nhà về một đơn vị AC hỏng, hoặc cho một giáo sư về một lớp học – điều không mới lạ đối với tất cả các trợ lí trí tuệ nhân tạo.

2. “Gemini Live cung cấp ‘cuộc trò chuyện thoải mái'”.

Tiếp theo, Phó Chủ tịch Jenny Blackburn của Google đã trình bày trợ lí giọng nói Gemini Live. Họ đã trò chuyện về thí nghiệm khoa học mà cháu gái và cháu trai của Blackburn có thể thích, và sau một số hồi hội, họ quyết định tạo mực vô hình. Cuộc trò chuyện đã có dòng thông thoại.

Mọi thứ đều ổn, trừ việc OpenAI đã trình diễn trợ lí giọng nói GPT-4o của mình, với những cuộc trò chuyện có thể bị gián đoạn một cách tương tự, vào tháng 5. Tính năng đó hiện đang có sẵn cho một nhóm nhỏ người dùng của ChatGPT Plus, nhưng chưa phải tất cả. Vậy nên Google đã vượt qua được trước, chúng ta có thể nghĩ vậy?

3. “Gemini Nano cung cấp các bản tóm tắt trên thiết bị của bạn sau các cuộc gọi”.

Đây là một tính năng có thể ít kì quái hơn những gì nghe có vẻ: Ghi chú cuộc gọi, mà “tiếp tục cuộc gọi của bạn với một bản tóm tắt hoàn toàn riêng tư về cuộc trò chuyện.” Nhưng đừng lo, vì nó đang sử dụng Gemini Nano, một dịch vụ trí tuệ nhân tạo dựa trên hoàn toàn trên điện thoại Pixel 9 mà không cần truy cập vào đám mây. (Phần trên thiết bị không mới; Samsung cũng thực hiện điều tương tự với Galaxy AI.)

Screenshots có thể tìm kiếm được.

Thêm một thành công cho Gemini Nano về những gì chúng tôi gọi là tính năng trí tuệ nhân tạo hữu ích nhất trong năm 2024.

Nhưng sau đó, chúng ta đã thấy rất nhiều điều hình ảnh mà trợ lí trí tuệ đã làm hàng chục lần trước đó. Ví dụ: tạo lời mời tiệc trong Pixel Studios, tự động cắt khung hình trong Magic Editor, thêm hình ảnh trí tuệ tạo ra vào hình ảnh của bạn, chèn chính mình vào một bức ảnh gia đình hoặc hình ảnh với người nổi tiếng (tính năng mới và buồn cười có tên gọi là “Add Me”). Cộng thêm những tính năng đáng yêu nhưng không phải AI gì cả (tính năng “Made You Look” sẽ đưa sự chú ý của con trẻ vào màn hình sau của Pixel).

Vậy liệu bộ tính năng này có đủ sức đảo ngược sự hoài nghi đã hiện hữu quanh bong bóng trí tuệ nhân tạo? Đừng mong chờ Gemini sẽ trả lời ngay một cách sớm.

#GoogleGemini #tríTuệNhânTạo #SựKiệnNgàyHômNay

Nguồn: https://mashable.com/article/google-gemini-ai

Consumers and investors are sick of AI hype, and Google knows it.

“There have been so many promises, so many ‘coming soon’s, and not enough real-world helpfulness when it comes to AI,” Google senior VP Rick Osterloh said at the “Made by Google” event that unveiled new Pixel phones in Mountain View Tuesday. “Which is why today, we’re getting real … we’re going to answer the biggest question people have about AI, what can AI do for me?”

OK, so did Google live up to that promise? When you strip the keynote of all the bells and whistles — the celebrity appearances, the jargon about “Tensor Processing Units,” the Pixel phone tech specs, the visions of what Gemini might be able to do in the long run — what was new about the Android experience here? And does any of it qualify as a must-have killer app?

Here’s a complete list of everything the 90-minute event offered in actual functioning demonstrations. Real-world helpfulness, in other words, as opposed to ads or promises.

1. Gemini can check your Google calendar to see if you’re free for a future concert, based on a poster.

Gemini tells a presenter that he is free when Sabrina Carpenter comes to town

Thanks, Gemini!
Credit: Google

Poor Dave Citron. In the keynote’s most awkward moment, this Google product lead had to invoke “the demo spirits” and switch phones before Gemini would actually display an answer to “check my calendar and see if I’m free when she’s coming to San Francisco this year” (“she” being the artist Sabrina Carpenter; Citron had just sent Gemini a photo of her concert poster).

“Sabrina Carpenter is coming to San Francisco on November 9, 2024,” Gemini eventually responded. “I don’t see any events on your calendar during that time.”

Mashable Light Speed

AI reading the text in an image and understanding the context isn’t new. The calendar add is, and that’s to Google’s advantage. In theory, Apple Intelligence will do the same thing when it debuts.

Citron’s next demos showed how Gemini could draft a letter to a landlord about a broken AC unit, or a professor about a class — well-trod ground for all AI assistants.

2. Gemini Live offers ‘free-flowing conversation’

Next up, Google VP Jenny Blackburn showed off the Gemini Live voice assistant. They had a chat about science experiments her niece and nephew might like, and after some back-and-forth, settled on making invisible ink. The discussion had a conversational flow.

All well and good, except that OpenAI demonstrated its GPT-4o voice assistant, with similarly interruptible conversations, back in May. That feature is currently live for a small group of ChatGPT Plus users, but not all. So Google got there first, we guess?

3. Gemini Nano offers on-device summaries of your phone calls

Here’s a feature that may be less creepy than it sounds: Call Notes, which “follows up on your phone calls with a completely private summary of the conversation.” But don’t worry, because it’s using Gemini Nano, an AI service that is based entirely on the Pixel 9 phone without requiring cloud access. (The on-device part is not new; Samsung does the same with Galaxy AI.)

4. Screenshots are searchable.

Score one more success for Gemini Nano on what we’re calling the most useful AI feature of 2024.

But after that, we got a lot of visual stuff we’ve seen AI assistants do a dozen times before. To wit: creating a party invite in Pixel Studios, auto-framing in Magic Editor, adding generative AI images to your image, inserting yourself into a family photo or a picture with a celebrity (the new and embarrassingly named “Add Me” feature). Plus stuff that was cute but not AI at all (the “Made You Look” feature that will point your child’s attention at the Pixel’s rear-facing screen).

So, will this feature set be enough to reverse the skepticism that has set in around the AI bubble? Don’t count on Gemini to answer that one any time soon.


Leave a Reply

Your email address will not be published. Required fields are marked *