“Google tìm cách đền đáp thời gian đã trôi qua với công nghệ AI”

#GoogleIO2021: Google lấp đầy phần thiếu của giao diện AI bằng thiết kế sản phẩm thực tế. Việc khiến người dùng chuyển đổi nền tảng để sử dụng AI tổng quát đang tỏ ra khó khăn hơn. Họ đang chờ đợi AI biến thành các sản phẩm và dịch vụ hữu ích. Với Bard, giới hạn của mô hình ngôn ngữ rộng lớn của Google, PaLM, sẽ ghi được vào Gmail, Tài liệu và Trang tính. Google đang trừu tượng hóa quá trình đó thành một nút bấm. Sản phẩm AI mới, cộng sự, được tích hợp vào các công cụ năng suất hiện có của Google như Tài liệu để tăng cường sáng tạo của người dùng. Google cũng hứa hẹn rằng, vào cuối năm nay, bạn có thể yêu cầu Gmail soạn email cho bạn trong cửa sổ soạn thư. Bài học là, AI chỉ trở thành hữu ích khi được tích hợp vào các sản phẩm và dịch vụ mà người dùng sử dụng hàng ngày.

Nguồn: https://www.theverge.com/2023/5/12/23721037/google-ai-progress-search-docs-starline-video-calls

Sự xuất hiện của ChatGPT vào năm ngoái đã khiến Google rùng mình hiếm thấy. Trong nhiều năm, công ty đã định vị mình là người dẫn đầu trong việc phát triển trí tuệ nhân tạo. Tuy nhiên, đột nhiên, một sản phẩm từ OpenAI mới nổi đã tăng vọt tới hàng chục triệu người dùng hàng tháng — và các nhà quan sát bắt đầu đặt câu hỏi liệu Google có lãng phí vị trí dẫn đầu của mình hay không.

Trong vòng vài tuần, các nhà lãnh đạo của công ty đã tuyên bố “mã đỏ” — một tín hiệu cho thấy đã đến lúc bắt đầu vận chuyển các tính năng AI. (Đã có thông tin rộng rãi rằng CEO Sundar Pichai đã tuyên bố mã màu đỏ, nhưng sau đó anh ấy nói với tôi rằng đó không phải là trường hợp.)

Kể từ đó, một số ít sản phẩm đã được xuất xưởng — đáng chú ý nhất là Bard, tương tự ChatGPT của công ty. Nhưng vào thứ Tư, tại hội nghị nhà phát triển hàng năm của công ty, các cửa xả lũ đã mở ra. Tại Google I/O, một loạt các tính năng AI mới đã được công bố, chạm đến gần như mọi phần trong dòng sản phẩm của công ty.

Bắt người dùng chuyển đổi nền tảng đang tỏ ra khó khăn hơn mà một số người tưởng tượng

Phần lớn, những sản phẩm này sẽ được xuất xưởng “trong vài tuần tới” hoặc “cuối năm nay”. Cho đến lúc đó, tất cả những gì chúng tôi thực sự phải tiếp tục là các bản xem trước mà chúng tôi đã thấy trong các cuộc biểu tình và các cuộc họp báo trước hội nghị.

Nhưng trong khi tôi tưởng tượng các tính năng sẽ khác nhau về chất lượng và tính hữu dụng, thì có một điều đang trở nên rõ ràng về tương lai gần của AI: chỉ riêng công nghệ thôi là không đủ để thiết lập lại hoàn toàn bối cảnh cạnh tranh. Những người đương nhiệm có thể đạt được vị thế đáng kể chỉ bằng cách đưa các tính năng mới vào các sản phẩm mà mọi người đang sử dụng — và việc khiến người dùng chuyển đổi nền tảng đang tỏ ra khó khăn hơn một số người có thể tưởng tượng.

Trước tiên hãy chuyển đổi nền tảng. Trong tháng Hai, Microsoft đã ra mắt lại Bing với kết quả tìm kiếm AI tổng quát được cung cấp bởi ChatGPT. Công ty hy vọng rằng đó sẽ là thời điểm mà người tiêu dùng nhìn Bing lần thứ hai — và có lẽ sẽ cho Microsoft cơ hội giành lấy thị phần đáng kể từ đối thủ lớn hơn nhiều của mình.

Ba tháng sau — và vào đêm trước khi Google bổ sung các kết quả AI tổng quát vào công cụ tìm kiếm của riêng mình — dự án đó dường như đã bị đình trệ. Trích dẫn một báo cáo từ công ty nghiên cứu YipitData, Thông tin đã báo cáo hôm thứ Tư rằng tỷ lệ tìm kiếm của Bing trên máy tính để bàn đã chỉ tăng 0,25 phần trăm trong ba tháng qua. Microsoft nói với cửa hàng rằng tốc độ tăng trưởng trên thiết bị di động cao hơn và có lẽ nó cũng sẽ tăng trên máy tính để bàn trong những tháng tới.

Nhưng câu chuyện tương tự cũng lưu ý rằng ChatGPT nhận được hơn 65 triệu lượt truy cập mỗi ngày, so với 40 triệu của Bing 14 tuổi. Những người muốn sử dụng chatbot của OpenAI phần lớn sẽ truy cập thẳng vào nguồn — và Microsoft, chỉ là một trong số hàng chục công ty tích hợp công nghệ của OpenAI với hy vọng rằng nó sẽ mở ra các nguồn doanh thu mới, nhận thấy rằng quyền truy cập API là một thứ hàng hóa chứ không phải hơn là động cơ tăng trưởng. (Tôi chắc chắn rằng Microsoft cuối cùng sẽ tìm ra nhiều cách để kiếm tiền từ AI, bắt đầu với tất cả các dịch vụ cơ sở hạ tầng mà nó cung cấp cho OpenAI thông qua nền tảng Azure của mình.)

Bài học ở đây là, ngoại trừ ChatGPT, hầu hết người dùng không tìm kiếm AI như một điểm đến cho chính họ. Thay vào đó, họ đang chờ nó biến thành các sản phẩm và dịch vụ hữu ích — lý tưởng nhất là các sản phẩm và dịch vụ mà họ đang sử dụng.

Tính năng “sidekick” trong Google Docs.
Hình ảnh: Google

Tuần trước tôi đã viết về Giao diện bị thiếu của AIvà những thách thức do công nghệ có thiết kế giao diện bắt đầu và kết thúc bằng hộp văn bản. Một cách suy nghĩ về I/O năm nay là Google bắt đầu lấp đầy những phần còn thiếu của giao diện đó bằng thiết kế sản phẩm thực tế — một cam kết thúc đẩy người dùng, bằng mọi cách, sử dụng AI một cách hiệu quả.

Hãy xem xét một vài trong số những cách đó. Cho đến bây giờ, Bard là một hòn đảo độc lập — một sandbox để thử nghiệm các giới hạn của mô hình ngôn ngữ rộng lớn của Google, PaLM. Tuy nhiên, bạn sẽ sớm có thể xuất đầu ra của Bard vào Gmail, Tài liệu và Trang tính — những nơi mà bạn có thể sẽ sao chép và dán nó vào. ChatGPT có thể ghi lại nhiều hành động sao chép và dán hơn bất kỳ trang web nào khác trên thế giới; Google đang trừu tượng hóa toàn bộ quá trình đó thành một nút bấm.

Tuy nhiên, lý tưởng nhất là bạn không bao giờ phải truy cập một trang web chuyên dụng để sử dụng AI tổng quát ngay từ đầu. Ví dụ: hiện tại, rất nhiều người đang yêu cầu ChatGPT viết email của họ và sau đó chuyển chúng vào ứng dụng email khách mà họ chọn. Google đang thực hiện bước tiếp theo rõ ràng: hứa hẹn rằng vào cuối năm nay, bạn sẽ có thể yêu cầu Gmail soạn email cho bạn trong cửa sổ soạn thư.

Tôi đoán ChatGPT sẽ thấy ít hành động sao chép và dán hơn sau đó.

Bạn cũng có thể chỉ cần gắn các hộp AI sáng tạo vào các công cụ năng suất hiện có — như cách mà Google đã thể hiện với “cộng sự” tính năng. Trong một trong những bản trình diễn hay nhất trong ngày, giám đốc điều hành Google Aparna Pappu đã giới thiệu người bạn đồng hành trong Tài liệu. Khi cô ấy tưởng tượng viết một câu chuyện ngắn về một chiếc vỏ sò bị mất tích với cháu gái của mình, người bạn đồng hành đã đưa ra những gợi ý theo ngữ cảnh. Điều gì đã xảy ra với vỏ sò, nó muốn biết.

Sau đó, người bạn đồng hành đưa ra một số gợi ý: có thể nó đã bị đánh cắp bởi một nàng tiên cá ghen tị. Có lẽ nó đã được thực hiện bởi một nhà du hành thời gian. Có lẽ nó đã bị ăn bởi một con mực.

Đây là cách AI sẽ bắt đầu hoạt động trong cuộc sống của chúng ta

Nếu bạn là một đứa trẻ 10 tuổi đang viết truyện ngắn, điều này sẽ rất thú vị. Và nó có thể thậm chí còn không xuất hiện với người dùng bình thường với tư cách là AI – thay vào đó, nó giống như một công cụ sáng tạo mới sử dụng một sản phẩm phổ biến hiện có và làm cho nó trở nên hữu ích hơn.

Có rất nhiều bản demo như thế ngày hôm qua. Tôi bị ấn tượng bởi một ứng dụng tạo ghi chú của diễn giả từ một tập hợp các trang trình bày – chắc chắn đây là món quà trời cho dành cho những người làm việc hay trì hoãn ở khắp mọi nơi – và một ứng dụng khác tạo danh sách các món ăn mà mọi người sẽ mang đến một số món ăn dựa trên Google Trang tính đính kèm.

Nhìn theo một cách nào đó, một số nội dung này có thể cảm thấy khá tầm thường. Nhưng trong tương lai gần, đây là cách AI sẽ bắt đầu hoạt động trong cuộc sống của chúng ta. Chẳng bao lâu nữa, có lẽ chúng ta sẽ không nghĩ nó là AI nữa. (Một chủ đề lặp đi lặp lại và có phần phòng thủ trong bài phát biểu quan trọng ngày hôm qua là Google đã xuất xưởng rất nhiều thứ sử dụng máy học nhưng vì bất kỳ lý do gì lại không đáp ứng được định nghĩa luôn thay đổi của chúng tôi về những gì được coi là AI. Tìm kiếm “chó” trong Google Ảnh chẳng hạn.)

Chắc chắn có một cột khác được viết ở đây về những thay đổi theo kế hoạch của Google đối với tìm kiếm, điều này sẽ đặt một mô-đun kết quả AI tổng quát lên trên 10 liên kết màu xanh lam tiêu chuẩn. Nhưng tôi muốn đợi cho đến khi tôi thực sự có thể tự mình thử nó để hiểu rõ hơn về cảm giác khó chịu của nó.

Hiện tại, với tìm kiếm và mọi thứ khác, Google đã định vị trí tuệ nhân tạo không phải là một nhà tiên tri biết tất cả mọi thứ mà là một điểm khởi đầu hữu ích cho nhiều nhiệm vụ. AI của Google sẽ viết bản nháp đầu tiên; đưa ra các con đường thay thế để xem xét; hoặc lướt qua một chủ đề mới mà bạn quan tâm. Điều này có lợi là cách mọi người thực sự sử dụng AI trong thực tế ngày nay và Google thật thông minh khi dựa vào thông điệp đó thay vì một thứ gì đó hoành tráng hơn.

Cuối cùng, tôi vẫn tin rằng cơ hội cho AI sẽ lớn hơn nhiều so với một công ty. Nhưng trong một thời điểm khi tất cả các mô hình ngôn ngữ lớn này đang hội tụ để trở nên gần như tương đương về mặt chức năng, thì không ai có thể giành chiến thắng trong trò chơi chỉ dựa vào công nghệ.

AI đang chuyển từ một vấn đề khoa học sang vấn đề thiết kế sản phẩm và tiếp thị, và sau này là những thứ mà Google đã có nhiều kinh nghiệm.

Một metaverse tốt hơn

Điều tuyệt vời nhất tôi thấy tại Google I/O là Dự án Starlinemột phần cứng thử nghiệm đặt câu hỏi: điều gì sẽ xảy ra nếu người trong cuộc gọi Zoom tiếp theo của bạn là một hình ba chiều?

Cuộc thảo luận kéo dài một năm mà chúng tôi đã có về metaverse từ năm 2021 đến năm 2022 thường đề cập đến ý tưởng về “hiện diện từ xa” — những công nghệ cho phép mọi người cảm thấy như thể họ đang hiện diện thực tế với ai đó ngay cả khi họ chỉ được đại diện bằng kỹ thuật số. Ngoài Zoom, điều tốt nhất chúng tôi có thể làm trên mặt trận này là đeo những chiếc tai nghe vô duyên, tự điều hướng vào các phòng hội nghị có pixel và nói chuyện với cụt chân phiên bản hoạt hình của đồng nghiệp và những người thân yêu của chúng tôi.

Dự án Starline, vẫn còn ở giai đoạn đầu trong quá trình phát triển và sẽ cần phải rẻ hơn rất nhiều để trở thành xu hướng chủ đạo, chỉ yêu cầu bạn ngồi xuống trước thiết bị giống như TV và bật nó lên. Không có tai nghe, kính hoặc tai nghe để nghịch — chỉ có một người nói chuyện với bạn, trong không gian ba chiều và ở độ phân giải cao đáng ngưỡng mộ.

Andrew Nartker, tổng giám đốc của Starline, đã trình diễn nó cho tôi khi ngồi trong một gian hàng riêng biệt. Khi anh ấy định đấm tôi một cái, bàn tay của anh ấy dường như đến bởi vì màn hình TV. Sau đó, anh ấy đưa cho tôi một quả táo, và hiệu quả rất chân thực. Và trong suốt thời gian đó, giọng nói của Nartker theo dõi chuyển động của anh ấy khi anh ấy thay đổi vị trí, làm tăng ảo giác rằng anh ấy đang ở ngay trước mặt tôi.

Trên thực tế, anh ấy đang ở trong một gian hàng cách gian hàng tôi đang ngồi vài bước chân. Tôi chắc chắn rằng đằng sau hậu trường có những cải tiến công nghệ ẩn giấu mà bạn có thể không tìm thấy trong thế giới thực: một đường ống dữ liệu vững chắc như đá các thiết bị chẳng hạn. Và trong cuộc trò chuyện của tôi với nhân viên Google ngày hôm qua, rõ ràng là trở ngại chính đối với sự phát triển của Starline sẽ là làm cho nó rẻ hơn nhiều so với hiện nay. (Không ai nói với tôi Làm sao nó đắt, nhưng nếu bạn nói với tôi rằng toàn bộ thiết lập tốn một triệu đô la trở lên thì có vẻ không quá đáng, so với chất lượng của trải nghiệm.)

Tin tốt là có những dấu hiệu Starline đang đi xuống đường cong chi phí. Google cho biết trong tuần này rằng họ đã bắt đầu thử nghiệm thiết bị với các đối tác bao gồm Salesforce, T-Mobile và WeWork, cũng như tại chính Google.

Với những thách thức và tất cả việc cắt giảm chi phí đang diễn ra tại Google và các nơi khác, sẽ ít người ngạc nhiên nếu Starline cuối cùng chứng tỏ là phần mềm hơi. Nhưng có một điều gì đó sâu sắc ở đây mà metaverse của Meta chưa đạt được: một hình thức trò chuyện video thuận tiện, thoải mái, tiện dụng mà tôi có thể dễ dàng tưởng tượng mình sẽ làm hàng giờ.

Tôi chắc chắn rằng tôi sẽ tham gia các cuộc họp trong thực tế ảo trong vài năm tới, nếu chỉ vì chúng rẻ hơn nhiều so với việc cài đặt Project Starline tại nhà của tôi.

Tuy nhiên, vào phút thay đổi, webcam và tai nghe của tôi sẽ được cất vào ngăn kéo.


Leave a Reply

Your email address will not be published. Required fields are marked *