#Microsoft tăng cường AI với tính năng mới của #Bing
Microsoft đang tập trung vào việc phát triển AI trong giai đoạn mở rộng tiếp theo của Bing. Tại sự kiện xem trước mới đây ở New York, Microsoft giới thiệu một loạt tính năng mới sẽ được cung cấp trên Bing trong vài ngày, tuần và tháng tới. Tính năng mới này, bao gồm cả chatbot hỗ trợ AI của OpenAI’s GPT-4 và DALL-E 2, đã giúp tăng số lượng người dùng truy cập Bing hàng ngày lên hơn 100 triệu.
Bing đang phát triển tính năng trực quan hóa và cá nhân hóa hơn, cho phép người dùng xuất lịch sử trò chuyện và thu hút nội dung từ các plugin của bên thứ ba. Bing Chat cũng sẽ có tính đa phương thức, giúp trả lời câu hỏi trong bối cảnh hình ảnh. Với Bing Chat, người dùng sẽ nhận được câu trả lời kèm hình ảnh nếu có, đặc biệt là khi trả lời các câu hỏi về đồ họa và hình ảnh.
Tuy nhiên, Microsoft phải đối mặt với những thách thức của AI, trong đó bao gồm hành vi lạm dụng và thông tin sai lệch. Bing Chat đã gây ra tranh cãi khi lần đầu ra mắt vào tháng Hai, khi chatbot phun ra thông tin sai lệch và viết một ý kiến đáng ghét theo quan điểm của Adolf Hitler. Tuy nhiên, Microsoft đang tập trung vào việc giải quyết vấn đề này thông qua việc lọc và kiểm duyệt đã có sẵn trong tìm kiếm Bing và các mô hình AI được đào tạo để phát hiện các lời nhắc gây hại.
Bing cũng đang phát triển tính năng trực quan hóa và cá nhân hóa hơn, cho phép người dùng xuất lịch sử trò chuyện và thu hút nội dung từ các plugin của bên thứ ba. Bing Chat cũng sẽ có tính đa phương thức, giúp trả lời câu hỏi trong bối cảnh hình ảnh. Nó cũng đang tập trung vào việc tạo ra nền tảng năng suất toàn diện, đặc biệt là khi được kết hợp với các khả năng tạo văn bản thành hình ảnh nâng cao đang được triển khai.
Điều này cho thấy Microsoft đang có những bước tiến lớn trong việc phát triển AI và cải thiện trải nghiệm người dùng trên Bing.
Nguồn: https://techcrunch.com/2023/05/04/microsoft-doubles-down-on-ai-with-new-bing-features/
Microsoft đang bắt tay trong giai đoạn mở rộng tiếp theo của Bing. Và – không có gì ngạc nhiên – nó chủ yếu xoay quanh AI.
Tại một sự kiện xem trước vào tuần này ở Thành phố New York, các giám đốc điều hành của Microsoft bao gồm Yusuf Mehdi, CVP và giám đốc tiếp thị người tiêu dùng, đã cho các thành viên báo chí bao gồm cả phóng viên này xem xét một loạt các tính năng sẽ có trên Bing trong vài ngày, vài tuần tới và tháng.
Họ không phát minh lại bánh xe quá nhiều khi họ xây dựng dựa trên những gì Microsoft đã đưa vào trải nghiệm Bing trong khoảng ba tháng qua. Kể từ khi ra mắt Bing Chat, chatbot hỗ trợ AI của nó được cung cấp bởi OpenAI’s GPT-4 Và DALL-E 2 Microsoft cho biết khách truy cập Bing — đã tăng lên hơn 100 triệu người dùng hoạt động hàng ngày — đã tham gia vào hơn nửa tỷ cuộc trò chuyện và tạo ra hơn 200 triệu hình ảnh.
Sắp tới, Bing sẽ trở nên trực quan hơn nhờ có nhiều câu trả lời tập trung vào hình ảnh và đồ họa hơn trong Bing Chat. Nó cũng sẽ trở nên cá nhân hóa hơn, với các khả năng cho phép người dùng xuất lịch sử Trò chuyện trên Bing của họ và thu hút nội dung từ các plugin của bên thứ ba (sẽ nói thêm về những nội dung đó sau). Và nó sẽ bao gồm tính đa phương thức, ít nhất là theo nghĩa Bing Chat sẽ có thể trả lời các câu hỏi trong bối cảnh hình ảnh.
“Tôi nghĩ có thể an toàn khi nói rằng chúng tôi đang tiến hành chuyển đổi hoạt động tìm kiếm,” Mehdi nói trong bài nhận xét đã chuẩn bị sẵn. “Trong suy nghĩ của chúng tôi, chúng tôi nghĩ rằng hôm nay sẽ là ngày bắt đầu thế hệ tiếp theo của ‘sứ mệnh tìm kiếm’ này.”
Mở và trực quan
Kể từ hôm nay, Bing mới — phiên bản có Bing Chat — hiện không có trong danh sách chờ. Bất kỳ ai cũng có thể dùng thử bằng cách đăng nhập bằng Tài khoản Microsoft.
Ít nhiều đó là trải nghiệm đã ra mắt vài tháng trước. Nhưng như đã đề cập trước đó, Bing Chat sẽ sớm phản hồi bằng hình ảnh — ít nhất là ở những nơi có ý nghĩa. Câu trả lời cho các câu hỏi (ví dụ: “Machu picchu ở đâu?”) sẽ được kèm theo các hình ảnh có liên quan nếu có, giống như luồng tìm kiếm tiêu chuẩn của Bing nhưng được cô đọng trong một giao diện giống như thẻ.
Trong một bản demo tại sự kiện, một phát ngôn viên đã gõ câu hỏi “Cây xương rồng saguaro có mọc hoa không?” và Bing Chat đã đưa ra một phản hồi dài một đoạn cùng với hình ảnh cây xương rồng được đề cập. Đối với tôi, nó gợi lên “bảng tri thức” trong Google Tìm kiếm.
Microsoft không nói chính xác danh mục nội dung nào có thể kích hoạt hình ảnh. Nhưng nó có bộ lọc tại chỗ để ngăn hình ảnh tục tĩu xuất hiện — hoặc nó tuyên bố như vậy.
Sarah Bird, người đứng đầu bộ phận AI chịu trách nhiệm tại Microsoft, nói với tôi rằng Bing Chat được hưởng lợi từ việc lọc và kiểm duyệt đã có sẵn với tìm kiếm Bing. Ngoài điều này, Bing Chat sử dụng kết hợp các “bộ phân loại độc tính” hoặc các mô hình AI được đào tạo để phát hiện các lời nhắc có khả năng gây hại và danh sách đen để giữ cho cuộc trò chuyện tương đối trong sạch.
Điều đáng chú ý là những biện pháp đó đã không ngăn được Bing Chat đi chệch hướng khi nó lần đầu tiên được tung ra trong bản xem trước vào đầu tháng Hai. Của chúng tôi phủ sóng đã tìm thấy chatbot phun ra thông tin sai lệch về vắc-xin và viết một ý kiến đáng ghét theo quan điểm của Adolf Hitler. Các phóng viên khác đã nhận nó để đe dọa, yêu cầu nhiều danh tính và thậm chí khiến họ xấu hổ vì đã khuyên nhủ nó.
trong khác cú đánh chống lại Microsoft, công ty chỉ vài tháng trước đã sa thải nhóm đạo đức và xã hội trong tổ chức AI lớn hơn của mình. Động thái này khiến Microsoft không có đội ngũ chuyên trách để đảm bảo các nguyên tắc AI của họ gắn chặt với thiết kế sản phẩm.
Tuy nhiên, Bird khẳng định rằng tiến bộ có ý nghĩa đã được thực hiện và những loại vấn đề AI này không được giải quyết trong một sớm một chiều – mặc dù Bing Chat có thể được công khai. Cô cho biết, trong số các biện pháp khác, một nhóm gồm những người điều hành con người sẵn sàng theo dõi các hành vi lạm dụng, chẳng hạn như những người dùng cố gắng sử dụng Bing Chat để tạo email lừa đảo.
Nhưng — vì các thành viên báo chí không có cơ hội tương tác với phiên bản Bing mới nhất ngoài các bản demo được tuyển chọn — tôi không thể nói tất cả những điều đó đã tạo nên sự khác biệt ở mức độ nào. Nó chắc chắn sẽ trở nên rõ ràng khi có thêm nhiều người chạm tay vào nó.
Một khía cạnh của Bing Chat mà là cải thiện là tính minh bạch xung quanh các phản hồi của nó – các phản hồi cụ thể có tính chất dựa trên thực tế. Chẳng bao lâu nữa, khi được yêu cầu tóm tắt một tài liệu hoặc về nội dung của một tài liệu (ví dụ: “trang này nói gì về Cầu Brooklyn?”), cho dù là một bản PDF dài 20 trang hay một bài viết trên Wikipedia, Bing Chat sẽ bao gồm các trích dẫn cho biết từ đâu trong đó. văn bản mà thông tin đến từ đó. Nhấp vào chúng sẽ làm nổi bật đoạn văn tương ứng.
Năng suất nổi lên
Trong một tính năng mới khác về giao diện trực quan, Bing Chat sẽ có thể tạo biểu đồ và đồ thị khi được cung cấp đúng dấu nhắc và dữ liệu. Trước đây, hãy hỏi những câu như “Thành phố đông dân nhất ở Brazil là thành phố nào?” sẽ mang lại một danh sách kết quả cơ bản. Nhưng trong bản xem trước trong tương lai gần, Bing Chat sẽ trình bày những kết quả đó một cách trực quan và ở dạng biểu đồ do người dùng lựa chọn.
Điều này dường như đại diện cho một bước để Bing hướng tới một nền tảng năng suất toàn diện, đặc biệt khi được kết hợp với các khả năng tạo văn bản thành hình ảnh nâng cao đang được triển khai.
Trong những tuần tới, Bing Trình tạo hình ảnh — Công cụ của Microsoft có thể tạo hình ảnh từ lời nhắc văn bản, được cung cấp bởi DALL-E 2 — sẽ hiểu được nhiều ngôn ngữ hơn ngoài tiếng Anh (tổng cộng hơn 100 ngôn ngữ). Cũng giống như tiếng Anh, người dùng sẽ có thể tinh chỉnh các hình ảnh mà họ tạo ra bằng các lời nhắc tiếp theo (ví dụ: “Tạo hình ảnh chú thỏ con”, tiếp theo là “bây giờ làm cho bộ lông có màu hồng”).
Gần đây, nghệ thuật sáng tạo AI đã xuất hiện trên các tiêu đề rất nhiều – và không nhất thiết phải vì những lý do lạc quan nhất.
Nguyên đơn đã đưa một số vụ kiện chống lại OpenAI và các nhà cung cấp đối thủ của nó, cáo buộc rằng dữ liệu có bản quyền — chủ yếu là tác phẩm nghệ thuật — đã được sử dụng mà không có sự cho phép của họ để đào tạo các mô hình tổng quát như DALL-E 2. Các mô hình tổng quát “học” cách sáng tạo nghệ thuật và hơn thế nữa bằng cách “đào tạo” trên các hình ảnh và văn bản mẫu, thường được lấy bừa bãi từ trang web công cộng.
Tôi đã hỏi Bird về việc liệu Microsoft có đang tìm cách đền bù cho những người sáng tạo có tác phẩm bị cuốn vào dữ liệu đào tạo hay không, ngay cả khi quan điểm chính thức của công ty là đó là vấn đề của sử dụng hợp lý. Một số nền tảng tung ra các công cụ AI tổng quát, bao gồm Shutterstock, đã bắt đầu gây quỹ cho người sáng tạo theo những cách này. Những người khác, như sinh sảnđang tạo ra các cơ chế để cho phép các nghệ sĩ từ chối hoàn toàn việc đào tạo mô hình AI.
Bird ngụ ý rằng những vấn đề này cuối cùng sẽ phải được giải quyết — và những người sáng tạo nội dung xứng đáng nhận được một số hình thức đền bù. Nhưng cô ấy không sẵn sàng cam kết với bất cứ điều gì cụ thể trong tuần này.
tìm kiếm đa phương thức
Ở những nơi khác trên mặt trận hình ảnh, Bing Chat đang đạt được khả năng hiểu hình ảnh cũng như văn bản. Người dùng sẽ có thể tải lên hình ảnh và tìm kiếm nội dung liên quan trên web, chẳng hạn như sao chép liên kết đến hình ảnh con bạch tuộc móc và hỏi Bing Chat câu hỏi “làm cách nào để tạo ra thứ đó?” để nhận hướng dẫn từng bước.
Tính đa phương thức cũng hỗ trợ chức năng ngữ cảnh trang mới trong ứng dụng Edge dành cho thiết bị di động. Người dùng sẽ có thể đặt câu hỏi trong Bing Chat liên quan đến trang di động mà họ đang xem.
Microsoft sẽ không nói theo cách nào, nhưng có vẻ như những khả năng đa phương thức mới này bắt nguồn từ GPT-4, có thể hiểu hình ảnh ngoài văn bản. Khi OpenAI công bố GPT-4, nó không cung cấp khả năng hiểu hình ảnh của mô hình cho tất cả khách hàng — và vẫn chưa có. Tuy nhiên, tôi cá rằng Microsoft, với tư cách là nhà đầu tư lớn và cộng tác chặt chẽ với OpenAI, có một số loại quyền truy cập đặc quyền.
Tất nhiên, bất kỳ công cụ tải lên hình ảnh nào cũng có thể bị lạm dụng, đó là lý do tại sao Microsoft đang sử dụng tính năng lọc và băm tự động để chặn tải lên bất hợp pháp, theo Bird. Tuy nhiên, ban giám khảo không biết những thứ này hoạt động tốt như thế nào — chúng tôi không có cơ hội tự mình kiểm tra các hình ảnh tải lên.
Tính năng trò chuyện mới
Đa phương thức và các tính năng hình ảnh mới không phải là tất cả những gì sẽ đến với Bing Chat.
Bing Chat sẽ sớm lưu trữ lịch sử trò chuyện của người dùng, cho phép họ tiếp tục từ nơi họ đã dừng lại và quay lại các cuộc trò chuyện trước đó khi họ muốn. Đó là một trải nghiệm giống với tính năng lịch sử trò chuyện OpenAI gần đây được đưa đến ChatGPT, hiển thị danh sách các cuộc trò chuyện và phản hồi của bot đối với từng cuộc trò chuyện đó.
Các chi tiết cụ thể của tính năng lịch sử trò chuyện vẫn chưa được giải quyết, chẳng hạn như chính xác thời gian các cuộc trò chuyện sẽ được lưu trữ. Nhưng người dùng sẽ có thể xóa lịch sử của họ bất cứ lúc nào, Microsoft cho biết — địa chỉ những lời chỉ trích mà một số chính phủ Liên minh Châu Âu đã chống lại ChatGPT.
Bing Chat cũng sẽ có chức năng xuất và chia sẻ, cho phép người dùng chia sẻ các cuộc hội thoại trên mạng xã hội hoặc tài liệu Word. Dena Saunders, một GM đối tác trong nhóm trải nghiệm web của Microsoft, nói với TechCrunch rằng một hệ thống sao chép và dán mạnh mẽ hơn đang hoạt động — nhưng chưa có trong bản xem trước — cho các biểu đồ và hình ảnh được tạo thông qua Bing Chat.
Tuy nhiên, có lẽ bổ sung mang tính biến đổi nhất cho Bing Chat là các plugin. Từ các đối tác như OpenTable và Wolfram Alpha, plugin mở rộng đáng kể những gì Bing Chat có thể làm, chẳng hạn như giúp người dùng đặt trước hoặc tạo trực quan hóa và nhận câu trả lời cho các câu hỏi toán học và khoa học đầy thách thức.
Giống như lịch sử trò chuyện, chức năng plugin chưa hoạt động đang ở giai đoạn sơ bộ. Không có thị trường phần bổ trợ nào để nói đến; có thể bật hoặc tắt plugin từ giao diện web Bing Chat.
Saunders gợi ý, nhưng sẽ không xác nhận, rằng lược đồ bổ trợ Bing Chat được liên kết với — hoặc có lẽ giống với — OpenAI được giới thiệu gần đây bổ sung cho ChatGPT. Điều đó chắc chắn có ý nghĩa, với những điểm tương đồng giữa hai người.
Cạnh, làm mới
Tất nhiên, Bing Chat có sẵn thông qua Edge cũng như web. Và Edge đang có một lớp sơn mới bên cạnh Bing Chat.
Được xem trước lần đầu tiên vào tháng 2, Edge mới và cải tiến có các góc bo tròn phù hợp với triết lý thiết kế Windows 11 của Microsoft. Các yếu tố trong trình duyệt giờ đây được “đóng gói” nhiều hơn, như một phát ngôn viên của Microsoft đã nói và có những điều chỉnh tinh tế xuyên suốt, chẳng hạn như hình ảnh Tài khoản Microsoft di chuyển sang trái giữa.
Trong Compose, công cụ hỗ trợ Bing Chat của Edge có thể viết email và hơn thế nữa với lời nhắc cơ bản (ví dụ: “viết lời mời dự tiệc sinh nhật con chó của tôi”), một tùy chọn mới cho phép người dùng điều chỉnh độ dài, cụm từ và âm điệu của văn bản được tạo để gần như bất cứ thứ gì họ muốn. Nhập giọng điệu mong muốn và Bing Chat sẽ viết một tin nhắn phù hợp — Bird cho biết các bộ lọc được áp dụng để ngăn việc sử dụng các giọng điệu rõ ràng có vấn đề, chẳng hạn như “đáng ghét” hoặc “phân biệt chủng tộc”.
Tuy nhiên, hấp dẫn hơn nhiều so với Soạn thư — ít nhất là đối với tôi — là các hành động trong Edge, dịch các lời nhắc Bing Chat nhất định thành tự động hóa.
Nhập một lệnh như “mang mật khẩu của tôi từ một trình duyệt khác” trong Bing Chat trong thanh bên của Edge sẽ mở trang cài đặt dữ liệu duyệt web của Edge, trong khi lời nhắc “chơi ‘The Devil Wears Prada’” sẽ hiển thị danh sách các tùy chọn phát trực tuyến bao gồm Vudu và (có thể đoán trước được ) Cửa hàng Microsoft. Thậm chí còn có một hành động tự động tổ chức — và phối hợp màu sắc — duyệt các tab.
Các hành động đang ở giai đoạn sơ khai hiện nay. Nhưng rõ ràng Microsoft sẽ đi đâu ở đây. Người ta tưởng tượng các hành động cuối cùng sẽ mở rộng ra ngoài Edge để tiếp cận các sản phẩm khác của Microsoft, như Office 365 và có lẽ một ngày nào đó sẽ là toàn bộ máy tính để bàn Windows.
Saunders sẽ không xác nhận hay phủ nhận rằng đây là trò chơi kết thúc. “Hãy theo dõi Microsoft Build,” cô ấy nói với tôi, đề cập đến hội nghị nhà phát triển sắp tới của Microsoft. Chúng ta sẽ.