Google chinh phục I/O với trí tuệ nhân tạo: Cùng đối mặt thử thách nâng cao quy định!

#SựKiệnNgàyHômNay #TuầnVềAI

Trong thế giới công nghiệp trí tuệ nhân tạo, quy định ngày càng tăng cao, và Google đang nỗ lực hết mình tại I/O để bắt kịp. Các công cụ mới của Google để tạo mã, tạo nhạc và tóm tắt nội dung sẽ tiết kiệm lao động hợp pháp và giúp cạnh tranh với các đối thủ. Tuy nhiên, các công nghệ AI vẫn còn tồn tại những hạn chế và thiếu sót. Ví dụ, PaLM 2 của Google trả lời các câu hỏi theo cách độc hại và thiên vị.

Trong lịch sử và thậm chí cả ngày nay, trí nhớ kém là một trở ngại đối với sự phát triển của AI tạo văn bản. Anthropic đã mở rộng cửa sổ ngữ cảnh của mô hình AI tạo văn bản hàng đầu của họ và đã trình bày chi tiết về “AI theo hiến pháp”. Allen Institute for Artificial Intelligence (AI2) đang tập trung vào Mô hình ngôn ngữ mở, với mục tiêu giúp cộng đồng nghiên cứu sử dụng và cải thiện từng thành phần. EU cũng đưa ra các quy tắc cho các công nghệ AI sáng tạo và các nhà cung cấp mô hình nền tảng phải áp dụng các biện pháp an toàn và giảm thiểu rủi ro.

Google cũng đang thử nghiệm một dịch vụ dịch thuật mới mạnh mẽ, và OpenAI đang phát triển công cụ để tự động xác định phần nào của các mô hình AI chịu trách nhiệm cho hành vi nào của chúng. IBM cũng mới ra mắt các dịch vụ AI mới.

Dù chúng ta vẫn còn đối mặt với nhiều thách thức và khó khăn, tuần này cho thấy rằng các công nghệ AI đang ngày càng được phát triển và cải thiện.

Nguồn: https://techcrunch.com/2023/05/13/the-week-in-ai-google-goes-all-out-at-i-o-as-regulations-creep-up/

Theo kịp một ngành công nghiệp chuyển động nhanh như trí tuệ nhân tạo là một thứ tự cao. Vì vậy, cho đến khi AI có thể làm điều đó cho bạn, đây là tổng hợp hữu ích các câu chuyện của tuần trước trong thế giới máy học, cùng với các nghiên cứu và thử nghiệm đáng chú ý mà chúng tôi không đề cập riêng.

Tuần này, Google đã thống trị chu kỳ tin tức AI với một loạt sản phẩm mới được ra mắt tại hội nghị nhà phát triển I/O hàng năm. Họ chạy giao diện từ một AI tạo mã nhằm cạnh tranh với Copilot của GitHub đến một Trình tạo nhạc AI biến lời nhắc văn bản thành các bài hát ngắn.

Có thể nói, một số lượng lớn các công cụ này có vẻ là những công cụ tiết kiệm lao động hợp pháp — hơn cả những thứ tiếp thị vớ vẩn. tôi đặc biệt quan tâm đến Dự án Tailwind, một ứng dụng ghi chú tận dụng AI để sắp xếp, tóm tắt và phân tích các tệp từ thư mục Google Tài liệu cá nhân. Nhưng chúng cũng phơi bày những hạn chế và thiếu sót của ngay cả những công nghệ AI tốt nhất hiện nay.

Lấy PaLM 2, ví dụ: mô hình ngôn ngữ lớn (LLM) mới nhất của Google. PaLM 2 sẽ cung cấp năng lượng cho công cụ trò chuyện Bard được cập nhật của Google, đối thủ cạnh tranh của công ty với ChatGPT của OpenAI và hoạt động như mô hình nền tảng cho hầu hết các tính năng AI mới của Google. Nhưng trong khi PaLM 2 có thể viết mã, email, v.v., giống như các LLM có thể so sánh được, thì nó cũng trả lời các câu hỏi theo những cách độc hại và thiên vị.

Trình tạo nhạc của Google cũng khá hạn chế về những gì nó có thể thực hiện. Như tôi đã viết trong bắt tay vàohầu hết các bài hát tôi đã tạo bằng MusicLM đều có âm thanh tốt nhất — và tệ nhất là giống như một đứa trẻ bốn tuổi thả rông trên DAW.

Đã có nhiều bài viết về cách AI sẽ thay thế công việc – có khả năng tương đương với 300 triệu công việc toàn thời gian, theo một báo cáo. báo cáo của Goldman Sachs. trong một sự khảo sát bởi Harris, 40% nhân viên quen thuộc với công cụ chatbot hỗ trợ AI của OpenAI, ChatGPT, lo ngại rằng nó sẽ thay thế hoàn toàn công việc của họ.

Trí tuệ nhân tạo của Google không phải là tất cả. Thật vậy, của công ty được cho là phía sau trong cuộc đua AI. Nhưng có một thực tế không thể phủ nhận là Google sử dụng một số nhà nghiên cứu AI hàng đầu trên thế giới. Và nếu đây là điều tốt nhất họ có thể quản lý, thì đó là bằng chứng cho thấy AI còn lâu mới là một vấn đề được giải quyết.

Dưới đây là các tiêu đề đáng chú ý khác về AI trong vài ngày qua:

  • Meta mang AI sáng tạo vào quảng cáo: Meta tuần này đã công bố một loại hộp cát AI dành cho các nhà quảng cáo để giúp họ tạo các bản sao thay thế, tạo nền thông qua lời nhắc văn bản và cắt xén hình ảnh cho quảng cáo trên Facebook hoặc Instagram. Công ty cho biết các tính năng này hiện có sẵn cho các nhà quảng cáo chọn lọc và sẽ mở rộng quyền truy cập cho nhiều nhà quảng cáo hơn vào tháng Bảy.
  • Đã thêm ngữ cảnh: Anthropic đã mở rộng cửa sổ ngữ cảnh cho Claude — mô hình AI tạo văn bản hàng đầu của nó, vẫn đang trong bản xem trước — từ 9.000 mã thông báo lên 100.000 mã thông báo. Cửa sổ ngữ cảnh đề cập đến văn bản mà mô hình xem xét trước khi tạo văn bản bổ sung, trong khi mã thông báo đại diện cho văn bản thô (ví dụ: từ “fantastic” sẽ được chia thành các mã thông báo “fan”, “tas” và “tic”). Trong lịch sử và thậm chí cả ngày nay, trí nhớ kém là một trở ngại đối với tính hữu ích của AI tạo văn bản. Nhưng các cửa sổ ngữ cảnh lớn hơn có thể thay đổi điều đó.
  • Anthropic chào hàng ‘AI hiến pháp’: Các cửa sổ ngữ cảnh lớn hơn không phải là điểm khác biệt duy nhất của các mô hình Anthropic. Tuần này, công ty đã trình bày chi tiết về “AI theo hiến pháp”, kỹ thuật đào tạo AI nội bộ của họ nhằm mục đích thấm nhuần các hệ thống AI với “các giá trị” được xác định bởi “hiến pháp”. Trái ngược với các cách tiếp cận khác, Anthropic lập luận rằng AI hợp hiến làm cho hành vi của các hệ thống trở nên dễ hiểu hơn và dễ điều chỉnh hơn khi cần.
  • Một LLM được xây dựng để nghiên cứu: Viện nghiên cứu AI phi lợi nhuận Allen (AI2) đã thông báo rằng họ có kế hoạch đào tạo một LLM tập trung vào nghiên cứu có tên là Mô hình ngôn ngữ mở, bổ sung vào thư viện nguồn mở lớn và đang phát triển. AI2 coi Mô hình ngôn ngữ mở, hay viết tắt là OLMo, là một nền tảng chứ không chỉ là một mô hình — một mô hình sẽ cho phép cộng đồng nghiên cứu sử dụng từng thành phần mà AI2 tạo ra và tự sử dụng hoặc tìm cách cải thiện nó.
  • Quỹ mới cho AI: Trong một tin tức khác về AI2, Vườn ươm AI2, quỹ khởi nghiệp AI của tổ chức phi lợi nhuận, đang tăng trở lại với quy mô gấp ba lần trước đó — 30 triệu USD so với 10 triệu USD. 21 công ty đã vượt qua vườn ươm kể từ năm 2017, thu hút khoảng 160 triệu USD đầu tư thêm và ít nhất một thương vụ mua lại lớn: XNOR, một trang phục hiệu quả và tăng tốc AI sau đó đã được Apple mua lại với giá khoảng 200 triệu USD.
  • EU giới thiệu các quy tắc cho AI tổng quát: Trong một loạt các cuộc bỏ phiếu tại Nghị viện Châu Âu, MEP tuần này đã ủng hộ một loạt sửa đổi đối với dự thảo luật AI của khối – bao gồm giải quyết các yêu cầu đối với cái gọi là mô hình nền tảng làm nền tảng cho các công nghệ AI sáng tạo như ChatGPT của OpenAI. Các sửa đổi đặt trách nhiệm cho các nhà cung cấp mô hình nền tảng để áp dụng kiểm tra an toàn, các biện pháp quản trị dữ liệu và giảm thiểu rủi ro trước khi đưa mô hình của họ ra thị trường
  • Một dịch giả phổ quát: Google đang thử nghiệm một dịch vụ dịch thuật mới mạnh mẽ giúp đăng lại video bằng một ngôn ngữ mới đồng thời đồng bộ hóa môi của người nói với những từ họ chưa từng nói. Nó có thể rất hữu ích vì nhiều lý do, nhưng công ty đã nói trước về khả năng lạm dụng và các bước được thực hiện để ngăn chặn điều đó.
  • Giải thích tự động: Người ta thường nói rằng các LLM dọc theo dòng ChatGPT của OpenAI là một hộp đen, và chắc chắn, có một số sự thật về điều đó. Trong nỗ lực bóc tách các lớp của chúng, OpenAI là đang phát triển một công cụ để tự động xác định phần nào của LLM chịu trách nhiệm cho hành vi nào của nó. Các kỹ sư đằng sau nó nhấn mạnh rằng nó đang ở giai đoạn đầu, nhưng mã để chạy nó có sẵn trong mã nguồn mở trên GitHub kể từ tuần này.
  • IBM ra mắt các dịch vụ AI mới: Tại hội nghị Think hàng năm, IBM đã công bố IBM Watsonx, một nền tảng mới cung cấp các công cụ để xây dựng các mô hình AI và cung cấp quyền truy cập vào các mô hình được đào tạo trước để tạo mã máy tính, văn bản, v.v. Công ty cho biết việc ra mắt được thúc đẩy bởi những thách thức mà nhiều doanh nghiệp vẫn gặp phải khi triển khai AI tại nơi làm việc.

Học máy khác

Tín dụng hình ảnh: hạ cánh AI

Công ty mới của Andrew Ng hạ cánh AI đang thực hiện một cách tiếp cận trực quan hơn để tạo ra đào tạo thị giác máy tính. Làm cho một mô hình hiểu những gì bạn muốn xác định trong hình ảnh là khá khó khăn, nhưng kỹ thuật “nhắc nhở trực quan” của họ cho phép bạn chỉ cần thực hiện một vài nét cọ và nó sẽ tìm ra ý định của bạn từ đó. Bất cứ ai phải xây dựng các mô hình phân khúc đều nói rằng “Chúa ơi, cuối cùng thì!” Có lẽ rất nhiều sinh viên tốt nghiệp hiện đang dành hàng giờ để che đậy các bào quan và đồ vật trong nhà.

Microsoft đã áp dụng mô hình khuếch tán một cách độc đáo và thú vị, về cơ bản là sử dụng chúng để tạo vectơ hành động thay vì hình ảnh, đã huấn luyện nó trên rất nhiều hành động được quan sát của con người. Vẫn còn rất sớm và khuếch tán không phải là giải pháp rõ ràng cho vấn đề này, nhưng vì chúng ổn định và linh hoạt, thật thú vị khi xem cách chúng có thể được áp dụng ngoài các tác vụ trực quan đơn thuần. Bài báo của họ sẽ được trình bày tại ICLR vào cuối năm nay.

Tín dụng hình ảnh: meta

Meta cũng đang thúc đẩy các cạnh của AI với ImageBind, mà nó tuyên bố là mô hình đầu tiên có thể xử lý và tích hợp dữ liệu từ sáu phương thức khác nhau: hình ảnh và video, âm thanh, dữ liệu độ sâu 3D, thông tin nhiệt và dữ liệu chuyển động hoặc vị trí. Điều này có nghĩa là trong không gian nhúng học máy nhỏ bé của nó, một hình ảnh có thể được liên kết với âm thanh, hình dạng 3D và các mô tả văn bản khác nhau, bất kỳ mô tả nào trong số đó đều có thể được hỏi hoặc sử dụng để đưa ra quyết định. Đó là một bước tiến tới AI “chung” ở chỗ nó hấp thụ và liên kết dữ liệu giống như bộ não hơn — nhưng nó vẫn ở mức cơ bản và thử nghiệm, vì vậy đừng quá phấn khích.

Nếu những protein này chạm vào… chuyện gì sẽ xảy ra?

Mọi người đều hào hứng với AlphaFold và vì lý do chính đáng, nhưng cấu trúc thực sự chỉ là một phần nhỏ của khoa học rất phức tạp về proteomics. Đó là cách những protein đó tương tác vừa quan trọng vừa khó dự đoán — nhưng điều này mới Mô hình PeSTo từ EPFL cố gắng để làm điều đó. “Nó tập trung vào các nguyên tử và tương tác quan trọng trong cấu trúc protein,” trưởng nhóm phát triển Lucien Krapp cho biết. “Điều đó có nghĩa là phương pháp này nắm bắt hiệu quả các tương tác phức tạp trong cấu trúc protein để cho phép dự đoán chính xác các giao diện liên kết protein.” Ngay cả khi nó không chính xác hoặc đáng tin cậy 100%, thì việc không phải bắt đầu lại từ đầu vẫn cực kỳ hữu ích cho các nhà nghiên cứu.

Các liên bang đang phát triển mạnh trên AI. Tổng thống thậm chí đã ghé vào một gặp gỡ với một loạt các CEO AI hàng đầu để nói rằng việc có được quyền này quan trọng như thế nào. Có thể một loạt các tập đoàn không nhất thiết phải là những người phù hợp để hỏi, nhưng ít nhất họ sẽ có một số ý tưởng đáng để xem xét. Nhưng họ đã có những người vận động hành lang, phải không?

Tôi hào hứng hơn về các trung tâm nghiên cứu AI mới xuất hiện với sự tài trợ của liên bang. Nghiên cứu cơ bản là cực kỳ cần thiết để đối trọng với công việc tập trung vào sản phẩm đang được thực hiện bởi OpenAI và Google — vì vậy khi bạn có các trung tâm AI với nhiệm vụ điều tra những thứ như khoa học xã hội (tại CMU)hoặc biến đổi khí hậu và nông nghiệp (tại U của Minnesota), có cảm giác như những cánh đồng xanh mướt (cả nghĩa bóng lẫn nghĩa đen). Mặc dù tôi cũng muốn hét lên một chút về điều này Nghiên cứu tổng hợp về đo lường lâm nghiệp.

Cùng nhau làm AI trên màn hình lớn — đó là khoa học!

Có rất nhiều cuộc trò chuyện thú vị về AI. tôi đã nghĩ cuộc phỏng vấn này với các học giả UCLA (trường cũ của tôi, go Bruins) Jacob Foster và Danny Snelson là một điều thú vị. Đây là một suy nghĩ tuyệt vời về LLM để giả vờ rằng bạn đã nghĩ ra vào cuối tuần này khi mọi người đang nói về AI:

Các hệ thống này tiết lộ hầu hết các bài viết nhất quán về mặt hình thức như thế nào. Các định dạng mà các mô hình dự đoán này mô phỏng càng chung chung thì chúng càng thành công. Những phát triển này thúc đẩy chúng tôi nhận ra các chức năng quy chuẩn của các hình thức của chúng tôi và có khả năng biến đổi chúng. Sau khi giới thiệu nhiếp ảnh, vốn rất giỏi trong việc nắm bắt không gian tượng trưng, ​​môi trường hội họa đã phát triển trường phái Ấn tượng, một phong cách từ chối hoàn toàn sự thể hiện chính xác để lưu lại với tính vật chất của chính bức vẽ.

Chắc chắn sử dụng đó!


Leave a Reply

Your email address will not be published. Required fields are marked *