#SựKiệnNgàyHômNay #AI #ĐọcSuyNghĩ #GiảiMãNgônNgữ
Ngày hôm nay, các nhà khoa học tại Đại học Texas, Austin đã tiến thêm một bước đột phá trong việc phát triển AI có khả năng đọc suy nghĩ riêng tư của con người. Sử dụng phương pháp phân tích quét fMRI, các chuyên gia đã phát triển bộ giải mã ngôn ngữ mới, cho phép dịch các cụm từ và ý nghĩa của suy nghĩ riêng tư của các đối tượng.
Sự nghiệp nghiên cứu này đã tập trung vào việc sử dụng mô hình ngôn ngữ để giải mã các hoạt động não bộ của các đối tượng trong phòng thí nghiệm. Điều này đã cho phép một AI đọc và diễn giải các suy nghĩ của con người tại các thời điểm khác nhau.
Tuy nhiên, phương pháp này vẫn còn một số hạn chế. Việc sử dụng quét fMRI là cồng kềnh và đắt tiền, trong khi đào tạo mô hình để giải mã được diễn ra một cách chậm và tốn kém. Ngoài ra, mỗi bộ não đều có những cách duy nhất để biểu thị ý nghĩa, do đó bộ giải mã chỉ có thể áp dụng cho từng cá nhân.
Dù vậy, đây là một bước đột phá mang tính cách mạng trong lĩnh vực AI và có thể mở ra những tiềm năng khả năng mới trong việc đọc suy nghĩ của con người.
Nguồn: https://www.nytimes.com/2023/05/01/science/ai-speech-language.html
Hãy nghĩ về những từ quay cuồng trong đầu bạn: trò đùa vô vị mà bạn đã khôn ngoan giữ cho riêng mình trong bữa tối; ấn tượng thầm lặng của bạn về đối tác mới của người bạn thân nhất của bạn. Bây giờ hãy tưởng tượng rằng ai đó có thể lắng nghe.
Vào thứ Hai, các nhà khoa học từ Đại học Texas, Austin, đã thực hiện một bước nữa theo hướng đó. Trong một nghiên cứu được công bố trên tạp chí Khoa học thần kinh tự nhiêncác nhà nghiên cứu đã mô tả một AI có thể dịch những suy nghĩ riêng tư của các đối tượng con người bằng cách phân tích các lần quét fMRI, đo lưu lượng máu đến các vùng khác nhau trong não.
Các nhà nghiên cứu đã phát triển các phương pháp giải mã ngôn ngữ để chọn bài phát biểu đã cố gắng của những người đã mất khả năng nói, và cho phép người bị liệt để viết trong khi chỉ nghĩ đến việc viết. Nhưng bộ giải mã ngôn ngữ mới là một trong những thiết bị đầu tiên không dựa vào cấy ghép. Trong nghiên cứu, nó có thể biến lời nói tưởng tượng của một người thành lời nói thực tế và khi các đối tượng được chiếu phim câm, nó có thể tạo ra những mô tả tương đối chính xác về những gì đang diễn ra trên màn hình.
Alexander Huth, một nhà thần kinh học tại trường đại học, người đã giúp dẫn đầu cuộc nghiên cứu, cho biết: “Đây không chỉ là một kích thích ngôn ngữ. “Chúng ta đang hiểu ý nghĩa, điều gì đó về ý tưởng về những gì đang xảy ra. Và thực tế là điều đó có thể xảy ra là rất thú vị.”
Nghiên cứu tập trung vào ba người tham gia, họ đã đến phòng thí nghiệm của Tiến sĩ Huth trong 16 giờ trong nhiều ngày để nghe “The Moth” và các podcast tường thuật khác. Khi họ lắng nghe, một máy quét fMRI đã ghi lại mức độ oxy hóa trong máu ở các bộ phận trong não của họ. Sau đó, các nhà nghiên cứu đã sử dụng một mô hình ngôn ngữ lớn để khớp các mẫu hoạt động của não với các từ và cụm từ mà những người tham gia đã nghe.
Các mô hình ngôn ngữ lớn như GPT-4 của OpenAI và Bard của Google được đào tạo trên một lượng lớn văn bản để dự đoán từ tiếp theo trong một câu hoặc cụm từ. Trong quá trình này, các mô hình tạo ra các bản đồ cho biết các từ liên quan với nhau như thế nào. Vài năm trước, Tiến sĩ Huth nhận thấy rằng các phần cụ thể của những bản đồ này – cái gọi là nhúng ngữ cảnh, nắm bắt các đặc điểm ngữ nghĩa hoặc ý nghĩa của cụm từ – có thể được sử dụng để dự đoán cách não hoạt động khi phản ứng với ngôn ngữ.
Shinji Nishimoto, một nhà thần kinh học tại Đại học Osaka, người không tham gia vào nghiên cứu, cho biết về cơ bản, “hoạt động của não là một loại tín hiệu được mã hóa và các mô hình ngôn ngữ cung cấp các cách để giải mã nó.”
Trong nghiên cứu của họ, Tiến sĩ Huth và các đồng nghiệp của ông đã đảo ngược quá trình một cách hiệu quả, sử dụng một AI khác để dịch các hình ảnh fMRI của người tham gia thành các từ và cụm từ. Các nhà nghiên cứu đã kiểm tra bộ giải mã bằng cách cho những người tham gia nghe các bản ghi âm mới, sau đó xem bản dịch khớp với bản ghi thực tế đến mức nào.
Hầu như mọi từ đều không đúng chỗ trong chữ viết được giải mã, nhưng ý nghĩa của đoạn văn vẫn được giữ nguyên. Về cơ bản, bộ giải mã đã diễn giải.
Bảng điểm gốc: “Tôi đứng dậy khỏi nệm hơi và áp mặt vào cửa kính của cửa sổ phòng ngủ, hy vọng sẽ thấy những đôi mắt đang nhìn chằm chằm vào mình nhưng thay vào đó chỉ thấy bóng tối.”
Giải mã từ hoạt động não bộ: “Tôi cứ tiếp tục đi đến cửa sổ và mở kính ra. Tôi kiễng chân nhìn ra ngoài thì không thấy gì và nhìn lên lần nữa thì không thấy gì.”
Trong khi quét fMRI, những người tham gia cũng được yêu cầu tưởng tượng thầm đang kể một câu chuyện; sau đó, họ kể lại to câu chuyện để tham khảo. Ở đây, mô hình giải mã cũng nắm bắt được ý chính của phiên bản không được nói ra.
phiên bản của người tham gia: “Hãy tìm một tin nhắn từ vợ tôi nói rằng cô ấy đã đổi ý và sẽ quay lại.”
phiên bản giải mã: “Để gặp cô ấy vì lý do nào đó, tôi nghĩ cô ấy sẽ đến gặp tôi và nói rằng cô ấy nhớ tôi.”
Cuối cùng, các đối tượng xem lại một bộ phim hoạt hình ngắn, không có tiếng trong khi trải qua quá trình quét fMRI. Bằng cách phân tích hoạt động não bộ của họ, mô hình ngôn ngữ có thể giải mã một bản tóm tắt sơ bộ về những gì họ đang xem — có thể là mô tả bên trong của họ về những gì họ đang xem.
Kết quả cho thấy bộ giải mã AI không chỉ ghi lại các từ mà còn cả ý nghĩa. Tiến sĩ Nishimoto cho biết: “Nhận thức ngôn ngữ là một quá trình do bên ngoài thúc đẩy, trong khi trí tưởng tượng là một quá trình tích cực bên trong. “Và các tác giả đã chỉ ra rằng bộ não sử dụng các biểu diễn chung trong các quá trình này.”
Greta Tuckute, một nhà thần kinh học tại Viện Công nghệ Massachusetts, người không tham gia vào nghiên cứu, cho biết đó là “câu hỏi cấp cao”.
“Chúng ta có thể giải mã ý nghĩa từ bộ não không?” cô ấy tiếp tục. “Theo một số cách, họ cho thấy điều đó, vâng, chúng tôi có thể.”
Tiến sĩ Huth và các đồng nghiệp của ông lưu ý rằng phương pháp giải mã ngôn ngữ này có những hạn chế. Thứ nhất, máy quét fMRI cồng kềnh và đắt tiền. Hơn nữa, đào tạo mô hình là một quá trình lâu dài, tẻ nhạt và để có hiệu quả, nó phải được thực hiện trên từng cá nhân. Khi các nhà nghiên cứu cố gắng sử dụng một bộ giải mã được đào tạo trên một người để đọc hoạt động não bộ của người khác, nó đã thất bại, điều này cho thấy rằng mỗi bộ não đều có những cách duy nhất để biểu thị ý nghĩa.
Những người tham gia cũng có thể che chắn những đoạn độc thoại nội tâm của họ, loại bỏ bộ giải mã bằng cách nghĩ về những thứ khác. AI có thể đọc được suy nghĩ của chúng ta, nhưng hiện tại nó sẽ phải đọc từng cái một và với sự cho phép của chúng ta.