Nvidia vừa công bố trình tạo âm thanh AI mới có khả năng tạo ra những âm thanh chưa từng nghe thấy trước đây, giống như tiếng kèn kêu meo meo. Trình chỉnh sửa nhạc AI này có tên là Fugatto, có khả năng tạo ra âm nhạc, âm thanh và lời nói từ văn bản và âm thanh đầu vào mà chưa từng được đào tạo trước đó.
#Nvidia #AI #âmthanh #Fugatto #sựkiện #côngnghệ
Fugatto có khả năng tập hợp các bài hát lại với nhau dựa trên những gợi ý hoang dã, tạo ra các hiệu ứng âm thanh độc đáo dựa trên mô tả như âm thanh của một cỗ máy có tri giác khổng lồ đang thức dậy. Điều đặc biệt hơn, Fugatto còn có thể biến đổi giọng nói của ai đó, thay đổi giọng điệu của họ hoặc thậm chí tách giọng hát trong bài hát, thêm nhạc cụ và thay đổi giai điệu.
#Fugatto #sángtạo #âmnhạc #côngnghệmới #đổiđạnggiọngnói
Để xây dựng Fugatto, nhà nghiên cứu phải tập hợp hàng triệu mẫu âm thanh. Nvidia cho biết họ đã mở rộng đáng kể phạm vi nhiệm vụ mà mô hình có thể thực hiện, đồng thời đạt được hiệu suất chính xác hơn và kích hoạt các nhiệm vụ mới mà không cần thêm dữ liệu. Hiện chưa rõ liệu công cụ này sẽ được phổ biến rộng rãi hay không.
#sángtạo #côngnghệcao #Nvidia #sựkiệnhômqua
Nguồn: https://www.theverge.com/2024/11/25/24305584/nvidia-fugatto-ai-audio-generator-music
Nvidia cho biết trình chỉnh sửa nhạc AI mới của họ có thể tạo ra “những âm thanh chưa từng nghe thấy trước đây” – giống như tiếng kèn kêu meo meo. Công cụ có tên Fugattocó khả năng tạo ra âm nhạc, âm thanh và lời nói bằng cách sử dụng văn bản và âm thanh đầu vào mà nó chưa từng được đào tạo.
Như thể hiện trong này video được nhúng bên dướiđiều này cho phép Fugatto tập hợp các bài hát lại với nhau dựa trên những gợi ý hoang dã, chẳng hạn như “Tạo tiếng saxophone hú, sủa rồi đến nhạc điện tử với tiếng chó sủa”.
Một số ví dụ khác được công ty chia sẻ bao gồm khả năng tạo ra các hiệu ứng âm thanh độc đáo dựa trên mô tả, chẳng hạn như “Các xung âm trầm sâu, ầm ầm kết hợp với các tiếng kêu kỹ thuật số cao, ngắt quãng, giống như âm thanh của một cỗ máy có tri giác khổng lồ đang thức dậy”.
Nó thậm chí có thể biến đổi âm thanh giọng nói của ai đó, thay đổi giọng nói của họ hoặc tạo cho họ một giọng điệu khác, như giận dữ hoặc bình tĩnh. Cũng có nhiều cách để chỉnh sửa âm nhạc, vì Fugatto có thể tách giọng hát trong bài hát, thêm nhạc cụ và thậm chí thay đổi giai điệu bằng cách đổi đàn piano cho ca sĩ opera.
MỘT giấy phát hành với thông báo hiển thị danh sách dài tất cả các tập dữ liệu mà Nvidia cho biết Fugatto đã được đào tạo, một trong số đó bao gồm thư viện hiệu ứng âm thanh từ BBC.
Để xây dựng Fugatto, Nvidia cho biết các nhà nghiên cứu phải tập hợp một tập dữ liệu với hàng triệu mẫu âm thanh. Sau đó, họ tạo ra các hướng dẫn “mở rộng đáng kể phạm vi nhiệm vụ mà mô hình có thể thực hiện, đồng thời đạt được hiệu suất chính xác hơn và kích hoạt các nhiệm vụ mới mà không yêu cầu thêm dữ liệu”. Nvidia không cho biết khi nào – hoặc nếu – công cụ này sẽ được phổ biến rộng rãi.