Quên Sora đi: Veo là công cụ tạo video từ văn bản tiên tiến nhất của Google! Trong năm 2023, các công cụ tạo hình ảnh AI đã trở nên phổ biến, nhưng bây giờ các công ty đang chuyển sự chú ý đến một bước tiến mới — tạo video bằng AI. Với việc OpenAI giới thiệu hệ thống tạo video từ văn bản AI của mình, Sora, vào tháng 2 năm 2024, chỉ là vấn đề thời gian trước khi Google làm điều tương tự.
Vào ngày Thứ Ba, tại hội nghị phát triển Google I/O hàng năm của mình, Google đã giới thiệu Veo, công cụ tạo video từ văn bản tiên tiến nhất của họ, có khả năng tạo ra video với độ phân giải 1080p và có thể dài hơn một phút.
Ngoài chất lượng đầu ra cao, Google cho biết Veo mang lại cho người dùng một “mức độ kiểm soát sáng tạo chưa từng có”. Công cụ tạo video AI này hiểu sâu về ngôn ngữ tự nhiên, cho phép Veo cung cấp thêm chi tiết từ các đoạn văn ngắn và hiểu rõ các thuật ngữ điện ảnh như “timelapse” hoặc “góc quay từ trên cao”.
Ngoài ra, công cụ tạo video này có thể giải quyết một vấn đề phổ biến khi tạo video — sự linh hoạt của các cảnh quay. Theo Google, Veo có thể tạo ra cảnh quay liền mạch, với các chủ thể khác nhau như con người, động vật và đồ vật di chuyển một cách thực tế trong các cảnh quay.
Google không phải là cái tên mới trong lĩnh vực tạo video. Công ty nhớ rằng mô hình này dựa trên tất cả các dự án tạo video trước đó của mình, bao gồm Imagen-Video, VideoPoet và Lumiere.
Giống như Sora của OpenAI, Veo của Google vẫn chưa được công bố công khai. Thay vào đó, Google đang chia sẻ Veo trước tiên với các nhà sáng tạo đã chọn trong một bản xem trước riêng tư trong VideoFX. Tuy nhiên, Google mời bạn tham gia một danh sách chờ để cuối cùng thử nghiệm mô hình này.
Ngoài ra, Google cũng giới thiệu Imagen 3, mô hình tạo hình ảnh từ văn bản chất lượng cao nhất của họ đến nay. Imagen 3, với chất lượng hình ảnh cải thiện và ít lỗi nghệ thuật hơn, cũng được giới hạn trong một bản xem trước riêng tư trong ImageFX cho các nhà sáng tạo đã chọn và có danh sách chờ riêng.
#GoogleI/O2024 #Veo #TạoVideoAI #ChấtLượngCao
AI image generators were all the rage in 2023, but now companies are shifting focus to the next frontier — AI video generation. With OpenAI unveiling its AI text-to-video generator, Sora, in February 2024, it was only a matter of time before Google did the same.
On Tuesday, at its annual Google I/O developer conference, Google unveiled Veo, its most advanced text-to-video generator, capable of generating videos with 1080p resolution that are over one minute long.
In addition to the high-quality output, Google says that Veo provides users with an “unprecedented level of creative control.” The AI generator’s deeper understanding of natural language enables Veo to deliver more details from longer prompts and to understand cinematic terms like “timelapse” or “aerial shots.”
Also: Everything announced during Google I/O 2024: Gemini, Search, Android 15, and more
Additionally, the video generator can tackle a common problem with video generation — the fluidity of shots. According to Google, Veo can create consistent footage, with different subjects such as people, animals, and objects moving realistically in the shots.
Google isn’t new to video generation. The company noted that this model builds on all its prior video-generating projects, including Imagen-Video, VideoPoet, and Lumiere.
Like OpenAI’s Sora, Google’s Veo is not available to the public yet. Rather, Google is sharing Veo first with select creators in a private preview inside VideoFX. Google does, however, invite that you join a waitlist to eventually try the model.
Additionally, Google unveiled Imagen 3, its highest-quality text-to-image model to date. Imagen 3, which boasts improved image quality and fewer visual artifacts, is also limited to a private preview inside ImageFX for select creators and has its own waitlist.