Đại chính đánh bại YouTube Shorts với video AI sáng tạo đầy ấn tượng

Một cơn bão video AI sẽ đổ bộ lên YouTube Shorts

Eli Collins, một phó chủ tịch quản lý sản phẩm tại Google DeepMind, đã trình diễn các công cụ video AI tạo ra ngẫu nhiên cho ban giám đốc công ty lần đầu vào năm 2022. Mặc dù mô hình chậm, tốn kém và đôi khi tạo ra sản phẩm không đồng đều, ông nói rằng đó là một thời khắc mở mang tầm nhìn khi họ thấy video clips mới được tạo ra từ một lời nhắc ngẫu nhiên.

Hiện, chỉ vài năm sau đó, Google đã công bố kế hoạch cho một công cụ trong ứng dụng YouTube sẽ cho phép bất kỳ ai tạo ra video AI clip, sử dụng mô hình Veo của công ty, và đăng trực tiếp chúng như một phần của YouTube Shorts. “Nhìn vào tương lai năm 2025, chúng tôi sẽ cho người dùng tạo ra các video clip và shorts đứng riêng lẻ”, Sarah Ali, một giám đốc cấp cao của quản lý sản phẩm tại YouTube nói. “Họ sẽ có thể tạo ra video 6 giây từ một lời nhắc văn bản mở”. Ali cho biết cập nhật này có thể giúp các nhà sáng tạo tìm kiếm hình ảnh để điền vào một video hoặc cố gắng hình dung ra một cái gì đó huyền bí. Cô khẳng định rằng công cụ AI Veo không được thiết kế để thay thế sự sáng tạo, mà là để bổ sung nó.

Đây không phải lần đầu tiên Google giới thiệu các công cụ tạo ra ngẫu nhiên cho YouTube, mặc dù thông báo này sẽ là sự tích hợp video AI rộng lớn nhất của công ty đến nay. Trong mùa hè, Google đã phát hành một công cụ thử nghiệm, gọi là Dream Screen, để tạo ra các phông nền AI cho video. Trước việc triển khai đầy đủ của các video được tạo ra, Google sẽ cập nhật công cụ xanh lá cây AI với mô hình Veo trong vài tháng tới.

Công ty công nghệ rộng lớn đã trình diễn nhiều mô hình video AI trong những năm gần đây, như Imagen và Lumiere, nhưng đang cố gắng tập trung vào một tầm nhìn thống nhất hơn với mô hình Veo. “Veo sẽ là mô hình của chúng tôi, trước mắt”, Collins nói. “Bạn không nên mong đợi có thêm năm mô hình khác từ chúng tôi.” Có thể Google sẽ phát hành một mô hình video khác sau này, nhưng ông kỳ vọng tập trung vào Veo trong tương lai gần.

Google đối mặt với cạnh tranh từ nhiều các công ty khởi nghiệp đang phát triển các công cụ văn bản-to-video tạo ra ngẫu nhiên của riêng họ. Sora của OpenAI là đối thủ nổi tiếng nhất, nhưng mô hình video AI, được công bố vào đầu năm 2024, vẫn chưa công bố công khai và chỉ dành cho một số người thử nghiệm. Đối với các công cụ có sẵn rộng rãi, startup AI Runway đã phát hành nhiều phiên bản của phần mềm video của mình, bao gồm một công cụ mới đây để chuyển đổi video gốc thành các phiên bản thực tại thay thế của clip.

Thông báo của YouTube đến khi các công cụ AI tạo ra ngẫu nhiên đã trở nên đáng kể cho các nhà sáng tạo, ai đôi khi xem xét làn sóng hiện tại của AI như đang đánh cắp từ công việc của họ và cố gắng phá hoại quá trình sáng tạo. Ali không thấy các công cụ tạo ra ngẫu nhiên AI làm cản trở giữa người tạo ra và tính chân thực của mối quan hệ với khán giả. “Điều này thực sự liên quan đến khán giả và những gì họ quan tâm – không nhất thiết về các công cụ”, cô nói. “Nhưng nếu khán giả của bạn quan tâm đến cách bạn tạo ra nó, điều đó sẽ được mở thông qua phần mô tả”. Google kế hoạch gắn dấu nước trên mỗi video AI được tạo ra cho YouTube Shorts bằng SynthID, hệ thống ẩn của tag để giúp nhìn biết video như là nhân tạo, cũng như bao gồm một thông báo “được tạo ra với AI” trong mô tả.

Những influencers văn hoá làm việc găm giữa cố gắng hack cái thuật toán bằng cách sử dụng nhiều công cụ bên thứ ba để tự động hóa quá trình sáng tạo và kiếm tiền với cố gắng tối thiểu. Việc tích hợp Veo trong năm sau có thể dẫn đến một cơn áp thấp mới của những video spam chất lượng thấp chiếm lĩnh feed người dùng không? “Tôi nghĩ rằng kinh nghiệm của chúng tôi với việc đề xuất nội dung phù hợp cho người xem thích hợp hoạt động trong thế giới AI này, vì chúng tôi đã thực hiện nó ở quy mô lớn như vậy,” Ali nói. Cô cũng nhấn mạnh rằng các nguyên tắc hướng dẫn tiêu chuẩn của YouTube vẫn áp dụng bất kể công cụ nào được sử dụng để tạo ra video.

Nghệ thuật AI thường có một thẩm mỹ riêng biệt, điều này có thể chú ý đến những người tạo video ai trân trọng tính cá nhân và muốn nội dung của họ phải cảm thấy duy nhất. Collins hy vọng dấu vết của Google sẽ không xuất hiện trên video AI. “Tôi không muốn người ta nhìn vào điều này và nói, ‘Ồ, đó là mô hình DeepMind’”, ông nói. Làm cho lời nhắc sản xuất một đầu ra AI hòa hợp với những gì người tạo ra hình dung là một mục tiêu cốt lõi, và tránh thể hiện thị cho Veo là quan trọng để đạt được sự linh hoạt rộng rãi.

” Một phần quan trọng của hành trình là thực sự xây dựng một cái gì đó hữu ích cho mọi người, có khả năng mở rộng, và triển khai,” Collins nói. “Đó không chỉ là một bản demo. Nó đang được sử dụng trong một sản phẩm thực.” Ông tin rằng việc đặt công cụ tạo ra ngẫu nhiên AI ngay trong ứng dụng YouTube sẽ là biến đổi cho các nhà sáng tạo, cũng như DeepMind. “Chúng tôi chưa bao giờ thực sự tạo ra một sản phẩm của người sáng tạo,” ông nói. “Và chúng tôi chắc chắn chưa bao giờ làm điều đó với quy mô này.”

#Youtube #Google #AI #GenerativeVideo #VeoModel #DeepMind #CreativeTools #Innovation.

Nguồn: https://www.wired.com/story/generative-ai-tools-youtube-shorts-veo/

Eli Collins, a vice president of product management at Google DeepMind, first demoed generative AI video tools for the company’s board of directors back in 2022. Despite the model’s slow speed, pricey cost to operate, and sometimes off-kilter outputs, he says it was an eye-opening moment for them to see fresh video clips generated from a random prompt.

Now, just a few years later, Google has announced plans for a tool inside of the YouTube app that will allow anyone to generate AI video clips, using the company’s Veo model, and directly post them as part of YouTube Shorts. “Looking forward to 2025, we’re going to let users create stand-alone video clips and shorts,” says Sarah Ali, a senior director of product management at YouTube. “They’re going to be able to generate six-second videos from an open text prompt.” Ali says the update could help creators hunting for footage to fill out a video or trying to envision something fantastical. She is adamant that the Veo AI tool is not meant to replace creativity, but augment it.

This isn’t the first time Google has introduced generative tools for YouTube, though this announcement will be the company’s most extensive AI video integration to date. Over the summer, Google launched an experimental tool, called Dream Screen, to generate AI backgrounds for videos. Ahead of next year’s full rollout of generated clips, Google will update that AI green-screen tool with the Veo model sometime in the next few months.

The sprawling tech company has shown off multiple AI video models in recent years, like Imagen and Lumiere, but is attempting to coalesce around a more unified vision with the Veo model. “Veo will be our model, by the way, going forward,” says Collins. “You shouldn’t expect five more models from us.” Yes, Google will likely release another video model eventually, but he expects to focus on Veo in the near future.

Google faces competition from multiple startups developing their own generative text-to-video tools. OpenAI’s Sora is the most well-known competitor, but the AI video model, announced earlier in 2024, is not yet publicly available and is reserved for a small number of testers. As for tools that are widely available, AI startup Runway has released multiple versions of its video software, including a recent tool for adapting original videos into alternate-reality versions of the clip.

YouTube’s announcement comes as generative AI tools have grown even more contentious for creators, who sometimes view the current wave of AI as stealing from their work and attempting to undermine the creative process. Ali doesn’t see generative AI tools coming between creators and the authenticity of their relationship with viewers. “This really is about the audience and what they’re interested in—not necessarily about the tools,” she says. “But, if your audience is interested in how you made it, that will be open through the description.” Google plans to watermark every AI video generated for YouTube Shorts with SynthID, which embeds an imperceptible tag to help identify the video as synthetic, as well as include a “made with AI” disclaimer in the description.

Hustle-culture influencers already try to game the algorithm by using multiple third-party tools to automate the creative process and make money with minimal effort. Will next year’s Veo integration lead to a new avalanche of low-quality, spammy YouTube Shorts dominating user feeds? “I think our experience with recommending the right content to the right viewer works in this AI world of scale, because we’ve been doing it at this huge scale,” says Ali. She also points out that YouTube’s standard guidelines still apply no matter what tool is used to craft the video.

AI art oftentimes has a distinct aesthetic, which could be concerning for video creators who value individuality and want their content to feel unique. Collins hopes Google’s thumbprints aren’t all over the AI video outputs. “I don’t want people to look at this and say, ‘Oh, that’s the DeepMind model,’” he says. Getting the prompt to produce an AI output aligned with what the creator envisioned is a core goal, and eschewing overt aesthetics for Veo is critical to achieving a wide-ranging adaptability.

“A big part of the journey is actually building something that’s useful to people, scalable, and deployable,” says Collins. “It’s not just a demo. It’s being used in a real product.” He believes putting generative AI tools right inside of the YouTube app will be transformational for creators, as well as DeepMind. “We’ve never really done a creator product,” he says. “And we certainly have never done it at this scale.”


[ad_2]

Leave a Reply

Your email address will not be published. Required fields are marked *