Tôi vừa tạo ra 5 hình ảnh với Google Gemini Imagen — ấn tượng đầy bất ngờ.

Vừa mới tạo ra 5 hình ảnh với Google Gemini Imagen – và cái này để lại cho tôi cảm giác ấn tượng và khó chịu. Imagen 3 của Google cuối cùng đã xuất hiện trong Gemini và đã tạo nên sóng gió với khả năng tạo ra hình ảnh tuyệt đẹp dựa trên các yêu cầu đơn giản. Google tự hào rằng đây là “mô hình tạo hình ảnh chất lượng cao nhất của họ cho đến nay,” và tôi mong chờ khám phá tiềm năng đầy đủ của nó. Các máy tạo hình ảnh dựa trên trí tuệ nhân tạo đang là ngôi sao sáng tại cảnh AI, với các mô hình như DALL-E 3 trong ChatGPT và Midjourney được chú ý nhất. Gemini trước đây đã truy cập vào Imagen 2 nhưng điều này đã bị loại bỏ sau một số vấn đề về hiệu suất. Mô hình mới được xây dựng bởi phòng thí nghiệm trí tuệ nhân tạo của Google, DeepMind, cung cấp một cách tiếp cận mới mẻ đối với quy trình với cách tiếp cận tinh vi đến sự sáng tạo hình ảnh.

Mục tiêu của tôi là xem nó xử lý những yêu cầu đa dạng như thế nào, từ cấu trúc của sushi đến các chi tiết phức tạp của một khuôn mặt người. Tôi ấn tượng bởi hình ảnh thực tế của nó nhưng cũng gặp phải một số điểm lạ mà nhắc tôi rằng đây vẫn là một công nghệ đang phát triển. Dưới đây là điều mà tôi thấy nổi bật.

Điểm khởi đầu:
Sử dụng Imagen 3 của Google Gemini rất dễ dàng. Giao diện là trực quan, và tôi thích việc nó cho phép điều chỉnh hoặc tạo lại yêu cầu, do đó nếu kết quả ban đầu không hoàn hảo, dễ dàng tìm ra các điểm cải tiến mà không phải bắt đầu từ đầu. Sự cân bằng giữa tốc độ và linh hoạt này thúc đẩy sự sáng tạo và khám phá.

Tôi quyết định thử nghiệm với một sự kết hợp giữa cả các yêu cầu chi tiết và mờ. Tôi nghĩ đây là cách tốt nhất để kiểm tra sự sáng tạo của Gemini trong khi xác định xem nó có phản ứng tốt hơn với các yêu cầu mơ hồ hay chi tiết hơn. Đáng chú ý, tôi bị ấn tượng bởi những hình ảnh trong một số trường hợp trong khi nhận thấy sự thiếu tinh tế rõ ràng ở những lần khác.

Tóm lại, Imagen của Gemini để lại cho tôi ấn tượng. Sự chi tiết, cấu trúc và thiết kế thẩm mỹ đều rất tuyệt vời. Tuy nhiên, rõ ràng là nó cần yêu cầu bổ sung để thực sự hiểu rõ hình ảnh cuối cùng. Nó gặp khó khăn với các yêu cầu tinh tế hơn và không thể tạo ra các biến thể sáng tạo, nghệ thuật.

#GoogleGemini #Imagen3 #trítuệnhântạo #sựkiệnHômNay

Nguồn: https://www.tomsguide.com/ai/ai-image-video/i-just-created-5-images-with-google-gemini-and-it-left-me-both-impressed-and-annoyed

Google‘s Imagen 3 has finally arrived in Gemini and is already making waves with its ability to create stunning visuals based on simple prompts. Google boasts that it’s their “highest quality image generation model yet,” and I couldn’t wait to explore its full potential.

AI-driven image generators dominate the AI landscape, with models like DALL-E 3 in ChatGPT and Midjourney getting most of the attention. Gemini previously had access to Imagen 2 but this was removed after some issues with performance.


[ad_2]

Leave a Reply

Your email address will not be published. Required fields are marked *