Google Imagen 3, một trong những mô hình AI chuyển văn bản thành hình ảnh mạnh mẽ nhất hiện nay, đã có mặt trên các ứng dụng Gemini từ lâu, nhưng với một giới hạn đáng kể: khả năng tạo ảnh người chỉ dành riêng cho người dùng trả phí. Tuy nhiên, tình hình này đã thay đổi, mang đến một cập nhật quan trọng cho cộng đồng yêu công nghệ.
Giới Hạn Tạo Ảnh Người Trên Gemini Miễn Phí Nay Đã Được Dỡ Bỏ
Nếu bạn đã từng sử dụng Gemini trên web, máy tính để bàn hoặc ứng dụng di động, hẳn bạn đã quen thuộc với khả năng tạo hình ảnh của nó, được hỗ trợ bởi mô hình Google Imagen 3. Google đã ra mắt công cụ này cho tất cả người dùng vào tháng 8 năm 2024, với nhiều tùy chọn đa dạng từ “phong cảnh chân thực” đến “cảnh đất sét sống động”, theo thông báo trên blog The Keyword của Google.
Tuy nhiên, việc tạo hình ảnh có người lại là một câu chuyện khác. Google đã giới hạn tính năng cụ thể này cho các thuê bao trả phí, bao gồm người dùng Gemini Advanced, Business và Enterprise. Nếu bạn sở hữu tài khoản miễn phí, mỗi khi yêu cầu Gemini tạo ra một hình ảnh có người, bạn sẽ nhận được thông báo: “Việc tạo ảnh người chỉ khả dụng ở chế độ truy cập sớm với Gemini Advanced.”
Hiện tại, tính đến tháng 2 năm 2025, đa số người dùng Gemini miễn phí đã có thể thành công trong việc tạo ra những hình ảnh có liên quan đến con người trên Gemini. Mặc dù vậy, nếu bạn vẫn nhận được thông báo lỗi, có thể tính năng này vẫn đang trong quá trình triển khai dần dần, bắt đầu từ người dùng tại Hoa Kỳ sử dụng Gemini với ngôn ngữ tiếng Anh.
Người dùng tương tác với giao diện Gemini để tạo ảnh một phụ nữ đang ăn kem, minh họa tính năng AI tạo hình ảnh.
Cần lưu ý rằng bạn vẫn không thể tạo ra hình ảnh chân thực của những người có thể nhận dạng hoặc trẻ em, theo các hướng dẫn chính sách của Gemini.
Hiệu Suất Của Imagen 3 Với Mô Hình Gemini Flash 2.0 Như Thế Nào?
Cũng trong tháng 2 năm 2025, Google đã phát hành rộng rãi mô hình Gemini nhanh nhất của mình cho người dùng miễn phí. Google mô tả mô hình này, có tên Gemini 2.0 Flash, là một “công cụ làm việc hiệu quả cao”, điều này hứa hẹn những điều tốt đẹp cho việc tạo hình ảnh. Theo truyền thống, việc tạo hình ảnh AI thường tốn nhiều năng lượng và thời gian hơn so với tạo văn bản thông thường, nhưng với một mô hình mạnh mẽ hơn làm động cơ, chất lượng hình ảnh có thể được cải thiện đáng kể.
Chất lượng dường như đặc biệt quan trọng khi nói đến việc tạo hình ảnh người. Chúng ta đều đã chứng kiến những hình ảnh người do AI tạo ra ở giai đoạn đầu, từ những bàn tay bị biến dạng với nhiều ngón thừa cho đến những đôi mắt trống rỗng, ám ảnh. Do đó, sự do dự khi tin tưởng vào công cụ tạo hình ảnh do AI của Google đối với người dùng miễn phí là điều dễ hiểu.
Loạt hình ảnh được AI Google Gemini tạo ra, thể hiện khả năng đa dạng trong việc tạo hình từ văn bản.
Ngược lại với những lo ngại ban đầu, tôi thực sự ấn tượng với khả năng xử lý các yêu cầu tạo hình ảnh có người của Gemini. Đặc biệt khi xem xét đây là một dịch vụ miễn phí, tôi nhận thấy những hình ảnh đầu tiên được tạo ra có chất lượng cao cấp, chân thực và phù hợp với yêu cầu được cung cấp.
Bạn có thể yêu cầu Gemini tiếp tục chỉnh sửa một hình ảnh mà không cần phải bắt đầu lại từ đầu mỗi lần.
Hình ảnh chi tiết một phụ nữ đang thưởng thức kem được tạo bởi Gemini AI, minh họa chất lượng của Imagen 3.
Ý Nghĩa Của Việc Mở Khóa Tính Năng Này Đối Với Người Dùng
Việc có thể truy cập Imagen 3 qua Gemini miễn phí chắc chắn là một trải nghiệm thú vị, nhưng việc phải tránh tạo hình ảnh người là một hạn chế đáng kể. Cập nhật mới nhất của Google đã mở rộng khả năng cho người dùng, biến dịch vụ miễn phí của Gemini thành một đối thủ cạnh tranh đáng gờm cho các dịch vụ trả phí như Midjourney.
Trong khi các dịch vụ trả phí sẽ có nhiều tùy chọn nâng cao hơn, chẳng hạn như kích thước hình ảnh tùy chỉnh, cách tiếp cận của Gemini lại đơn giản và sẵn sàng để sử dụng. Với rất nhiều thứ có sẵn miễn phí, có lẽ việc truy cập sớm liệu có còn đủ để người dùng trả tiền cho Gemini Advanced hay không vẫn là một câu hỏi đáng suy ngẫm.
Kết luận:
Sự mở rộng tính năng tạo ảnh người cho người dùng Gemini miễn phí đánh dấu một bước tiến quan trọng trong việc phổ cập công nghệ AI tạo hình ảnh. Với hiệu suất ấn tượng của Imagen 3 trên mô hình Gemini Flash 2.0, Google đang định vị Gemini như một công cụ AI mạnh mẽ, dễ tiếp cận cho mọi người. Hãy trải nghiệm và chia sẻ nhận định của bạn về khả năng tạo ảnh người của Gemini miễn phí trong phần bình luận bên dưới, và đừng quên theo dõi thuthuatdidong.net để cập nhật những tin tức công nghệ mới nhất!