Bản cập nhật ChatGPT mới nhất của OpenAI đã mang đến một nâng cấp lớn cho khả năng tạo hình ảnh của mô hình GPT-4o. Giờ đây, thay vì phải chuyển đổi sang DALL-E 3, người dùng có thể tạo ra những hình ảnh chất lượng cực cao trực tiếp bằng GPT-4o mà không cần bắt đầu một cuộc trò chuyện mới. Tuy nhiên, một điểm đáng chú ý là tính năng này hiện vẫn có một số hạn chế nhất định đối với người dùng miễn phí của ChatGPT.
GPT-4o: Bước Tiến Vượt Bậc Trong Khả Năng Tạo Ảnh của ChatGPT
Mô hình GPT-4o của OpenAI hiện là lựa chọn mặc định cho hầu hết các cuộc trò chuyện trên ChatGPT. Nó được đánh giá là “Tuyệt vời cho hầu hết các câu hỏi” và thực sự đáp ứng một lượng lớn thông tin với tốc độ và độ chính xác cao, nhưng trước đây chỉ giới hạn ở định dạng văn bản.
Kể từ bản cập nhật ngày 25 tháng 3 năm 2025, GPT-4o đã có thể tạo ra những hình ảnh chất lượng cao với độ chi tiết đáng kinh ngạc, vượt xa chất lượng của mô hình mà nó gần như thay thế hoàn toàn là DALL-E 3. Hơn nữa, GPT-4o giờ đây còn có khả năng thực hiện các thao tác chỉnh sửa và điều chỉnh hình ảnh vượt xa khả năng của DALL-E 3. Việc chỉnh sửa hình ảnh, điều chỉnh màu sắc và phong cách, thực hiện các thay đổi tinh tế, thêm hoặc bớt đối tượng ở tiền cảnh và hậu cảnh, cùng nhiều tính năng khác đều có thể thực hiện được một cách dễ dàng.
Hình ảnh một thợ săn quái vật giả tưởng tóc trắng có sẹo, đang mua sắm tại siêu thị hiện đại, được tạo bởi DALL-E 3.
Hình ảnh tương tự thợ săn quái vật giả tưởng được tái tạo với chi tiết sắc nét hơn, minh họa khả năng tạo ảnh nâng cấp của GPT-4o.
Cải Thiện Đáng Kể Trong Tạo Văn Bản và Chi Tiết Hình Ảnh
Khả năng tạo văn bản cũng được cải thiện một cách đáng kinh ngạc. Việc tạo văn bản của DALL-E 3 chưa bao giờ là một điểm mạnh (dù đây cũng không phải là điểm mạnh của hầu hết các mô hình AI khác). Giờ đây, GPT-4o có thể tạo ra các infographic chi tiết với các giải thích đầy đủ về hầu hết mọi chủ đề. Vị trí văn bản trong hình ảnh hiện đã chính xác hơn, sử dụng các kiểu văn bản và hướng cụ thể mà không có nguy cơ tạo ra hình ảnh AI mờ nhòe. Khả năng giữ chi tiết cũng là một cải tiến rõ ràng khác, với các đặc điểm cụ thể giờ đây có thể dễ dàng chuyển từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Ảnh minh họa một người đàn ông giống Einstein đang ăn kem tại Công viên Trung tâm, được tạo bởi DALL-E 3.
Phiên bản hình ảnh người đàn ông giống Einstein ăn kem được tạo bởi GPT-4o, thể hiện sự cải tiến về chất lượng hình ảnh AI.
Một phần của chất lượng hình ảnh được nâng cấp đến từ mối quan hệ đối tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia huấn luyện đã dành hàng giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với Tạp chí Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên nhiều yêu cầu tạo hình ảnh khác nhau, nhưng chỉ cần “hơn 100 nhân viên” để hoàn thành quá trình. Khả năng tạo hình ảnh mới của ChatGPT thực sự đáng kinh ngạc và chúng tôi khuyên bạn nên thử nó với bất kỳ chủ đề nào bạn muốn. Dĩ nhiên, nó không hoàn hảo; không có công cụ tạo hình ảnh AI nào là hoàn hảo. Nhưng đây là một bước nhảy vọt đáng kể về chất lượng từ một mô hình tạo hình ảnh AI như DALL-E 3, vốn hữu ích nhưng chưa thực sự ấn tượng, lên đến chất lượng mà GPT-4o hiện có thể đạt được.
Tính Năng Tạo Ảnh Tuyệt Vời Của ChatGPT Đang Dần Đến Tay Người Dùng (Gần Như Mọi Người)
Không may, do nhu cầu chưa từng có đối với GPT-4o, người dùng miễn phí của ChatGPT một lần nữa buộc phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, Giám đốc điều hành OpenAI, Sam Altman đã xác nhận sự chậm trễ nhưng không đưa ra khoảng thời gian cụ thể cho việc kết thúc.
Hạn Chế Đối Với Người Dùng ChatGPT Miễn Phí
Sự gia tăng về mức độ quan tâm đã được dự đoán trước, nhưng không đến mức lớn như vậy. Thật không may, điều đó có nghĩa là bạn sẽ phải đợi lâu hơn một chút hoặc nâng cấp lên ChatGPT Plus với giá 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn nhiều so với việc ra mắt mô hình nâng cấp trước đây của OpenAI, GPT-4.5.
DALL-E 3 Trở Thành “Mô Hình Tạo Ảnh Cũ” Của OpenAI
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo hình ảnh cũ của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có khung thời gian cụ thể cho sự thay đổi này.
Tóm lại, bản cập nhật GPT-4o đã mang đến một cuộc cách mạng trong khả năng tạo và chỉnh sửa hình ảnh của ChatGPT, đặt ra một tiêu chuẩn mới cho các mô hình AI tạo sinh. Dù người dùng miễn phí có thể phải chờ đợi, sự vượt trội về chất lượng và tính năng của GPT-4o chắc chắn sẽ khiến việc nâng cấp trở nên đáng giá. Hãy trải nghiệm ngay khả năng tạo ảnh ấn tượng của GPT-4o để thấy được sự khác biệt! Đừng quên theo dõi thuthuatdidong.net để cập nhật những tin tức và đánh giá công nghệ mới nhất.