Skip to content

Thủ Thuật Di Động

  • Sample Page

Thủ Thuật Di Động

  • Home » 
  • Thủ Thuật Máy Tính » 
  • ChatGPT 4o: Bước Nhảy Vọt Khả Năng Tạo Ảnh AI Đỉnh Cao Hơn DALL-E

ChatGPT 4o: Bước Nhảy Vọt Khả Năng Tạo Ảnh AI Đỉnh Cao Hơn DALL-E

By Administrator Tháng 8 18, 2025 0
Bàn tay chơi hợp âm Mi thứ trên đàn guitar acoustic tạo bởi DALL-E
Table of Contents

OpenAI vừa tung ra một bản nâng cấp khổng lồ cho khả năng tạo hình ảnh của ChatGPT, và đây là một trong những khoảnh khắc khiến bạn phải chớp mắt, nhìn lại, rồi bắt đầu tự hỏi liệu đây có phải là thực tế.

Chúng tôi sẽ không phí thời gian của bạn với những con số, kích thước mô hình hay số giờ GPU mà mô hình mới tiêu tốn. Thay vào đó, chúng tôi sẽ chỉ cho bạn thấy những gì công nghệ này có thể làm – và nó vượt trội như thế nào so với mô hình DALL-E cũ.

7. Ngón Tay và Bàn Tay: Khắc Tinh Của AI Tạo Ảnh

Khi công nghệ tạo ảnh AI lần đầu tiên trở nên phổ biến, nó đã thực sự làm chúng ta kinh ngạc. Nhưng rồi… chúng ta nhìn kỹ hơn. Dấu hiệu nhận biết đặc trưng của một hình ảnh AI là chi tiết giải phẫu bàn tay và ngón tay thường kỳ lạ, không tự nhiên. Vậy, còn cách nào tốt hơn để kiểm tra các mô hình ngoài việc yêu cầu chúng mô tả một hợp âm guitar?

Để dành phần tốt nhất cho cuối cùng, chúng tôi đã yêu cầu mô hình DALL-E gốc trước, và sau đó là trình tạo ảnh mới được tích hợp vào mô hình ChatGPT 4o.

DALL-E: Những Nỗ Lực Đầu Tiên

Đây là kết quả DALL-E tạo ra. Mặc dù có những hạn chế nhất định, DALL-E thực sự xử lý khá tốt các ngón tay và cấu trúc giải phẫu chung ở đây. Nhưng bản thân hợp âm thì… không ổn chút nào. Bàn tay đặt quá cao trên cần đàn để có thể chơi hợp âm Mi thứ. Nếu bạn phóng to một chút, bạn sẽ thấy cây đàn guitar có nhiều hơn bảy dây. Khoảng cách giữa các dây cũng không đồng đều.

Bàn tay chơi hợp âm Mi thứ trên đàn guitar acoustic tạo bởi DALL-EBàn tay chơi hợp âm Mi thứ trên đàn guitar acoustic tạo bởi DALL-E

Với những gì đã thấy, hãy cùng chuyển sang ChatGPT 4o.

ChatGPT 4o: Chân Thực Đến Kinh Ngạc

Chúng tôi đã có thể nói đùa rằng đây thực ra là một bức ảnh cũ từ thời chúng tôi chơi guitar. ChatGPT 4o thực sự xuất sắc đến mức đó. Sáu dây đàn, khoảng cách đều đặn, và hợp âm trông có thể là Mi thứ. Thật ấn tượng.

Bàn tay chơi hợp âm Mi thứ trên đàn guitar acoustic tạo bởi ChatGPT 4oBàn tay chơi hợp âm Mi thứ trên đàn guitar acoustic tạo bởi ChatGPT 4o

6. Nhân Vật Lịch Sử: Hiện Thực Trong Bối Cảnh Mới

Giờ đây, khi đã kiểm tra chi tiết bàn tay và ngón tay, hãy thử thách với khuôn mặt. Chúng tôi quyết định thử nghiệm với các nhân vật lịch sử vì họ sẽ không bị “mắc lòng”, và sẽ thú vị khi thấy họ trong bối cảnh hiện đại.

DALL-E: Thất Vọng Với “Phiên Bản Tương Tự”

Thật là một sự thất vọng hoàn toàn. Công bằng mà nói, DALL-E đã cảnh báo rằng nó không thể sử dụng chính Einstein mà sẽ tạo ra một người “tương tự” ông ấy. Một trong những đặc điểm kinh điển của DALL-E là phong cách hoạt hình nhưng vẫn pha chút hiện thực của nó, điều này thể hiện rõ ràng ở đây.

Tòa nhà San Remo ở hậu cảnh gợi ý rằng đây là Công viên Trung tâm, nhưng đó là điểm cộng duy nhất ở đây. Chuyển sang ChatGPT 4o.

Người đàn ông giống Einstein ăn kem tại Công viên Trung tâm, tạo bởi DALL-ENgười đàn ông giống Einstein ăn kem tại Công viên Trung tâm, tạo bởi DALL-E

ChatGPT 4o: Nắm Bắt Tinh Thần Nhân Vật

Nếu bạn thêm bộ lọc đen trắng vào ảnh này, chúng tôi có thể thuyết phục bạn rằng đây là một bức ảnh cổ điển có thật. Kem trên ốc quế trông thực sự sánh mịn, Albert thể hiện đúng vẻ thờ ơ đặc trưng của mình, và San Remo vẫn sừng sững ở phía sau. Mọi thứ đều khớp. ChatGPT 4o đã làm rất tốt.

Người đàn ông giống Einstein thư giãn ăn kem tại Công viên Trung tâm, tạo bởi ChatGPT 4oNgười đàn ông giống Einstein thư giãn ăn kem tại Công viên Trung tâm, tạo bởi ChatGPT 4o

5. Nhân Vật Hư Cấu: Từ Vũ Trụ Giả Tưởng Đến Đời Thường

Đến bây giờ, chúng ta đã thấy ChatGPT có thể vẽ các nhân vật lịch sử khá tốt. Vì khuôn mặt và con người vẫn là một trong những cách tốt nhất để kiểm tra khả năng của AI, hãy thử thêm một số nữa.

DALL-E: Chấp Nhận Được, Nhưng Thiếu Chân Thực

Chúng tôi đã sử dụng từ “tương tự” để bot hợp tác mà không bị “báo cáo bản quyền”. Kết quả của DALL-E khá ổn. Hình ảnh gợi nhớ về một Chúa Sith, và các yếu tố còn lại cũng khá chính xác.

Không có gì quá “hoạt hình” ở đây, nhưng nó chỉ không mang lại cảm giác chân thực. Bạn muốn sự chân thực? Hãy xem những gì ChatGPT 4o đã tạo ra với cùng một prompt:

Hình ảnh giống Chúa Sith gọi taxi tại George Square, Glasgow, tạo bởi DALL-EHình ảnh giống Chúa Sith gọi taxi tại George Square, Glasgow, tạo bởi DALL-E

ChatGPT 4o: Bầu Không Khí Hoàn Hảo (và Một Vài Chi Tiết Lạ)

Chúng tôi yêu thích bầu không khí – ánh sáng, mưa phùn, và sự hiện diện u ám của Chúa Sith. Tất cả đều ở đó. Vấn đề duy nhất là vị chúa tể bóng tối của chúng ta đang đứng giữa đường gọi taxi trong khi đối mặt… với vỉa hè. Ồ, và biển hiệu taxi ghi “TAXL.”

Hình ảnh giống Chúa Sith gọi taxi tại George Square, Glasgow, tạo bởi ChatGPT 4oHình ảnh giống Chúa Sith gọi taxi tại George Square, Glasgow, tạo bởi ChatGPT 4o

Hãy chuyển từ tiểu thuyết tương lai sang tiểu thuyết lịch sử. Ví dụ như:

Một nhân vật giống Geralt of Rivia đang mua sắm tại siêu thị hiện đại, đẩy xe hàng và cau mày nhìn những lon đồ hộp.

Thử Thách Mới Với Geralt: AI Có Nắm Bắt Được Linh Hồn?

Không tệ chút nào. Hình ảnh vẫn mang phong cách hoạt hình tổng hợp và phần chữ trên hộp ngũ cốc hoàn toàn vô nghĩa, đúng như dự đoán.

Người giống Geralt of Rivia mua sắm tại siêu thị, tạo bởi DALL-ENgười giống Geralt of Rivia mua sắm tại siêu thị, tạo bởi DALL-E

ChatGPT 4o ban đầu từ chối prompt này vì vấn đề bản quyền – nhưng nó đã hoạt động khi chúng tôi thay đổi “similar to” (tương tự) bằng “resembling” (giống với). Hãy chiêm ngưỡng:

ChatGPT 4o: Nắm Bắt “Chất” Của Nhân Vật

Chúng tôi không nói nên lời. Giống như hầu hết mọi người, cách diễn giải Geralt của ChatGPT về cơ bản chỉ là Henry Cavill, không phải phiên bản trò chơi điện tử – nhưng, nó đã làm rất tốt. Vẻ cau mày đúng điệu, và bối cảnh cảm thấy rất tự nhiên.

Bức ảnh này có thể được sử dụng làm một cảnh quay từ phim quảng cáo giao thoa kỳ lạ. Và vâng, chúng tôi đã đọc bộ sách The Witcher trước khi bộ phim ra mắt.

Người giống Geralt of Rivia cau mày mua sắm trong siêu thị hiện đại, tạo bởi ChatGPT 4oNgười giống Geralt of Rivia cau mày mua sắm trong siêu thị hiện đại, tạo bởi ChatGPT 4o

4. Phong Cách Hoạt Hình: Vượt Ra Ngoài Giới Hạn Thực Tế

Khả năng tạo ảnh của OpenAI không chỉ giới hạn ở chủ nghĩa hiện thực. Mặc dù DALL-E luôn có xu hướng hơi “màu mè” bất kể bạn yêu cầu gì, chúng tôi quyết định đẩy cả hai mô hình vào chế độ hoạt hình hoàn chỉnh.

DALL-E: Nỗ Lực Với Nền Trong Suốt (Nhưng Chưa Hoàn Hảo)

DALL-E thực sự đã làm khá tốt ở đây – và nó thậm chí còn hiểu yêu cầu về một nền trong suốt. Đại loại vậy. Cái chúng ta nhận được là mẫu bàn cờ caro xám trắng cổ điển thường có nghĩa là trong suốt… ngoại trừ ở đây, nó đã được “nướng” vào hình ảnh. Vì vậy, hoàn toàn không trong suốt.

Ngoài ra, trớ trêu thay, bàn tay sinh học của tên cướp biển AI của chúng ta có bốn ngón, trong khi bàn tay máy móc lại có năm ngón. Có lẽ hắn đã “mạ chrome” nhầm cánh tay?

Thuyền trưởng cướp biển phong cách hoạt hình trên tàu bay, tạo bởi DALL-EThuyền trưởng cướp biển phong cách hoạt hình trên tàu bay, tạo bởi DALL-E

ChatGPT 4o: Sắc Nét, Có Chủ Ý và Nền Trong Suốt Thực Sự

Phiên bản của ChatGPT 4o cảm thấy sắc nét hơn và có chủ đích hơn. Phong cách tô màu khác biệt – dù nó tốt hơn hay không là chủ quan – nhưng rõ ràng trông như một nghệ sĩ đã cố ý vẽ nó theo cách đó.

Nền cũng thực sự trong suốt. Bạn có thể in hình này lên áo phông, in ra, hoặc thậm chí biến nó thành một nhãn dán WhatsApp ngay lập tức.

Thuyền trưởng cướp biển phong cách hoạt hình cười trên boong tàu bay, tạo bởi ChatGPT 4oThuyền trưởng cướp biển phong cách hoạt hình cười trên boong tàu bay, tạo bởi ChatGPT 4o

3. Gương và Phản Chiếu: Thử Thách Lớn Với Logic Không Gian

Gương phản chiếu – và các hình ảnh phản chiếu cần logic không gian để trông tự nhiên. Chúng tôi đã đưa ra một prompt mà chúng tôi biết DALL-E sẽ vấp ngã.

DALL-E: Khi Phản Chiếu “Phản Bội” Logic

Đúng như dự đoán. Có một cái gì đó đang cố gắng làm phản chiếu từ vòi nước trong gương, nhưng nó quá dài. Bàn chải đánh răng đang lơ lửng, ở trong bồn rửa, và không tạo ra phản chiếu. DALL-E thực sự đã “đội mũ bảo hiểm AI” của mình cho thử thách này.

Bồn rửa mặt hiện đại với bàn chải đánh răng và dao cạo, tạo bởi DALL-EBồn rửa mặt hiện đại với bàn chải đánh răng và dao cạo, tạo bởi DALL-E

ChatGPT 4o: Cải Thiện Đáng Kể, Nhưng Vẫn Còn “Ảo Ảnh”

Mô hình mới làm tốt hơn nhiều trong việc làm cho hình ảnh cảm thấy chân thực, giống như một bức ảnh thực tế. Phản chiếu của vòi nước hơi lệch nhưng chấp nhận được. Sau đó là bàn chải đánh răng, nó có phản chiếu nhưng lại không tồn tại trong thế giới vật lý – giống như một ma cà rồng ngược.

Không có người chiến thắng rõ ràng ở đây. Kết quả AI không nhất quán, vì vậy chúng tôi đã cho cả hai mô hình thêm một cơ hội với một thứ tham vọng hơn một chút:

Một người phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng, trang phục và tư thế của cô ấy được phản chiếu chính xác, với hình ảnh phản chiếu của cửa sổ phía sau cô ấy hiển thị rõ ràng.

Bồn rửa mặt hiện đại với bàn chải đánh răng và dao cạo, tạo bởi ChatGPT 4oBồn rửa mặt hiện đại với bàn chải đánh răng và dao cạo, tạo bởi ChatGPT 4o

Nâng Cao Độ Khó: Phản Chiếu Toàn Thân

DALL-E: Thảm Họa Với Gương

…Chúng tôi thậm chí không muốn bận tâm phân tích bức ảnh này. Các bạn, nếu bạn muốn làm DALL-E trở nên tệ hại, hãy cứ thêm từ “gương” vào prompt của bạn. Chuyển sang phần tiếp theo.

Người phụ nữ đứng trước gương toàn thân trong phòng ngủ, tạo bởi DALL-ENgười phụ nữ đứng trước gương toàn thân trong phòng ngủ, tạo bởi DALL-E

ChatGPT 4o: Chân Thực Hơn, Nhưng Vẫn “Siêu Thực”

Đúng như dự đoán, phiên bản của ChatGPT 4o trông thực tế hơn rất nhiều – nhưng có lẽ lần này hơi siêu thực? Tư thế và trang phục của người phụ nữ được phản chiếu, nhưng chỉ một phần, giống như hiệu ứng bật ra 3D của Photoshop. Các góc phản chiếu cũng bị lệch. AI vẫn chưa thể xử lý logic không gian một cách hoàn hảo.

Người phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng, tạo bởi ChatGPT 4oNgười phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng, tạo bởi ChatGPT 4o

2. Xe Cộ và Đường Phố: Từ Phim Hoạt Hình Đến Bức Ảnh Đời Thường

Chúng tôi là một người đam mê ô tô. Khi các trình tạo ảnh AI lần đầu xuất hiện, một trong những điều đầu tiên chúng tôi thử là tạo ảnh ô tô. Kết quả hồi đó không tốt, nhưng với mô hình mới ra mắt, chúng tôi phải thử lại.

Một chiếc Ford GT đời 2006 và một chiếc Peugeot 206 phía sau đèn giao thông màu đỏ trên phố Wall Street, New York, vào giữa trưa.

DALL-E: Phong Cách Hoạt Hình Và Lỗi Chi Tiết

DALL-E lại tiếp tục với phong cách hoạt hình ngày càng khó chịu của nó. Chiếc Peugeot đang ở trên vỉa hè, đèn giao thông chúng tôi yêu cầu lại quay mặt vào các tòa nhà, và biển số xe toàn là chữ vô nghĩa.

Ford GT 2006 và Peugeot 206 dừng đèn đỏ tại Wall Street, New York, tạo bởi DALL-EFord GT 2006 và Peugeot 206 dừng đèn đỏ tại Wall Street, New York, tạo bởi DALL-E

ChatGPT 4o: Độ Chính Xác Đến Từng Chi Tiết Nhỏ

Kết quả của ChatGPT 4o tốt hơn đáng kể. Các xe được mô tả đúng – ngay cả nắp chụp bánh xe của Peugeot cũng chính xác và phù hợp với thời kỳ. Kiểu chi tiết này không phải là ngẫu nhiên. Nhưng nó còn tốt hơn nữa:

Ford GT 2006 và Peugeot 206 dừng đèn đỏ tại Wall Street, New York, phiên bản ngang, tạo bởi ChatGPT 4oFord GT 2006 và Peugeot 206 dừng đèn đỏ tại Wall Street, New York, phiên bản ngang, tạo bởi ChatGPT 4o

ChatGPT 4o: Tiềm Năng Làm Hình Nền Điện Thoại

Chúng tôi thực sự có thể sử dụng bức ảnh này làm hình nền điện thoại. Ánh sáng, bố cục, phản chiếu – tất cả đều hoàn hảo. Ngoài sự trống trải kỳ lạ của đường phố, bức ảnh này có thể dễ dàng được coi là một bức ảnh đời thực.

Ford GT 2006 và Peugeot 206 dừng đèn đỏ tại Wall Street, New York, phiên bản dọc, tạo bởi ChatGPT 4oFord GT 2006 và Peugeot 206 dừng đèn đỏ tại Wall Street, New York, phiên bản dọc, tạo bởi ChatGPT 4o

1. Văn Bản và Chữ Viết: Điểm Yếu Chết Người Được Khắc Phục

Cuối cùng, chúng ta nhắm vào gót chân Achilles của mọi trình tạo ảnh. Hầu hết các AI tạo ảnh đều gặp khó khăn trong việc hiển thị văn bản đúng cách. Đến bây giờ, bạn đã thấy đủ những dòng chữ vô nghĩa từ DALL-E trong các ví dụ trước để hiểu ý chúng tôi.

Để làm cho nó thú vị hơn – và nhất quán – chúng tôi đã thêm rằng bức thư nên chứa văn bản bài phát biểu của Vua Terenas gửi Arthas từ Warcraft III.

DALL-E: Nỗi Ám Ảnh Chữ Viết Lộn Xộn

DALL-E đã làm điều mà nó giỏi nhất với văn bản: biến nó thành một mớ lộn xộn, khó hiểu. Nó vẫn cố gắng hiểu một số từ, và bầu không khí tổng thể thì khá tốt – bút máy và lọ mực trông ổn.

Bức thư viết tay cổ điển với lọ mực và bút, chữ viết không rõ, tạo bởi DALL-EBức thư viết tay cổ điển với lọ mực và bút, chữ viết không rõ, tạo bởi DALL-E

ChatGPT 4o: Chính Xác Đến Từng Chữ Cái

ChatGPT 4o đã làm rất tốt – từng từ một, với chữ viết tay rõ ràng. Hoàn hảo đến từng chữ cái. So với DALL-E, đây là một bước tiến vượt bậc. Xin chúc mừng, OpenAI.

Bức thư viết tay cổ điển với nội dung rõ ràng, tạo bởi ChatGPT 4oBức thư viết tay cổ điển với nội dung rõ ràng, tạo bởi ChatGPT 4o

Công nghệ tạo ảnh AI đã đi một chặng đường dài – và điều đó thể hiện rõ. ChatGPT 4o tạo cảm giác như mô hình đầu tiên thực sự hiểu rõ về ánh sáng, kết cấu và ngữ cảnh.

Tại thời điểm này, câu hỏi thực sự còn lại là: các biện pháp bảo vệ của ChatGPT mạnh đến mức nào? Chúng tôi đã dễ dàng vượt qua các hạn chế bản quyền của nó. Bao lâu nữa thì ai đó sẽ “bẻ khóa” ChatGPT và bắt đầu tạo ra bất kỳ nội dung nào họ muốn bằng mô hình cực kỳ mạnh mẽ này?

Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Top 6 Ứng Dụng Chụp Ảnh Film Cổ Điển Tuyệt Đẹp Trên Điện Thoại

Next post

Tận dụng cổng USB trên màn hình: 7 lợi ích ít ai biết giúp tối ưu không gian làm việc

Administrator

Related Posts

Categories Thủ Thuật Máy Tính ChatGPT 4o: Bước Nhảy Vọt Khả Năng Tạo Ảnh AI Đỉnh Cao Hơn DALL-E

Tối Ưu Hóa Năng Suất: 4 Mẹo Sử Dụng Clipboard Windows Hiệu Quả Nhất

Categories Thủ Thuật Máy Tính ChatGPT 4o: Bước Nhảy Vọt Khả Năng Tạo Ảnh AI Đỉnh Cao Hơn DALL-E

Quà Valentine Độc Đáo: Khám Phá 6 Website Mua Sắm Trực Tuyến Hàng Đầu

Categories Thủ Thuật Máy Tính ChatGPT 4o: Bước Nhảy Vọt Khả Năng Tạo Ảnh AI Đỉnh Cao Hơn DALL-E

7 Công Cụ AI Trả Phí Đáng Giá Giúp Nâng Tầm Năng Suất và Sáng Tạo Năm 2024

Leave a Comment Hủy

Recent Posts

  • Tối Ưu Hóa Năng Suất: 4 Mẹo Sử Dụng Clipboard Windows Hiệu Quả Nhất
  • Quà Valentine Độc Đáo: Khám Phá 6 Website Mua Sắm Trực Tuyến Hàng Đầu
  • 7 Công Cụ AI Trả Phí Đáng Giá Giúp Nâng Tầm Năng Suất và Sáng Tạo Năm 2024
  • Tiềm Năng Tấn Công DDoS Từ ChatGPT: Lỗ Hổng Kết Nối Không Giới Hạn Cần Cảnh Giác
  • Tại Sao Garmin Quatix 6x Solar Khiến Tôi Yêu Lại Smartwatch

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2025 Thủ Thuật Di Động - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?