Khi DeepSeek còn chưa kịp hạ nhiệt trên các diễn đàn công nghệ, một mô hình Trí tuệ Nhân tạo (AI) khác của Trung Quốc đã nhanh chóng xuất hiện và chiếm lấy spotlight. Gã khổng lồ thương mại điện tử Alibaba vừa công bố phiên bản mới của dòng mô hình AI Qwen, hứa hẹn nhiều điểm sáng vượt trội, thậm chí còn tốt hơn cả DeepSeek và ChatGPT trong một số khía cạnh quan trọng. Sự ra đời của Qwen Max không chỉ khẳng định vị thế của Alibaba trong cuộc đua AI toàn cầu mà còn đặt ra câu hỏi lớn về tương lai của các mô hình AI tiếng Việt và liệu Qwen Max có thể trở thành lựa chọn hàng đầu cho cộng đồng công nghệ Việt Nam hay không.
Qwen Max là gì và thuộc hệ sinh thái AI nào?
Qwen Max là phiên bản mới nhất và mạnh mẽ nhất trong đại gia đình AI Qwen của Alibaba. Hiện tại, các mô hình Qwen AI (chat.qwenlm.ai) sau đây đã có mặt:
- Qwen2.5-Plus
- Qwen2.5-Max
- Qwen2.5-VL-72B-Instruct
- Qwen2.5-14B-Instruct-1M
- QVQ-72B-Preview
- QwQ-32B-Preview
- Qwen2.5-Coder-32B-Instruct
- Qwen2.5-Turbo
- Qwen2.5-72B-Instruct
Tất cả các mô hình kể trên đều miễn phí sử dụng sau khi bạn tạo tài khoản thông qua email, Google hoặc GitHub. Đặc biệt, các mô hình AI của Qwen cũng là mã nguồn mở, cho phép bạn tìm thấy chúng trên GitHub hoặc HuggingFace. Điều này có nghĩa là người dùng có thể cài đặt chúng cục bộ trên thiết bị của mình (tùy thuộc vào cấu hình), cho phép chạy AI mà không cần kết nối internet.
Giao diện trang chủ Qwen Chat với các tính năng chính và khu vực nhập prompt
Qwen2.5-Max là một mô hình Mixture-of-Experts (MoE) với 72 tỷ tham số, hỗ trợ 29 ngôn ngữ và được huấn luyện trên hơn 20 nghìn tỷ token. Nó có khả năng xử lý tới 128.000 token trong một cuộc hội thoại duy nhất, điều này có nghĩa là việc xử lý các tài liệu dài không còn là vấn đề. Nếu bạn làm việc với dữ liệu, Qwen có thể xử lý các định dạng có cấu trúc như bảng, CSV và tệp JSON một cách hiệu quả.
Như tên gọi gợi ý, một số mô hình Qwen được tối ưu cho các tác vụ cụ thể. Ví dụ, Qwen2.5-Coder-32B-Instruct xuất sắc trong các tác vụ lập trình, trong khi QwQ-32B-Preview có khả năng tư duy và suy luận. Mặc dù không phải tất cả các mô hình đều có thể thực hiện mọi tác vụ, nhưng hầu hết chúng đều có thể xử lý các prompt văn bản, cũng như tạo hình ảnh và video.
Một tính năng khá độc đáo khác là khả năng kết hợp hai mô hình với nhau. Theo trải nghiệm thực tế, bạn có thể đạt được kết quả tốt hơn một chút khi kết hợp hai phiên bản thành một cặp mạnh mẽ hơn. Chẳng hạn, việc ghép nối Qwen2.5-Max với Qwen2.5-Coder-32B-Instruct đã giúp tạo ra mã code với ít prompt và lỗi hơn trong đầu ra.
Qwen 2.5 Max đang tạo hình ảnh theo yêu cầu, minh họa khả năng sáng tạo đa phương tiện của mô hình AI
Trang web của Qwen là nơi duy nhất để truy cập chính thức các mô hình AI này. Bạn có thể nhập prompt và làm việc với văn bản, nhưng cũng có khả năng tạo hình ảnh và video với nhiều tỷ lệ khung hình khác nhau. Một tính năng “Tìm kiếm web” (Web Search) vẫn chưa được ra mắt.
Tuy nhiên, có một nhược điểm là đôi khi Qwen mất một khoảng thời gian để xử lý các prompt của bạn. Ban đầu, người dùng có thể nghĩ rằng trang web không hoạt động. Prompt đầu tiên trong một cuộc hội thoại có thể mất khoảng 30 giây để tạo phản hồi, sau đó tốc độ phản hồi sẽ được cải thiện đáng kể.
Hình ảnh và video được tạo ra nhanh hơn dự kiến. Chúng không phải là hàng đầu về chất lượng hoặc độ chân thực, nhưng nếu bạn cần tạo nhanh một hình ảnh trong tình huống cấp bách, chúng sẽ đáp ứng được. Bạn có thể kỳ vọng một lượng đáng kể các lỗi hình ảnh ngẫu nhiên trong hầu hết các phương tiện được tạo ra. Thời gian phản hồi chậm ban đầu có thể chỉ do tải máy chủ, tương tự như hầu hết các chatbot AI khi ra mắt, bao gồm DeepSeek và ChatGPT. Đôi khi, cũng có lỗi kết nối với Qwen do có quá nhiều yêu cầu trong hàng đợi.
So sánh Qwen Max và DeepSeek: Ai là người chiến thắng?
Về mặt kỹ thuật, Qwen tốt hơn DeepSeek trên mọi phương diện. Mô hình của Alibaba mang lại cảm giác tương tác tự nhiên hơn và chạy nhanh hơn một chút. Tuy nhiên, nếu bỏ qua kết quả benchmark, bạn sẽ khó tìm thấy sự khác biệt rõ rệt giữa hai mô hình này trong trải nghiệm hàng ngày.
Lợi thế lớn của Qwen so với DeepSeek là khả năng căn chỉnh tốt hơn với ưu tiên của con người, giúp người dùng dễ dàng nhập các prompt phức tạp và nhận được phản hồi chính xác mà không cần nhiều tinh chỉnh. Ngay cả những câu lệnh đơn giản cũng có thể tạo ra phản hồi khá chi tiết với nhiều thông tin. Trong khi đó, DeepSeek, mặc dù là một mô hình AI tuyệt vời, có thể mất vài lần thử và một số kỹ thuật prompt engineering trước khi bạn đạt được kết quả mong muốn.
Trang tải ứng dụng chatbot DeepSeek AI trên Apple App Store, thể hiện sự hiện diện của DeepSeek trên nền tảng di động
Khi nói đến kiến thức tổng quát và độ chính xác thực tế, cả hai mô hình đều hoạt động tương tự, nhưng Qwen có một chút lợi thế về tính nhất quán của thông tin.
Tuy nhiên, một lĩnh vực mà DeepSeek rõ ràng vượt trội là chi phí sử dụng. DeepSeek có giá 0.25 USD mỗi triệu token, trong khi Qwen là 0.38 USD. Mặc dù vậy, cả hai vẫn rẻ hơn đáng kể so với mức 5 USD và 3 USD của GPT-4o và Claude 3.5.
Bảng so sánh hiệu suất Benchmark chi tiết
Như đã đề cập trước đó, Qwen vượt trội hơn DeepSeek gần như trên mọi bảng xếp hạng benchmark.
Benchmark | Qwen 2.5 Max | DeepSeek V3 R1 |
---|---|---|
Arena-Hard | 89.4 | 85.5 |
MMLU-Pro | 76.1 | 75.9 |
GPQA-Diamond | 60.1 | 59.1 |
LiveCodeBench | 38.7 | 37.6 |
LiveBench | 62.2 | 60.5 |
Các benchmark rõ ràng cho thấy khả năng hiểu biết tốt hơn và mức độ căn chỉnh cao hơn của Qwen với các giá trị của con người. Ngoài ra, về mặt kiến thức và lý luận, kiến thức tổng quát, khả năng lập trình và năng lực tổng thể, nó chỉ nhỉnh hơn một chút so với DeepSeek.
Kết luận
Hai mô hình AI từ Trung Quốc, Qwen và DeepSeek, đã thiết lập một chuẩn mực mới cho sự phát triển của Trí tuệ Nhân tạo. Mặc dù vẫn còn những lo ngại về bảo mật và quyền riêng tư, đặc biệt khi DeepSeek đã từng gặp sự cố rò rỉ dữ liệu, nhưng không thể phủ nhận rằng các mô hình AI như Qwen Max và DeepSeek đang vượt trội hơn các đối thủ phương Tây về mặt hiệu suất. Sự xuất hiện của Qwen Max củng cố vị thế của Alibaba và đặt ra một thách thức lớn, thúc đẩy toàn bộ ngành công nghiệp AI phải thay đổi để theo kịp.
Bạn nghĩ sao về Qwen Max và khả năng của nó trong việc thay đổi cục diện ngành AI tại Việt Nam? Hãy chia sẻ ý kiến của bạn trong phần bình luận bên dưới và đừng quên theo dõi thuthuatdidong.net để cập nhật những thông tin công nghệ mới nhất!