Google tiếp tục khẳng định vị thế dẫn đầu trong lĩnh vực trí tuệ nhân tạo khi chính thức giới thiệu thế hệ mô hình AI mới nhất của mình: Gemini 2.5. Khởi đầu với phiên bản thử nghiệm Gemini 2.5 Pro, Google đặt kỳ vọng đây sẽ là một bước tiến đáng kể trong khả năng suy luận, lập trình và giải quyết vấn đề của AI, vượt trội so với cả Gemini 2.0 và các mô hình cạnh tranh khác trên thị trường. Sự ra mắt nhanh chóng này cho thấy cuộc đua AI đang ngày càng khốc liệt.
Gemini 2.5 Pro: Bước đột phá với mô hình “Chain-of-Thought” hoàn chỉnh
Điểm nhấn quan trọng nhất của Gemini 2.5 chính là việc đây là mô hình “chain-of-thought” (chuỗi suy nghĩ) hoàn chỉnh đầu tiên của Google. Điều này có nghĩa là Gemini 2.5 Pro có khả năng thực hiện quá trình tư duy đa bước và tự kiểm tra phản hồi của mình để đảm bảo độ chính xác trước khi đưa ra kết quả cuối cùng. Mặc dù Gemini 2.0 đã hỗ trợ tính năng tương tự thông qua mô hình 2.0 Flash Thinking (cũng đang trong giai đoạn thử nghiệm), nhưng Gemini 2.5 chỉ tồn tại dưới dạng “chain-of-thought” đầy đủ. Mặc dù đôi khi có thể mất nhiều thời gian hơn để phản hồi các truy vấn, nhưng đổi lại, các câu trả lời sẽ chính xác hơn và đáng tin cậy hơn, góp phần giảm thiểu tình trạng “ảo giác” – một vấn đề lớn vẫn còn tồn tại trong các mô hình ngôn ngữ lớn (LLM) hiện nay.
Hiệu suất vượt trội và khả năng lập trình đỉnh cao
Google công bố những cải tiến đáng kể về hiệu suất thế hệ với Gemini 2.5 Pro. Trong các lĩnh vực đòi hỏi suy luận nâng cao, mô hình này được cho là hoạt động rất tốt trên các bài kiểm tra chuẩn như GPQA (Graduate-Level Google-Proof Q&A) và AIME 2025 (American Invitational Mathematics Examination problems). Đáng chú ý, khi được kiểm tra mà không sử dụng công cụ bên ngoài, Gemini 2.5 Pro đã đạt 18.8% trên Humanity’s Last Exam – một bộ dữ liệu thách thức được thiết kế bởi các chuyên gia. Mô hình này cũng ra mắt ở vị trí dẫn đầu trên bảng xếp hạng LMArena, nền tảng đánh giá các mô hình AI dựa trên sở thích của con người, vượt trên cả các mô hình mới ra mắt như GPT 4.5 của OpenAI hay Grok 3 của xAI.
Biểu đồ hiệu suất của Google Gemini 2.5
Google khẳng định rằng Gemini 2.5 Pro có hiệu suất tuyệt vời trong việc tạo các ứng dụng web, mã tác nhân (agentic code – mã được thiết kế để tự động thực hiện các tác vụ), chuyển đổi mã và chỉnh sửa mã. Trên bài kiểm tra chuẩn SWE-Bench Verified, đánh giá kỹ năng mã hóa tác nhân, Gemini 2.5 Pro đã đạt được 63.8% khi sử dụng thiết lập tác nhân tùy chỉnh. Để chứng minh thêm khả năng của mình, công ty thậm chí còn tuyên bố rằng mô hình này có khả năng tạo ra mã nguồn có thể thực thi cho một trò chơi điện tử chỉ từ một dòng lệnh duy nhất. Mặc dù một số trải nghiệm trước đó với tính năng tạo game của Gemini chưa thực sự ấn tượng, nhưng với Gemini 2.5 Pro, khả năng này hứa hẹn sẽ được cải thiện đáng kể.
Tốc độ phát triển AI và sự khả dụng của Gemini 2.5 Pro
Chỉ chưa đầy hai tháng kể từ khi gia đình mô hình Gemini 2.0 được phát hành rộng rãi vào cuối tháng 1, Google đã nhanh chóng tiến thêm một bước với Gemini 2.5. Đáng chú ý, Google đã loại bỏ hoàn toàn phiên bản thử nghiệm của Gemini 2.0 Pro và thay thế bằng Gemini 2.5. Điều này cho thấy tốc độ phát triển chóng mặt trong ngành công nghiệp AI, nơi các công ty đang nỗ lực hết sức để khẳng định vị thế dẫn đầu trong cuộc đua giành “ngôi vương” AI. Việc các mô hình được phát hành liên tiếp với tốc độ nhanh chóng có lẽ sẽ trở thành một cảnh tượng ngày càng phổ biến.
Hiện tại, Gemini 2.5 Pro đang trong giai đoạn thử nghiệm và dành riêng cho người dùng Gemini Advanced. Nếu bạn đã đăng ký gói dịch vụ này, bạn có thể trải nghiệm ngay từ bây giờ. Tuy nhiên, nếu chưa thấy tính năng này xuất hiện, bạn có thể cần chờ thêm vài ngày. Google chưa công bố khi nào phiên bản ổn định của Gemini 2.5 sẽ được ra mắt, hoặc khi nào sẽ có một mô hình Gemini 2.5 Flash nhỏ hơn dành cho người dùng miễn phí.
Nguồn: Google Blog