Trí tuệ nhân tạo đang thay đổi thế giới, nhưng liệu nó đã đủ thông minh để vượt qua con người? Một bài kiểm tra mang tính bước ngoặt mang tên “Kỳ thi cuối cùng của nhân loại” (HLE) đã được thiết kế để trả lời câu hỏi đó. Và bất ngờ thay, dù sở hữu kho dữ liệu khổng lồ, các mô hình AI đình đám như ChatGPT hay Gemini vẫn bó tay trước thử thách này.
Mục lục
I. HLE – Bài thi khó nhất dành cho AI

HLE là kết quả của sự hợp tác giữa hai tổ chức ở hai thái cực: Trung tâm An toàn AI (Center for AI Safety) – đại diện cho quan điểm kiểm soát và đảm bảo tính an toàn của AI trong xã hội, và Scale AI – công ty chuyên cung cấp dữ liệu huấn luyện cho các tập đoàn công nghệ lớn. Mục tiêu của họ là xác định ranh giới cuối cùng giữa trí tuệ nhân tạo và trí tuệ con người.
Không giống những bài kiểm tra thông thường, HLE không dựa vào khả năng xử lý ngôn ngữ hay phân tích văn bản đơn thuần. Nó bao gồm hơn 2.700 câu hỏi được gửi từ các chuyên gia trên toàn cầu, trải dài từ toán học, vật lý, hóa học, sinh học đến nhân văn, ngôn ngữ cổ và thậm chí cả triết học. Có câu hỏi yêu cầu dịch dòng chữ La Mã cổ, câu khác lại xoáy sâu vào cấu trúc sinh học của chim ruồi – những đề bài mà ngay cả con người cũng phải vất vả suy nghĩ.
II. AI “trượt” – Một thất bại đáng suy ngẫm

Kết quả ban đầu cho thấy: AI đã trượt toàn tập. Các mô hình tiên tiến như Gemini hay DeepSeek chỉ đạt 3-14% độ chính xác. Lý do chính là vì bài kiểm tra quá khó và không thể “lách luật” bằng việc tìm kiếm trên mạng. Mỗi câu hỏi đều có một đáp án duy nhất, không chấp nhận sự mơ hồ hay “vòng vo” thường thấy trong các mô hình ngôn ngữ lớn (LLM).
Việc chấm điểm được tự động hóa bằng GPT-40 – một AI khác đóng vai trò giám khảo, đảm bảo tính công bằng và nhất quán tuyệt đối. Để được công nhận, câu trả lời của AI phải đúng về bản chất, không chỉ đúng theo “cú pháp”.
III. Từ sai lầm đến hy vọng

Dù kết quả ban đầu có vẻ tệ hại, nhưng các chuyên gia không quá bi quan. Theo nhóm nghiên cứu, nếu tốc độ phát triển AI hiện tại được duy trì, các mô hình có thể đạt 50% câu trả lời đúng vào cuối năm 2025. Đây là cột mốc cho thấy AI đang từng bước tiến gần hơn đến ngưỡng cửa của hiểu biết con người.
Một điểm đáng chú ý trong giai đoạn tiếp theo của dự án là việc huấn luyện AI biết khi nào mình không chắc chắn. Thay vì luôn trả lời với độ tự tin 100% – dù có thể sai hoàn toàn – AI giờ sẽ phải đưa ra mức độ tin tưởng cho mỗi câu trả lời, tính theo phần trăm. Chỉ số này giúp giảm thiểu những sai sót nghiêm trọng trong các lĩnh vực nhạy cảm như y tế, pháp luật hay tài chính, nơi một sai lầm nhỏ cũng có thể dẫn đến hậu quả lớn.
IV. Khi AI đối diện giới hạn của chính mình

HLE không chỉ là một bài kiểm tra. Nó là một tấm gương soi để AI nhìn lại những giới hạn mà mình chưa thể vượt qua. Không còn là việc “học vẹt” từ hàng tỷ dữ liệu trên mạng, mà là thách thức khả năng lý luận, phân tích và tự nhận thức – những điều tưởng như chỉ con người mới có.
Thất bại lần này không có nghĩa AI yếu kém, mà là lời nhắc rằng trí tuệ nhân tạo vẫn cần thêm thời gian, sự kiểm soát và định hướng đúng đắn. Và nếu một ngày nào đó AI vượt qua được kỳ thi cuối cùng này, câu hỏi quan trọng sẽ không còn là “AI biết được gì?”, mà sẽ chuyển thành: “Chúng ta còn giữ vai trò gì trong một thế giới mà AI đã thực sự hiểu biết?”
V. Kết luận
“Kỳ thi cuối cùng của nhân loại” đã hé lộ một sự thật thú vị: AI vẫn chưa thể thay thế hoàn toàn trí tuệ con người, ít nhất là ở thời điểm hiện tại. Nhưng con đường phía trước vẫn rộng mở. Sự thất bại của AI hôm nay có thể là nền tảng cho những bước tiến vượt bậc ngày mai. Và cuộc đua giữa trí tuệ tự nhiên và trí tuệ nhân tạo chắc chắn sẽ còn nhiều hồi hấp dẫn hơn nữa.
Hãy cùng Phong Vũ Tech News cập nhật thêm nhiều thông tin về công nghệ trí tuệ nhân tạo trong những bài viết khác tại blog Tin Tức nhé!
Bài viết liên quan:
- ChatGPT trở thành chuyên gia định vị ảnh: Tác động và triển vọng
- Khi AI “Nổi Loạn”: Hồi chuông cảnh báo từ trí tuệ nhân tạo vượt trội
- Nhân tố nào sẽ bị Trí tuệ nhân tạo – AI thay thế?


Công Nghệ
Hướng dẫn bật Siri đọc thông báo ứng dụng trên iPhone 17 siêu nhanh
Th7
Công Nghệ
Steam Machine chính thức mở bán với giá khởi điểm hơn 1.000 USD dành cho game thủ
Th7
Thời Sự
Đẩy mạnh đối ngoại toàn diện ở tầm cao mới
Th7
Giải Trí
Địa điểm mát cả ngày lẫn đêm ở Quảng Ngãi, khách hào hứng cắm trại, săn mây
Th7
Ẩm Thực
Trứng gà luộc bao lâu thì chín? Cách luộc trứng gà ngon
Th7
Ẩm Thực
Đặc sản miền Trung có vẻ ngoài kỳ dị, được khen ngọt thơm hơn thịt gà
Th7
Ẩm Thực
Luộc trứng cút lộn bao nhiêu phút thì chín?
Th7
Thời Sự
Các giám đốc sở, bí thư huyện ủy dự kiến làm bí thư phường ở Nam Định
Th7
Thể Thao
Florian Wirtz, ma thuật Đức và kỷ lục gia Liverpool
Th7
Công Nghệ
Chủ quyền số: Chìa khoá tăng trưởng của Việt Nam trong thập kỷ tới
Th7
Công Nghệ
Thiếu tướng Nguyễn Tùng Hưng: ‘Không thể bảo đảm chủ quyền số nếu phụ thuộc công nghệ nước ngoài’
Th7
Giải Trí
Trước khi bị bắt vì liên quan ma túy, Tăng Nhật Tuệ từng vướng loạt bê bối
Th7
Thời Sự
Trường ĐH Khoa học Tự nhiên – ĐHQGHN công bố điểm sàn xét tuyển năm 2026
Th7
Radio My
Hí hửng nhận 3 cây vàng ngày cưới từ mẹ chồng, dâu mới khóc thét đòi ly hôn ngay lập tức khi biết xuất xứ của nó
Th7
Công Nghệ
Góc tối sau siêu bom tấn IPO: ‘Con gà đẻ trứng vàng’ của Elon Musk gặp biến
Th7
Radio My
Bé gái mất tích 47 ngày trong rừng, gầy trơ xương khi được tìm thấy, giờ ra sao?
Th7
Video
funny moment #onepiece #shorts #anime
Th7
Video
Bao Thanh Thiên Khai Phong Kỳ Án Tập 29
Th7
Video
Không hề khó TÔM SÚ KHO LÁ QUẾ đưa cơm phải biết | MÓN NGON MỖI NGÀY
Th7
Video
HƯỚNG DẪN LÀM GÀ GIANG MUỐI SIÊU ĐỈNH | LẠC ĐƯỜNG VLOG
Th7
Video
X-72: TANG TRÙNG TANG – CHƯƠNG 5: MẮT ÂM DƯƠNG || TG: HOÀNG EZ – PHẠM HOA
Th7
Video
THÁO AO BỎ LÂU NGÀY CÓ MÓN NGON | Nhịp Sống Tây Bắc
Th7
Công Nghệ
5 phụ kiện Belkin dành cho hệ sinh thái Apple mà dân văn phòng không nên bỏ qua
Th7
Công Nghệ
Top 5 tai nghe chơi game PUBG PC, Mobile nên mua nhất
Th7
Công Nghệ
Qualcomm bất ngờ hoãn Snapdragon X3, thay thế bằng dòng X2 Refresh
Th7
Thời Sự
Thanh Liệt: Hoàn tất hiệp thương lần 3, thống nhất danh sách ứng cử Hội đồng nhân dân
Th7
Radio My
Phụ nữ khổ tâm thường sẽ có thói quen này, muốn đổi vận hãy sửa ngay hôm nay
Th7
Radio My
Có 3 việc ngộ ra sớm nửa đời sau bớt khổ
Th7
Giải Trí
Cách Hà Nội không xa có “Làng nguyên thủy 3 không”, là thiên đường cho hội chữa lành với không khí mát lạnh
Th7
Ẩm Thực
Cách làm sườn xốt me đơn giản, đưa cơm cho cả gia đình
Th7
Ẩm Thực
Món ‘nửa nộm, nửa bánh đúc’ giá 25.000 đồng, khách ưa thích trong mùa hè Hà Nội
Th7
Ẩm Thực
Mực luộc bao nhiêu phút để giòn sần sật, không bị teo nhỏ?
Th7
Thời Sự
Clip thầy giáo bơi giữa ‘phố biến thành sông’ khiến dân mạng xôn xao
Th7
Thể Thao
Tin tức về chuyển nhượng 22/6: Osimhen về MU, Liverpool ký Guehi
Th7
Công Nghệ
Việt Nam cần khoảng 15.000 nhân sự điện hạt nhân vào năm 2035
Th7
Công Nghệ
Hacker đang tấn công đánh cắp dữ liệu ở 2 cơ quan cấp bộ ở mức độ nghiêm trọng
Th7
Giải Trí
‘Lửa trắng’ tập 6: Bạn gái Cương ‘đen’ lật mặt khi biết Mai là con gái ông trùm
Th7
Thời Sự
Đại học Kinh tế Quốc dân lấy điểm sàn là 22
Th7
Radio My
Vừa gặp anh rể tương lai liền khuyên chị gái “bỏ của chạy lấy người”, tôi giận tím mặt trước câu trả lời của chị
Th7
Công Nghệ
CellphoneS gia nhập mạng lưới YouTube Shopping Affiliate tại Việt Nam
Th7
Radio My
Vườn chà là 6.800m2 ở miền Tây mở cửa miễn phí, khách đến tự hái trái
Th7
Video
Cái Bóng Trên Tường || Kỳ Án Có Thật chap 7
Th7
Video
[Vietnamese] MOON PRIDE (ÁNH TRĂNG KIÊU HÃNH) | Nhạc phim THỦY THỦ MẶT TRĂNG PHA LÊ | Music Video
Th7
Video
LÊN KẾ HOẠCH NẤU ĂN DỄ DÀNG? NGHĨ LIỀN “Món Ngon Mỗi Ngày”
Th7
Video
CHÈO XIẾC CÁ TRÊN SÔNG THƯƠNG MỘT NGÀY MAY MẮN GẶP ĐÔI CÁ CHÉP ĐẸP
Th7
Video
X-90: The Ring – Vòng tròn oan nghiệt || Lời nguyền của sadako || Radio phim ma – Hồ sơ x
Th7
Video
MÓN TỦ CỦA EM THƠM | Nhịp Sống Tây Bắc
Th7
Công Nghệ
Sơn Tùng M-TP và OPPO rục rịch ‘comeback’: Hé lộ màn tái hợp với Reno14 series, thiết kế đuôi cá đa sắc cuốn hút
Th7
Công Nghệ
Cách cài extension nhắc nhở uống nước cho dân văn phòng
Th7
Công Nghệ
Apple chính thức ra mắt iOS 27 beta 2: Bản nâng cấp có gì đổi mới?
Th7
Công Nghệ
Một tính năng trên Zalo giúp ngăn chặn truy cập trái phép kể cả khi bị lộ mật khẩu, được Công an khuyến nghị kích hoạt
Th6
Quang Hùng Video
HẾT THƯƠNG CẠN NHỚ | KARAOKE BEAT CHUẨN
Th4
Giải Trí
Sốc visual chuẩn vibe thập niên 90 của đệ nhất mỹ nhân Trung Quốc 2025: Nguyện seeding nhan sắc này cả đời
Th6
Thể Thao
Nhận định bóng đá hôm nay 13/6: U19 Tây Ban Nha vs U19 Đan Mạch, U19 Romania vs U19 Montenegro
Th6
Quang Hùng Video
mưa đêm tỉnh nhỏ | quang hùng tuyết nhi mixxing
Th6
Giải Trí
Bê bối của Yoo Ah-in dần mờ nhạt khi 2 bộ phim thành công vang dội tại phòng vé
Th6
Sức Khỏe
Nghiên cứu mới phát hiện khả năng trị ung thư từ một loại thuốc tẩy giun
Th4
Công Nghệ
Cách xem thông tin laptop đầy đủ nhất chỉ trong 2 phút
Th4