Chuyên mục

Liên kết website

Thống kê truy cập

Đang trực tuyến :	12998
Tổng truy cập :	57,998

Khoa học kỹ thuật và công nghệ

Một mô hình AI tự học cách tư duy để giải quyết vấn đề, không cần con người (10/11/2025)

Trí tuệ nhân tạo (AI) ngày càng thông minh hơn, nhưng vẫn có những giới hạn. Một trong những thách thức lớn nhất là dạy các mô hình AI tiên tiến cách suy luận, tức là giải quyết vấn đề từng bước một. Nhưng trong một bài báo mới được công bố trên tạp chí Nature, nhóm nghiên cứu từ DeepSeek AI, một công ty AI của Trung Quốc, báo cáo rằng họ đã có thể dạy mô hình R1 của mình tự suy luận mà không cần sự can thiệp của con người.

Khi chúng ta cố gắng giải quyết một vấn đề, chúng ta thường không có ngay câu trả lời. Chúng ta tuân theo một quy trình có phương pháp, có thể bao gồm việc thu thập thông tin và ghi chú cho đến khi tìm ra giải pháp. Theo truyền thống, việc đào tạo các mô hình AI để suy luận liên quan đến việc sao chép cách tiếp cận của chúng ta. Tuy nhiên, đây là một quá trình kéo dài, trong đó con người phải cho mô hình AI xem vô số ví dụ về cách giải quyết một vấn đề. Điều này cũng có nghĩa là AI chỉ giỏi bằng những ví dụ được cung cấp và có thể tiếp thu những thành kiến của con người.

Thay vì chỉ cho mô hình R1 từng bước, các nhà nghiên cứu tại DeepSeek AI đã sử dụng một kỹ thuật gọi là học tăng cường (reinforcement learning). Cách tiếp cận thử và sai này, sử dụng phần thưởng cho các câu trả lời đúng, đã khuyến khích mô hình tự suy luận.

Mô hình DeepSeek R1 được đào tạo trên các bài toán toán học, lập trình và khoa học khó. Phần thưởng duy nhất mà nó nhận được là tín hiệu cho biết câu trả lời cuối cùng của nó là đúng. Trong quá trình đào tạo, các nhà nghiên cứu đã thấy nó phát triển các kỹ năng như tự kiểm tra công việc và khám phá các chiến lược khác nhau để tìm ra giải pháp. Nó thậm chí còn bắt đầu sử dụng các từ như "chờ đã" khi tự phản ánh về quá trình suy nghĩ của mình. Nếu một hướng đi dẫn đến câu trả lời đúng, chiến lược đó sẽ được củng cố. Nếu nó sai, mô hình sẽ học cách không lặp lại nó. Có một số sự can thiệp của con người, nhưng chỉ để trau dồi các kỹ năng của R1 sau này trong quá trình.

Kết quả thật ấn tượng. R1 hoạt động tốt hơn trong các nhiệm vụ toán học, lập trình và khoa học so với các mô hình cũ được đào tạo với sự hướng dẫn của con người. Một trong những kết quả đáng chú ý nhất là nó đã đạt được độ chính xác 86,7% trong Kỳ thi Toán học Mời gọi Hoa Kỳ (AIME) 2024, một cuộc thi toán khó dành cho những học sinh trung học thông minh nhất.

Ngay cả với những kết quả xuất sắc này, các nhà nghiên cứu thừa nhận mô hình của họ có một số hạn chế cần khắc phục. Ví dụ, đôi khi nó trộn lẫn các ngôn ngữ khi được đưa ra một lời nhắc không phải tiếng Anh và làm cho một số vấn đề đơn giản trở nên phức tạp hơn mức cần thiết. Nhưng một khi những vấn đề này được giải quyết, các nhà nghiên cứu tin rằng một mô hình AI có thể tự suy luận sẽ dẫn đến một kỷ nguyên mới của các mô hình có năng lực và tự chủ hơn./.

P.T.T (NASTIS), theo https://techxplore.com/news/, 2025

Ngày cập nhật: 03/11/2025

https://www.vista.gov.vn/vi/news/cac-linh-vuc-khoa-hoc-va-cong-nghe/mot-mo-hinh-ai-tu-hoc-cach-tu-duy-de-giai-quyet-van-de-khong-can-con-nguoi-12216.html

Các tin liên quan