Theo tin tức BlockBeats vào ngày 3 tháng 3, theo 1M AI News, các nhóm nghiên cứu từ Đại học Quản lý Singapore, Đại học Heidelberg, Đại học Bamberg và King’s College London đã xuất bản một bài báo trên arXiv, lần đầu tiên đánh giá định lượng tác động của hồ sơ cấp kho AGENTS.md đối với hiệu quả của các tác nhân lập trình AI. AGENTS.md là một tệp hướng dẫn được lưu trữ trong thư mục gốc của kho lưu trữ mã để giải thích kiến trúc dự án, lệnh xây dựng, thông số kỹ thuật mã hóa và các ràng buộc hoạt động đối với Tác nhân AI, tương tự như CLAUDE.md của Anthropic Claude Code và copilot-instructions.md của GitHub Copilot và đã được hơn 60.000 kho lưu trữ GitHub áp dụng.
Nhóm nghiên cứu đã tiến hành các thử nghiệm ghép nối bằng cách sử dụng OpenAI Codex (gpt-5.2-codex) trên 124 PR hợp nhất trên 10 kho lưu trữ (không có kho nào có hơn 100 dòng thay đổi mã), chạy trong cả hai điều kiện AGENTS.md. Kết quả cho thấy AGENTS.md thời gian chạy trung bình giảm từ 98,57 giây xuống 70,34 giây (giảm 28,64%) và mã thông báo đầu ra trung bình giảm từ 2.925 xuống 2.440 (giảm 16,58%) mà không có sự khác biệt đáng kể về hành vi hoàn thành nhiệm vụ (kiểm tra xếp hạng có chữ ký Wilcoxon, p). < 0.05)。
Các nhà nghiên cứu chỉ ra rằng AGENTS.md đã thay đổi hướng dẫn tác nhân từ “lời nhắc tạm thời” thành “cấu hình tạo tác được phiên bản, có thể xem xét và hợp tác duy trì”, và đề nghị các nhóm phát triển kết hợp nó vào kho lưu trữ như một thực tiễn tiêu chuẩn. Về hạn chế, nghiên cứu chỉ thử nghiệm tác nhân đơn lẻ OpenAI Codex và mẫu chỉ giới hạn ở PR quy mô nhỏ và không tiến hành đánh giá tính đúng đắn của mã toàn diện.