Phòng thí nghiệm Princeton AI^2 vừa thả một điều gì đó hoang dã — nhà nghiên cứu sau tiến sĩ của họ, Shilong Liu, đã quản lý để xây dựng lại toàn bộ hệ thống DeepSeek-OCR từ đầu. Điều đặc biệt? Hai tuần. Chỉ vậy thôi.
Để có bối cảnh, OCR (Nhận dạng Ký tự Quang học) thường mất nhiều tháng phát triển, hàng tấn dữ liệu huấn luyện và nhiều lần lặp lại để hoàn thiện. Phiên bản của DeepSeek được coi là một trong những triển khai tinh vi hơn có sẵn.
Điều làm cho điều này đặc biệt thú vị là tốc độ. Xây dựng lại một kiến trúc OCR phức tạp trong 14 ngày cho thấy hoặc là kỹ năng kỹ thuật xuất sắc, hoặc là mã nguồn nền tảng thực sự vững chắc, hoặc cả hai. Đó là loại chu kỳ phát triển nhanh chóng khiến bạn tự hỏi những thời gian "không thể" nào khác có thể thực sự khả thi với chuyên môn đúng.
Không gian nghiên cứu AI đang phát triển nhanh hơn hầu hết mọi người nhận ra. Khi các phòng thí nghiệm học thuật có thể sao chép các hệ thống tiên tiến nhanh như vậy, điều đó nói lên điều gì về mức độ dễ tiếp cận của những công nghệ này — và mức độ cạnh tranh của lĩnh vực này.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
11 thích
Phần thưởng
11
5
Đăng lại
Retweed
Bình luận
0/400
ChainSauceMaster
· 15giờ trước
Lại đến để cạnh tranh đúng không? Muốn khiến ai phải mệt mỏi?
Xem bản gốcTrả lời0
StakeWhisperer
· 15giờ trước
AI thực sự đang trở nên phổ biến.
Xem bản gốcTrả lời0
OnchainGossiper
· 15giờ trước
Hai tuần có thể sao chép lại cảm giác như hệ thống mà chưa nghe nói đến đều đang chờ được sao chép lại
Xem bản gốcTrả lời0
OnchainArchaeologist
· 15giờ trước
Mã sao chép dán hiệp hhh
Xem bản gốcTrả lời0
OffchainWinner
· 15giờ trước
Đây chẳng phải là phát triển ngược sao, có gì để khoe khoang chứ.
Phòng thí nghiệm Princeton AI^2 vừa thả một điều gì đó hoang dã — nhà nghiên cứu sau tiến sĩ của họ, Shilong Liu, đã quản lý để xây dựng lại toàn bộ hệ thống DeepSeek-OCR từ đầu. Điều đặc biệt? Hai tuần. Chỉ vậy thôi.
Để có bối cảnh, OCR (Nhận dạng Ký tự Quang học) thường mất nhiều tháng phát triển, hàng tấn dữ liệu huấn luyện và nhiều lần lặp lại để hoàn thiện. Phiên bản của DeepSeek được coi là một trong những triển khai tinh vi hơn có sẵn.
Điều làm cho điều này đặc biệt thú vị là tốc độ. Xây dựng lại một kiến trúc OCR phức tạp trong 14 ngày cho thấy hoặc là kỹ năng kỹ thuật xuất sắc, hoặc là mã nguồn nền tảng thực sự vững chắc, hoặc cả hai. Đó là loại chu kỳ phát triển nhanh chóng khiến bạn tự hỏi những thời gian "không thể" nào khác có thể thực sự khả thi với chuyên môn đúng.
Không gian nghiên cứu AI đang phát triển nhanh hơn hầu hết mọi người nhận ra. Khi các phòng thí nghiệm học thuật có thể sao chép các hệ thống tiên tiến nhanh như vậy, điều đó nói lên điều gì về mức độ dễ tiếp cận của những công nghệ này — và mức độ cạnh tranh của lĩnh vực này.