Páng Ruòmíng còn chưa kịp ngồi ấm chỗ tại Meta đã rời đi.
Tháng 7 năm 2025, Zuckerberg dùng một kế hoạch lương thưởng nhiều năm trị giá hơn 200 triệu USD để giành lấy kỹ sư Trung Quốc hàng đầu trong lĩnh vực hạ tầng AI từ Apple. Páng Ruòmíng được sắp xếp vào Phòng thí nghiệm Siêu trí tuệ của Meta, phụ trách xây dựng hạ tầng cho mô hình AI thế hệ tiếp theo.
Chỉ sau 7 tháng, OpenAI đã lôi kéo anh ấy đi.
Theo The Information, OpenAI đã tiến hành chiến dịch tuyển dụng kéo dài nhiều tháng đối với Páng Ruòmíng. Dù anh từng nói với đồng nghiệp “mình rất vui vẻ khi làm việc tại Meta”, cuối cùng anh vẫn chọn rời đi. Theo Bloomberg, kế hoạch lương của anh tại Meta liên quan đến các mốc thành tích, việc rời đi sớm đồng nghĩa từ bỏ phần lớn cổ phần chưa thực hiện.
200 triệu USD, không thể mua được lòng trung thành trong 7 tháng.
Đây không chỉ là câu chuyện chuyển việc đơn thuần.
Một người rời đi, một nhóm người gửi tín hiệu
Páng Ruòmíng không phải người đầu tiên ra đi.
Tuần trước, trưởng nhóm phát triển nền tảng sản phẩm Phòng thí nghiệm Siêu trí tuệ của Meta, Mat Velloso, cũng tuyên bố rời khỏi. Người này gia nhập Meta từ Google DeepMind vào tháng 7 năm ngoái, chưa đầy 8 tháng. Trước đó nữa, vào tháng 11 năm 2025, Yann LeCun, người đoạt giải Turing và là nhà khoa học chính về AI của Meta sau 12 năm gắn bó, đã tuyên bố rời đi để khởi nghiệp, theo đuổi “mô hình thế giới” mà anh luôn ủng hộ. Các học trò cưng của Geoffrey Hinton, Phó Chủ tịch nghiên cứu AI tạo sinh của Meta, Russ Salakhutdinov, cũng đã chính thức rời khỏi gần đây.
Để hiểu rõ về sự mất mát nhân tài của Meta AI, cần phải hiểu rõ Llama 4 đã gây tổn thương ra sao.
Tháng 4 năm 2025, Meta công bố rầm rộ dòng mô hình Scout và Maverick của Llama 4. Dữ liệu chính thức trên giấy tờ rất ấn tượng, tuyên bố vượt trội hoàn toàn trong các bài kiểm tra tiêu chuẩn như MATH-500 và GPQA Diamond, so sánh với GPT-4.5 và Claude Sonnet 3.7.
Tuy nhiên, mô hình chủ lực mang tham vọng của Meta này nhanh chóng bị “lộ diện” trong các thử nghiệm độc lập của cộng đồng mở, khả năng tổng quát và suy luận thực tế của nó đã sụt giảm rõ rệt so với quảng cáo. Trước những phản đối dữ dội từ cộng đồng, nhà khoa học chính Yann LeCun cuối cùng thừa nhận rằng, trong giai đoạn thử nghiệm, nhóm đã “sử dụng các phiên bản mô hình khác nhau để chạy các bộ dữ liệu khác nhau nhằm tối ưu điểm số cuối cùng”.
Trong giới học thuật và kỹ thuật AI nghiêm túc, điều này là một vi phạm không thể tha thứ. Nói cách khác, nhóm đã huấn luyện Llama 4 thành một “thợ làm đề thi cũ” chứ không phải một “thành viên ưu tú” sở hữu trí tuệ tiên tiến. Chấm toán thì cho xem đề toán, chấm lập trình thì cho xem đề lập trình, mỗi bài kiểm tra đều rất mạnh, nhưng thực ra đó không phải là cùng một mô hình.
Trong giới học thuật AI, việc này gọi là “hái cherry” (lấy quả anh đào), còn trong giáo dục thi cử gọi là “thi hộ”.
Đối với Meta, tự hào là “ngọn đèn dẫn đường mở nguồn”, vụ bê bối này đã trực tiếp phá hủy niềm tin quý giá nhất trong hệ sinh thái nhà phát triển của họ. Hệ quả trực tiếp là, Zuckerberg hoàn toàn mất niềm tin vào nguyên tắc kỹ thuật của đội ngũ GenAI ban đầu, từ đó mở ra làn sóng bổ nhiệm các quản lý cấp cao mới, thậm chí là lật đổ các bộ phận hạ tầng cốt lõi.
Ông đã chi từ 14,3 đến 15 tỷ USD để mua 49% cổ phần của công ty dữ liệu Scale AI, cử CEO 28 tuổi của Scale AI, Alexandr Wang, về làm Giám đốc AI của Meta, thành lập Phòng thí nghiệm Siêu trí tuệ Meta (MSL). LeCun, người đoạt giải Turing, phải báo cáo trực tiếp cho người trẻ tuổi này trong cấu trúc mới. Tháng 10, Meta cắt giảm khoảng 600 vị trí trong MSL, bao gồm cả các thành viên của bộ phận nghiên cứu FAIR do LeCun sáng lập.
Dòng mô hình chủ lực dự kiến ra mắt mùa hè 2025, Llama 4 Behemoth, cũng bị trì hoãn liên tục, từ mùa hè sang mùa thu, rồi cuối cùng bị hoãn vô thời hạn.
Meta chuyển sang phát triển dòng mô hình văn bản thế hệ mới mang mã “Avocado” và mô hình hình ảnh/video mang mã “Mango”. Theo báo cáo, mục tiêu của Avocado là cạnh tranh với GPT-5 và Gemini 3 Ultra. Dự kiến bàn giao cuối năm 2025, nhưng do không đạt tiêu chuẩn về hiệu năng và tối ưu huấn luyện, bị hoãn đến quý 1 năm 2026. Meta đang xem xét phát hành mã nguồn đóng, từ bỏ truyền thống mở nguồn của dòng Llama.
Meta mắc hai sai lầm chết người trong các mô hình AI. Thứ nhất là gian lận benchmark, trực tiếp phá hủy niềm tin của cộng đồng nhà phát triển; thứ hai là đưa các bộ phận nghiên cứu cơ bản như FAIR, vốn cần mười năm rèn giũa, vào trong tổ chức sản phẩm chỉ chú trọng KPI hàng quý. Cả hai đều là nguyên nhân chính dẫn đến mất nhân tài hiện nay.
Chíp tự phát triển: Một chân bị đứt
Nhân tài chạy, chíp cũng gặp vấn đề.
Theo The Information, Meta tuần trước đã cắt bỏ dự án phát triển chip huấn luyện AI tiên tiến nhất của họ.
Kế hoạch chip tự phát triển của Meta gọi là MTIA (Meta Training and Inference Accelerator). Ban đầu, công ty đặt mục tiêu rất tham vọng: các phiên bản v4 mã “Santa Barbara”, v5 mã “Olympus”, v6 mã “Universal Core” dự kiến lần lượt ra mắt từ 2026 đến 2028. Trong đó Olympus được thiết kế là chip dựa trên kiến trúc chiplet 2nm đầu tiên của Meta, nhằm bao phủ cả huấn luyện mô hình cao cấp lẫn suy luận thời gian thực, cuối cùng thay thế vị trí của Nvidia trong các cụm huấn luyện của Meta.
Hiện tại, dự án chip huấn luyện tiên tiến nhất này đã bị cắt bỏ.
Meta không hoàn toàn không có tiến bộ, chip MTIA trong lĩnh vực suy luận đã có một số thành quả. Chip suy luận MTIA v3 mã “Iris” đã được triển khai quy mô lớn trong trung tâm dữ liệu của Meta, chủ yếu dùng cho hệ thống đề xuất Facebook Reels và Instagram, được cho là giảm 40-44% tổng chi phí vận hành. Nhưng suy luận và huấn luyện là hai chuyện khác nhau. Suy luận là chạy mô hình, huấn luyện là rèn mô hình. Meta có thể tự làm chip suy luận, nhưng không thể tạo ra chip huấn luyện đủ sức cạnh tranh trực tiếp với Nvidia.
Lịch sử không phải lần đầu tiên. Năm 2022, Meta từng thử tự phát triển chip suy luận, thất bại trong triển khai quy mô nhỏ rồi bỏ cuộc, chuyển sang đặt hàng lớn Nvidia.
Thất bại trong tự phát triển chip đã thúc đẩy Meta đẩy mạnh mua ngoài.
Mua sắm hoảng loạn 135 tỷ USD
Tháng 1 năm 2026, Meta công bố ngân sách chi tiêu vốn trong năm là từ 1150 đến 1350 tỷ USD, gần gấp đôi năm ngoái 722 tỷ USD. Phần lớn số tiền này sẽ dành cho chip.
Trong vòng 10 ngày, liên tiếp có ba hợp đồng lớn:
Ngày 17 tháng 2, Meta ký hợp đồng hợp tác chiến lược nhiều năm, nhiều thế hệ với Nvidia. Meta sẽ triển khai “hàng triệu” GPU Blackwell và thế hệ mới Vera Rubin của Nvidia, cùng CPU độc lập Grace. Các nhà phân tích ước tính quy mô giao dịch lên tới hàng trăm tỷ USD, Meta trở thành khách hàng siêu máy tính đầu tiên trên thế giới triển khai quy mô lớn CPU Grace của Nvidia.
Ngày 24 tháng 2, Meta ký hợp đồng nhiều năm trị giá từ 600 đến 1000 tỷ USD với AMD. Meta sẽ mua các GPU dòng MI450 mới nhất của AMD và CPU EPYC thế hệ thứ sáu. Trong khuôn khổ giao dịch, AMD phát hành cho Meta quyền mua 1,6 tỷ cổ phiếu phổ thông, tương đương khoảng 10% cổ phần của AMD, với giá 0,01 USD/cổ phiếu, phân bổ theo các mốc giao hàng.
Ngày 26 tháng 2, theo The Information, Meta ký hợp đồng nhiều năm trị giá hàng tỷ USD với Google, thuê các chip TPU của Google Cloud để huấn luyện và vận hành mô hình ngôn ngữ lớn thế hệ tiếp theo của họ. Đồng thời, hai bên còn đang thảo luận về việc Meta sẽ mua trực tiếp các TPU để triển khai trong trung tâm dữ liệu của chính họ từ năm 2027.
Một công ty mạng xã hội, trong vòng 10 ngày, đã đặt hàng cùng lúc từ ba nhà cung cấp chip với tổng giá trị có thể vượt quá nghìn tỷ USD.
Đây không phải là đa dạng hóa chiến lược. Đây là mua theo kiểu hoảng loạn.
Ba tầng lý luận về lo lắng về năng lực tính toán
Tại sao Meta lại vội vàng như vậy?
Thứ nhất, không thể trông chờ vào chip tự phát triển. Dự án chip huấn luyện tiên tiến nhất bị cắt bỏ, nghĩa là trong tương lai gần, Meta chỉ còn cách dựa vào mua ngoài để đáp ứng nhu cầu huấn luyện AI. Trong lĩnh vực suy luận, chip MTIA có thể xử lý các hệ thống đề xuất như Reels, nhưng để huấn luyện các mô hình đỉnh cao như Avocado, cạnh tranh với GPT-5, cần phải dùng phần cứng của Nvidia hoặc tương đương.
Thứ hai, đối thủ cạnh tranh không chờ đợi. OpenAI đã huy động được nguồn lực khổng lồ từ Microsoft, SoftBank, quỹ đầu tư nhà nước Các Tiểu Vương quốc Ả Rập Thống Nhất. Anthropic đã khóa 100 vạn TPU của Google và Amazon, cùng với Trainium. Gemini 3 của Google đã hoàn tất huấn luyện trên TPU. Nếu Meta không có đủ sức mạnh tính toán, họ sẽ không thể giữ vững vị trí trong cuộc đua.
Thứ ba, có thể là nguyên nhân sâu xa nhất, là Zuckerberg cần dùng “khả năng mua sắm” để bù đắp cho “khả năng nghiên cứu phát triển”. Thất bại của Llama 4, mất nhân tài chủ chốt, thất bại của chip tự phát triển, tất cả cộng lại khiến câu chuyện AI của Meta trên Wall Street trở nên mong manh. Việc ký hợp đồng lớn với Nvidia, AMD, Google ít nhất gửi đi một tín hiệu: chúng tôi có tiền, chúng tôi đang mua, chúng tôi không từ bỏ.
Chiến lược hiện tại của Meta là, không thể làm phần mềm thì mua phần cứng, không giữ chân được người thì mua chip. Nhưng cuộc đua AI không phải chỉ dựa vào ký hợp đồng. Năng lực tính toán là điều kiện cần, chứ không phải đủ. Không có đội ngũ mô hình hàng đầu và lộ trình công nghệ rõ ràng, nhiều chip cũng chỉ là hàng tồn kho đắt đỏ.
Khó khăn của người mua
Nhìn lại ba hợp đồng của Meta trong tháng 2, có một chi tiết thú vị mà phần lớn mọi người bỏ qua.
Meta mua của Nvidia các GPU hiện tại là Blackwell và tương lai là Vera Rubin; với AMD, mua MI450 và dự kiến mua MI455X trong tương lai; thuê của Google TPU hiện tại, dự kiến mua trực tiếp trong năm tới.
Ba nhà cung cấp, ba kiến trúc phần cứng và hệ sinh thái phần mềm hoàn toàn khác nhau.
Điều này có nghĩa là Meta phải liên tục chuyển đổi giữa CUDA của Nvidia, ROCm của AMD và XLA/JAX của Google. Chiến lược đa nhà cung cấp giúp phân tán rủi ro chuỗi cung ứng, giảm giá phần cứng, nhưng lại làm tăng độ phức tạp kỹ thuật theo cấp số nhân.
Đây chính là điểm yếu chết người của Meta hiện nay. Để một mô hình hàng tỷ tham số có thể huấn luyện hiệu quả trên ba nền tảng phần cứng khác nhau này, cần không chỉ kỹ sư biết CUDA, mà còn cần kiến trúc sư có thể xây dựng khung huấn luyện đa nền tảng từ đầu.
Người như vậy trên thế giới có thể chưa đến 100 người. Páng Ruòmíng là một trong số đó.
Chi 1000 tỷ USD để mua bộ phần cứng phức tạp nhất thế giới, nhưng lại mất đi bộ não có thể vận hành chúng, đó chính là hình ảnh kỳ quặc nhất trong cuộc chơi cược lớn của Zuckerberg.
Cược của Zuckerberg
Nhìn xa hơn, trong 18 tháng qua, chiến lược AI của Zuckerberg rất giống với con đường “All In” vào Metaverse trước đây:
Nhận thấy xu hướng, đổ tiền lớn, tuyển dụng mạnh, gặp thất bại, chuyển hướng chiến lược, rồi lại đổ tiền lớn.
Từ 2021 đến 2023 là thời kỳ Metaverse, kết quả là mỗi năm lỗ hàng trăm tỷ USD, cổ phiếu từ 380 USD giảm còn 88 USD. Từ 2024 đến 2026 là AI, cũng là đổ tiền không tiếc, tổ chức lại liên tục, cũng là câu chuyện “tin tôi, tôi có tầm nhìn”.
Điểm khác biệt là, lần này, làn sóng AI thực sự rõ ràng hơn nhiều so với Metaverse. Meta có tiền để đốt, doanh thu quảng cáo tạo ra dòng tiền dồi dào, quý 4 năm 2025, doanh thu của Meta đạt 599 tỷ USD, tăng 24% so với cùng kỳ.
Vấn đề là: tiền có thể mua chip, mua năng lực tính toán, thậm chí mua người ngồi trong chỗ làm việc, nhưng không thể mua người ở lại.
Cược của Zuckerberg hiện tại là, chỉ cần mua đủ chip, xây dựng đủ trung tâm dữ liệu, chi đủ tiền, chắc chắn sẽ tìm hoặc đào tạo ra người có thể vận hành các nguồn lực đó.
Cược này có thể thành công. Meta là một trong những công ty công nghệ giàu nhất thế giới, dòng tiền hoạt động hơn 100 tỷ USD là hàng rào vững chắc nhất của họ. Từ OpenAI đến Anthropic, từ Google đến các đối thủ cạnh tranh khác, Meta liên tục tuyển dụng nhân tài. Theo báo cáo của Quantum, trong đội ngũ siêu trí tuệ của Meta, 44 người, gần 40% đến từ OpenAI.
Nhưng tính khốc liệt của cuộc đua AI là, năng lực tính toán, danh sách nhân tài, thành tích mô hình đều công khai rõ ràng. Sự gian lận benchmark của Llama 4 đã chứng minh rằng, trong ngành này, bạn không thể duy trì vị thế dẫn đầu chỉ bằng PPT và PR.
Thị trường cuối cùng chỉ chấp nhận một điều: mô hình của bạn đủ tốt hay không.
Vị trí trong chuỗi thức ăn
Cuộc đua vũ khí AI bước vào năm 2026, thứ tự trong chuỗi thức ăn đã rõ ràng sơ bộ:
Ở đỉnh là OpenAI và Google. OpenAI có mô hình mạnh nhất, lượng người dùng lớn nhất và nguồn vốn đầu tư mạnh mẽ nhất. Google có hệ sinh thái tích hợp hoàn chỉnh: chip tự phát triển, mô hình tự phát triển, hạ tầng đám mây tự phát triển. Anthropic theo sát, dựa vào sức mạnh của mô hình Claude và nguồn lực của Google, Amazon, đứng trong nhóm hàng đầu.
Còn Meta? Nó đã bỏ ra nhiều nhất, ký nhiều hợp đồng chip nhất, tổ chức nhiều lần tái cấu trúc nhất, nhưng đến nay vẫn chưa trình ra được mô hình tiên tiến đủ thuyết phục thị trường.
Câu chuyện AI của Meta có phần giống Yahoo năm 2005. Thời đó Yahoo cũng là một trong những công ty giàu nhất internet, cũng liên tục mua sắm, đổ tiền, nhưng không thể tạo ra công cụ tìm kiếm như Google. Tiền không phải là tất cả. Zuckerberg cần phải rõ ràng hơn về mục tiêu của Meta trong AI, chứ không phải cứ thấy hot là mua.
Dĩ nhiên, việc viết bài tiểu sử cho Meta còn quá sớm. Với 3,58 tỷ người dùng hoạt động hàng tháng, doanh thu quý 599 tỷ USD, bộ dữ liệu xã hội lớn nhất thế giới, đó là những tài sản mà bất kỳ đối thủ nào cũng khó sao chép.
Nếu dòng mô hình mới mang mã “Avocado” có thể đúng hạn ra mắt năm 2026 và trở lại nhóm dẫn đầu, thì mọi khoản tiền đổ vào và tái cấu trúc của Zuckerberg sẽ được xem như “chiến lược quyết đoán cứu vãn tình thế”. Nhưng nếu không đạt kỳ vọng, thì số tiền 1350 tỷ USD này chỉ còn là những kho chứa silicon nóng bỏng, sáng đèn.
Dù sao, cuộc đua vũ khí AI ở Silicon Valley chưa từng thiếu những nhà mua hàng siêu giàu vung tiền. Điều thiếu là những người biết cách dùng sức mạnh tính toán đó để tạo ra tương lai.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Meta:Mua được hàng nghìn tỷ sức mạnh tính toán, không giữ được nhân tố then chốt
Viết bài: Ada, Deep Tide TechFlow
Páng Ruòmíng còn chưa kịp ngồi ấm chỗ tại Meta đã rời đi.
Tháng 7 năm 2025, Zuckerberg dùng một kế hoạch lương thưởng nhiều năm trị giá hơn 200 triệu USD để giành lấy kỹ sư Trung Quốc hàng đầu trong lĩnh vực hạ tầng AI từ Apple. Páng Ruòmíng được sắp xếp vào Phòng thí nghiệm Siêu trí tuệ của Meta, phụ trách xây dựng hạ tầng cho mô hình AI thế hệ tiếp theo.
Chỉ sau 7 tháng, OpenAI đã lôi kéo anh ấy đi.
Theo The Information, OpenAI đã tiến hành chiến dịch tuyển dụng kéo dài nhiều tháng đối với Páng Ruòmíng. Dù anh từng nói với đồng nghiệp “mình rất vui vẻ khi làm việc tại Meta”, cuối cùng anh vẫn chọn rời đi. Theo Bloomberg, kế hoạch lương của anh tại Meta liên quan đến các mốc thành tích, việc rời đi sớm đồng nghĩa từ bỏ phần lớn cổ phần chưa thực hiện.
200 triệu USD, không thể mua được lòng trung thành trong 7 tháng.
Đây không chỉ là câu chuyện chuyển việc đơn thuần.
Một người rời đi, một nhóm người gửi tín hiệu
Páng Ruòmíng không phải người đầu tiên ra đi.
Tuần trước, trưởng nhóm phát triển nền tảng sản phẩm Phòng thí nghiệm Siêu trí tuệ của Meta, Mat Velloso, cũng tuyên bố rời khỏi. Người này gia nhập Meta từ Google DeepMind vào tháng 7 năm ngoái, chưa đầy 8 tháng. Trước đó nữa, vào tháng 11 năm 2025, Yann LeCun, người đoạt giải Turing và là nhà khoa học chính về AI của Meta sau 12 năm gắn bó, đã tuyên bố rời đi để khởi nghiệp, theo đuổi “mô hình thế giới” mà anh luôn ủng hộ. Các học trò cưng của Geoffrey Hinton, Phó Chủ tịch nghiên cứu AI tạo sinh của Meta, Russ Salakhutdinov, cũng đã chính thức rời khỏi gần đây.
Để hiểu rõ về sự mất mát nhân tài của Meta AI, cần phải hiểu rõ Llama 4 đã gây tổn thương ra sao.
Tháng 4 năm 2025, Meta công bố rầm rộ dòng mô hình Scout và Maverick của Llama 4. Dữ liệu chính thức trên giấy tờ rất ấn tượng, tuyên bố vượt trội hoàn toàn trong các bài kiểm tra tiêu chuẩn như MATH-500 và GPQA Diamond, so sánh với GPT-4.5 và Claude Sonnet 3.7.
Tuy nhiên, mô hình chủ lực mang tham vọng của Meta này nhanh chóng bị “lộ diện” trong các thử nghiệm độc lập của cộng đồng mở, khả năng tổng quát và suy luận thực tế của nó đã sụt giảm rõ rệt so với quảng cáo. Trước những phản đối dữ dội từ cộng đồng, nhà khoa học chính Yann LeCun cuối cùng thừa nhận rằng, trong giai đoạn thử nghiệm, nhóm đã “sử dụng các phiên bản mô hình khác nhau để chạy các bộ dữ liệu khác nhau nhằm tối ưu điểm số cuối cùng”.
Trong giới học thuật và kỹ thuật AI nghiêm túc, điều này là một vi phạm không thể tha thứ. Nói cách khác, nhóm đã huấn luyện Llama 4 thành một “thợ làm đề thi cũ” chứ không phải một “thành viên ưu tú” sở hữu trí tuệ tiên tiến. Chấm toán thì cho xem đề toán, chấm lập trình thì cho xem đề lập trình, mỗi bài kiểm tra đều rất mạnh, nhưng thực ra đó không phải là cùng một mô hình.
Trong giới học thuật AI, việc này gọi là “hái cherry” (lấy quả anh đào), còn trong giáo dục thi cử gọi là “thi hộ”.
Đối với Meta, tự hào là “ngọn đèn dẫn đường mở nguồn”, vụ bê bối này đã trực tiếp phá hủy niềm tin quý giá nhất trong hệ sinh thái nhà phát triển của họ. Hệ quả trực tiếp là, Zuckerberg hoàn toàn mất niềm tin vào nguyên tắc kỹ thuật của đội ngũ GenAI ban đầu, từ đó mở ra làn sóng bổ nhiệm các quản lý cấp cao mới, thậm chí là lật đổ các bộ phận hạ tầng cốt lõi.
Ông đã chi từ 14,3 đến 15 tỷ USD để mua 49% cổ phần của công ty dữ liệu Scale AI, cử CEO 28 tuổi của Scale AI, Alexandr Wang, về làm Giám đốc AI của Meta, thành lập Phòng thí nghiệm Siêu trí tuệ Meta (MSL). LeCun, người đoạt giải Turing, phải báo cáo trực tiếp cho người trẻ tuổi này trong cấu trúc mới. Tháng 10, Meta cắt giảm khoảng 600 vị trí trong MSL, bao gồm cả các thành viên của bộ phận nghiên cứu FAIR do LeCun sáng lập.
Dòng mô hình chủ lực dự kiến ra mắt mùa hè 2025, Llama 4 Behemoth, cũng bị trì hoãn liên tục, từ mùa hè sang mùa thu, rồi cuối cùng bị hoãn vô thời hạn.
Meta chuyển sang phát triển dòng mô hình văn bản thế hệ mới mang mã “Avocado” và mô hình hình ảnh/video mang mã “Mango”. Theo báo cáo, mục tiêu của Avocado là cạnh tranh với GPT-5 và Gemini 3 Ultra. Dự kiến bàn giao cuối năm 2025, nhưng do không đạt tiêu chuẩn về hiệu năng và tối ưu huấn luyện, bị hoãn đến quý 1 năm 2026. Meta đang xem xét phát hành mã nguồn đóng, từ bỏ truyền thống mở nguồn của dòng Llama.
Meta mắc hai sai lầm chết người trong các mô hình AI. Thứ nhất là gian lận benchmark, trực tiếp phá hủy niềm tin của cộng đồng nhà phát triển; thứ hai là đưa các bộ phận nghiên cứu cơ bản như FAIR, vốn cần mười năm rèn giũa, vào trong tổ chức sản phẩm chỉ chú trọng KPI hàng quý. Cả hai đều là nguyên nhân chính dẫn đến mất nhân tài hiện nay.
Chíp tự phát triển: Một chân bị đứt
Nhân tài chạy, chíp cũng gặp vấn đề.
Theo The Information, Meta tuần trước đã cắt bỏ dự án phát triển chip huấn luyện AI tiên tiến nhất của họ.
Kế hoạch chip tự phát triển của Meta gọi là MTIA (Meta Training and Inference Accelerator). Ban đầu, công ty đặt mục tiêu rất tham vọng: các phiên bản v4 mã “Santa Barbara”, v5 mã “Olympus”, v6 mã “Universal Core” dự kiến lần lượt ra mắt từ 2026 đến 2028. Trong đó Olympus được thiết kế là chip dựa trên kiến trúc chiplet 2nm đầu tiên của Meta, nhằm bao phủ cả huấn luyện mô hình cao cấp lẫn suy luận thời gian thực, cuối cùng thay thế vị trí của Nvidia trong các cụm huấn luyện của Meta.
Hiện tại, dự án chip huấn luyện tiên tiến nhất này đã bị cắt bỏ.
Meta không hoàn toàn không có tiến bộ, chip MTIA trong lĩnh vực suy luận đã có một số thành quả. Chip suy luận MTIA v3 mã “Iris” đã được triển khai quy mô lớn trong trung tâm dữ liệu của Meta, chủ yếu dùng cho hệ thống đề xuất Facebook Reels và Instagram, được cho là giảm 40-44% tổng chi phí vận hành. Nhưng suy luận và huấn luyện là hai chuyện khác nhau. Suy luận là chạy mô hình, huấn luyện là rèn mô hình. Meta có thể tự làm chip suy luận, nhưng không thể tạo ra chip huấn luyện đủ sức cạnh tranh trực tiếp với Nvidia.
Lịch sử không phải lần đầu tiên. Năm 2022, Meta từng thử tự phát triển chip suy luận, thất bại trong triển khai quy mô nhỏ rồi bỏ cuộc, chuyển sang đặt hàng lớn Nvidia.
Thất bại trong tự phát triển chip đã thúc đẩy Meta đẩy mạnh mua ngoài.
Mua sắm hoảng loạn 135 tỷ USD
Tháng 1 năm 2026, Meta công bố ngân sách chi tiêu vốn trong năm là từ 1150 đến 1350 tỷ USD, gần gấp đôi năm ngoái 722 tỷ USD. Phần lớn số tiền này sẽ dành cho chip.
Trong vòng 10 ngày, liên tiếp có ba hợp đồng lớn:
Ngày 17 tháng 2, Meta ký hợp đồng hợp tác chiến lược nhiều năm, nhiều thế hệ với Nvidia. Meta sẽ triển khai “hàng triệu” GPU Blackwell và thế hệ mới Vera Rubin của Nvidia, cùng CPU độc lập Grace. Các nhà phân tích ước tính quy mô giao dịch lên tới hàng trăm tỷ USD, Meta trở thành khách hàng siêu máy tính đầu tiên trên thế giới triển khai quy mô lớn CPU Grace của Nvidia.
Ngày 24 tháng 2, Meta ký hợp đồng nhiều năm trị giá từ 600 đến 1000 tỷ USD với AMD. Meta sẽ mua các GPU dòng MI450 mới nhất của AMD và CPU EPYC thế hệ thứ sáu. Trong khuôn khổ giao dịch, AMD phát hành cho Meta quyền mua 1,6 tỷ cổ phiếu phổ thông, tương đương khoảng 10% cổ phần của AMD, với giá 0,01 USD/cổ phiếu, phân bổ theo các mốc giao hàng.
Ngày 26 tháng 2, theo The Information, Meta ký hợp đồng nhiều năm trị giá hàng tỷ USD với Google, thuê các chip TPU của Google Cloud để huấn luyện và vận hành mô hình ngôn ngữ lớn thế hệ tiếp theo của họ. Đồng thời, hai bên còn đang thảo luận về việc Meta sẽ mua trực tiếp các TPU để triển khai trong trung tâm dữ liệu của chính họ từ năm 2027.
Một công ty mạng xã hội, trong vòng 10 ngày, đã đặt hàng cùng lúc từ ba nhà cung cấp chip với tổng giá trị có thể vượt quá nghìn tỷ USD.
Đây không phải là đa dạng hóa chiến lược. Đây là mua theo kiểu hoảng loạn.
Ba tầng lý luận về lo lắng về năng lực tính toán
Tại sao Meta lại vội vàng như vậy?
Thứ nhất, không thể trông chờ vào chip tự phát triển. Dự án chip huấn luyện tiên tiến nhất bị cắt bỏ, nghĩa là trong tương lai gần, Meta chỉ còn cách dựa vào mua ngoài để đáp ứng nhu cầu huấn luyện AI. Trong lĩnh vực suy luận, chip MTIA có thể xử lý các hệ thống đề xuất như Reels, nhưng để huấn luyện các mô hình đỉnh cao như Avocado, cạnh tranh với GPT-5, cần phải dùng phần cứng của Nvidia hoặc tương đương.
Thứ hai, đối thủ cạnh tranh không chờ đợi. OpenAI đã huy động được nguồn lực khổng lồ từ Microsoft, SoftBank, quỹ đầu tư nhà nước Các Tiểu Vương quốc Ả Rập Thống Nhất. Anthropic đã khóa 100 vạn TPU của Google và Amazon, cùng với Trainium. Gemini 3 của Google đã hoàn tất huấn luyện trên TPU. Nếu Meta không có đủ sức mạnh tính toán, họ sẽ không thể giữ vững vị trí trong cuộc đua.
Thứ ba, có thể là nguyên nhân sâu xa nhất, là Zuckerberg cần dùng “khả năng mua sắm” để bù đắp cho “khả năng nghiên cứu phát triển”. Thất bại của Llama 4, mất nhân tài chủ chốt, thất bại của chip tự phát triển, tất cả cộng lại khiến câu chuyện AI của Meta trên Wall Street trở nên mong manh. Việc ký hợp đồng lớn với Nvidia, AMD, Google ít nhất gửi đi một tín hiệu: chúng tôi có tiền, chúng tôi đang mua, chúng tôi không từ bỏ.
Chiến lược hiện tại của Meta là, không thể làm phần mềm thì mua phần cứng, không giữ chân được người thì mua chip. Nhưng cuộc đua AI không phải chỉ dựa vào ký hợp đồng. Năng lực tính toán là điều kiện cần, chứ không phải đủ. Không có đội ngũ mô hình hàng đầu và lộ trình công nghệ rõ ràng, nhiều chip cũng chỉ là hàng tồn kho đắt đỏ.
Khó khăn của người mua
Nhìn lại ba hợp đồng của Meta trong tháng 2, có một chi tiết thú vị mà phần lớn mọi người bỏ qua.
Meta mua của Nvidia các GPU hiện tại là Blackwell và tương lai là Vera Rubin; với AMD, mua MI450 và dự kiến mua MI455X trong tương lai; thuê của Google TPU hiện tại, dự kiến mua trực tiếp trong năm tới.
Ba nhà cung cấp, ba kiến trúc phần cứng và hệ sinh thái phần mềm hoàn toàn khác nhau.
Điều này có nghĩa là Meta phải liên tục chuyển đổi giữa CUDA của Nvidia, ROCm của AMD và XLA/JAX của Google. Chiến lược đa nhà cung cấp giúp phân tán rủi ro chuỗi cung ứng, giảm giá phần cứng, nhưng lại làm tăng độ phức tạp kỹ thuật theo cấp số nhân.
Đây chính là điểm yếu chết người của Meta hiện nay. Để một mô hình hàng tỷ tham số có thể huấn luyện hiệu quả trên ba nền tảng phần cứng khác nhau này, cần không chỉ kỹ sư biết CUDA, mà còn cần kiến trúc sư có thể xây dựng khung huấn luyện đa nền tảng từ đầu.
Người như vậy trên thế giới có thể chưa đến 100 người. Páng Ruòmíng là một trong số đó.
Chi 1000 tỷ USD để mua bộ phần cứng phức tạp nhất thế giới, nhưng lại mất đi bộ não có thể vận hành chúng, đó chính là hình ảnh kỳ quặc nhất trong cuộc chơi cược lớn của Zuckerberg.
Cược của Zuckerberg
Nhìn xa hơn, trong 18 tháng qua, chiến lược AI của Zuckerberg rất giống với con đường “All In” vào Metaverse trước đây:
Nhận thấy xu hướng, đổ tiền lớn, tuyển dụng mạnh, gặp thất bại, chuyển hướng chiến lược, rồi lại đổ tiền lớn.
Từ 2021 đến 2023 là thời kỳ Metaverse, kết quả là mỗi năm lỗ hàng trăm tỷ USD, cổ phiếu từ 380 USD giảm còn 88 USD. Từ 2024 đến 2026 là AI, cũng là đổ tiền không tiếc, tổ chức lại liên tục, cũng là câu chuyện “tin tôi, tôi có tầm nhìn”.
Điểm khác biệt là, lần này, làn sóng AI thực sự rõ ràng hơn nhiều so với Metaverse. Meta có tiền để đốt, doanh thu quảng cáo tạo ra dòng tiền dồi dào, quý 4 năm 2025, doanh thu của Meta đạt 599 tỷ USD, tăng 24% so với cùng kỳ.
Vấn đề là: tiền có thể mua chip, mua năng lực tính toán, thậm chí mua người ngồi trong chỗ làm việc, nhưng không thể mua người ở lại.
Páng Ruòmíng chọn OpenAI, Russ Salakhutdinov chọn rời đi, LeCun chọn khởi nghiệp.
Cược của Zuckerberg hiện tại là, chỉ cần mua đủ chip, xây dựng đủ trung tâm dữ liệu, chi đủ tiền, chắc chắn sẽ tìm hoặc đào tạo ra người có thể vận hành các nguồn lực đó.
Cược này có thể thành công. Meta là một trong những công ty công nghệ giàu nhất thế giới, dòng tiền hoạt động hơn 100 tỷ USD là hàng rào vững chắc nhất của họ. Từ OpenAI đến Anthropic, từ Google đến các đối thủ cạnh tranh khác, Meta liên tục tuyển dụng nhân tài. Theo báo cáo của Quantum, trong đội ngũ siêu trí tuệ của Meta, 44 người, gần 40% đến từ OpenAI.
Nhưng tính khốc liệt của cuộc đua AI là, năng lực tính toán, danh sách nhân tài, thành tích mô hình đều công khai rõ ràng. Sự gian lận benchmark của Llama 4 đã chứng minh rằng, trong ngành này, bạn không thể duy trì vị thế dẫn đầu chỉ bằng PPT và PR.
Thị trường cuối cùng chỉ chấp nhận một điều: mô hình của bạn đủ tốt hay không.
Vị trí trong chuỗi thức ăn
Cuộc đua vũ khí AI bước vào năm 2026, thứ tự trong chuỗi thức ăn đã rõ ràng sơ bộ:
Ở đỉnh là OpenAI và Google. OpenAI có mô hình mạnh nhất, lượng người dùng lớn nhất và nguồn vốn đầu tư mạnh mẽ nhất. Google có hệ sinh thái tích hợp hoàn chỉnh: chip tự phát triển, mô hình tự phát triển, hạ tầng đám mây tự phát triển. Anthropic theo sát, dựa vào sức mạnh của mô hình Claude và nguồn lực của Google, Amazon, đứng trong nhóm hàng đầu.
Còn Meta? Nó đã bỏ ra nhiều nhất, ký nhiều hợp đồng chip nhất, tổ chức nhiều lần tái cấu trúc nhất, nhưng đến nay vẫn chưa trình ra được mô hình tiên tiến đủ thuyết phục thị trường.
Câu chuyện AI của Meta có phần giống Yahoo năm 2005. Thời đó Yahoo cũng là một trong những công ty giàu nhất internet, cũng liên tục mua sắm, đổ tiền, nhưng không thể tạo ra công cụ tìm kiếm như Google. Tiền không phải là tất cả. Zuckerberg cần phải rõ ràng hơn về mục tiêu của Meta trong AI, chứ không phải cứ thấy hot là mua.
Dĩ nhiên, việc viết bài tiểu sử cho Meta còn quá sớm. Với 3,58 tỷ người dùng hoạt động hàng tháng, doanh thu quý 599 tỷ USD, bộ dữ liệu xã hội lớn nhất thế giới, đó là những tài sản mà bất kỳ đối thủ nào cũng khó sao chép.
Nếu dòng mô hình mới mang mã “Avocado” có thể đúng hạn ra mắt năm 2026 và trở lại nhóm dẫn đầu, thì mọi khoản tiền đổ vào và tái cấu trúc của Zuckerberg sẽ được xem như “chiến lược quyết đoán cứu vãn tình thế”. Nhưng nếu không đạt kỳ vọng, thì số tiền 1350 tỷ USD này chỉ còn là những kho chứa silicon nóng bỏng, sáng đèn.
Dù sao, cuộc đua vũ khí AI ở Silicon Valley chưa từng thiếu những nhà mua hàng siêu giàu vung tiền. Điều thiếu là những người biết cách dùng sức mạnh tính toán đó để tạo ra tương lai.