DeepSeek bị nghi chi tới 1,6 tỷ USD để phát triển AI

DeepSeek bị nghi chi tới 1,6 tỷ USD để phát triển AI

Mới đây, công ty phân tích SemiAnalysis cho biết chi phí phát triển các mô hình AI của DeepSeek có thể lên tới 1,6 tỷ USD, thay vì mức dưới 6 triệu USD mà công ty này từng công bố.

Theo SemiAnalysis, chỉ riêng khoản đầu tư phần cứng của DeepSeek đã vượt 500 triệu USD, trong khi chi phí “5,6 triệu USD” mà DeepSeek nêu ra được cho là chỉ bao gồm khoản huấn luyện chính thức, chưa tính đến chi tiêu cho nghiên cứu, hạ tầng máy chủ, chuẩn bị dữ liệu và bảo trì.

Nhóm phân tích chỉ ra rằng DeepSeek có thể đã tiếp cận tới 10.000 GPU Nvidia H800 (bản hiệu năng giảm để tuân thủ lệnh cấm của Mỹ đối với Trung Quốc) và 10.000 GPU H100. Thậm chí, công ty còn được cho là sử dụng phiên bản H20 để đào tạo các mô hình. SemiAnalysis nhận định nguồn chip này được chia sẻ với quỹ đầu tư High-Flyer, đặt tại nhiều địa điểm khác nhau, phục vụ nhu cầu giao dịch, suy luận và nghiên cứu AI.

deepseek bi nghi chi toi 1 6 ty usd

Thời gian qua, DeepSeek nhiều lần đăng tuyển nhân lực AI, khẳng định “có thể truy cập 10.000 GPU không giới hạn,” đưa mức lương trên 1,3 triệu USD/năm cho các ứng viên tiềm năng. Một số chuyên gia nhìn nhận DeepSeek đạt được hiệu quả đào tạo mô hình AI với chi phí rẻ, nhưng nghi ngờ rằng con số dưới 6 triệu USD thực tế chỉ là một phần. Yann LeCun, Giám đốc AI của Meta, lưu ý rằng phần lớn chi tiêu tỷ USD của các công ty Mỹ là cho cơ sở hạ tầng suy luận, chứ không chỉ riêng việc huấn luyện.

Thomas Sohmers, nhà sáng lập Positron, đồng ý với LeCun rằng suy luận sẽ “ngốn” phần lớn chi phí trong tương lai, khi AI phải phục vụ lượng người dùng khổng lồ. Alexandr Wang, CEO Scale AI, thậm chí tiết lộ DeepSeek có thể sở hữu tới 50.000 chip Nvidia H100, nhưng không thể công khai do rào cản xuất khẩu của Mỹ. Elon Musk, nhà sáng lập xAI, cũng cho rằng “chuyện này khá rõ ràng.”

Về phía DeepSeek, công ty từng tuyên bố chi phí chính họ bỏ ra chủ yếu cho thuê máy chủ AI, trong khi chưa đề cập các khoản đầu tư vào nghiên cứu, thử nghiệm hay “chưng cất” (distillation) mô hình. DeepSeek được thành lập tháng 5.2023 do quỹ High-Flyer rót vốn, đặt trụ sở tại Hàng Châu, Trung Quốc, với phương châm xây dựng công nghệ nền tảng AI. Tuy nhiên, hiện công ty chưa đưa ra phản hồi chính thức về các cáo buộc và con số 1,6 tỷ USD nói trên.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *