Nvidia ra mắt chip AI Blackwell rẻ hơn cho Trung Quốc sau hạn chế xuất khẩu của Mỹ

Diệu Linh
Junior Editor
Nvidia sẽ ra mắt một chipset trí tuệ nhân tạo mới cho Trung Quốc với giá thấp hơn đáng kể so với mẫu H20 bị hạn chế gần đây và có kế hoạch bắt đầu sản xuất hàng loạt sớm nhất là vào tháng 6.

Bộ xử lý đồ họa (GPU) sẽ là một phần trong các bộ xử lý AI kiến trúc Blackwell thế hệ mới nhất của Nvidia (NASDAQ:NVDA) và dự kiến có giá từ 6,500 USD đến 8,000 USD, thấp hơn nhiều so với mức 10,000-12,000 USD của H20.
Giá thấp hơn phản ánh các thông số kỹ thuật yếu hơn và yêu cầu sản xuất đơn giản hơn.
Nó sẽ dựa trên bộ xử lý đồ họa cấp máy chủ RTX Pro 6000D của Nvidia và sẽ sử dụng bộ nhớ GDDR7 thông thường thay vì bộ nhớ băng thông cao (HBM) tiên tiến hơn, hai nguồn tin cho biết.
Họ nói thêm rằng nó sẽ không sử dụng công nghệ đóng gói Chip-on-Wafer-on-Substrate (CoWoS) tiên tiến của Taiwan Semiconductor Manufacturing Co.
Giá, thời điểm sản xuất và các chi tiết trên của chip mới chưa từng được báo cáo trước đây.
Ba nguồn tin mà Reuters đã phỏng vấn cho bài viết này từ chối tiết lộ danh tính vì họ không được phép phát ngôn với truyền thông.
Một người phát ngôn của Nvidia cho biết công ty vẫn đang đánh giá các lựa chọn 'có hạn' của mình. 'Cho đến khi chúng tôi chốt thiết kế sản phẩm mới và nhận được sự chấp thuận từ chính phủ Hoa Kỳ, chúng tôi thực tế không thể tiếp cận thị trường trung tâm dữ liệu trị giá 50 tỷ USD của Trung Quốc.'
TSMC từ chối bình luận.
Trung Quốc vẫn là một thị trường khổng lồ đối với Nvidia, chiếm 13% doanh số của họ trong năm tài chính vừa qua. Đây là lần thứ ba Nvidia phải tùy chỉnh GPU cho nền kinh tế lớn thứ hai thế giới sau các hạn chế từ chính quyền Hoa Kỳ, những người muốn ngăn chặn sự phát triển công nghệ của Trung Quốc.
GPU mới của Nvidia, mặc dù có sức mạnh tính toán yếu hơn nhiều so với H20, được kỳ vọng sẽ giúp công ty duy trì cạnh tranh bất chấp mất thị phần đáng kể cho đến nay do các hạn chế xuất khẩu. Đối thủ chính của họ ở Trung Quốc là Huawei, công ty sản xuất chip Ascend 910B.
'Các công nghệ nội địa Trung Quốc như Huawei được kỳ vọng sẽ bắt kịp hiệu suất tính toán của các phiên bản hạ cấp trong vòng một đến hai năm,' Nori Chiou, một chuyên gia về bán dẫn và giám đốc đầu tư tại White Oak Capital Partners có trụ sở tại Singapore, cho biết.
Ông nói thêm, 'Ưu thế còn lại của Nvidia chủ yếu nằm ở khả năng tích hợp các cụm AI với nền tảng CUDA của họ.'
CUDA là kiến trúc lập trình của công ty mà các kỹ sư sử dụng để xây dựng các mô hình AI và ứng dụng trên GPU của họ. Việc sử dụng rộng rãi và hệ sinh thái được xây dựng xung quanh nó khiến các nhà phát triển muốn gắn bó với Nvidia.
Tuy nhiên, Nicolas Gaudois, trưởng bộ phận nghiên cứu công nghệ châu Á tại UBS, cho biết một GPU mới với bộ nhớ thông thường sẽ không đủ cho một số trường hợp sử dụng huấn luyện và suy luận AI.
Thị phần của Nvidia tại Trung Quốc đã giảm mạnh từ 95% trước năm 2022, khi các hạn chế xuất khẩu của Hoa Kỳ bắt đầu ảnh hưởng đến sản phẩm của họ, xuống còn 50% hiện tại, CEO Nvidia Jensen Huang nói với các phóng viên ở Đài Bắc tuần trước.
Huang cũng cảnh báo rằng nếu các hạn chế xuất khẩu của Hoa Kỳ tiếp tục, nhiều khách hàng Trung Quốc sẽ mua chip của Huawei.
Theo hai nguồn tin, Nvidia cũng đang phát triển một chip kiến trúc Blackwell khác cho Trung Quốc, dự kiến bắt đầu sản xuất sớm nhất là vào tháng 9. Reuters đã không thể tìm hiểu ngay các thông số kỹ thuật của biến thể đó.
Sau khi Hoa Kỳ thực sự cấm H20 vào tháng 4, Nvidia ban đầu cân nhắc phát triển một phiên bản hạ cấp của H20 cho Trung Quốc, các nguồn tin cho biết, nhưng kế hoạch đó đã không thành công.
Huang cho biết kiến trúc Hopper cũ hơn của công ty - mà H20 sử dụng - không còn có thể chứa thêm các sửa đổi theo các hạn chế xuất khẩu hiện hành của Hoa Kỳ.
Reuters không thể xác định tên cuối cùng cho GPU mới sẽ ra mắt sớm nhất là vào tháng 6.
Công ty chứng khoán Trung Quốc GF Securities cho biết trong một báo cáo công bố tuần trước rằng nó có khả năng được gọi là 6000D hoặc B40, mặc dù họ không tiết lộ giá hoặc trích dẫn nguồn thông tin.
Lệnh cấm H20 đã buộc Nvidia phải xóa sổ 5.5 tỷ USD hàng tồn kho và Huang nói với podcast Stratechery tuần trước rằng công ty cũng phải bỏ qua 15 tỷ USD doanh số.
Các hạn chế xuất khẩu gần nhất đã đưa ra các giới hạn mới đối với băng thông bộ nhớ GPU - một chỉ số quan trọng đo tốc độ truyền dữ liệu giữa bộ xử lý chính và chip nhớ. Khả năng này đặc biệt quan trọng đối với các khối lượng công việc AI yêu cầu xử lý dữ liệu chuyên sâu.
Ngân hàng đầu tư Jefferies ước tính rằng các quy định mới giới hạn băng thông bộ nhớ ở mức 1.7-1.8 terabyte mỗi giây. Con số đó so với 4 terabyte mỗi giây mà H20 có thể đạt được.
GF Securities dự báo GPU mới sẽ đạt khoảng 1.7 terabyte mỗi giây bằng công nghệ bộ nhớ GDDR7, chỉ nằm trong giới hạn kiểm soát xuất khẩu.
Investing