Công nghệ bộ nhớ AI của Google thất bại trong ứng dụng kỹ thuật? TurboQuant "ra đời", giới công nghệ gọi là "DeepSeek phiên bản Google", "Pied Piper phiên bản đời thực"! Phố Wall thì "haha, bắt đáy cổ phiếu bộ nhớ"!
Tin tức phố Wall
Công nghệ nén bộ nhớ AI mới do Google phát hành không chỉ gây phấn khích về cuộc cách mạng hiệu suất trong lĩnh vực công nghệ mà còn khiến cổ phiếu các công ty vi mạch lưu trữ của Mỹ bị định giá lại mạnh mẽ. Tuy nhiên, các tổ chức tài chính phố Wall lại nhìn thấy cơ hội mua trong nỗi lo sợ này.
Ngày thứ Tư, chịu tác động từ kỳ vọng công nghệ này sẽ giảm mạnh nhu cầu phần cứng AI, nhóm cổ phiếu vi mạch lưu trữ của Mỹ giảm mạnh trong phiên giao dịch.Tính đến khi đóng phiên, chỉ số chuỗi cung ứng phần cứng và vi mạch lưu trữ giảm 2,08%, SanDisk, Micron Technology và các doanh nghiệp hàng đầu đều đóng cửa giảm sâu, phản ánh phản ứng phòng thủ về triển vọng nhu cầu của thị trường.
Tuy nhiên, khi giới công nghệ tung hô công nghệ đột phá này là “Pied Piper phiên bản thực tế” và “Google phiên bản DeepSeek”, các ngân hàng đầu tư phố Wall lại có quan điểm hoàn toàn khác. Nhiều chuyên gia phân tích cho rằng tác động thực tế của công nghệ này bị thị trường đánh giá quá mức và khuyến nghị nhà đầu tư mua cổ phiếu ngành bộ nhớ khi giá đang điều chỉnh.
Mặc dù dữ liệu phòng thí nghiệm cho thấy hiệu quả nén đáng kinh ngạc, nhưng xét từ tiến trình phát triển thực tế của kinh tế vĩ mô và triển khai tính toán, công nghệ phá vỡ nút thắt bộ nhớ AI này,cuối cùng có thể không hủy hoại nhu cầu lưu trữ mà ngược lại còn thúc đẩy sự mở rộng tiếp theo của ngành.
Nhóm cổ phiếu lưu trữ giảm mạnh
Sau khi Google công bố thuật toán nén bộ nhớ TurboQuant, nỗi lo về nhu cầu phần cứng lưu trữ dài hạn nhanh chóng lan rộng, khiến tài sản liên quan bị bán tháo.
Trong phiên thứ Tư, nhóm cổ phiếu vi mạch lưu trữ cùng nhau lao dốc. SanDisk có thời điểm giảm 6,5%, Micron Technology giảm 4%, Western Digital và Seagate Technology lần lượt giảm hơn 4% và 5%. Tâm lý thị trường dần được điều chỉnh vào cuối phiên, mức giảm của các cổ phiếu liên quan thu hẹp. Tính đến khi đóng cửa, SanDisk và Micron Technology đều giảm hơn 3,4%, Seagate Technology giảm 2,6%, Western Digital giảm còn 1,6%. Trong ngày, chỉ số chuỗi cung ứng phần cứng và vi mạch lưu trữ đóng tại 113,03 điểm, có lúc chạm đáy trong ngày ở mức 109 điểm.
Nguyên nhân trực tiếp gây hoang mang trên thị trường là Google tuyên bố TurboQuant có thể giảm ít nhất 6 lần bộ nhớ cache sử dụng khi vận hành mô hình ngôn ngữ lớn mà không mất đi độ chính xác.Trong cuộc đua mở rộng phần cứng cho AI, bất kỳ tiến bộ kỹ thuật nào có thể giảm số lượng bộ nhớ vật lý cần mua đều có thể khiến cổ phiếu vi mạch vốn đang bị định giá cao phải chịu áp lực bán.
“Pied Piper phiên bản thực tế” và “Google phiên bản DeepSeek”
Trong ngành công nghệ, sự ra mắt của TurboQuant được xem là cột mốc quan trọng giải quyết chi phí vận hành cao của mô hình ngôn ngữ lớn. Công nghệ này thiết kế đặc biệt để xử lý nút thắt bộ nhớ cache KV trong hệ thống AI, cốt lõi là nén bộ nhớ vốn chiếm không gian lớn chỉ còn 3 bit.
Theo truyền thông, Google sử dụng phương pháp nén hai bước: đầu tiên chuyển vector dữ liệu sang tọa độ cực bằng công nghệ PolarQuant để loại bỏ chi phí chuẩn hóa thêm, sau đó dùng thuật toán lượng hóa QJL để loại bỏ lỗi dư.
Trong các thử nghiệm với mô hình mã nguồn mở như Gemma và Mistral, thuật toán này không chỉ giảm bộ nhớ tới 6 lần mà còn tăng hiệu suất trên Nvidia H100 GPU tới 8 lần so với phương án chưa lượng hóa 32 bit.
Dữ liệu ấn tượng này đã gây tranh luận sôi nổi trên Internet,nhiều người gọi đây là “Pied Piper phiên bản thực tế”— tức startup hư cấu trong series HBO nổi tiếng Silicon Valley đã làm thay đổi ngành bằng thuật toán nén không mất dữ liệu. CEO Cloudflare Matthew Prince và nhiều người khác coi đây là “thời khắc DeepSeek” của Google, cho rằng công nghệ này sẽ giúp giảm mạnh chi phí vận hành AI nhờ hiệu suất vượt trội như DeepSeek.
Phố Wall không sợ, còn hô “bắt đáy”
Đối mặt với sự cuồng nhiệt của ngành công nghệ và làn sóng bán tháo trên thị trường thứ cấp, các ngân hàng đầu tư phố Wall vẫn giữ bình tĩnh và cho rằng thị trường phản ứng quá mức.
Chuyên gia KC Rajkumar từ Lynx Equity Strategies đặt nghi vấn về tính “đột phá” của công nghệ này. Báo cáo gửi khách hàng cho rằng truyền thông đã thổi phồng về kỹ thuật này.
Ông cho biết, các mô hình suy luận hiện nay đã ứng dụng rộng rãi dữ liệu lượng hóa 4 bit, hiệu suất TurboQuant được Google dẫn ra là so sánh với mô hình 32 bit cũ. Ông nhấn mạnh, kỹ thuật nén tiên tiến này chỉ nhằm giảm bớt nút thắt tính toán, không làm giảm nhu cầu bộ nhớ và flash vốn vẫn rất mạnh do nguồn cung hạn chế trong 3-5 năm tới. Ông vẫn giữ mục tiêu giá Micron Technology ở mức 700 USD và khuyến nghị mua, đồng thời đề xuất “mua vào sau điều chỉnh do tin tức từ Google”.
Chuyên gia Andrew Rocha của Wells Fargo cũng nhận định dù TurboQuant tấn công trực diện vào đường cong chi phí bộ nhớ của hệ thống AI, kinh nghiệm quá khứ cho thấy,sự tồn tại của thuật toán nén chưa từng làm thay đổi quy mô tổng thể mua sắm phần cứng, nhu cầu bộ nhớ AI hiện tại vẫn rất ổn định.
Nghịch lý Jevons tái hiện, nhu cầu dài hạn có thể được kích thích
Bên cạnh đánh giá thị trường phản ứng thái quá, các tổ chức còn đánh giá lại tác động của TurboQuant dưới góc độ kinh tế lâu dài.
Morgan Stanley phân tích TurboQuant chỉ ảnh hưởng đến bộ nhớ KV cache ở giai đoạn suy luận, hoàn toàn không liên quan tới nhiệm vụ huấn luyện mô hình và bộ nhớ dung lượng cao HBM chứa trọng số mô hình. Ý nghĩa cốt lõi của công nghệ này là nâng cao throughput của GPU, giúp phần cứng hỗ trợ ngữ cảnh hay batch lớn hơn trên cùng hệ thống.
Morgan Stanley tiếp tục dẫn lại “Nghịch lý Jevons” để lý giải hiện tượng này:Nâng cao hiệu suất kỹ thuật thường dẫn tới giảm chi phí sử dụng, kích thích nhu cầu tổng lớn hơn.Bằng cách giảm mạnh chi phí phục vụ mỗi truy vấn, TurboQuant giúp các mô hình vốn chỉ chạy tại cụm cloud đắt đỏ chuyển sang local, hạ thấp đáng kể ngưỡng triển khai AI quy mô.
Điều này có nghĩa hiệu suất nâng cao sẽ kích hoạt nhiều ứng dụng AI bị hạn chế bởi chi phí trước đây. Ngân hàng đầu tư tổng kết rằng công nghệ này đã tái cấu trúc đường cong chi phí triển khai AI, tác động dài hạn đến phần cứng tính toán và bộ nhớ không phải là tiêu cực mà còn thể hiện tín hiệu “trung tính nghiêng tích cực”.
Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.
Bạn cũng có thể thích
MemeCore (M) biến động 65,1% trong 24 giờ: Nâng cấp hard fork và bùng nổ khối lượng giao dịch thúc đẩy giá tăng mạnh


