Cơn sóng AI quét qua toàn cầu, DeepSeek nổi lên gây chấn động thị trường
Gần đây, đã xảy ra một sự kiện thu hút sự chú ý trong lĩnh vực AI. Một mô hình AI lớn của Trung Quốc có tên là DeepSeek lần đầu tiên vượt qua ChatGPT về lượng tải xuống trên App Store của Mỹ, đứng đầu bảng xếp hạng. Hiện tượng này không chỉ thu hút sự quan tâm rộng rãi từ cộng đồng công nghệ, giới đầu tư và truyền thông toàn cầu, mà còn gây ra một cảm giác hoảng loạn tạm thời trên thị trường vốn Mỹ.
Do ảnh hưởng này, giá cổ phiếu của nhiều gã khổng lồ công nghệ đã giảm ở mức độ khác nhau. Nvidia giảm 5,3%, ARM giảm 5,5%, Broadcom giảm 4,9%, TSMC giảm 4,5%. Các công ty khác như Micron, AMD, Intel cũng ghi nhận mức giảm tương ứng. Hợp đồng tương lai Nasdaq 100 giảm xuống -400 điểm, có khả năng tạo ra mức giảm trong một ngày lớn nhất kể từ ngày 18 tháng 12. Theo thống kê chưa đầy đủ, giá trị thị trường chứng khoán Mỹ có thể bốc hơi hơn 1 nghìn tỷ đô la trong giao dịch ngày thứ Hai, tương đương với một phần ba tổng giá trị thị trường tiền điện tử.
Thị trường tiền điện tử cũng không thể tránh khỏi xu hướng giảm này. Giá Bitcoin đã giảm xuống dưới 100500 USD, với mức giảm 4,48% trong 24 giờ. Ethereum giảm xuống dưới 3200 USD, với mức giảm 3,83% trong 24 giờ. Nhiều nhà đầu tư cảm thấy bối rối trước sự biến động đột ngột của thị trường, một số người cho rằng có thể liên quan đến kỳ vọng giảm lãi suất của Cục Dự trữ Liên bang hoặc các yếu tố vĩ mô khác.
Sự trỗi dậy của DeepSeek đã khiến mọi người phải suy nghĩ lại về mô hình phát triển AI. Khác với các công ty như OpenAI, Meta, DeepSeek không phát triển dựa vào vốn lớn và nhiều tài nguyên phần cứng. Ngược lại, OpenAI được thành lập cách đây 10 năm, có 4500 nhân viên và đã huy động 6,6 tỷ USD. Một công ty mạng xã hội thậm chí đã chi 60 tỷ USD để phát triển một trung tâm dữ liệu AI lớn bằng Manhattan. Trong khi đó, DeepSeek được thành lập chưa đầy 2 năm, chỉ có 200 nhân viên, chi phí phát triển chưa đến 10 triệu USD và không mua sắm nhiều GPU cao cấp.
Sự tương phản này khiến những người trong ngành không khỏi đặt câu hỏi: Các gã khổng lồ công nghệ truyền thống sẽ cạnh tranh với DeepSeek như thế nào? Thành công của DeepSeek không chỉ thể hiện lợi thế chi phí về vốn và công nghệ, mà còn phá vỡ những quan niệm cố hữu của mọi người về sự phát triển của AI.
Phó giám đốc sản phẩm của một công ty công nghệ nổi tiếng đã bình luận trên mạng xã hội rằng câu chuyện của DeepSeek thể hiện một sự đổi mới mang tính cách mạng điển hình. Các doanh nghiệp hiện tại đang tối ưu hóa quy trình hiện có, trong khi những kẻ phá vỡ đang suy nghĩ lại các phương pháp cơ bản. DeepSeek đã đưa ra một ý tưởng mới: Nếu chúng ta làm điều này một cách thông minh hơn, thay vì chỉ đơn giản là đầu tư thêm phần cứng, thì sẽ có sự khác biệt gì?
Hiện tại, chi phí để đào tạo các mô hình AI hàng đầu là cực kỳ đắt đỏ. Một số công ty AI hàng đầu chỉ riêng về tính toán đã tiêu tốn tới hơn 100 triệu đô la, cần phải trang bị các trung tâm dữ liệu lớn với hàng ngàn GPU trị giá 40.000 đô la. Thế nhưng, DeepSeek đã đưa ra một giải pháp gây bất ngờ: hoàn thành nhiệm vụ này với 5 triệu đô la. Càng đáng ngạc nhiên hơn là họ không chỉ đề xuất ý tưởng này mà còn thực sự thực hiện được. Mô hình của họ ở nhiều nhiệm vụ tương đương hoặc thậm chí vượt trội hơn so với các hệ thống AI hàng đầu trong ngành.
Sự thành công của DeepSeek đến từ việc họ nghĩ lại mọi thứ từ con số không. Các mô hình AI truyền thống sử dụng số thập phân 32 bit để biểu diễn mỗi số, trong khi DeepSeek cố gắng sử dụng số thập phân 8 bit và phát hiện ra rằng độ chính xác vẫn đủ. Sự thay đổi này đã làm giảm 75% bộ nhớ cần thiết. Kết quả là, chi phí đào tạo giảm từ 100 triệu đô la xuống còn 5 triệu đô la, số lượng GPU cần thiết giảm từ 100.000 xuống còn 2.000, và chi phí API giảm 95%. Quan trọng hơn, mô hình của họ có thể chạy trên GPU chơi game thông thường mà không cần phần cứng trung tâm dữ liệu chuyên dụng.
Thành công của DeepSeek đã thách thức nhiều quan niệm truyền thống trong lĩnh vực AI, bao gồm việc Trung Quốc chỉ có thể làm mã nguồn đóng, vị trí dẫn đầu tuyệt đối của Silicon Valley trong lĩnh vực AI, và việc phát triển các mô hình AI hàng đầu cần đầu tư khổng lồ. Những quan điểm này, dù chưa bị lật đổ hoàn toàn, nhưng đã bị lung lay nghiêm trọng.
Một tổ chức đầu tư cổ phần nổi tiếng của Mỹ trong báo cáo của mình đã đánh giá DeepSeek, cho rằng đây là một chiến thắng của mã nguồn mở so với mã nguồn đóng. Những đóng góp từ cộng đồng mã nguồn mở có thể nhanh chóng chuyển hóa thành sự thịnh vượng của toàn bộ hệ sinh thái. Đồng thời, họ cũng cho rằng, mặc dù con đường phát triển của các công ty AI truyền thống có vẻ đơn giản và thô bạo, nhưng không loại trừ khả năng sẽ xảy ra biến đổi chất mới khi đạt đến một quy mô nhất định. Nhìn vào lịch sử phát triển 70 năm của AI, sức mạnh tính toán vẫn rất quan trọng, điều này có thể vẫn áp dụng trong tương lai.
Sự xuất hiện của DeepSeek đã đưa các mô hình mã nguồn mở đạt đến mức tương đương với các mô hình mã nguồn đóng, thậm chí còn vượt trội hơn về hiệu suất. Điều này làm giảm sự cần thiết cho các doanh nghiệp mua API AI thương mại, tạo ra không gian phát triển lớn hơn cho các ứng dụng hạ nguồn. Dự kiến trong một hai năm tới, chúng ta sẽ chứng kiến nhiều sản phẩm chip suy diễn phong phú hơn và một hệ sinh thái ứng dụng mô hình ngôn ngữ lớn thịnh vượng hơn.
Mặc dù DeepSeek thể hiện hiệu quả rất cao, nhưng các chuyên gia cho rằng nhu cầu về sức mạnh tính toán sẽ không giảm. Điều này phù hợp với nghịch lý Jevons trong kinh tế học, tức là việc cải thiện hiệu quả công nghệ lại làm tăng tổng mức tiêu thụ tài nguyên. Giống như trong quá trình phổ biến từ điện thoại di động lớn sang điện thoại Nokia, chính nhờ việc giảm chi phí mà sự phổ biến này được thực hiện, và sự phổ biến lại dẫn đến sự gia tăng tổng mức tiêu thụ trên thị trường.
Sự đột phá lớn này trong công nghệ AI chắc chắn sẽ có ảnh hưởng sâu rộng đến cấu trúc công nghệ toàn cầu, đồng thời cung cấp những hướng đi mới cho sự phát triển tương lai của AI. Với sự tiến bộ không ngừng của công nghệ, chúng tôi mong đợi sẽ thấy nhiều đổi mới và đột phá hơn nữa, thúc đẩy lĩnh vực AI phát triển theo hướng hiệu quả hơn và phổ biến hơn.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
14 thích
Phần thưởng
14
7
Chia sẻ
Bình luận
0/400
ContractFreelancer
· 7giờ trước
GPT này chết tiệt rồi
Xem bản gốcTrả lời0
LuckyBlindCat
· 7giờ trước
Đánh trúng điểm đau của các ông lớn
Xem bản gốcTrả lời0
WhaleStalker
· 7giờ trước
Mã nguồn mở才是正道啊!
Xem bản gốcTrả lời0
BankruptcyArtist
· 8giờ trước
Lại có một người muốn thu hút sự chú ý.
Xem bản gốcTrả lời0
LightningLady
· 8giờ trước
Chết cũng không tin đâu.
Xem bản gốcTrả lời0
BlockchainDecoder
· 8giờ trước
Từ góc độ lý thuyết kiến trúc AI, điểm đột phá của DeepSeek nằm ở việc tối ưu hóa thuật toán cơ bản, tham khảo dữ liệu bài báo hội nghị AAAI 2023.
DeepSeek vượt qua rào cản công nghệ AI gây ra chấn động trên thị trường chứng khoán Mỹ
Cơn sóng AI quét qua toàn cầu, DeepSeek nổi lên gây chấn động thị trường
Gần đây, đã xảy ra một sự kiện thu hút sự chú ý trong lĩnh vực AI. Một mô hình AI lớn của Trung Quốc có tên là DeepSeek lần đầu tiên vượt qua ChatGPT về lượng tải xuống trên App Store của Mỹ, đứng đầu bảng xếp hạng. Hiện tượng này không chỉ thu hút sự quan tâm rộng rãi từ cộng đồng công nghệ, giới đầu tư và truyền thông toàn cầu, mà còn gây ra một cảm giác hoảng loạn tạm thời trên thị trường vốn Mỹ.
Do ảnh hưởng này, giá cổ phiếu của nhiều gã khổng lồ công nghệ đã giảm ở mức độ khác nhau. Nvidia giảm 5,3%, ARM giảm 5,5%, Broadcom giảm 4,9%, TSMC giảm 4,5%. Các công ty khác như Micron, AMD, Intel cũng ghi nhận mức giảm tương ứng. Hợp đồng tương lai Nasdaq 100 giảm xuống -400 điểm, có khả năng tạo ra mức giảm trong một ngày lớn nhất kể từ ngày 18 tháng 12. Theo thống kê chưa đầy đủ, giá trị thị trường chứng khoán Mỹ có thể bốc hơi hơn 1 nghìn tỷ đô la trong giao dịch ngày thứ Hai, tương đương với một phần ba tổng giá trị thị trường tiền điện tử.
Thị trường tiền điện tử cũng không thể tránh khỏi xu hướng giảm này. Giá Bitcoin đã giảm xuống dưới 100500 USD, với mức giảm 4,48% trong 24 giờ. Ethereum giảm xuống dưới 3200 USD, với mức giảm 3,83% trong 24 giờ. Nhiều nhà đầu tư cảm thấy bối rối trước sự biến động đột ngột của thị trường, một số người cho rằng có thể liên quan đến kỳ vọng giảm lãi suất của Cục Dự trữ Liên bang hoặc các yếu tố vĩ mô khác.
Sự trỗi dậy của DeepSeek đã khiến mọi người phải suy nghĩ lại về mô hình phát triển AI. Khác với các công ty như OpenAI, Meta, DeepSeek không phát triển dựa vào vốn lớn và nhiều tài nguyên phần cứng. Ngược lại, OpenAI được thành lập cách đây 10 năm, có 4500 nhân viên và đã huy động 6,6 tỷ USD. Một công ty mạng xã hội thậm chí đã chi 60 tỷ USD để phát triển một trung tâm dữ liệu AI lớn bằng Manhattan. Trong khi đó, DeepSeek được thành lập chưa đầy 2 năm, chỉ có 200 nhân viên, chi phí phát triển chưa đến 10 triệu USD và không mua sắm nhiều GPU cao cấp.
Sự tương phản này khiến những người trong ngành không khỏi đặt câu hỏi: Các gã khổng lồ công nghệ truyền thống sẽ cạnh tranh với DeepSeek như thế nào? Thành công của DeepSeek không chỉ thể hiện lợi thế chi phí về vốn và công nghệ, mà còn phá vỡ những quan niệm cố hữu của mọi người về sự phát triển của AI.
Phó giám đốc sản phẩm của một công ty công nghệ nổi tiếng đã bình luận trên mạng xã hội rằng câu chuyện của DeepSeek thể hiện một sự đổi mới mang tính cách mạng điển hình. Các doanh nghiệp hiện tại đang tối ưu hóa quy trình hiện có, trong khi những kẻ phá vỡ đang suy nghĩ lại các phương pháp cơ bản. DeepSeek đã đưa ra một ý tưởng mới: Nếu chúng ta làm điều này một cách thông minh hơn, thay vì chỉ đơn giản là đầu tư thêm phần cứng, thì sẽ có sự khác biệt gì?
Hiện tại, chi phí để đào tạo các mô hình AI hàng đầu là cực kỳ đắt đỏ. Một số công ty AI hàng đầu chỉ riêng về tính toán đã tiêu tốn tới hơn 100 triệu đô la, cần phải trang bị các trung tâm dữ liệu lớn với hàng ngàn GPU trị giá 40.000 đô la. Thế nhưng, DeepSeek đã đưa ra một giải pháp gây bất ngờ: hoàn thành nhiệm vụ này với 5 triệu đô la. Càng đáng ngạc nhiên hơn là họ không chỉ đề xuất ý tưởng này mà còn thực sự thực hiện được. Mô hình của họ ở nhiều nhiệm vụ tương đương hoặc thậm chí vượt trội hơn so với các hệ thống AI hàng đầu trong ngành.
Sự thành công của DeepSeek đến từ việc họ nghĩ lại mọi thứ từ con số không. Các mô hình AI truyền thống sử dụng số thập phân 32 bit để biểu diễn mỗi số, trong khi DeepSeek cố gắng sử dụng số thập phân 8 bit và phát hiện ra rằng độ chính xác vẫn đủ. Sự thay đổi này đã làm giảm 75% bộ nhớ cần thiết. Kết quả là, chi phí đào tạo giảm từ 100 triệu đô la xuống còn 5 triệu đô la, số lượng GPU cần thiết giảm từ 100.000 xuống còn 2.000, và chi phí API giảm 95%. Quan trọng hơn, mô hình của họ có thể chạy trên GPU chơi game thông thường mà không cần phần cứng trung tâm dữ liệu chuyên dụng.
Thành công của DeepSeek đã thách thức nhiều quan niệm truyền thống trong lĩnh vực AI, bao gồm việc Trung Quốc chỉ có thể làm mã nguồn đóng, vị trí dẫn đầu tuyệt đối của Silicon Valley trong lĩnh vực AI, và việc phát triển các mô hình AI hàng đầu cần đầu tư khổng lồ. Những quan điểm này, dù chưa bị lật đổ hoàn toàn, nhưng đã bị lung lay nghiêm trọng.
Một tổ chức đầu tư cổ phần nổi tiếng của Mỹ trong báo cáo của mình đã đánh giá DeepSeek, cho rằng đây là một chiến thắng của mã nguồn mở so với mã nguồn đóng. Những đóng góp từ cộng đồng mã nguồn mở có thể nhanh chóng chuyển hóa thành sự thịnh vượng của toàn bộ hệ sinh thái. Đồng thời, họ cũng cho rằng, mặc dù con đường phát triển của các công ty AI truyền thống có vẻ đơn giản và thô bạo, nhưng không loại trừ khả năng sẽ xảy ra biến đổi chất mới khi đạt đến một quy mô nhất định. Nhìn vào lịch sử phát triển 70 năm của AI, sức mạnh tính toán vẫn rất quan trọng, điều này có thể vẫn áp dụng trong tương lai.
Sự xuất hiện của DeepSeek đã đưa các mô hình mã nguồn mở đạt đến mức tương đương với các mô hình mã nguồn đóng, thậm chí còn vượt trội hơn về hiệu suất. Điều này làm giảm sự cần thiết cho các doanh nghiệp mua API AI thương mại, tạo ra không gian phát triển lớn hơn cho các ứng dụng hạ nguồn. Dự kiến trong một hai năm tới, chúng ta sẽ chứng kiến nhiều sản phẩm chip suy diễn phong phú hơn và một hệ sinh thái ứng dụng mô hình ngôn ngữ lớn thịnh vượng hơn.
Mặc dù DeepSeek thể hiện hiệu quả rất cao, nhưng các chuyên gia cho rằng nhu cầu về sức mạnh tính toán sẽ không giảm. Điều này phù hợp với nghịch lý Jevons trong kinh tế học, tức là việc cải thiện hiệu quả công nghệ lại làm tăng tổng mức tiêu thụ tài nguyên. Giống như trong quá trình phổ biến từ điện thoại di động lớn sang điện thoại Nokia, chính nhờ việc giảm chi phí mà sự phổ biến này được thực hiện, và sự phổ biến lại dẫn đến sự gia tăng tổng mức tiêu thụ trên thị trường.
Sự đột phá lớn này trong công nghệ AI chắc chắn sẽ có ảnh hưởng sâu rộng đến cấu trúc công nghệ toàn cầu, đồng thời cung cấp những hướng đi mới cho sự phát triển tương lai của AI. Với sự tiến bộ không ngừng của công nghệ, chúng tôi mong đợi sẽ thấy nhiều đổi mới và đột phá hơn nữa, thúc đẩy lĩnh vực AI phát triển theo hướng hiệu quả hơn và phổ biến hơn.