Thời đại mô hình AI lớn: Sự trỗi dậy của Transformer và cuộc chiến trăm mô hình
Tháng trước, trong giới AI đã nổ ra một cuộc "chiến tranh động vật". Một bên là Llama (lạc đà không bướu) của Meta, bên kia là mô hình lớn có tên Falcon (diều hâu). Hai mô hình này đã liên tục cạnh tranh trên bảng xếp hạng LLM mã nguồn mở, lần lượt chiếm vị trí đầu bảng.
Thú vị thay, các nhà phát triển của Falcon không phải là những gã khổng lồ công nghệ, mà là một viện nghiên cứu ở Các Tiểu vương quốc Ả Rập Thống nhất. Các quan chức của quốc gia này cho biết, họ tham gia vào cuộc đua AI nhằm "lật đổ các nhân tố chính". Ngày nay, chỉ cần có đủ tài chính, hầu như tất cả các quốc gia và doanh nghiệp đều đang xây dựng mô hình ngôn ngữ lớn của riêng họ.
Sau "cuộc chiến mô hình lớn", là thuật toán Transformer được Google phát hành vào năm 2017. Nó giải quyết vấn đề máy móc hiểu văn bản dài, biến mô hình lớn từ nghiên cứu lý thuyết thành vấn đề kỹ thuật. Ngày nay, bất kể là GPT hay các mô hình khác, đều được xây dựng trên nền tảng của Transformer.
Sự xuất hiện của Transformer đã giảm đáng kể rào cản trong việc phát triển AI. Chỉ cần có đủ sức mạnh tính toán và dữ liệu, bất kỳ công ty nào cũng có thể huấn luyện một mô hình lớn. Điều này cũng dẫn đến tình trạng hiện tại với sự phát triển đa dạng - theo thống kê, số lượng mô hình lớn của Trung Quốc đã vượt qua Mỹ, đạt 130 mô hình.
Tuy nhiên, việc có thể trở thành ông lớn trong thời đại AI không chỉ đơn giản là xếp chồng các tham số. Thành công của Llama của Meta nằm ở cộng đồng nhà phát triển năng động. Trong khi đó, sự vượt trội của GPT-4 xuất phát từ sức mạnh nghiên cứu khoa học của OpenAI.
Hiện tại, thách thức lớn nhất mà ngành mô hình lớn đang phải đối mặt là vấn đề lợi nhuận. Chi phí tính toán cao khiến nhiều công ty gặp lỗ nặng trong lĩnh vực AI. Theo ước tính, tổng đầu tư của toàn ngành vào cơ sở hạ tầng hàng năm có thể vượt quá doanh thu 125 tỷ đô la.
Do đó, sự cạnh tranh trong tương lai có thể không nằm ở việc ai có nhiều tham số mô hình hơn, mà ở ai có thể tìm ra mô hình kinh doanh phù hợp, thực sự biến AI thành năng suất. Giống như sự thành công của iPhone 4 không nằm ở vi xử lý, mà ở hệ sinh thái ứng dụng phong phú, những người chiến thắng trong ngành AI trong tương lai có thể cũng là những công ty có khả năng cung cấp giải pháp thực tiễn.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
18 thích
Phần thưởng
18
5
Chia sẻ
Bình luận
0/400
StealthMoon
· 07-14 19:49
Đây là sở thú gì vậy?
Xem bản gốcTrả lời0
SleepTrader
· 07-14 19:46
chuyên nghiệp đều đang đua AI ai nhiều tiền hơn
Xem bản gốcTrả lời0
LiquidationAlert
· 07-14 19:39
Mì ăn liền cũng có thể gọi là mô hình AI, thật mới mẻ.
Xem bản gốcTrả lời0
ZKProofEnthusiast
· 07-14 19:38
Bây giờ phải so sánh khả năng tính toán và tài chính rồi.
Transformer dẫn đầu thời đại mô hình AI lớn, cuộc chiến trăm mô hình đang nổi lên.
Thời đại mô hình AI lớn: Sự trỗi dậy của Transformer và cuộc chiến trăm mô hình
Tháng trước, trong giới AI đã nổ ra một cuộc "chiến tranh động vật". Một bên là Llama (lạc đà không bướu) của Meta, bên kia là mô hình lớn có tên Falcon (diều hâu). Hai mô hình này đã liên tục cạnh tranh trên bảng xếp hạng LLM mã nguồn mở, lần lượt chiếm vị trí đầu bảng.
Thú vị thay, các nhà phát triển của Falcon không phải là những gã khổng lồ công nghệ, mà là một viện nghiên cứu ở Các Tiểu vương quốc Ả Rập Thống nhất. Các quan chức của quốc gia này cho biết, họ tham gia vào cuộc đua AI nhằm "lật đổ các nhân tố chính". Ngày nay, chỉ cần có đủ tài chính, hầu như tất cả các quốc gia và doanh nghiệp đều đang xây dựng mô hình ngôn ngữ lớn của riêng họ.
Sau "cuộc chiến mô hình lớn", là thuật toán Transformer được Google phát hành vào năm 2017. Nó giải quyết vấn đề máy móc hiểu văn bản dài, biến mô hình lớn từ nghiên cứu lý thuyết thành vấn đề kỹ thuật. Ngày nay, bất kể là GPT hay các mô hình khác, đều được xây dựng trên nền tảng của Transformer.
Sự xuất hiện của Transformer đã giảm đáng kể rào cản trong việc phát triển AI. Chỉ cần có đủ sức mạnh tính toán và dữ liệu, bất kỳ công ty nào cũng có thể huấn luyện một mô hình lớn. Điều này cũng dẫn đến tình trạng hiện tại với sự phát triển đa dạng - theo thống kê, số lượng mô hình lớn của Trung Quốc đã vượt qua Mỹ, đạt 130 mô hình.
Tuy nhiên, việc có thể trở thành ông lớn trong thời đại AI không chỉ đơn giản là xếp chồng các tham số. Thành công của Llama của Meta nằm ở cộng đồng nhà phát triển năng động. Trong khi đó, sự vượt trội của GPT-4 xuất phát từ sức mạnh nghiên cứu khoa học của OpenAI.
Hiện tại, thách thức lớn nhất mà ngành mô hình lớn đang phải đối mặt là vấn đề lợi nhuận. Chi phí tính toán cao khiến nhiều công ty gặp lỗ nặng trong lĩnh vực AI. Theo ước tính, tổng đầu tư của toàn ngành vào cơ sở hạ tầng hàng năm có thể vượt quá doanh thu 125 tỷ đô la.
Do đó, sự cạnh tranh trong tương lai có thể không nằm ở việc ai có nhiều tham số mô hình hơn, mà ở ai có thể tìm ra mô hình kinh doanh phù hợp, thực sự biến AI thành năng suất. Giống như sự thành công của iPhone 4 không nằm ở vi xử lý, mà ở hệ sinh thái ứng dụng phong phú, những người chiến thắng trong ngành AI trong tương lai có thể cũng là những công ty có khả năng cung cấp giải pháp thực tiễn.