Từ AI ngôn ngữ đến AI vật lý
Thế hệ AI đầu tiên đã giúp máy tính "nhìn thấy" và "nghe được". Tiếp nối thành công đó, AI tạo sinh (Generative AI) đã mở ra khả năng cho máy tính "viết", "nói" và "sáng tạo" như con người, với những minh chứng rõ ràng như ChatGPT, Midjourney, Claude hay Gemini. Tuy nhiên, các mô hình này vẫn còn bị giới hạn trong thế giới số, nơi mọi hành động chỉ là dữ liệu.
Theo Jensen Huang, sự chuyển dịch tiếp theo là đưa AI ra khỏi thế giới số để tương tác với thế giới vật lý. Đây là lĩnh vực của AI vật lý (Physical AI), nơi các yếu tố như lực, ma sát, quán tính, không gian ba chiều và tính bất định đóng vai trò quyết định. Physical AI sẽ biến các mô hình ngôn ngữ lớn thành những hệ thống có khả năng suy nghĩ, lên kế hoạch và hành động trong môi trường thực tế.
Physical AI là gì và vì sao nó quan trọng?
Làn sóng tiếp theo của AI không nằm trong mã lập trình mà nằm trong các định luật vật lý, CEO Nvidia Jensen Huang cho biết.
Định nghĩa của Nvidia cho Physical AI là những mô hình trí tuệ nhân tạo có khả năng nhận thức, hiểu và thao tác với thế giới vật lý. Khác với các mô hình chỉ tạo ra văn bản hay hình ảnh, Physical AI có thể điều khiển robot, xe tự hành, cánh tay máy trong nhà máy hay drone bay trong không gian mở.
Điểm khác biệt cốt lõi nằm ở việc AI không chỉ "nghĩ" mà còn "làm". Một robot gắp hàng trong kho vận không chỉ cần nhận diện hình dáng vật thể, mà còn phải tính toán đường đi ngắn nhất, lực cần thiết để cầm nắm, và thích ứng với sự thay đổi của môi trường – những tác vụ mà các mô hình Generative AI đơn thuần không thể thực hiện.
Jensen Huang nhìn nhận đây là mảnh đất màu mỡ tiếp theo của ngành công nghệ, một thị trường có tiềm năng đạt quy mô hàng nghìn tỷ USD khi robot, xe tự hành và các thiết bị AI tương tác vật lý trở nên phổ biến. Goldman Sachs từng ước tính riêng thị trường robot hình người (humanoid robotic) có thể đạt 38 tỷ USD vào năm 2035.
Hệ sinh thái Physical AI của Nvidia
Để đón đầu làn sóng Physical AI, Nvidia đang xây dựng một hệ sinh thái toàn diện, khác biệt với làn sóng Generative AI chủ yếu dựa vào phần mềm và hạ tầng điện toán.
Nền tảng mô phỏng: Nvidia cung cấp Isaac và Omniverse, hai nền tảng cho phép mô phỏng thế giới thực một cách chính xác. Isaac giúp lập trình và huấn luyện robot trong môi trường ảo, còn Omniverse là "vũ trụ mô phỏng" để tạo dữ liệu tổng hợp và tái hiện các kịch bản phức tạp, từ đó huấn luyện robot hiệu quả mà không cần thử nghiệm vật lý tốn kém.
Mô hình nền tảng cho robot: Các mô hình tiêu biểu như Cosmos và GR00T đang được Nvidia phát triển. Cosmos giúp robot hiểu thế giới vật lý và điều hướng hành vi dựa trên dữ liệu mô phỏng. GR00T, một mô hình mã nguồn mở cho robot hình người, có khả năng học cách đi, đứng, cầm nắm và phản ứng như con người.
Hạ tầng phần cứng: Nvidia cung cấp các giải pháp phần cứng chuyên biệt, từ siêu máy chủ DGX cho việc huấn luyện mô hình AI đến chip Jetson Thor dành cho các thiết bị biên như robot và xe tự hành. Jensen Huang nhấn mạnh rằng Physical AI cần ba loại "máy tính": một để huấn luyện (train), một để mô phỏng (simulate) và một để hành động (act). Nvidia đang đáp ứng đầy đủ ba nhu cầu này.
Vì sao Nvidia đặt cược vào Physical AI?
(Ảnh minh hoạ)
Sự đầu tư vào Physical AI của Nvidia xuất phát từ cả tầm nhìn công nghệ lẫn chiến lược thị trường. Trong khi thị trường mô hình ngôn ngữ đang ngày càng bão hòa với sự cạnh tranh gay gắt từ các ông lớn, Physical AI vẫn là một vùng đất rộng lớn chưa có người tiên phong. Đây là cơ hội để Nvidia định vị mình không chỉ là nhà cung cấp GPU, mà còn là kiến trúc sư của thế hệ máy móc thông minh trong thế giới thực.
Quan trọng hơn, Physical AI không thể phát triển chỉ bằng phần mềm mã nguồn mở hay mô hình đám mây. Nó đòi hỏi phần cứng cực kỳ chuyên biệt, tối ưu cho môi trường khắc nghiệt, thời gian phản hồi tức thời và độ tin cậy gần như tuyệt đối. Với các kiến trúc phần cứng tiên tiến như Blackwell, Rubin và sắp tới là Feynman, Nvidia đang xây dựng nền tảng cho tương lai AI trong thập kỷ tới, một lợi thế mà ít đối thủ có thể sánh kịp.
Một chặng đường dài nhưng đầy hứa hẹn
Mặc dù tiềm năng của Physical AI là rõ ràng, giới chuyên gia cảnh báo rằng đây sẽ là một cuộc chơi dài hơi. Việc thiết kế, thử nghiệm và đưa vào vận hành robot và hệ thống vật lý đòi hỏi nhiều năm, khác biệt với việc cập nhật phần mềm chỉ trong vài tuần. Những thách thức về an toàn, pháp lý, chi phí sản xuất và niềm tin của người tiêu dùng vẫn còn là những rào cản lớn.
Tuy nhiên, điều đó không ngăn cản các tập đoàn lớn đổ tiền vào cuộc đua này. Tesla với Optimus, Figure AI với mô hình robot học sâu, Boston Dynamics với Atlas, và giờ là Nvidia, tất cả đang cùng nhau định hình một tương lai nơi các mô hình AI không chỉ phản hồi câu hỏi, mà còn mở cửa, bốc hàng, chạy xe và thậm chí… chăm sóc con người.
T.Hà (Theo Thương Hiệu và Pháp Luật)