Hỏi đáp
Tư vấn trực tuyến
Hotline
0981 811 879
Email
info@wi-mesh.com.vn

Ultra Ethernet Consortium (UEC) Ra Mắt Đặc Tả 1.0: Đưa Ethernet Lên Tầm Cao Mới Cho HPC và AI

Ultra Ethernet Consortium (UEC) Ra Mắt Đặc Tả 1.0: Nâng Tầm Ethernet Cho HPC và AI

Tập đoàn Ultra Ethernet Consortium (UEC) đã chính thức công bố đặc tả 1.0, một cột mốc quan trọng trong việc tối ưu hóa Ethernet cho các ứng dụng Điện toán Hiệu năng Cao (HPC) và Trí tuệ Nhân tạo (AI). Phiên bản này tích hợp phương pháp RDMA hiện đại, giao thức truyền tải mới và cơ chế kiểm soát tắc nghẽn tiên tiến, hứa hẹn thay đổi cục diện mạng hiệu năng cao.

UEC 1.0: Bước Đột Phá cho Ethernet

Giữa năm 2023, một loạt các nhà cung cấp mạng lớn như Cisco, Arista, HPE và Intel đã cùng nhau thành lập Ultra Ethernet Consortium (UEC) với mục tiêu cải thiện Ethernet để đáp ứng nhu cầu của AI và Điện toán hiệu năng cao (HPC). Gần hai năm sau, UEC đã hiện thực hóa lời hứa ban đầu với việc phát hành đặc tả UEC 1.0 đầu tiên. Đặc tả này mô tả chi tiết các cải tiến cho Ethernet nhằm nâng cao khả năng truyền tải độ trễ thấp trong các triển khai mạng thông lượng cao. Nó bao gồm một phương pháp Truy cập bộ nhớ trực tiếp từ xa (RDMA) hiện đại, các triển khai truy cập bộ nhớ trực tiếp, giao thức truyền tải và cơ chế kiểm soát tắc nghẽn.

Ban đầu, các công ty muốn tạo ra một cách tiếp cận mở cho Ethernet chủ yếu tập trung vào HPC, vì vào thời điểm đó, đó là nơi cần đến tiêu chuẩn vàng cho mạng hiệu năng cao. Tuy nhiên, chỉ vài tháng sau khi chúng tôi chính thức hóa và thành lập, ChatGPT đã thay đổi thế giới.

- J Metz, Chủ tịch Ủy ban Chỉ đạo, Ultra Ethernet Consortium

Ý Nghĩa Của Đặc Tả 1.0

Phiên bản 1.0 của một đặc tả thường cho thấy mức độ ổn định mà các tổ chức và nhà triển khai có thể tin cậy. Theo J Metz, 1.0 không chỉ là một phiên bản tài liệu tiêu chuẩn mà còn là một cột mốc quan trọng, bởi vì một nhóm các công ty và tổ chức đã áp dụng cách tiếp cận toàn diện để đồng bộ hóa mạng lưới với các yêu cầu của khối lượng công việc. Metz chia sẻ: "Ethernet, một mạng đa năng tuyệt vời được thiết kế để linh hoạt nhất có thể cho nhiều loại khối lượng công việc khác nhau, luôn được cho là không đủ cho các khối lượng công việc đòi hỏi khắt khe nhất vì sự linh hoạt của nó lại là một điểm yếu. Sự thật là – như chúng tôi đã phát hiện ra ở UEC – việc điều chỉnh Ethernet cho các yêu cầu khối lượng công việc cụ thể là khó. Khó, nhưng không phải không thể."

Việc điều chỉnh Ethernet đòi hỏi phải biết cách và khi nào phá vỡ quy tắc, đặc biệt là xung quanh các lớp mạng. Metz cho biết UEC giải quyết thách thức này bằng các tiêu chuẩn mở. Nó giải quyết các vi phạm lớp bằng cách phối hợp giữa các nhóm làm việc theo lớp và giải quyết vấn đề là một giao thức 'mới toanh' bằng cách hợp tác chặt chẽ với các đối tác trong hệ sinh thái ngành (như SNIA, OCP, IEEE, DMTF, NVM Express). Ông nhấn mạnh: "Vì vậy, nó không chỉ là việc đưa ra một đặc tả, mà là phát triển một khuôn khổ dài hạn cho phép người dùng cuối tin tưởng rằng việc triển khai UEC không phải là một kế hoạch hành động đơn lẻ, cô lập."

Biểu đồ minh họa các lớp mạng và cách Ultra Ethernet Consortium phối hợp để tối ưu hóa hiệu suất cho các ứng dụng HPC và AI.

Biểu đồ minh họa các lớp mạng và cách Ultra Ethernet Consortium phối hợp để tối ưu hóa hiệu suất cho các ứng dụng HPC và AI.

Kiểm Soát Tắc Nghẽn: Trọng Tâm Của UEC

Một trong những lĩnh vực đổi mới chính trong đặc tả UEC 1.0 là cơ chế kiểm soát tắc nghẽn mạng mới, vốn rất quan trọng đối với khối lượng công việc AI. J Metz giải thích rằng cách tiếp cận kiểm soát tắc nghẽn của UEC không dựa vào mạng không mất gói (lossless network) như truyền thống. Nó cũng giới thiệu một chế độ hoạt động mới, trong đó bộ nhận có khả năng giới hạn việc truyền dữ liệu của bộ gửi thay vì chỉ thụ động.

Metz nhận định: "Điều này rất quan trọng đối với khối lượng công việc AI vì các nguyên tắc cơ bản này cho phép xây dựng các mạng lớn hơn với hiệu quả tốt hơn. Đây là một yếu tố quan trọng trong việc giảm thời gian đào tạo và suy luận." Điều này cho thấy UEC đang trực tiếp giải quyết một trong những thách thức lớn nhất trong việc mở rộng quy mô và hiệu suất của hạ tầng AI.

Những điểm chính cần lưu ý

  • Phương pháp RDMA Hiện Đại: Tối ưu hóa việc truy cập bộ nhớ trực tiếp từ xa, cải thiện đáng kể hiệu suất truyền dữ liệu.
  • Giao Thức Truyền Tải Mới: Được thiết kế cho yêu cầu AI và HPC, đảm bảo độ trễ thấp và thông lượng cao.
  • Cơ Chế Kiểm Soát Tắc Nghẽn Tiên Tiến: Không yêu cầu mạng không mất gói, bộ nhận có thể giới hạn bộ gửi, tăng hiệu quả mạng.
  • Cách Tiếp Cận Toàn Diện: Đồng bộ hóa mạng với yêu cầu khối lượng công việc từ các lớp khác nhau.
  • Tiêu Chuẩn Mở và Hợp Tác Sinh Thái: Giải quyết các thách thức kỹ thuật thông qua tiêu chuẩn mở và hợp tác với các đối tác ngành lớn.
  • Cách Tiếp Cận Ngữ Nghĩa Khối Lượng Công Việc: Tối ưu hóa mạng dựa trên đặc điểm của khối lượng công việc mà không yêu cầu thay đổi ứng dụng.
  • Tận Dụng Mọi Đường Dẫn Trong Mạng: Cho phép các điểm cuối mạng tận dụng tất cả các đường dẫn có sẵn, giảm yêu cầu bộ nhớ và không cần hạ tầng chuyển mạch mới.
Tóm lại, điều đó có nghĩa là chúng tôi lấy khối lượng công việc và xác định các đặc điểm mạng cần thiết để điều chỉnh việc truyền gói mà không yêu cầu thay đổi trong chính các ứng dụng. Việc xác định các yêu cầu ngữ nghĩa sau đó chuyển thành các điều chỉnh trong hệ thống truyền gói, và điều đó lần lượt dẫn đến các yêu cầu về tắc nghẽn, yêu cầu bảo mật, yêu cầu sắp xếp thứ tự phân phối, v.v.

- J Metz

Ethernet so với Infiniband: UEC Có Phải Là Cú Hích?

Infiniband thường được coi là vượt trội hơn Ethernet khi nói đến HPC và AI, vì nó có đặc tính hiệu suất tốt hơn cho các khối lượng công việc đó. Tuy nhiên, UEC hứa hẹn sẽ cân bằng đáng kể sân chơi giữa hai đối thủ này. J Metz lưu ý rằng UEC áp dụng cách tiếp cận ngữ nghĩa khối lượng công việc.

Ngoài ra, Metz giải thích rằng UEC tạo ra một môi trường trong mạng nơi các điểm cuối vải không chỉ bị giới hạn bởi cổng NIC. Thay vào đó, UEC cho phép một khả năng mới quan trọng tận dụng tất cả các đường dẫn trong mạng. Trạng thái chỉ được duy trì trong thời gian một giao dịch tồn tại, điều này làm giảm yêu cầu bộ nhớ và không yêu cầu cơ sở hạ tầng chuyển mạch mới.

Các Nhà Cung Cấp Đón Nhận UEC

Trong hai năm qua, sự hỗ trợ UEC đã mở rộng với số lượng ngày càng tăng của các nhà cung cấp mạng. Trong số những người ủng hộ ban đầu có Arista Networks. Hugh Holbrook, Giám đốc Phát triển của Arista Networks, nói với Network World rằng từ góc độ của ông, điểm cốt lõi của bản phát hành 1.0 là đặc tả của giao thức truyền tải mới. Ông lưu ý rằng nó được thiết kế cho các yêu cầu AI và HPC trong tương lai, bao gồm độ trễ thấp, thời gian khởi động nhanh, kiểm soát tắc nghẽn hiện đại và mã hóa.

Từ góc độ sản phẩm, Martin Hull, Phó chủ tịch và Tổng giám đốc nền tảng đám mây và AI tại Arista, nói với Network World rằng danh mục sản phẩm của công ty ông đã sẵn sàng cho đặc tả UEC 1.0. Hull cho biết: "Arista sẽ hỗ trợ các cải tiến chuyển mạch UE 1.0 trên toàn bộ danh mục sản phẩm Etherlink của chúng tôi, bắt đầu với 7060X và 7800R ban đầu."

Juniper Networks và HPE Đóng Góp

Juniper Networks cũng đang hỗ trợ nỗ lực của UEC. Amit Sanyal, Trưởng phòng Marketing sản phẩm trung tâm dữ liệu tại Juniper Networks, nói với Network World rằng Juniper đặc biệt hào hứng với khả năng của đặc tả UEC 1.0 trong việc cho phép 'packet spraying' ở cấp độ chuyển mạch và sắp xếp lại ở NIC. Sanyal cho biết: "Cách tiếp cận này cải thiện đáng kể việc sử dụng mạng bằng một phương pháp dựa trên tiêu chuẩn mở – những khả năng mà cho đến nay chỉ có trong các hệ thống độc quyền và đóng kín."

Về triển khai, Sanyal cho biết Juniper đang hợp tác với AMD về một thiết kế được xác nhận chung, kết hợp các thiết bị chuyển mạch hiệu suất cao của Juniper với NIC AMD Pollara sẵn sàng cho UEC. Một nhà tài trợ ban đầu khác của nỗ lực UEC là HPE, công ty đã đóng góp một lượng lớn tài sản trí tuệ nền tảng có trong đặc tả UEC 1.0.

Tương Lai Của UEC

Theo Mark Pearson, nhà công nghệ trưởng của HPE Aruba Networking, "Là trọng tâm của đặc tả UEC 1.0, khoảng 75% Giao thức truyền tải Ultra Ethernet (UET) lấy từ công nghệ truyền tải Slingshot của HPE, một công nghệ đã được chứng minh và triển khai trong các siêu máy tính hàng đầu thế giới." Pearson lưu ý rằng HPE đang triển khai đặc tả UEC 1.0 vào danh mục sản phẩm chuyển mạch của mình, bao gồm dòng HPE Aruba Networking CX và các sản phẩm chuyển mạch Trung tâm dữ liệu HPE Aruba Networking CX trong tương lai.

Theo J Metz, UEC chỉ mới bắt đầu. Bốn nhóm làm việc đã được khởi động sau khi công việc chính của 1.0 bắt đầu, mỗi nhóm với các sáng kiến riêng nhằm củng cố và đơn giản hóa việc triển khai UEC. Các nhóm này bao gồm: lưu trữ, quản lý, tuân thủ và hiệu suất. Ông lưu ý rằng tất cả các nhóm làm việc này đều có các dự án đang được phát triển để tăng cường tính dễ sử dụng, cải thiện hiệu quả ở các giai đoạn tiếp theo và đơn giản hóa việc cung cấp.

Kết luận

UEC cũng đang phát triển các tài liệu giáo dục để giúp thông báo cho các quản trị viên mạng về công nghệ và khái niệm UEC. Nhóm cũng đang hợp tác với các đối tác hệ sinh thái công nghiệp. "Chúng tôi có các dự án với OCP, NVM Express, SNIA, và nhiều đối tác khác – với nhiều dự án nữa đang được triển khai để làm việc trên từng lớp – từ vật lý đến phần mềm," Metz nói. "Chúng tôi không có mong muốn cố gắng làm tất cả mọi thứ cho tất cả mọi người, và đang làm việc với các chuyên gia trong ngành để giải quyết những vấn đề đó cùng nhau."

Với sự ra đời của đặc tả UEC 1.0 và sự hợp tác chặt chẽ từ các ông lớn trong ngành, tương lai của mạng lưới hiệu năng cao cho AI và HPC đang được định hình lại một cách mạnh mẽ. UEC không chỉ là một tiêu chuẩn mới mà còn là một khuôn khổ toàn diện, mở ra những khả năng chưa từng có, giúp các doanh nghiệp và tổ chức tối ưu hóa hạ tầng mạng để đón đầu kỷ nguyên dữ liệu lớn và AI.

BÀI VIẾT LIÊN QUAN