Load balancing là một tính năng công nghệ rất quan trọng trong ngành mạng máy tính. TinoHost sẽ giúp các bạn hiểu thêm về Load balancing là gì, cách thức vận hành của Load balancing ra sao và lợi ích của Load balancing như thế nào trong bài viết sau nhé!
Tìm hiểu chung về Load balancing
Load balancing là gì?
Load balancing được tạm dịch là cân bằng tải. Đây là một phương pháp phân phối khối lượng tải trên nhiều máy tính, hoặc một cụm máy tính nhằm sử dụng tối ưu hoá các nguồn lực và tối đa hoá thông lượng, từ đó làm giảm thời gian đáp ứng cũng như giảm thiểu tình trạng quá tải trên máy chủ.
Ví dụ cụ thể bạn có thể thấy ngay trong đời sống của chúng ta và khá giống với Load balancer đó chính là “cảnh sát giao thông”. “Anh ấy” sẽ thực hiện các công việc như:
- Phân phối các yêu cầu (requests) trên nhiều server sao cho các yêu cầu đó tối ưu nhất – điều tiết giao thông.
- Đảm bảo rằng không có server nào quá tải – đảm bảo không kẹt đường.
- Nếu một server bị hỏng thì Load Balancer giúp chuyển hướng lưu lượng truy cập đến những server khác (nếu có). – Rất giống với điều hướng của mấy anh cho bạn đi đường khác để tránh kẹt xe dài thêm.
Một số khái niệm cần phân biệt:
- Load balancing là phương pháp.
- Load balancer là đối tượng thực hiện việc cân bằng tải. Load balancer có thể là một server hay một thiết bị chuyên dụng. Tuy nhiên nó không có Load balancer chức năng xử lý yêu cầu, Load balancer chỉ có thể phân phối các yêu cầu đến hệ thống backend.
Lợi ích của Load balancing
Uptime
Nhờ Load balancing, khi máy chủ gặp sự cố, toàn bộ lưu lượng truy cập sẽ được tự động chuyển đến các máy chủ còn lại. Trong hầu hết mọi trường hợp, những sự cố bất ngờ sẽ được phát hiện sớm và xử lý nhanh gọn, kịp thời từ đó không làm gián đoạn sự truy cập của người dùng.
Bảo mật hệ thống Datacenter
Với Load balancing, những yêu cầu của người dùng sẽ được tiếp nhận xử lý trước khi được phân phối đến các máy chủ. Trong quá trình phản hồi cũng sẽ thông qua Load balancing, từ đó giúp ngăn cản việc người dùng thực hiện tác động trực tiếp đến máy chủ. Phương pháp này giúp ẩn đi các thông tin và cấu trúc mạng nội bộ, từ đó chặn đứng được các cuộc xâm nhập trái phép vào cơ sở dữ liệu hay những cuộc tấn công mạng có chủ đích.
Sự linh hoạt
Với khả năng điều phối của mình, Load balancing điều phối giữa các máy chủ để xử lý các yêu cầu mà không làm gián đoạn các hoạt động khác trong cùng hệ thống.
Các thuật toán trong Load balancing
TinoHost sẽ giới thiệu đến các bạn 5 thuật toán được sử dụng trong các hệ thống cân bằng tải là:
- Round Robin
- Weighted Round Robin
- Dynamic Round Robin
- Least connections
- Least response time (Fastest)
Và bây giờ chúng ta sẽ tìm hiểu sâu hơn về từng thuật toán trong Load balancing.
Round Robin
Thuật toán Round Robin là thuật toán lựa chọn các máy chủ theo một trình tự nhất định. Load balancer sẽ bắt đầu từ máy chủ số 1 tương ứng trong danh sách, và Load balancer sẽ di chuyển dần đến hết danh sách theo thứ tự. Khi đến trang cuối cùng thì Load balancer sẽ bắt đầu lại.
Nhược điểm của Round Robin:
Khi có 2 yêu cầu song song từ phía người dùng, 2 yêu cầu đó sẽ có thể được gửi vào 2 server khác nhau. Điều này làm tốn thời gian tạo thêm kết nối với server thứ 2, trong khi đó server thứ nhất vẫn có thể trả lời được thông tin người dùng đang cần. Để giải quyết điều này, Round Robin được cài đặt cùng với các phương pháp duy trì session như sử dụng cookie.
Weighted Round Robin
Tương tự như kĩ thuật Round robin nhưng Weighted Round Robin còn có khả năng xử lý cấu hình của từng server đích một. Mỗi server được đánh giá khả năng bằng một số nguyên. Nếu server nào có khả năng xử lý mạnh hơn sẽ có số điểm đánh giá cao hơn. Từ đó Weighted Round Robin sẽ đổ đến server lượng yêu cầu tương ứng với khả năng xử lý của server đó.
Nhược điểm thuật toán Weighted Round Robin:
Weighted Round Robin gây mất cân bằng tải động nếu như tải của các request liên tục thay đổi trong một khoảng thời gian rộng.
Dynamic Round Robin
Thuật toán Dynamic Round Robin hoạt động gần giống với thuật toán Weighted Round Robin. Điểm khác biệt là trọng số ở đây dựa trên sự kiểm tra server một cách liên tục, do đó trọng số liên tục thay đổi.
Việc chọn server sẽ dựa trên rất nhiều khía cạnh trong việc phân tích hiệu năng của server trên thời gian thực. Ví dụ: số kết nối hiện đang có trên các server hoặc server trả lời nhanh nhất, …
Thuật toán này thường không được cài đặt trong các bộ cân bằng tài đơn giản. Nó thường được sử dụng trong các sản phẩm cân bằng tải của F5 Network.
Least connections
Least Connections có khả năng hoạt động tốt, ngay cả khi các kết nối biến thiên trong một khoảng lớn. Do đó nếu sử dụng Least Connections sẽ khắc phục được nhược điểm của Round Robin.
Với thuật toán Least Connections, các yêu cầu sẽ được chuyển vào server có ít kết nối nhất trong hệ thống. Thuật toán này được coi như thuật toán động, vì Least Connections phải đếm số kết nối đang hoạt động của server một cách liên tục.
Least Response Time (Fastest)
Least Response Time là thuật toán dựa trên tính toán thời gian đáp ứng của mỗi server (response time). Thuật toán này sẽ chọn server nào có thời gian đáp ứng nhanh nhất. Thời gian đáp ứng được xác định bởi khoảng thời gian giữa thời điểm gửi một gói tin đến server và thời điểm nhận được gói tin trả lời.
Việc gửi và nhận này sẽ được bộ cân bằng tải đảm nhiệm. Dựa trên thời gian đáp ứng, bộ cân bằng tải sẽ biết chuyển yêu cầu tiếp theo đến server nào.
Thuật toán Least Response Time thường được dùng khi các server ở các vị trí địa lý khác nhau. Server nào gần nhất với người dùng, thời gian đáp ứng của server đó sẽ nhanh nhất, và thuật toán sẽ sử dụng server gần nhất để trả lời yêu cầu từ người dùng.
Các loại giao thức trong Load balancing?
Khi là quản trị viên của hệ thống Load balancing, bạn sẽ có thể quy định chuyển tiếp với bốn loại giao thức chính là:
- HTTP – Load balancing HTTP thực hiện dựa trên cơ chế HTTP chuẩn. Bộ cân bằng sẽ có tiêu đề X-Forwarded-For, X-Forwarded-Proto, và X-Forwarded-Port nhằm cung cấp các thông tin về yêu cầu tới hệ thống backend.
- HTTPS – Load balancing HTTPS giống với load balancing HTTP nhưng có thêm phần mã hoá, việc mã hoá này được xử lý theo 1 trong 2 cách: duy trì mã hoá từ đầu đến cuối, 2 là đặt bộ giải mã trên Load balancing mà không mã hoá từ đầu đến cuối.
- TCP – Các ứng dụng không sử dụng HTTP hoặc HTTPS, thì lưu lượng TCP vẫn có thể cân bằng được. Chẳng hạn như lưu lượng truy cập vào một cụm cơ sở dữ liệu có thể được mở rộng trên tất cả các máy chủ.
- UDP – Hiện tại, một số hệ thống đã hỗ trợ cân bằng tải cho giao thức Internet cốt lõi như DNS và syslog sử dụng UDP.
Với những thông tin bài viết cung cấp, TinoHost hi vọng bạn đã tìm được những kiến thức mà bạn cần để phục vụ cho việc xây dựng và kiểm soát ổn định trang web của mình.
Những câu hỏi thường gặp
Một số phần mềm Load balancing phổ biến hiện nay?
Có rất nhiều phần mềm Load balancer có thể kể đến như: NGINX, Haproxy, LVS, Network Load balancing,…
Health Checks là gì?
Health Checks là quá trình mà Load balancer thực hiện kiểm tra “sức khỏe” định kỳ trên các server để đảm bảo chúng hoạt động tốt và đáp ứng được hiệu quả. Nếu xảy ra sự việc server hỏng dù bất cứ lý do gì, Load balancer sẽ phát hiện và ngừng việc gửi lưu lượng truy cập theo cách hoạt động riêng của Load balancer.
Load balancer Layer 4 là gì? Load balancer Layer 7 là gì?
Load balancer Layer 4 hay cân bằng tải Layer 4, hoạt động dựa trên dữ liệu được tìm thấy trong: các giao thức mạng, các giao vận layer như: IP, TCP, FTP, UDP.
Load balancer Layer 7 hay bộ cân bằng tải Layer 7, có khả năng thêm là: phân phối các yêu cầu (requests) dựa trên dữ liệu cụ thể của từng ứng dụng như HTTP header hay cookies, cũng có thể là dữ liệu trong chính các thông báo ứng dụng.
UDP là gì?
UDP là một trong những giao thức cốt lõi của giao thức TCP/IP. Dùng UDP, chương trình trên mạng máy tính có thể gửi những dữ liệu ngắn được gọi là datagram tới máy khác