Sre là gì

     

Site Reliability Engineering là gì?

Site Reliability Engineering (SRE), hay nói một cách khác là Kỹ sư làm chủ độ tin cậy, là khái niệm thành lập và hoạt động tại Google vào năm 2003, trước khi DevOps bắt đầu thịnh hành. Khi đó nhóm kỹ sư phần mềm được giao nhiệm vụ làm cho các trang website của Google trở nên đáng tin cậy, tác dụng và luôn luôn sẵn sàng nhằm mở rộng. Các phương pháp mà họ trở nên tân tiến đã đáp ứng tốt nhất có thể nhu mong của Google mang đến mức các công ty công nghệ lớn khác, chẳng hạn như Amazon cùng Netflix, cũng áp dụng và mang đến các tác dụng rất tốt.

Bạn đang xem: Sre là gì

Google sẽ mô tả tay nghề và phân phát hiện của chính mình trong cuốn “Site Reliability Engineering – How Google Runs Production Systems”. Bạn có thể tải về hiểu miễn phí. Cuốn sách giới thiệu các quan niệm như error budgets (tức thời hạn tối đa cơ mà hệ thống hoàn toàn có thể bị lỗi cơ mà không vướng lại hậu quả ảnh hưởng đến quý khách hay vừa lòng đồng), Service màn chơi Objective (SLO – là một thỏa thuận về một số trong những liệu rõ ràng như thời gian hoạt động hoặc thời hạn phản hồi). Đồng thời cuốn sách cũng bộc lộ các phương thức của Google về auto hóa, xử lý những trường hợp cấp bách và sự cố, khắc phục và hạn chế sự gắng và giám sát, cai quản rủi ro cũng giống như xây dựng các hệ thống có thể mở rộng. Cuốn sách cũng nói về những khía cạnh như tổ chức nhóm SRE và các nhiệm vụ theo yêu thương cầu.

*
Site Reliability Engineering book

Các Kỹ sư Site Reliability làm cho gì?

Ben Traynor, phó tổng giám đốc kỹ thuật trên Google cùng là người sáng lập Google SRE, đã xác định chính xác bản chất của vai trò SRE trong một cuộc bỏng vấn:

“Về cơ bản, SRE đang thực hiện quá trình mà trước đây được thực hiện bởi một đội quản lý (operations). Điều khác hoàn toàn là SRE sử dụng những kỹ sư có trình độ về phần mềm và hầu hết kỹ sư này còn có khả tự động hóa những hoạt động vui chơi của con người. Nói chung, team SRE phụ trách về tính sẵn sàng, độ trễ, hiệu suất, hiệu quả, làm chủ thay đổi, giám sát, ứng phó khẩn cấp và hoạch định công suất. ”

Các Site Reliability Engineer tạo nên cầu nối giữa trở nên tân tiến và vận hành bằng phương pháp áp dụng tứ duy kỹ thuật ứng dụng vào những chủ đề cai quản trị hệ thống. Chúng ta phân chia thời gian giữa việc quản lý và trở nên tân tiến giúp tăng mức độ tin cậy và năng suất của hệ thống. Google không cho phép các Site Reliability Engineer dành riêng hơn 50% thời gian của họ cho các tác vụ vận hành và coi bất kỳ vi phạm nào đối với quy tắc này là tín hiệu của một khối hệ thống không tốt.

Theo Google, mục tiêu sau cùng của Site Reliability Engineering là auto hóa để xong xuôi công việc. Một cách đặc biệt quan trọng để làm điều đó là xây dựng những công vậy tự ship hàng cho những nhóm fan dùng nhờ vào dịch vụ họ nên (ví dụ: cung ứng môi trường thể nghiệm tự động, ghi logs, hiển thị báo cáo.. ). Làm vậy nên sẽ bớt bớt quá trình cần tiến hành cho toàn bộ các bên, chất nhận được các nhà trở nên tân tiến tập trung hoàn toàn vào việc cách tân và phát triển tính năng và được cho phép họ tập trung vào nhiệm vụ tiếp theo sau để tự động hóa hóa. Những Site Reliability Engineer cùng tác nghiêm ngặt với những nhóm cách tân và phát triển sản phẩm để bảo đảm an toàn rằng phương án đưa ra đáp ứng nhu cầu được các yêu ước phi chức năng như tính khả dụng, hiệu suất, bảo mật thông tin và năng lực bảo trì. Chúng ta cũng thao tác với các kỹ sư phát hành để bảo đảm an toàn rằng tiến trình phát hành phần mềm là hiệu quả nhất bao gồm thể.

Làm sao để biến hóa một Site Reliability engineer?

Để đổi mới một Site Reliability Engineer, bạn cần có background là kỹ sư phần mềm hoặc kỹ sư hệ thống. Điều đặc biệt quan trọng là bạn có được một nền tảng vững chắc và kiên cố trong cả hai nghành nghề đó. Đồng thời bạn cần phải có ý thức về sự đổi mới và auto hóa. Nếu như bạn là một kỹ sư khối hệ thống và muốn cải tiến kỹ năng lập trình, hoặc bạn là 1 trong kỹ sư phần mềm và mong muốn học cách cai quản những khối hệ thống có quy mô lớn thì SRE chính là vị trí chúng ta nên hướng tới.

Tại sao Site Reliability Engineering lại quan liêu trọng?

SRE mang về rất nhiều tác dụng ý nghĩa:

Giảm thiểu thời hạn để sửa lỗi (time to lớn repair – MTTR) và thời gian trung bình thân hai lỗi (mean time between failures – MTBF)Đẩy cấp tốc việc update phần mềm cùng sửa lỗi.Giảm thiểu những rủi ro vì con tín đồ bằng cách tự động hóa hóa.Giảm thiểu sự quá tải của nhân viên.Cân bởi sự nỗ lực giữa những developers cùng đội SRE vì chưng cả hai bao gồm cùng mục tiêuNâng cao sự bảo mật thông tin và tương thíchCân bằng những yêu cầu.

Xem thêm: Hướng Dẫn Cài Đặt Ổ Cứng Mới Trên Windows 10, Cài Đặt Ổ Cứng Mới

Mức lương của những SRE cố nào?

Trên các site tuyển chọn dụng chăm ngành IT rất có thể dễ dàng tìm kiếm thấy những vị trí SRE sẽ tuyển với mức lương vừa đủ từ 1,000 mang đến 1,500 USD. Riêng những vị trí lead lương hoàn toàn có thể lên mang lại 3,500 USD trên Việt Nam.

*
Một tin tuyển dụng về địa chỉ Lead Site Reliability Engineer

Tại Mỹ, lương vừa đủ của một SRE là vào lúc $120K theo Glassdoor.

Khác nhau giữa Site Reliability Engineer với DevOps?

Bạn có thể nghĩ SRE bao gồm vẻ giống hệt như DevOps. Nhưng sự thật không buộc phải vậy. DevOps với SRE yêu cầu được xem là các quy tắc bổ sung cập nhật cho nhau. Thân DevOps cùng SRE có một số điểm khác biệt cơ bản:

DevOps chủ yếu về việc triệu tập vào việc tăng tốc vòng đời phát triển ứng dụng (Soft Ware Development Life Cycle – SDLC) với thắt chặt sự bắt tay hợp tác giữa nhóm ngũ quản lý và vận hành và những kỹ sư phần mềm. DevOps giúp những developer xúc tiếp sâu hơn với các hệ thống đang hoạt động và chất nhận được các team vận hành tiện lợi thông báo các vấn đề nghiêm trọng cho nhóm phạt triển.Trên thực tế, những nhóm SRE là 1 phần không thể thiếu hụt trong vấn đề xây dựng kiểm thử chủ động, kĩ năng quan sát, độ tin cẩn của dịch vụ và vận tốc để cấu thành một đội nhóm chức lấy DevOps làm trung tâm.SRE là một phương pháp để xác định các điểm yếu kém của hệ thống, kiểm test các môi trường production và giải quyết các vấn đề trước khi chúng trở đề nghị nghiêm trọng. SRE như là một trong những phần của DevOps, trong đó team triệu tập vào việc cải thiện độ tin cẩn của những dịch vụ kỹ thuật thông qua việc hợp tác và ký kết chặc chẽ và dữ thế chủ động tối ưu hóa những dư thừa cũng giống như các hoạt động giám gần kề và cảnh báo.

Bảng sau đây giúp bạn tưởng tượng sự khác biệt giữa DevOps với SRE theo Google:

DevOps

SRE

Tăng cường sự hợp tác ký kết trong tổ chức

Chia sẻ quyền sở hữa với các developers bằng cách dùng chung các công gắng và kỹ thuật trên toàn thể hệ thống. 

Chấp nhận những thất bại

Có bí quyết cho việc cân bằng giữa những sự vắt và thất bại trong các lần gây ra mới

Thực hiện sự thay đổi từng bước

Khuyến khích biến đổi nhanh chóng bằng cách giảm ngân sách chi tiêu thất bại (failure cost) .

Tận dụng hiện tượng và tự động hóa

Khuyến khích việc tự động hóa hóa các công việc và giảm thiểu các các bước làm thủ công để tập trung vào các nỗ lực mang lại giá trị lâu bền hơn cho hệ thống. 

Đo lường hầu như thứ

Cho rằng các vận động (operations) là vụ việc của phầm mềm, cùng định nghĩa các cách theo cơ chế để giám sát và đo lường mức độ sẵn sàng, thời hạn hoạt động, thời hạn ngừng…

Các vị trí rất có thể có trong team SRE?

Có các tên gọi khác biệt tùy công ty cho những vị trí vào team SRE trong số đó có một trong những vị trí phổ biến như SRE Team Lead, System Architect, SRE Infrastructure Engineer, Release manager, Monitoring engineer

*
Sơ đồ gia dụng một team SRE đặc trưng. Ảnh Relevant Software

Các kĩ năng một SRE cần phải có là gì?

Trách nhiệm thiết yếu của SRE bao hàm theo dõi cùng phân tích hiệu suất thao tác làm việc của các khối hệ thống đang được vận hành. Tùy trực thuộc và khối hệ thống hay dịch vụ mà các chuyên viên SRE dùng những công cụ phù hợp trong công việc của mình. Mặc dù nhiên, cho dù làm với hệ thống nào và dùng phép tắc gì thì một số tài năng kỹ thuật và phi nghệ thuật sau đấy là yêu cầu cần phải có đối với mỗi Site Reliability Engineer 

Kỹ năng kỹ thuật:

Nắm vững kỹ năng về cai quản phiên bản (version control)Chuyên gia về hệ quản lý và điều hành LinuxHiểu về DevOps và biết cách áp dụng.Chuyên gia về CI/CD (Continuous Integration & Continuous Delivery)Chuyên gia về sử lý vấn đề, xử trí sự cố.Có kinh nghiệm tay nghề về viết code.Hiểu về nền tảng ứng dụng (software stack)

Kỹ năng mềm:

Phân tích nhiệm vụ (Business analysis)Làm câu hỏi nhómKỹ năng xử lý vấn đềLàm vấn đề dưới áp lực caoKỹ năng giao tiếp, bao gồm cả viết lẫn nóiKỹ năng diễn giải kỹ thuật đến các đối tượng người dùng khác nhau.

Xem thêm: 8+ Cách Giải Phóng Dung Lượng Hệ Thống Iphone Cao, Xóa Dung Lượng Hệ Thống Trên Iphone

Kết luận

Site Reliability Engineering ngày càng quan trọng đặc biệt trong các công ty. Vì chưng vậy bài toán tuyển dụng các vị trí SRE ngày càng phổ biến không chỉ có tại Silicon Valley mà ngay tất cả ở Việt Nam. Nếu bạn có nhu cầu trở thành một SRE hãy bắt đầu chuẩn bị tức thì từ bây giờ. Cơ hội sẽ có không ít ở phía trước.

 

Bạn có biết?

tham gia cộng đồng vachngannamlong.com bên trên Linkedin, Facebook và các kênh mạng xã hội khác có thể giúp bạn lập cập tìm được phần lớn chủ đề cách tân và phát triển nghề nghiệp và cập nhật thông tin về câu hỏi làm IT mới nhất Linkedin Page: https://bit.ly/Linkedinvachngannamlong.com Facebook Group: https://bit.ly/vachngannamlong.comvn cơ hội việc làm cho IT : vachngannamlong.com