Chúng tôi đang tìm kiếm một nhân sự có kỹ năng chuyên môn cao để tham gia vào vận hành, đảm bảo hệ thống công nghệ thông tin cho chuỗi sản xuất và bán lẻ hàng thời trang và gia dụng, với hàng trăm cửa hàng trên toàn quốc.
Ứng viên sẽ chịu trách nhiệm xây dựng và duy trì cơ sở hạ tầng hoạt động ổn định, kiểm soát rủi ro để hỗ trợ nền tảng công nghệ bao gồm Python, Postgres, Redis, RabbitMQ, VMWare, NodeJS, MongoDB, MySQL và Linux.
Nhiệm vụ chính:
1. Quản lý Cơ sở hạ tầng:
Thiết kế, triển khai và duy trì cơ sở hạ tầng có tính sẵn sàng cao và khả năng mở rộng bằng cách sử dụng VMWare cho ảo hóa.
Tối ưu hóa và quản lý cơ sở dữ liệu sử dụng Postgres, MongoDB đảm bảo hiệu suất cao và độ tin cậy.
Cấu hình và duy trì các dịch vụ middleware như Redis và RabbitMQ để hỗ trợ nhu cầu ứng dụng.Giám sát Hệ thống và Ứng phó Sự cố:
Phát triển và triển khai các chiến lược giám sát cho tất cả các lớp của nền tảng công nghệ, bao gồm hiệu suất của ứng dụng, tình trạng hệ thống và sự ổn định về hạ tầng mạng.
2. Giám sát Hệ thống và Ứng phó Sự cố:
Phát triển và triển khai các chiến lược giám sát cho tất cả các lớp của nền tảng công nghệ, bao gồm hiệu suất của ứng dụng, tình trạng hệ thống và sự ổn định về hạ tầng mạng.
Chủ động xác định các vấn đề tiềm ẩn và giải quyết sự cố để giảm thiểu thời gian ngừng hoạt động và đảm bảo tính sẵn sàng 24/7.
Triển khai các quy trình cảnh báo tự động và ứng phó sự cố để giải quyết các vấn đề một cách nhanh chóng và hiệu quả.
3. Điều chỉnh và Tối ưu hóa Hiệu suất:
Liên tục đánh giá và tối ưu hóa hiệu suất hệ thống, tập trung vào việc giảm độ trễ và tăng khả năng xử lý.
Hợp tác với các nhóm phát triển để tối ưu hóa các ứng dụng Python, NodeJS về hiệu suất và khả năng mở rộng.
Tinh chỉnh cơ sở dữ liệu Postgres, MongoDB, MySQL để xử lý hiệu quả các khối lượng truy vấn lớn và phức tạp.
4. Tự động hóa và Công cụ giám sát
Phát triển và duy trì các công cụ tự động hóa để cải thiện hiệu quả hoạt động, bao gồm các quy trình triển khai, quản lý cấu hình và các công cụ giám sát.
Triển khai áp dụng Infrastructure as Code (IaC) để đảm bảo tính nhất quán và khả năng tái sử dụng trong quá trình triển khai.
5. Hợp tác và Giao tiếp:
Làm việc chặt chẽ với các nhóm phát triển, vận hành và sản phẩm để đảm bảo việc triển khai và vận hành trơn tru các ứng dụng, đặc biệt là Odoo.
Tham gia vào việc đánh giá mã nguồn, thảo luận về kiến trúc và cung cấp các hướng dẫn về độ tin cậy và khả năng mở rộng của hệ thống cho đội ngũ phát triển.
6. Bảo mật và Tuân thủ:
Triển khai và duy trì các thực tiễn tốt nhất về bảo mật trên toàn bộ cơ sở hạ tầng, đảm bảo tuân thủ các tiêu chuẩn và quy định của ngành.
Thường xuyên thực hiện các đánh giá và kiểm tra bảo mật, và giải quyết các lỗ hổng một cách kịp thời.
7. Lập kế hoạch Năng lực và Phục hồi sau Thảm họa:
Tiến hành lập kế hoạch năng lực để đảm bảo cơ sở hạ tầng có thể đáp ứng các nhu cầu hiện tại và tương lai.
Phát triển và duy trì các kế hoạch phục hồi sau thảm họa để đảm bảo tính liên tục của hoạt động kinh doanh trong trường hợp xảy ra các sự cố lớn.
Yêu Cầu Công Việc
1. Học vấn: Bằng cử nhân về Khoa học Máy tính, Công nghệ Thông tin hoặc một lĩnh vực liên quan. Các chứng chỉ liên quan là một lợi thế.
2. Kinh nghiệm: Tối thiểu 3-5 năm kinh nghiệm làm việc với vai trò SRE, Kỹ sư DevOps hoặc trong một vai trò tương tự, quản lý và tối ưu hóa các nền tảng công nghệ phức tạp.
3. Kỹ năng kỹ thuật:
Thành thạo Python để viết kịch bản và tự động hóa.
Kinh nghiệm vững chắc về quản trị cơ sở dữ liệu Postgres, MySQL, MongoDB.
Kinh nghiệm thực tế với Redis và RabbitMQ để quản lý middleware.
Chuyên môn về ảo hóa sử dụng VMWare.
Hiểu biết sâu sắc về hệ điều hành Linux, bao gồm quản trị hệ thống và viết kịch bản shell.
Kinh nghiệm triển khai và bảo trì ứng dụng Odoo là một lợi thế.
4. Kỹ năng mềm:
Kỹ năng giải quyết vấn đề linh hoạt với cách tiếp cận chủ động để xác định và giải quyết các vấn đề.
Có kỹ năng giao tiếp, có khả năng làm việc hiệu quả và mềm dẻo giữa các nhóm.
Khả năng làm việc trong môi trường nhịp độ nhanh, quản lý nhiều nhiệm vụ với các cấp độ ưu tiên khác nhau.