Inscrivez-vous pour accéder à toutes les fonctionnalités de notre service.
  • Recherche d'offres d'emploi
  • Favoris
  • Créer un CV
    Nouveau
  • Salaires
  • Souscriptions

MÉCANICIEN MACHINES INDUSTRIELLES

$90k - $140k par année

Principal Site Reliability Engineering specialist (SRE)

Principal Site Reliability Engineer (SRE)

Languages: Bilingual (French & English)

We are hiring a Principal Site Reliability Engineering specialist (SRE) to support the design, evolution, and operation of mission critical technology platforms. In this strategic and handson role, you will lead the adoption of SRE best practices, shape cloud and application architectures, and drive the reliability, performance, and availability of client services. You will influence engineering standards, strengthen operational excellence, and collaborate across development, operations, security, and business teams to deliver resilient, scalable, and modern cloud solutions.

You are an experienced SRE professional with deep technical expertise and a strong ability to improve reliability at scale. You communicate effectively with technical and business stakeholders, collaborate naturally across teams, and consistently drive continuous improvement. Recommend reliability focused solutions based on business and technical needs.

  • Define and influence cloud and application architectures aligned with performance, availability, and resilience goals.
  • Build, enhance, and maintain monitoring, logging, and alerting capabilities.

Develop and improve observability frameworks (monitoring, alerting, logging).

  • Automate operational and reliability processes using Python, Bash, Ansible, and cloud native tooling.
  • Integrate reliability automation into CI/CD pipelines and optimize delivery workflows.

Incident Management & Continuous Improvement

  • Lead major incident response, root cause analysis, and post mortem activities.
  • Collaboration & Technical Leadership
  • Partner with development, DevOps, architecture, security, and business stakeholders.
  • Act as a technical authority and trusted advisor on service reliability.
  • Promote knowledge sharing and foster continuous improvement in engineering practices.

Bachelor’s degree in Computer Science, Software Engineering, or related field—or equivalent experience.

  • Bilingual (French/English)
  • 5+ years of experience in SRE, DevOps, operations, or distributed systems.
  • Strong experience with cloud platforms (AWS, Azure, or GCP) and modern architectural patterns.
  • Proficiency in Linux, automation scripting (Python, Bash), and Infrastructure as Code (Terraform, CloudFormation).
  • Ability to influence stakeholders and provide strategic technical guidance.
  • French proficiency required; English proficiency considered an asset or required based on client context.

________________________________________

Core: SRE, DevOps, Incident Management, Observability, SLIs/SLOs/SLAs

  • Cloud: AWS / Azure / GCP
  • Infrastructure: Linux, Terraform, CloudFormation
  • Automation: Python, Bash, Ansible
  • The determination of this range includes factors such as skill set level, geographic market, experience and training, and licenses and certifications. At CGI, we value the strength that diversity brings and are committed to fostering a workplace where everyone belongs. Spécialiste principal(e) en ingénierie de la fiabilité des sites (SRE)

Langues : Bilingue (français et anglais)

Type d’emploi : Temps plein

Nous recrutons un(e) Principal Ingénieur Site Reliability (SRE) pour soutenir la conception, l’évolution et l’exploitation de plateformes technologiques critiques. Dans ce rôle stratégique et très opérationnel, vous dirigerez l’adoption des meilleures pratiques SRE, façonnerez les architectures cloud et applicatives, et piloterez la fiabilité, la performance et la disponibilité des services clients. Vous influencerez les normes d’ingénierie, renforcerez l’excellence opérationnelle et collaborerez avec les équipes de développement, d’exploitation, de sécurité et métiers afin de livrer des solutions cloud résilientes, évolutives et modernes.

Vous êtes un(e) professionnel(le) SRE expérimenté(e), doté(e) d’une expertise technique approfondie et d’une forte capacité à améliorer la fiabilité à grande échelle. Vous communiquez efficacement avec les parties prenantes techniques et métiers, collaborez naturellement entre les équipes et favorisez en permanence l’amélioration continue. Recommander des solutions axées sur la fiabilité en fonction des besoins métiers et techniques.

  • Définir et influencer les architectures cloud et applicatives alignées sur les objectifs de performance, de disponibilité et de résilience.
  • Concevoir, améliorer et maintenir les capacités de supervision, de journalisation et d’alerte.

Développer et améliorer les cadres d’observabilité (supervision, alerting, journalisation).

  • Automatiser les processus opérationnels et de fiabilité à l’aide de Python, Bash, Ansible et d’outils cloud natifs.
  • Intégrer l’automatisation de la fiabilité dans les pipelines CI/CD et optimiser les flux de livraison.

Gestion des incidents et amélioration continue

  • Diriger la gestion des incidents majeurs, l’analyse des causes profondes et les activités de post mortem.
  • Collaboration et leadership technique
  • Travailler en partenariat avec les équipes de développement, DevOps, d’architecture, de sécurité et les parties prenantes métiers.
  • Agir en tant qu’autorité technique et conseiller de confiance en matière de fiabilité des services.
  • Encourager le partage de connaissances et promouvoir l’amélioration continue des pratiques d’ingénierie.

Baccalauréat en informatique, en génie logiciel ou dans un domaine connexe — ou expérience équivalente.

  • Plus de 5 ans d’expérience en SRE, DevOps, exploitation ou systèmes distribués.
  • Forte expérience avec les plateformes cloud (AWS, Azure ou GCP) et les architectures modernes.
  • Maîtrise de Linux, des scripts d’automatisation (Python, Bash) et de l’infrastructure en tant que code (Terraform, CloudFormation).
  • Capacité à influencer les parties prenantes et à fournir une orientation technique stratégique.
  • Maîtrise du français requise ; la maîtrise de l’anglais est considérée comme un atout ou requise selon le contexte client.

Principales : SRE, DevOps, gestion des incidents, observabilité, SLI/SLO/SLA

  • Cloud : AWS / Azure / GCP
  • Infrastructure : Linux, Terraform, CloudFormation
  • Automatisation : Python, Bash, Ansible
  • Le calcul de cette fourchette dépend de divers facteurs, notamment le niveau de compétence, le marché géographique, l’expérience, la formation ainsi que les licences et certifications professionnelles. Principal Site Reliability Engineering specialist (SRE)

Principal Site Reliability Engineer (SRE)

Languages: Bilingual (French & English)

We are hiring a Principal Site Reliability Engineering specialist (SRE) to support the design, evolution, and operation of mission critical technology platforms. In this strategic and handson role, you will lead the adoption of SRE best practices, shape cloud and application architectures, and drive the reliability, performance, and availability of client services. You will influence engineering standards, strengthen operational excellence, and collaborate across development, operations, security, and business teams to deliver resilient, scalable, and modern cloud solutions.

You are an experienced SRE professional with deep technical expertise and a strong ability to improve reliability at scale. You communicate effectively with technical and business stakeholders, collaborate naturally across teams, and consistently drive continuous improvement. Recommend reliability focused solutions based on business and technical needs.

  • Define and influence cloud and application architectures aligned with performance, availability, and resilience goals.
  • Build, enhance, and maintain monitoring, logging, and alerting capabilities.

Develop and improve observability frameworks (monitoring, alerting, logging).

  • Automate operational and reliability processes using Python, Bash, Ansible, and cloud native tooling.
  • Integrate reliability automation into CI/CD pipelines and optimize delivery workflows.

Incident Management & Continuous Improvement

  • Lead major incident response, root cause analysis, and post mortem activities.
  • Collaboration & Technical Leadership
  • Partner with development, DevOps, architecture, security, and business stakeholders.
  • Act as a technical authority and trusted advisor on service reliability.
  • Promote knowledge sharing and foster continuous improvement in engineering practices.

Bachelor’s degree in Computer Science, Software Engineering, or related field—or equivalent experience.

  • Bilingual (French/English)
  • 5+ years of experience in SRE, DevOps, operations, or distributed systems.
  • Strong experience with cloud platforms (AWS, Azure, or GCP) and modern architectural patterns.
  • Proficiency in Linux, automation scripting (Python, Bash), and Infrastructure as Code (Terraform, CloudFormation).
  • Ability to influence stakeholders and provide strategic technical guidance.
  • French proficiency required; English proficiency considered an asset or required based on client context.

________________________________________

Core: SRE, DevOps, Incident Management, Observability, SLIs/SLOs/SLAs

  • Cloud: AWS / Azure / GCP
  • Infrastructure: Linux, Terraform, CloudFormation
  • Automation: Python, Bash, Ansible
  • The determination of this range includes factors such as skill set level, geographic market, experience and training, and licenses and certifications. At CGI, we value the strength that diversity brings and are committed to fostering a workplace where everyone belongs. Spécialiste principal(e) en ingénierie de la fiabilité des sites (SRE)

Langues : Bilingue (français et anglais)

Type d’emploi : Temps plein

Nous recrutons un(e) Principal Ingénieur Site Reliability (SRE) pour soutenir la conception, l’évolution et l’exploitation de plateformes technologiques critiques. Dans ce rôle stratégique et très opérationnel, vous dirigerez l’adoption des meilleures pratiques SRE, façonnerez les architectures cloud et applicatives, et piloterez la fiabilité, la performance et la disponibilité des services clients. Vous influencerez les normes d’ingénierie, renforcerez l’excellence opérationnelle et collaborerez avec les équipes de développement, d’exploitation, de sécurité et métiers afin de livrer des solutions cloud résilientes, évolutives et modernes.

Vous êtes un(e) professionnel(le) SRE expérimenté(e), doté(e) d’une expertise technique approfondie et d’une forte capacité à améliorer la fiabilité à grande échelle. Vous communiquez efficacement avec les parties prenantes techniques et métiers, collaborez naturellement entre les équipes et favorisez en permanence l’amélioration continue. Recommander des solutions axées sur la fiabilité en fonction des besoins métiers et techniques.

  • Définir et influencer les architectures cloud et applicatives alignées sur les objectifs de performance, de disponibilité et de résilience.
  • Concevoir, améliorer et maintenir les capacités de supervision, de journalisation et d’alerte.

Développer et améliorer les cadres d’observabilité (supervision, alerting, journalisation).

  • Automatiser les processus opérationnels et de fiabilité à l’aide de Python, Bash, Ansible et d’outils cloud natifs.
  • Intégrer l’automatisation de la fiabilité dans les pipelines CI/CD et optimiser les flux de livraison.

Gestion des incidents et amélioration continue

  • Diriger la gestion des incidents majeurs, l’analyse des causes profondes et les activités de post mortem.
  • Collaboration et leadership technique
  • Travailler en partenariat avec les équipes de développement, DevOps, d’architecture, de sécurité et les parties prenantes métiers.
  • Agir en tant qu’autorité technique et conseiller de confiance en matière de fiabilité des services.
  • Encourager le partage de connaissances et promouvoir l’amélioration continue des pratiques d’ingénierie.

Baccalauréat en informatique, en génie logiciel ou dans un domaine connexe — ou expérience équivalente.

  • Plus de 5 ans d’expérience en SRE, DevOps, exploitation ou systèmes distribués.
  • Forte expérience avec les plateformes cloud (AWS, Azure ou GCP) et les architectures modernes.
  • Maîtrise de Linux, des scripts d’automatisation (Python, Bash) et de l’infrastructure en tant que code (Terraform, CloudFormation).
  • Capacité à influencer les parties prenantes et à fournir une orientation technique stratégique.
  • Maîtrise du français requise ; la maîtrise de l’anglais est considérée comme un atout ou requise selon le contexte client.

Principales : SRE, DevOps, gestion des incidents, observabilité, SLI/SLO/SLA

  • Cloud : AWS / Azure / GCP
  • Infrastructure : Linux, Terraform, CloudFormation
  • Automatisation : Python, Bash, Ansible
  • Le calcul de cette fourchette dépend de divers facteurs, notamment le niveau de compétence, le marché géographique, l’expérience, la formation ainsi que les licences et certifications professionnelles.
L'offre d'emploi a été publiée il y a 11 jours
Des emplois similaires qui pourraient vous intéresserBasé sur l'offre MÉCANICIEN MACHINES INDUSTRIELLES à Montréal, QC
  •  ...Le poste : Titre du poste : Ingénieur en Fiabilité de Site (SRE) - Kubernetes sur Azure L'Ingénieur en Fiabilité de Site (SRE) spécialisé en Kubernetes sur Azure sera responsable de garantir la fiabilité, l'évolutivité et la disponibilité de la flotte Kubernetes de l'... 
    Site web
    Tarif journalier
    Emploi permanent
    Temps plein

    KLANIK

    Montréal, QC
    il y a 3 jours
  •  ...such as public cloud, data science, AI, engineering innovation, and IoT. Our customers include...  ...and growing. We are hiring a Senior Site Reliability / Gitops Engineer to our Information...  ...60 million Ubuntu users. As an Senior SRE & Gitops engineer you'll be in a unique... 
    Site web
    Travail au bureau
    Zone locale
    Travail à domicile
    Le monde entier
    Horaires flexibles

    Canonical

    Montréal, QC
    il y a 19 jours
  •  ...customers. Cohere is a team of researchers, engineers, designers, and more, who are passionate...  ...building high-performance, scalable and reliable machine learning systems? Do you want to...  ...NLP applications? We are looking for a Site Reliability Engineer to join the Model... 
    Site web
    Temps plein
    Travail au bureau
    Travail à distance
    Horaires flexibles

    Cohere

    Montréal, QC
    il y a 13 jours
  •  ...thinking organization, apply now.   We are currently seeking a Site Reliability Engineer w/Python (Onsite Hybrid) to join our team in Montreal, Quebec...  ...feedback on policy and procedures related to the delivery of SRE and operational practices with a view to continually making... 
    Site web
    Travail au bureau
    Travail à distance
    Horaires flexibles
    3 jours par semaine

    NTT DATA Services

    Montréal, QC
    il y a 18 jours
  •  ...Collaboration and Training: Work closely with Architecture, Site Reliability Engineering, Development, Cloud Operations and Finance to align on...  ...Promouvoir une culture FinOps Encourager l’adoption des principes et pratiques FinOps dans l’entreprise. Instaurer une culture... 
    Site web
    Apprentissage
    Travail au bureau
    Horaires flexibles

    WorkJam

    Montréal, QC
    il y a 10 jours
  •  ...Systems Reliability Engineering (SRE) is a production-oriented discipline focused on improving system service availability, observability, scalability...  ...on-call rotation and periodic conference calls with other specialists from other time zones. Successful candidates have... 
    Temps plein
    Travail au bureau
    Travail à distance

    Morgan Stanley

    Montréal, QC
    il y a 1 jour
  •  ...Regulatory team as an Application Support SME as well as expertise in SRE Role to support and ensure stability of critical applications...  ...our communities. This is a Software Production Management & Reliability Engineering III position at Director level, which is part of the job... 
    Temps plein
    Travail au bureau
    Travail à distance

    Morgan Stanley

    Montréal, QC
    il y a 1 jour
  •  ...of VIA Rail means being part of a collective effort towards sustainable mobility. Under the leadership of the Senior engineering manager, the reliability engineer will improve the reliability of VIA Rail's off-corridor fleet systems. He will optimize maintenance operations... 
    Stage

    VIA Rail Canada

    Montréal, QC
    il y a 5 jours
  • $60k - $115k par année

    DevOps SRE Specialist (Intermediate) Position Description To foster agility, software craftsmanship, and DevOps practices within the bank...  ...(intermédiaire) Job Description Mode de travail : Sur site Pour favoriser l'agilité, l'artisanat logiciel et les pratiques... 
    Site web
    Montréal, QC
    Il y a un mois
  •  ...25WD94192, Ingénieur logiciel principal English translation...  ...promouvoir les méthodologies, les principes et les valeurs agiles au sein...  ..., Principal Software Engineer Position Overview   At...  ...Responsibilities Write clean, reliable and secure code in different... 
    Principal / Directeur D'École
    Site web
    Temps plein
    Pour les contractants
    Travail au bureau
    Travail à distance

    Autodesk

    Montréal, QC
    il y a 1 jour
  • $83.3k par année

     ...About the role The Senior Electrical Engineer uses their expertise in the definition,...  ...products by addressing End Of Life and Reliability issues. Resolve engineering problems...  ...propos du rôle L’ingénieur électricien principal utilise son expertise dans la définition... 
    Principal / Directeur D'École
    Taux horaire
    Contrat Longue Durée
    Travail temporaire
    Travail posté

    Boston Scientific

    Montréal, QC
    il y a 9 jours
  • $240k - $260k par année

     ...Boston, New York, Chicago, Washington DC, Toronto, Montreal Principal Engineer ____ WHO WE ARE Oliver Wyman Performance...  ...mobile applications. With a mixture of over 700 consultants, specialists and support professionals in 16 major cities across the world... 
    Principal / Directeur D'École
    Salaire minimum
    Emploi permanent
    Travail au bureau
    Zone locale
    Travail à distance
    Travail à domicile
    Horaires flexibles
    3 jours par semaine
    1 jour par semaine

    Oliver Wyman

    Montréal, QC
    il y a 21 jours
  •  ...real difference. Job Description As an Application Engineering Specialist at Vention… You will be reporting directly to the...  ...of machines and after sales activities Travel to Client’s site (up to 2x per quarter) Qualifications What You Bring... 
    Site web
    Temps plein
    Stage
    Travail au bureau
    Travail à domicile

    Vention

    Montréal, QC
    il y a 4 jours
  •  ...national security. About your next Challenge as a Component Engineering Specialist : What will you do: Select mechanical and electronic...  ...be eligible to obtain and maintain a government of Canada “Reliability” status and Level 2 (Secret) security clearance. Must be... 

    L3Harris Technologies

    Montréal, QC
    il y a 17 jours
  •  ...L’ Ingénieur SRE Senior est le garant de la conception, de l’évolution et de la supervision de nos plateformes. Ton rôle est structurant et s’articule autour de trois piliers majeurs : une maîtrise totale de l’ Observabilité , une expertise Kubernetes (OKD) et une solide... 

    Ringover

    Montréal, QC
    Il y a un mois
  •  ...afin d'assurer la fiabilité des sites de Turbulent Surveiller les...  ...aux autres ingénieurs DevOps et SREs de votre équipe Qu'attendons-nous de notre DevOps Principal·e ? ~5 ans+ d'expérience...  ...being strategic in ensuring the reliability of Turbulent sites Monitoring... 
    Principal / Directeur D'École
    Site web
    Temps plein
    Travail d'été
    Recrutement immédiat
    Travail posté

    Cloud Imperium Games Limited

    Montréal, QC
    il y a 14 jours
  •  ...Role We are looking for a Principal of End User Services...  ...security, performance, and reliability. They will develop and execute...  ...Technology principles. Ensure best engineering practices and enhance user...  ...Innovation Work with technical specialists and architects to enhance... 
    Principal / Directeur D'École
    Site web
    Contrat Longue Durée
    Travail au bureau
    Horaires flexibles

    Intact

    Montréal, QC
    il y a 24 jours
  • $70k - $135k par année

    DevOps- SRE Description de poste SRE (Site Reliability Engineer) un développeur Java avec une majeur en DevOps (pipelines, monitoring-alerting-tracing (as-code), experience avec Github action et Argo CD Fonctions et responsabilités -Assurer la disponibilité et la... 
    Site web
    Montréal, QC
    il y a 10 jours
  • $109.9k par année

     ...Systems Product Development team. You will lead a team of Electrical Engineers in driving the advancement of new products and technologies for...  ...l'amélioration des produits existants. En tant que Responsable principal de la R&D - Conception de matériel électrique, vous dirigerez... 
    Principal / Directeur D'École
    Contrat Longue Durée
    Stage
    Le monde entier

    Boston Scientific

    Montréal, QC
    il y a 18 jours
  •  ...We are seeking a Senior Cloud Engineering Specialist to join our dynamic Cloud Infrastructure team. The ideal candidate brings deep technical...  ...markets and shape the future of our communities. This is a Principal Cloud & Infrastructure Engineering position at Vice President... 
    Temps plein
    Travail au bureau
    Travail à distance

    Morgan Stanley

    Montréal, QC
    il y a 1 jour
  •  ...- Data Infrastructure team as a Senior Data Infrastructure Engineering Specialist in Risk Tech to design and operate data assets and workflows...  ...on… What you’ll do in the role: Own and improve the reliability and stability of UAT data environments used by multiple application... 
    Emploi permanent
    Temps plein
    Travail au bureau
    Travail à distance

    Morgan Stanley

    Montréal, QC
    il y a 1 jour
  •  ...skills to support an Automated Sortation System. As part of the engineering function at UPS, the incumbent may be involved in Control Room...  ...using system analysis tools. Dispatching of field-support specialists/technicians and maintenance mechanics to resolve system issues... 
    Emploi permanent
    Temps plein
    Travail au bureau
    Travail posté

    UPS

    Montréal, QC
    il y a 18 jours
  • $60k - $115k par année

    Développeur en spécialiste de la fiabilité des sites (SRE) et JAVA Position Description Work...  ...Engineering (SRE) Developer, you are a specialist in developing and managing resilient...  ...knowledge, Kubernetes, Google Kubernetes Engine (GKE), AWS Required qualifications to... 
    Site web
    Montréal, QC
    Il y a un mois
  •  ...our Endpoint Security team as a Linux Endpoint Infrastructure Engineering Specialist in Cyber to design, engineer and operate solutions that...  ...automation, build, and documentation tasks with a focus on reliability and ongoing supportability. Contribute with strong analytical... 
    Temps plein
    Travail au bureau
    Travail à distance

    Morgan Stanley

    Montréal, QC
    il y a 1 jour
  • $35 - $60 par heure

     ...systems—documenting every failure mode so we can harden model reasoning. Organization : Alignerr Position : Computer Engineering Expert - AI Content Specialist Type : Hourly Contract Compensation : $35–$60 /hour Location : Remote Commitment : 10–40 hours/week What... 
    Taux horaire
    Сontrat
    Freelance
    Travail à distance
    Horaires flexibles

    Alignerr

    Montréal, QC
    il y a 4 jours
  •  ...We are currently looking to fill multiple GenAI engineering roles across the Montreal office. The firm is heavily investing in Montreal as an AI location with roles ranging from chatbot engineering, AI solution and platform engineering to data engineering for AI projects.... 
    Temps plein
    Travail au bureau

    Morgan Stanley

    Montréal, QC
    il y a 1 jour
  •  ...We’re seeking someone to join our AI Clouds Services team as an AI Cloud Solution Engineering Specialist in Architecture & Modernization to help build a firmwide AI Development Platform that will aid the adoption of AI capabilities throughout the enterprise. The ideal candidate... 
    Temps plein
    Travail au bureau
    Travail à distance

    Morgan Stanley

    Montréal, QC
    il y a 1 jour
  •  ...power our Firm, enabling our clients and colleagues to redefine markets and shape the future of our communities. This is a Workplace Engineering III position at Director level, which is part of the job family responsible for managing and optimizing the technical environment... 
    Temps plein
    Travail au bureau
    Travail à distance

    Morgan Stanley

    Montréal, QC
    il y a 1 jour
  • $80k - $98k par année

    Site Supervisor Technician ref.23787JW Our client, an engineering consulting firm, is looking for a Site Supervisor Technician (90% site work and 10% office work). ~Monitor municipal construction sites (cities, municipalities and developers); ~Read plans and specifications... 
    Site web
    Pour les contractants
    Travail au bureau

    Techaid Inc.

    Montréal, QC
    il y a 11 jours
  • $35 - $60 par heure

     ...documenting every failure mode so we can harden model reasoning. Organization : Alignerr Position : Mechanical Engineering Expert - AI Content Specialist Type : Hourly Contract Compensation : $35–$60 /hour Location : Remote Commitment : 10–40 hours/week What... 
    Taux horaire
    Сontrat
    Freelance
    Travail à distance
    Horaires flexibles

    Alignerr

    Montréal, QC
    il y a 19 jours

Voulez-vous recevoir plus d'offres d'emploi ?

S'abonner et recevoir des offres d'emploi similaires à MÉCANICIEN MACHINES INDUSTRIELLES. Soyez parmi les premiers à postuler !