Développeur Senior Traitement de Données ML
LoiZéro
Nous recherchons un·e Développeur.euse sénior, Traitement de Données ML pour participer au développement, à l’édition et à la mise à l'échelle de notre pipeline d'actifs de données. À la jonction de l'ingénierie des données, de l’édition des données et de l'apprentissage automatique, vous serez responsable de l’entièreté du pipeline qui transforme les données brutes à l'échelle du web en ensembles de données à haut signal utilisés pour entraîner l'IA-Chercheur.
Dans ce rôle, vous ne vous contenterez pas de gérer les données ; vous en concevrez la qualité. Vous élaborerez le filtrage algorithmique, développerez des mécanismes de notation basés sur des modèles et assurerez une intégrité rigoureuse des bancs d'essai pour alimenter la prochaine génération d'IA. Et à mesure que nos modèles dépasseront les paradigmes établis, vous concevrez et implémenterez de nouvelles transformations de données qui n'ont pas encore de guide d'utilisation, travaillant à la frontière de ce que peuvent être les données d'entraînement.
Nous recrutons plusieurs personnes pour ce poste, et les responsabilités pourront être réparties au sein de l'équipe en fonction de l'expérience, des compétences et des intérêts de chacun·e .
Responsabilités clés
- Travailler en partenariat avec l'équipe de Recherche pour définir, construire, automatiser, mettre à l'échelle et gérer des pipelines de données qui transforment les données brutes à l'échelle du web en ensembles de données d'entraînement pour l'IA-Chercheur.
- Construire et maintenir des pipelines de traitement de données, incluant la dé-duplication, la notation de qualité basée sur des modèles, le filtrage heuristique, la suppression de la toxicité, le masquage des informations personnelles identifiables (IPI ( PII )), l'extraction de métadonnées et les transformations de données propriétaires, avec un versionnage et un suivi de la provenance des ensembles de données complets, en optimisant le débit et le coût à l'échelle.
- S'assurer que toutes les données ingérées répondent aux exigences de conformité, aux politiques internes de gouvernance des données et aux obligations légales.
- Développer et affiner la suite d'outils de notation et de filtrage : heuristiques, évaluateurs basés sur les grands modèles de langage (“ LLM-as-a-judge ”), classificateurs ML, modules d'extraction de métadonnées et flux de travail de révision avec intervention humaine (" human-in-the-loop ") requis pour le traitement et l'assurance qualité des données.
- Instrumenter les pipelines de traitement de données avec de la surveillance de la qualité des données, des garde-fous et des alertes pour détecter les régressions avant qu'elles ne se propagent en aval.
- Collaborer avec l'équipe de Recherche et d'autres équipes pour comprendre l'évolution des exigences en matière de données, puis identifier et acquérir de vastes corpus de texte qui répondent à ces exigences. Cela comprend la réalisation d'analyses systématiques de couverture pour identifier les lacunes dans le corpus et le développement de stratégies d'acquisition ciblées pour y remédier, ainsi que la collaboration avec l'équipe juridique et de gouvernance pour obtenir la licence de nouvelles sources de données.
- Concevoir et maintenir des mécanismes stricts de détection des fuites pour se prémunir contre la contamination de l'évaluation à toutes les étapes du pipeline de traitement des données.
- Construire des outils et des interfaces internes qui permettent aux chercheurs d'explorer, d'interroger et de comprendre les ensembles de données disponibles avec un minimum de friction.
Compétences et qualifications
- Diplôme en informatique, en génie logiciel ou dans un domaine connexe.
- Expérience avérée dans le traitement des ensembles de données textuelles non structurées massives (échelle du billion de jetons), avec plus de 5 ans d'expérience dans le traitement des données, l'ingénierie de l'apprentissage automatique ou le traitement du langage naturel ( NLP ).
- Expérience pratique des cadres de traitement distribué (par exemple, Spark, Ray, Flink), de la conception et de l'optimisation des pipelines à haut débit.
- Expérience de la mise en œuvre de la confidentialité des données (masquage des IPI), du filtrage de la sécurité du contenu (toxicité, biais) et de la prévention de la contamination de l'évaluation.
- Capacité démontrée à travailler avec des équipes de Recherche, d'Ingénierie et/ou Juridique/de Gouvernance, à traduire les exigences variées en travail concret de pipeline.
- Solide maîtrise de Python, y compris l'écriture de code de traitement de données de qualité production.
- Expérience des cadres d'orchestration de pipelines (par exemple, Airflow, Prefect, Dagster).
Atouts
- Expérience dans la formation, l'affinage (" fine-tuning ") ou le déploiement de modèles ML pour des tâches de qualité des données (classificateurs, évaluateurs basés sur les LLM) et familiarité avec l'optimisation de l'inférence LLM (par exemple vLLM, SGLang).
- Familiarité avec le déploiement conteneurisé (Docker, Kubernetes) et les pratiques d'infrastructure en tant que code (" infrastructure-as-code ").
- Familiarité avec les outils de suivi des expériences ML (par exemple Weights and Biases).
- Expérience des flux de travail de licence de données ou de l'acquisition de données à l'échelle du web.
- Contributions aux outils open-source de traitement de données ou de NLP.
Ce que nous offrons
- La possibilité de contribuer de manière significative à une initiative d'importance mondiale.
- Des avantage sociaux complets en matière de santé (incluant un compte de gestion de la santé mentale et du bien-être).
- 20 jours de vacances par an dès l'embauche.
- Une contribution de l'employeur de 4 % à votre épargne-retraite, sans exigence de contribution équivalente de la part de l'employé.
- Une rémunération supplémentaire totalisant 8 % de votre salaire, à attribuer à une épargne-retraite supplémentaire ou à des primes (non lié à la performance).
- Une équipe d'experts passionnés et compétents.
- Un environnement de travail collaboratif et inclusif dans nos bureaux situés au cœur de la Petite Italie, dans le quartier branché de Mile-Ex, à proximité des transports en commun.
À propos de LoiZéro
LoiZéro est une organisation à but non lucratif dédiée à faire progresser la recherche et à développer des solutions techniques permettant de concevoir des systèmes d'IA sécuritaires. Son approche scientifique repose sur de nouvelles recherches et méthodes proposées par le professeur Yoshua Bengio, le chercheur en IA le plus cité au monde. Basée à Montréal, LoiZéro mène des recherches pour concevoir des systèmes d’IA non agentiques qui apprennent à comprendre le monde plutôt qu'à y intervenir, en répondant de manière véridique aux questions posées sur la base d'un raisonnement probabiliste transparent et extériorisé. De tels systèmes d'IA pourraient être utilisés pour accélérer la découverte scientifique, superviser les systèmes d'IA agentiques et faire progresser notre compréhension des risques de l'IA et des moyens de les éviter. LoiZéro croit que l’IA doit être considérée comme un bien public mondial, développée et utilisée de manière sécuritaire pour favoriser l’épanouissement humain. Plus d’information :
Vous avez votre place ici
À LoiZéro, la diversité nous tient à cœur. Nous valorisons un environnement de travail équitable, ouvert et respectueux des différences. Nous encourageons les candidatures de personnes hautement qualifiées désireuses de travailler à la réalisation de notre mission dans un cadre respectueux, inclusif et collaboratif.
Vos informations personnelles seront collectées et traitées par LoiZéro afin d'évaluer votre demande d'emploi conformément à notre politique de vie privée . En vertu des lois sur la protection de la vie privée en vigueur dans votre pays de résidence, vous pouvez disposer de plusieurs droits en matière de protection de la vie privée, comme celui de demander l'accès à vos informations personnelles ou de demander que vos informations personnelles soient rectifiées ou effacées. Vous trouverez des détails sur la manière dont vous pouvez exercer vos droits dans notre politique de protection de la vie privée.
- ...Nous recherchons un·e Développeur.euse sénior, Plateforme de données ML visionnaire et hautement technique pour concevoir, implémenter, faire évoluer et maintenir le moteur de données qui alimente nos modèles de pointe ( frontier models ) de prochaine génération. Dans...DataSeniorApprenticeshipWork at office
- ...consensus. Nous recherchons un dévloppeur de données pour rejoindre notre équipe IA et... ...travail en IA. Développer des "workflows" de traitement de données pour préparer et optimiser les... .... Collaborer avec les ingénieurs ML afin d’optimiser les formats de données et...DataWork at officeWorldwide
- ...sécuritaire. Description du poste En tant que Développeur Sénior en Transfert de Données, vous concevrez, développerez et ferez évoluer des systèmes... ...selon les ressources disponibles Assurer le traitement efficace de données complexes, notamment dans le domaine...DataSeniorPermanent employmentFull timeWork at officeRemote workWorldwide
- ...organisation. Nous recherchons un profil hybride passionné par les données, capable de faire le pont entre l’ingénierie de données et l’... ...un atout) Connaissance d’un langage de programmation pour le traitement de données (Python un atout) Forte capacité d’analyse, d’organisation...DataSeniorPermanent employmentFull timeFlexible hours
- ...créer l’inconnu! Description du poste En tant que Développeur·euse de données à Ubisoft Montréal , vous intégrerez le domaine Joueur... ...responsable de la conception et de la livraison de chaînes de traitement de données répondant à des normes élevées de qualité , de...DataFull timeWork at office
$70k - $135k per year
Développeur spécialiste des données Description de poste Rejoignez notre équipe de données CGI où l’expertise data façonne l’avenir... ...et d'expérience dans un rôle technique. Séniorité : Intermédiaire ou senior. Expérience • 3 à 5 ans et plus d'expérience...DataSeniorDay shift- ...En plus de travailler en mode agile, un emploi en sciences de données chez GIRO c’est : Analyser, penser de manière critique face à... ...apprentissage profond pour résoudre des problèmes réels de prédiction et traitement du langage naturel. Expérience d’intégration d’un LLM dans un...DataDaily paidContract workApprenticeshipInternshipRemote workFlexible hours
- ...An English version will follow. Développeur·euse principal·e de données La plateforme de données de Plusgrade alimente les décisions et les modèles d'IA pour les plus grandes marques de voyage au monde, et nous recherchons une personne prête à façonner l'évolution de...DataSeniorWork at officeRemote workFlexible hours
$75k - $130k per year
Développeur sénior – Ingénierie de plateforme de données Description de poste Mode de travail: Hybride, 2 jours en présentiel Le Développeur sénior en ingénierie de plateforme de données jouera un rôle clé dans la conception, le développement, l'évolution et l'opérationnalisation...DataSeniorDay shift- ...développe, servent à optimiser l'utilisation des données massives de santé pour la recherche et ainsi contribuer à l'amélioration des traitements et diagnostics des petits patients du CHU... ...de données Nous recherchons un développeur spécialiste de données médicales pour...DataFull timeRemote work
- ...notre page carrières officielle Votre rôle à titre de Développeur(euse) de données principal(e) Nous recherchons un(e) Développeur(euse) de... ...produits, une gestion de l'admissibilité en temps réel et le traitement des remboursements. Ces systèmes améliorent notre produit,...DataDaily paidFull timeApprenticeshipWork at office
- ...avez une expérience en développement de données, une forte maîtrise des outils numériques... ...A220 est à la recherche d'un Développeur de solutions de données et d'intelligence... ...PostgreSQL), de Python (PySpark) pour le traitement des données et du JavaScript pour la personnalisation...DataPermanent employmentFull timeContract workApprenticeshipFlexible hours
- ...poste Prelib est à la recherche d'un développeur logiciel senior pour se joindre à une petite équipe d'... ...atout. De bonnes bases en bases de données, particulièrement les bases de données... ...dans une autre industrie réglementée traitant des données sensibles. Une...DataSeniorFull time
- ..., notamment par le développement et l’évolution de pipelines de données fiables et scalables. La personne est également responsable de... ...qualité et l’intégrité des données tout au long de la chaîne de traitement, en veillant au respect des bonnes pratiques de gouvernance, de...DataFull time
- ...success. Nous recherchons un.e Développeur.euse Java Senior avec 5 à 15 ans d’expérience professionnelle... ...piloté par les tests (TDD) et le traitement multifilière . L’expérience dans le... ...les interactions avec les bases de données. Développer des applications...DataSeniorFull timeWork at officeLocal areaWorldwideWork visa
- ...authentique et d’exceller. Votre profil À titre de développeur/développeuse logiciel senior, vous intégrerez une équipe qui conçoit des logiciels... ...similaires; ~ Maîtrise avancée de la modélisation de bases de données NoSQL avec DynamoDB (y compris la conception de tables...DataSenior
- En tant que Développeur Python vous évoluerez au cœur de projets d’ingénierie de données et d’automatisation intelligente, en concevant des solutions Python avancées intégrant... ...dont une part significative en ingénierie ou traitement de données ; ~Excellente maîtrise de Python (...DataDaily paidPermanent employment
$80k - $120k per year
Développeur .NET Sénior Description de poste Mode de travail: Hybride, 2 jours/semaine en présentiel. Description de poste – Développeur... ...et livrer les fonctionnalités conformément à la Definition of Done Être responsable de la livraison du contenu des sprints dans...SeniorDay shift- ...antérieures Vous avez 8 ans et plus d'expérience en tant que développeur.euse fullstack. Diplôme en programmation informatique ou... ...implémentation d'API REST. Connaissance approfondie des bases de données relationnelles et non relationnelles (MySQL, Redis)....SeniorFull timeSummer work
- ...agréable. Aperçu du rôle En tant que développeur·euse logiciel sénior avec une solide expérience en data... ...et livres des solutions robustes en données et en apprentissage machine pour nos clients... ...liées au cycle de vie des modèles ML, l’infrastructure, le CI/CD, l’...DataSeniorFull timeApprenticeship
- ...Nous recherchons un.e développeur.se de recherche sénior en apprentissage automatique pour rejoindre notre équipe... ...et les plateformes de données (par exemple, les bases de données vectorielles... ...informations personnelles seront collectées et traitées par LoiZéro afin d'évaluer votre...DataSeniorApprenticeshipWork at officeFlexible hoursDay shift
- ...du monde entier. Fondée en 2012 par le développeur de jeux renommé Chris Roberts, Cloud... ...nous de notre Développeur.euse Full-Stack Senior ? ~5 ans et plus d'expérience en développement... .... ~ Bonne connaissance des bases de données MySQL et Redis, notamment pour l'...SeniorFull timeWorldwide
- ...Wepoint est à la recherche d’un profil sénior pour rejoindre son équipe spécialisée en... ...avec des équipes techniques (architectes, développeurs, devops, analystes qualités) et des équipes... ...maîtrise de Entity Framework pour l’accès aux données Bonne connaissance des bases de...DataSeniorFull timeApprenticeshipWork at officeRemote work
- ...Nous sommes actuellement à la recherche d’un développeur logiciel senior ou d’une développeuse logicielle senior afin de se joindre à notre équipe d’ingénierie à Montréal. La personne choisie contribuera à la conception, au développement, à la vérification et à la maintenance...SeniorFull timeApprenticeship
- ...levons avec la motivation de faire du monde un endroit plus efficace et plus agréable. Aperçu du rôle En tant que Développeur.euse IA senior, tu bâtis des fonctionnalités et des systèmes d’IA robustes, prêts pour la production, pour des client.e.s en contexte entreprise...SeniorFull timeApprenticeship
- ...Nous recherchons un.e développeur.se en apprentissage automatique sénior (recherche appliquée) pour rejoindre notre équipe... .... Développer des jeux de données, des outils et des bibliothèques pour... ...personnelles seront collectées et traitées par LoiZéro afin d'évaluer votre demande...DataSeniorApprenticeshipWork at officeFlexible hoursDay shift
- ...nous levons avec la motivation de faire du monde un endroit plus efficace et plus agréable. Aperçu du rôle En tant que Développeur Logiciel Senior, tu es prêt et enthousiaste à collaborer avec et à encadrer des coéquipiers techniques et non techniques tout en planifiant...SeniorFull timeApprenticeship
- ...(« cloud-first »), ainsi qu’un ensemble de SDK, d’outils pour développeurs et de services logiciels déployés qui rendent possible le développement... ...formations trimestrielles en gestion sur des sujets tels que : donner et recevoir de la rétroaction, bâtir des équipes performantes,...SeniorFull timeApprenticeshipWork at officeWork from homeDay shift
- ...Spherea collabore avec les concepteurs, développeurs et fabricants de produits afin de les aider... ...systèmes de contrôle et la gestion des données. Job Description Analyste de... ...Expérience pratique avec les modèles d’IA/ML, les grands modèles de langage (LLM) et l...DataFull timeApprenticeshipRemote workFlexible hours
- ...entreprises à tirer le meilleur de leurs données, de façon concrète, durable et le tout.. fait... ...Le poste On est à la recherche d’un·e développeur(euse) en intelligence artificielle, qui... ...implémenter et mettre en production des solutions ML robustes Comprendre les besoins d’...DataFull time
Do you want to receive more vacancies?
Subscribe and receive similar vacancies to Développeur Senior Traitement de Données ML. Be the first to apply!
- data centre engineer Montréal, QC
- data engineer Montréal, QC
- python data engineer Montréal, QC
- junior data engineer Montréal, QC
- data integration developer Montréal, QC
- information engineer Montréal, QC
- data cabling engineer Montréal, QC
- gcp data engineer Montréal, QC
- remote data engineer Montréal, QC
- big data engineer Montréal, QC

