informatique

Stage 6 mois – Data Scientist H / F – Transfer Learning

Référence inf196527
Recruteur Octopeek
Département Val-d'Oise (95)

Le cadre, l'entreprise

Qui sommes-nous ?

Octopeek est une société de conseil, de formation dans le Big Data et l’Intelligence Artificielle pour les entreprises.

Octopeek accélère la transformation digitale des entreprises et façonne le futur de leur business.

Notre mission

La mission d'Octopeek est de faciliter l’accès à la data et permettre aux entreprises de décider en s’appuyant facilement sur des données : transformer la technologie en bénéfices pour le quotidien de chacun.

Nos valeurs

• Satisfaction client
• Engagements
• Respect
• Loyauté, honnêteté et bienveillance

Mission proposée:

Contexte du stage

Aujourd’hui, les modèles de machine learning sont de plus en plus abondants. En plus de la donnée qui devient plus facile d’accès et de traitement, les use-cases de data science et d’Intelligence Artificielle (IA) se multiplient. L’émergence des acteurs cloud (principalement AWS, Azure et GCP) et des outils dédiés au développement et au déploiement de modèles de Machine Learning (ML) à démocratiser l’accès à l’IA.Il devient, donc, de moins en moins nécessaire de construire des modèles de ML from scratch (de zéro). C’est à ce niveau là qu’interviennent les techniques de transfer-learning qui permettent de prendre des modèles ML déjà entraînés et de les ajuster, avec un coût en données et en puissance de calcul relativement faible, pour les use-cases cibles.

Votre mission

Au sein de la direction R&D et Innovation, vous aurez en charge de mettre en place un cadre de conception, développement, déploiement et maintien de modèles de Machine Learning basés sur des modèles pré-entraînés grâce au Transfer Learning.

Le stage se déroulera comme suit, le tout étant testé et déployé en parallèle sur des use-cases réels afin de valider en continu l’applicabilité des concepts théoriques :

• Identifier et cartographier les types de transfer learning
o d’un point de vu méthode
o d’un point de vu use-case
o comparer aux autres méthodes similaires telles que le Semi-Supervised Learning, Incremental Learning et Active Learning, voire auto-ml
• Identifier les acteurs et les outils (open source ou non) principaux
o comparer fonctionnellement, techniquement, et en termes de coûts
• Identifier et formaliser les mesures génériques (extrinsèques) d'évaluation des modèles entraînés grâce au Transfer Learning
• Finaliser et déployer les use-cases

Livrable

• mémoire de recherche

Conditions (lieu, salaire, horaires...):

Gratification

1300€ / mois

Localisation

95880 Enghien-les-Bains

Profil du candidat recherché par le recruteur:

Votre profil

Elève Data Scientist en fin de cursus type école d'ingénieur

Références bibliographiques pertinentes

Quelques ressources et références qui pourraient être pertinentes dans le cadre de votre futur stage de recherche

• https://towardsdatascience.com/5-websites-to-download-pre-trained-machine-learning-models-6d136d58f4e7
• https://modelzoo.co/
• https://medium.com/starschema-blog/transfer-learning-the-dos-and-donts-165729d66625
• Zhao, P., Hoi, S. C., Wang, J., & Li, B. (2014). Online transfer learning. Articial Intelligence, 216, 76-102.
• Wu, Q., Zhou, X., Yan, Y., Wu, H., & Min, H. (2017). Online transfer learning by leveraging multiple source domains. Knowledge and Information Systems, 52(3), 687-707.
• Liu, F., Zhang, G., & Lu, J. (2017). Heterogeneous Transfer Learning: An Unsupervised Approach. arXiv preprint arXiv:1701.02511.
• Day, O., & Khoshgoftaar, T. M. (2017). A survey on heterogeneous transfer learning. Journal of Big Data, 4(1), 29.
• Weiss, K., Khoshgoftaar, T. M., & Wang, D. (2016). A survey of transfer learning. Journal of Big Data, 3(1), 9.
• Yang, Q., Chen, Y., Xue, G. R., Dai, W., & Yu, Y. (2009, August). Heterogeneous transfer learning for image clustering via the social web. In Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th international joint Conference on Natural Language Processing of the AFNLP: Volume 1-Volume 1 (pp. 1-9). Association for Computational Linguistics.

Pour postuler

Merci d'adresser CV + lettre de motivation à (voir ci-dessous) en rappelant la référence de l'annonce.

Postulez

Le recruteur demande les pièces suivantes:

  • Votre CV mis à jour

Pensez à inclure la référence T2022 dans votre candidature.

Pour le contacter:

Postulez directement en un seul clic: Identifiez vous ou Inscrivez vous.

Attention: n'envoyez jamais d'argent à un recruteur.