IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

La science des données est-elle morte ?
Vu l'abondance de services clé en main comme IBM Watson, la majorité de leurs tâches sont externalisables

Le , par dourouc05

2PARTAGES

11  0 
L’apprentissage automatique et la science des données sont maintenant partout, l’actualité le montre assez. En exploitant des jeux de données immenses, il devient possible de résoudre n’importe quel problème, comme détecter si quelqu’un s’est fait voler son identité en ligne ou jouer au go.

Le problème, c’est que, pour atteindre ces résultats, il faut de la créativité, pas simplement une capacité d’écrire du code : en d’autres termes, il faut des scientifiques des données. Ils sont cependant une ressource rare, que les entreprises s’arrachent.

La solution est toute trouvée dans un grand nombre de cas : des services en ligne proposant les modèles de sociétés privées, appelables par une API REST ou autre. Ainsi, un même genre de problème est résolu une seule fois, avec des jeux de données de plus grande taille, qui grandissent sans cesse avec l’utilisation de la plateforme. C’est notamment le cas d’IBM Watson, dont les capacités n’ont de cesse d’étonner.

L’efficacité de ces services est souvent extrêmement bonne, largement suffisante pour ne pas justifier l’engagement d’un scientifique des données. Dans certains cas, des solutions plus spécifiques peuvent apporter une meilleure performance, une prédiction juste dans 95 % des cas plutôt que 80 % en utilisant un service tout fait, mais avec un coût autre — et un bénéfice plus que très relatif, selon le cas d’utilisation. Dans d’autres cas, battre un service en ligne (de traduction automatique, notamment) requiert des compétences très poussées, des solutions algorithmiques avancées et une puissance de calcul pas à la portée du premier venu.

Ce constat est suffisant pour que certains affirment d’ores et déjà que la science des données telle qu’on la connaît pour l’instant est morte et enterrée : il n’y a plus besoin d’engager quelqu’un qui a des compétences spécifiques dans ce domaine, pour la plupart des besoins. Le scientifique des données « du futur » aura donc tendance à devenir un chef d’orchestre, qui arrange savamment les différentes API avec des données traitées en conséquence.

Ce ne serait pas le premier domaine à subir une telle évolution. La recherche opérationnelle était autrefois présente dans bon nombre d’entreprises, avec des services dédiés, bon nombre des tâches sont maintenant reprises par des sociétés qui proposent des logiciels clé en main — les services de recherche opérationnelle ont depuis souvent fusionné avec ceux de science des données.

Néanmoins, dans tous les cas, des gens avec ces compétences spécifiques restent requis : d’un côté, il faut construire ces services en ligne ; de l’autre, tous les besoins ne sont pas remplis par des logiciels existants, il faudra toujours développer, de temps à autre, une solution sur-mesure.

N’est-ce pas ?
Les scientifiques des données doivent-ils craindre pour leur emploi ?

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de dourouc05
Responsable Qt & Livres https://www.developpez.com
Le 18/06/2017 à 18:05
Citation Envoyé par souviron34 Voir le message
J'ai à mon actif peut-être une 30aine de langages différents sur 6 ou 7 plateformes différentes.... Dans la vision d'aujourd'hui, je suis un pauvre clampin dépassé parce que je n'ai pas le dernier langage à la mode.... Quelqu'un d'un peu plus attentif verrait que pour beaucoup de ces langages, j'ai eu à les apprendre en .. 2 semaines ? 4 ? et à les mettre en pratique pour faire un logiciel opérationnel... de produits vendus au public.... Donc a priori ça devrait les inciter à réfléchir sur leurs critères... Mais non...
Toi, tu as les connaissances et l'expérience nécessaire pour te dire que tu peux apprendre un nouveau langage, de nouveaux concepts en quelques semaines. Quand je pense à des étudiants qui ont des cours dont l'intitulé est Java ou C#, c'est-à-dire dont l'objectif est l'apprentissage d'un langage (pas de concepts utilisés dans d'autres langages), je ne suis pas sûr qu'ils auront les mêmes bases pour facilement passer d'un langage à l'autre.
3  0 
Avatar de souviron34
Expert éminent sénior https://www.developpez.com
Le 15/06/2017 à 21:23
Citation Envoyé par dourouc05 Voir le message

Les scientifiques des données doivent-ils craindre pour leur emploi ?
Je commenterais en pointant le fait que le terme même, "scientifique de données", copié de l'anglais "data scientist", n'existe que depuis une petite douzaine ou dizaine d'années..

Et que je n'ai jamais compris réellement pourquoi ce n'était pas simplement "scientifique"..

Comme physicien, mais d'autres comme mathématiciens ou ingénieurs, de la "vieille" génération, nous avons toujours été confrontés (et engagés) pour en partie ça..

Avec l'émergence au début des années 2000 de la "micro-labellisation" des titres et grades, on a vu fleurir ce genre d'appellation, que ce soit des "ingénieur dotnet", les "cp C++", les "cloud manager" ou "ingénieur info-nuagique", "analyste Java", etc etc.. Les "data scientist" en font partie...

Il ne faut donc pas s'étonner de la "disparition". Les appellations (et métiers) ayant été liés à des concepts de "buzz" et "spécialisation outrancière" (souvent par les marketings et patenteux de grosses boites, suivi par des enseignements voulant profiter de la manne), leurs durées de vie sont liées à la mode du "buzzword" en question...

C'est une des conséquences des slogans "80% de réussite" et "tous avec un diplôme"...
2  0 
Avatar de souviron34
Expert éminent sénior https://www.developpez.com
Le 18/06/2017 à 17:03
Citation Envoyé par Aurelien.Regat-Barrel Voir le message
Ben si on pousse ta logique plus loin ça veut dire qu'un physicien en nucléaire peut faire le boulot d'un généticien et inversement ?
Ben c'est pas totalement faux, hein ?

Quand j'ai débuté, j'etais docteur en physique, spécialité astrophysique... Au bout de 4 ans, on me proposait des boulots chez Kodak en chimie, en informatique industrielle en traitement d'images, etc.... et j'aurais tout à fait pu partir en physique nucléaire....

Des copains à moi sont passés en télécoms, d'autres en recherche sur les lasers, d'autres dans les films d'animation (tu sais, les trucs, là, comme les jeux vidéos.... ) dans de grands studios (imiter le comportement de cheveux, d'étoffes, des muscles, avec du vent, de la pluie, des coups, c'est dérivé de la physique...)... d'autres ont changé de métier apres avoir repris des cours..

Moi j'avais fait de la Chimie, de la Chimie-Physique, et de la Physique...

Et pourtant 99% de ma carrière s'est faite en informatique scientifique...

Il suffit de regarder la section jeux et projets (moteurs 3D !! il y a même une sous-section moteurs physiques!)

Citation Envoyé par Aurelien.Regat-Barrel Voir le message
Mais quand même, faut avoir assimilé à quoi servent les différents algo et quelles sont leurs limites.


Ben c'est bien à ça que sert une formation généraliste, appuyée par des mathématiques, non ??

La vision des 20 dernières années a été d'apprendre un langage info, puis - très éventuellement - de comprendre les algos qui sont dans des bibliothèques (ou simplement d'utiliser des "boîtes noires" comme R ou MatLab).. Suffit de voir sur les forums correspondants le nombre de posts disant : "moi je suis nul en maths"....

Mais l'approche en sens inverse est tout à fait valable : apprendre à comprendre des algos, puis apprendre à utliser tel ou tel langage pour les programmer....

J'ai à mon actif peut-être une 30aine de langages différents sur 6 ou 7 plateformes différentes.... Dans la vision d'aujourd'hui, je suis un pauvre clampin dépassé parce que je n'ai pas le dernier langage à la mode.... Quelqu'un d'un peu plus attentif verrait que pour beaucoup de ces langages, j'ai eu à les apprendre en .. 2 semaines ? 4 ? et à les mettre en pratique pour faire un logiciel opérationnel... de produits vendus au public.... Donc a priori ça devrait les inciter à réfléchir sur leurs critères... Mais non...

Donc j'en conclus que la disparition annoncée dans ce thread n'est en rien extraordinaire.... et même tout à fait normale...


Citation Envoyé par Aurelien.Regat-Barrel Voir le message

Derrière la multiplication des "micro-labels" (être expert en C++ ou Java, c'est pas du micro boulot), il faut peut être voir aussi une augmentation importante du nombre de programmeurs ces 20 dernières années et de l'outil informatique en général.
Si tu relis c'est justement la dernière phrase de mon post
1  0 
Avatar de Madmac
Membre extrêmement actif https://www.developpez.com
Le 17/01/2018 à 23:21
Citation Envoyé par dourouc05 Voir le message
L’apprentissage automatique et la science des données sont maintenant partout, l’actualité le montre assez. En exploitant des jeux de données immenses, il devient possible de résoudre n’importe quel problème, comme détecter si quelqu’un s’est fait voler son identité en ligne ou jouer au go.
À mon avis, l'apprentissage automatisé n'est qu'un nouveau miroir aux alouettes. Le classement automatique est une chimère. On se retrouve avec les mèmes problèmes que les réseaux neuronaux: On doit au préalable établir les éléments significatif. Si on n'utilise pas suffisamment de paramètre, on a des chances élevés d'arrivée à de mauvaises conclusions. Si on introduit trop de paramètre, on introduit un niveau important de bruit, ce qui rend les prédictions beaucoup moins efficaces.

Comme bel exemple de cassage de gueule en beauté dû à l'apprentissage automatique, on peut citer le cas du jeux Mass Effect: Andromeda. Une des multiples raisons pour laquelle ce jeux a été la pire débâcle de l'année 2017, est que les concepteur ont abandonné ce qui faisait la signature de la série: La possibilité de choisir le type de réplique et de choisir des conséquences différentes selon le choix. Mème si le jeu avait été sans aucun bug, le jeu aurait été très mal reçu par les fans de la franchise.

Alors pourquoi Bioware a-t-elle abandonné sa formule gagnante? Parce que EA avait analysé le comportement de joueur et était arrivé à la mauvaise conclusion: Il était inutile de créer des choix multiples, puisque les joueurs faisaient toujours les mêmes choix et que d'offrir plusieurs choix étaient inutiles. Des choix très semblables étaient largement suffisants. Mais c'était une grave erreur !

Pour les gens qui ne sont pas familiarisé avec cette série, Je dois expliqué que les choix du joueur ont véritablement un impact: Plus le joueur prend de mauvaise décision, plus il perd des coéquipiers. Et plus le joueur perd des coéquipier plus le jeu devient difficile (légèrement).

Donc selon les analyses de EA réduire les répliques permettaient de faire des économie sans réduire le niveau de satisfaction, Pour Bioware, cela réduisait le nombre d'animations et d'enregistrements. Et en augmentant un peu le niveau de difficulté, le joueur aurait dû être satisfait.

Mais voila la véritable raison du comportement des joueurs pour laquelle ils faisaient toujours les mèmes choix étaient dû à la qualité de l'histoire et que les personnages secondaires étaient tellement intéressants que les joueurs désiraient les garder jusqu'à la fin du jeu. Et seulement quelques combinaisons de choix ne permettait de réussir à conserver tous les coéquipiers. Donc en conclusion, les joueurs ne pouvaient pas vraiment faire d'autres choix. Alors que EA croyait que le joueur ne voulait pas faire d'autre choix.

Comme quoi, il est très facile d'arriver à de mauvaises conclusions, si on ne dispose pas de la bonne grille d'analyse.
1  0 
Avatar de Aurelien.Regat-Barrel
Expert éminent sénior https://www.developpez.com
Le 16/06/2017 à 10:35
Ben si on pousse ta logique plus loin ça veut dire qu'un physicien en nucléaire peut faire le boulot d'un généticien et inversement ? Les scientifiques et mathématiciens ne sont pas en reste en ce qui concerne de créer des spécialités

La "science des données" est une spécialité parmi d'autres qui demande des compétences en statistiques etc... mais aussi en programmation car (pour aller dans le sens de l'article) le gros boulot c'est d'obtenir et préparer les data afin de les traiter. Peut être que ce métier évolue vers plus de compétences en logiciel qu'en mathématiques. Mais quand même, faut avoir assimilé à quoi servent les différents algo et quelles sont leurs limites. Une question d'expérience en sommes. Et on ne peut pas avoir 5 à 10 d'expérience dans tous les sujets... d'où des termes spécifiques. Ca aide tout le monde pour la recherche d'emplois et de doc.

Derrière la multiplication des "micro-labels" (être expert en C++ ou Java, c'est pas du micro boulot), il faut peut être voir aussi une augmentation importante du nombre de programmeurs ces 20 dernières années et de l'outil informatique en général.
0  0 
Avatar de vivid
Membre habitué https://www.developpez.com
Le 18/06/2017 à 8:41
entièrement d'accord avec souviron34

"Derrière la multiplication des "micro-labels" (être expert en C++ ou Java, c'est pas du micro boulot), il faut peut être voir aussi une augmentation importante du nombre de programmeurs ces 20 dernières années et de l'outil informatique en général."

ce n'est pas du micro boulot mais d'autant plus vrai sur ces langages 'assisté' (poo) ce n'est que de l'assemblage avec de la lecture technique. L'ouvrier d'aujourd'hui en somme... sauf que le vraie ouvrier ou manuel fait travailler sa tête et ces mains.
0  0 
Avatar de souviron34
Expert éminent sénior https://www.developpez.com
Le 18/06/2017 à 18:24
Citation Envoyé par dourouc05 Voir le message
Toi, tu as les connaissances et l'expérience nécessaire pour te dire que tu peux apprendre un nouveau langage, de nouveaux concepts en quelques semaines. Quand je pense à des étudiants qui ont des cours dont l'intitulé est Java ou C#, c'est-à-dire dont l'objectif est l'apprentissage d'un langage (pas de concepts utilisés dans d'autres langages), je ne suis pas sûr qu'ils auront les mêmes bases pour facilement passer d'un langage à l'autre.
Absolument....

C'est ce que moi et d'autres dénonçont régulièrement depuis une bonne dizaine d'années...

Et c'est aussi ce pour quoi je me suis aussi souvent insurgé contre les annonces d'emplois et les "titres"...

En quoi est-ce que un "CP Java" pourra-t-il être reconverti lorsque cela change(ra) de langage ????

En fait, je l'avais dit dans un des premiers débats sur ce forum auquels j'ai participé : on a produit des "ouvriers à la chaîne", qui se sont sentis (et qu'on a) "gonflés" avec des titres ronflants et un discours sur les "technos de pointe"...

Et parallèllement on a dévalorisé les titres d'ingénieur ou docteur, qui justement, malgré leurs spécialisations affichées - et réelles - , étaient en fait très polyvalents et relativement inter-changeables... quand on voit fleurir des appellations "ingénieur Java" ou "ingénieur dotnet" , ça laisse rêveur..... (dans le sens cauchemardesque !!)
0  0 
Avatar de dourouc05
Responsable Qt & Livres https://www.developpez.com
Le 18/06/2017 à 19:22
Déjà, quel est le sens d'utiliser l'appellation "ingénieur" dans ce cas ?
0  0 
Avatar de souviron34
Expert éminent sénior https://www.developpez.com
Le 18/06/2017 à 19:36
Ben....

  • Ca flatte ceux qui acquièrent le titre...
  • Ca flatte ceux qui les forment
  • Ca flatte ceux qui les engagent
  • Ca flatte leurs parents
  • Ca flatte les ministères , pour les statistiques


Ca correspond au mouvement "enfants-rois" : ces pôv' petits, ils sont tous brillants !!.. Foin de la sélection, il faut leur reconnaître leurs talents, absolument...

Je me suis fait traiter d'élitiste quand je disais que le texte et ce sur quoi se basait le Manifeste Agile était fait pour des gens expérimentés, connaissant sur le bout des doigts ce qui était demandé dans les cycles en V, et en ayant expérimenté par eux-mêmes les écueuils...

Tu peux pas prendre des raccourcis si tu connais pas le chemin normal....
0  0 
Avatar de BufferBob
Expert éminent https://www.developpez.com
Le 18/06/2017 à 19:42
Citation Envoyé par dourouc05 Voir le message
Déjà, quel est le sens d'utiliser l'appellation "ingénieur" dans ce cas ?
afficher "nos ingénieurs" plutôt que "nos techniciens" est une valeur ajoutée (y compris au sens commercial de la chose), particulièrement pour les petites/moyennes entreprises, là où inversement les grosses boites n'ont plus besoin d'afficher leurs prétentions pour être prises au sérieux et tendent justement à plutôt tirer vers le bas
0  0