IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Stack Overflow est la victime de ChatGPT avec Baisse du trafic de 14 %,
Alors que ChatGPT a attiré 1,6 milliard de visites en mars et 920,7 millions au cours de la première quinzaine d'avril

Le , par Bruno

23PARTAGES

7  0 
Dans un billet de blog publié le 19 avril, David F. Carr, Senior Manager au sein de l'équipe Similarweb, présente l’impact de ChatGPT, un chatbot basé sur l’intelligence artificielle, sur le trafic de Stack Overflow, un site web communautaire pour les développeurs. Pour étayer ses déclarations, explique que ChatGPT peut générer du code et des explications à partir d’un simple texte, ce qui réduit le besoin de chercher des solutions sur Stack Overflow. Il compare aussi ChatGPT avec CoPilot, un assistant de codage proposé par GitHub, qui utilise la même technologie que ChatGPT. Il présente des données de Similarweb qui montrent que le trafic de Stack Overflow a baissé de 14 % en mars 2023, tandis que celui de ChatGPT et de GitHub a augmenté. Il conclut que ChatGPT et CoPilot représentent une nouvelle façon de coder, plus basée sur l’ingénierie des prompts que sur le copier-coller.

Les programmeurs peuvent poser des questions et trouver des réponses sur Stack Overflow. Il s'agit du site phare du réseau Stack Exchange. Joel Spolsky et Jeff Atwood l'ont développé en 2008. Toutefois, les développeurs obtiennent de plus en plus de conseils auprès des chatbots d'IA et de GitHub CoPilot plutôt que sur les tableaux de messages de Stack Overflow. Alors que le trafic sur le ChatGPT d'OpenAI augmente de façon exponentielle, Stack Overflow connaît un déclin régulier, perdant ainsi une partie de son statut de source privilégiée vers laquelle les développeurs se tournent pour obtenir des réponses à leurs problèmes de codage.


La plupart des sites web souffrent aujourd'hui de la comparaison avec ChatGPT, et cette comparaison n'est pas juste dans la mesure où Stack Overflow et GitHub sont des services spécialisés pour les développeurs. ChatGPT a gagné l'attrait du marché de masse, en plus d'être utile aux développeurs. Google a envoyé des questions d'entretien de codage à ChatGPT et, sur la base des réponses de l'IA, a déterminé qu'il serait embauché pour un poste d'ingénieur de niveau trois, selon un document interne. L'expérience a été réalisée dans le cadre des récents tests de Google sur plusieurs chatbots IA, qu'il envisage d'ajouter à son moteur de recherche. La capacité de ChatGPT à proposer une réponse concise et fidèle à une question pourrait faire gagner aux utilisateurs le temps qu'ils passent généralement à parcourir les liens sur Google pour trouver la même information.

Stack Overflow vs ChatGPT and GitHub


En décembre dernier, Stack Overflow a décidé d'interdire la publication d'informations produites par ChatGPT en raison du degré élevé d'inexactitude des réponses fournies par le robot, qui peut être « substantiellement préjudiciable aux sites et aux utilisateurs qui recherchent des réponses correctes ». Finalement, cette interdiction de ChatGPT n'a pas eu de conséquences positives pour Stack Overflow.

Une étude publiée en octobre 2018 dans la revue Empirical Software Engineering par les universitaires Sebastian Baltes et Stephan Diehl a révélé qu’un extrait de code fourni en réponse à une question Stack Overflow en septembre 2010 par Andreas Lundblad, développeur Java chez Palantir, est l’extrait de code Java le plus copié sur la plateforme communautaire. Cependant, dans un billet publié la décembre 2019, Lundblad a expliqué que le code était défectueux et qu'il convertissait de manière incorrecte le nombre d'octets dans des formats lisibles par l'homme.

Des rapports de Similar Web font état d'une baisse de 14 % du nombre de visites sur le site web après la mise en place de ChatGPT en novembre. Cela peut s'expliquer en partie par une évolution connexe, l'introduction de l'assistant de codage CoPilot de l'entreprise GitHub de Microsoft. CoPilot est construit sur le même modèle de langage OpenAI que ChatGPT, capable de traiter à la fois le langage humain et le langage de programmation. Un plugin pour Microsoft Visual Studio Code, largement utilisé, permet aux développeurs de demander à CoPilot d'écrire des fonctions entières en leur nom, plutôt que d'aller sur Stack Overflow à la recherche de quelque chose à copier et coller. CoPilot intègre désormais la dernière version GPT-4 de la plateforme OpenAI.

La connexion intrigante entre Stack Overflow et ChatGPT est que le chatbot basé sur LLM est formé en utilisant les informations trouvées sur Stack Overflow. Cela est confirmé par la déclaration de l'article GPT-3 selon laquelle il a été formé sur une variété d'ensembles de données, y compris Common Crawl, qui est pratiquement équivalent à l'ensemble de l'Internet. Il n'y a aucune raison de penser que Stack Overflow n'est pas inclus dans les données d'entraînement, à moins qu'OpenAI n'ait pris des mesures proactives pour le faire. Par conséquent, ChatGPT est un outil très pratique pour les développeurs.

Puisque ChatGPT est construit sur les informations de Stack Overflow, il peut fournir la solution idéale sans que l'utilisateur n'ait à passer des heures à chercher sur le site pour trouver la réponse idéale à sa question. La communauté des développeurs étant centrée sur Stack Overflow, ChatGPT est confronté à un défi de taille.

Depuis l'introduction de ChatGPT, de nombreux utilisateurs ont cessé de visiter Stack Overflow, mais aucun chatbot, y compris ChatGPT, ne pourra jamais remplacer l'opportunité de discuter des réponses avec les autres membres du forum.

  • D'une année sur l'autre, le trafic vers Stack Overflow a baissé en moyenne de 6 % chaque mois depuis janvier 2022 et de 13,9 % en mars.
  • ChatGPT n'a pas d'antécédents sur une année, n'ayant été lancé qu'à la fin du mois de novembre, mais son site web est devenu en peu de temps l'une des propriétés numériques les plus populaires au monde, plus importante que le moteur de recherche Bing de Microsoft pour ce qui est du trafic mondial. Il a attiré 1,6 milliard de visites en mars et 920,7 millions au cours de la première quinzaine d'avril.
  • Le site web GitHub a également connu une forte croissance, le trafic vers github ayant augmenté de 26,4 % d'une année sur l'autre en mars, pour atteindre 524 millions de visites. Ce chiffre ne reflète pas toute l'utilisation de CoPilot, qui se fait normalement dans un éditeur comme Visual Studio Code, mais il inclut les personnes qui viennent sur le site web pour s'abonner au service.
  • Alors que Stack Overflow et GitHub sont beaucoup plus proches en taille que ChatGPT, GitHub augmente son trafic tandis que Stack Overflow diminue. Le nombre de visites de la page d'inscription à l'essai gratuit de GitHub CoPilot a plus que triplé entre février et mars, pour atteindre 800 000.

Stack Overflow vs GitHub


ChatGPT comme outil de codage

Peu après l'introduction de ChatGPT, les développeurs ont découvert qu'il était utile pour produire des échantillons de code détaillés et des fonctions complètes - avec des tutoriels expliquant pourquoi le code fonctionne - en réponse à une simple invite textuelle. Les comparaisons avec Stack Overflow et les prédictions selon lesquelles ChatGPT « tuerait » Stack Overflow ont immédiatement commencé.

Pendant ce temps, et comme dit précédemment, Stack Overflow a annoncé une interdiction temporaire de publier le contenu de ChatGPT sur son site - considéré comme une violation des normes de la communauté parce que, selon la direction du site, les réponses de ChatGPT aux questions de codage sont trop souvent incorrectes.

La tradition de Stack Overflow veut que les membres de la communauté publient une variété de réponses à une question de codage donnée, débattent des avantages et des compromis, et votent pour reconnaître la meilleure solution. Pour de nombreuses questions de codage courantes, un développeur trouvera une réponse largement reconnue qui l'attend.

Les utilisateurs de ChatGPT ne participent pas au débat et obtiennent simplement une réponse, ce qui peut sembler plus rapide et plus efficace. La réponse qui revient peut ne pas correspondre exactement à ce dont le développeur a besoin, mais elle est souvent suffisamment proche pour être façonnée et ajustée en une solution fonctionnelle. Ce n'est pas si différent du processus consistant à trouver une réponse à la question de quelqu'un d'autre sur Stack Overflow et à l'adapter à ses propres besoins.

CoPilot a fait l'objet d'une controverse sur la génération de code basée sur du contenu open source, sans respect des licences open source pertinentes, et ces questions s'appliquent également aux conseils de codage fournis par ChatGPT.

Comme pour Stack Overflow, la méthodologie de ChatGPT n'est pas parfaite et contient des milliers de réponses incorrectes et inutiles. Par conséquent, ChatGPT fournira inévitablement des réponses trompeuses s'il est entraîné sur l'ensemble des données de Stack Overflow et pas seulement sur les réponses les plus populaires. Cela s'est produit à de nombreuses reprises, ce qui a finalement incité les membres à retourner sur l'internet. Ce n'est pas une bonne idée de faire trop confiance aux réponses du chatbot.

Récemment, OpenAI a fait une autre avancée significative pour résoudre le problème de la fiabilité. Les développeurs peuvent désormais vérifier leur code sur le chatbot grâce à la sortie du plugin Code Interpreter pour ChatGPT. Actuellement, ChatGPT Plus, qui utilise GPT-4, est la seule plateforme qui supporte ce plugin. Les développeurs peuvent également accéder à Internet par l'intermédiaire de Bing Chat, en plus de ChatGPT. Cela leur permet de combiner le code avec des informations actualisées. D'un autre côté, certains développeurs le décrivent comme « toxique ». De nombreux utilisateurs pensent que les développeurs utilisent Stack Overflow pour critiquer les autres plutôt que de l'utiliser comme un site de questions-réponses.

À l'heure actuelle, il semble improbable que Stack Overflow accepte les technologies d'IA sur son site. La façon dont Getty Images a réagi à la décision de Stack Overflow de supprimer les réponses au ChatGPT est similaire à la façon dont Shutterstock, un concurrent, a choisi d'accepter les œuvres d'art issues de l'IA sur sa place de marché d'images de stock en payant les artistes originaux. De même, Stack Overflow pourrait être en mesure de gérer et de s'adapter à ce terrain changeant s'il le souhaite.

Source : David F. Carr's blog post

Et vous ?

Quel est votre avis sur le sujet ?

Quels sont les avantages et les inconvénients de Stack Overflow par rapport à ChatGPT pour apprendre à coder ou à résoudre des problèmes de programmation ?

Quels sont les défis et les opportunités que ChatGPT représente pour Stack Overflow en termes de concurrence, de collaboration ou d’innovation ?

Voir aussi :

L'extrait de code Java le plus copié sur Stack Overflow contient un bogue et son auteur, Andreas Lundblad, développeur Java chez Palantir, propose un correctif

ChatGPT réussit l'entretien de codage Google pour un ingénieur de niveau 3 avec un salaire de 183 000 $, tout en indiquant qu'il ne peut pas reproduire la créativité humaine

Stack Overflow, le site de questions-réponses pour développeurs, racheté par Prosus pour 1,8 milliard de dollars, l'activité de Stack Overflow restera inchangée, précise l'entreprise

OpenAI lance ChatGPT Plus, un plan d'abonnement ChatGPT pour 20 $ par mois, qui est proposé à ceux qui veulent des réponses plus rapides ainsi qu'un accès prioritaire aux nouvelles fonctionnalités

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Psylle
Membre à l'essai https://www.developpez.com
Le 16/10/2024 à 9:47
Votre raisonnement tient si l'I.A. générative ne générait que des vraies réponses. Mais ce n'est pas le cas. Donc on finit par avoir des I.A. génératives qui apprennent avec des mauvaises réponses. Perso, je vois cela comme le problème de la consanguinité. Enfin, il me semble. Non?
8  0 
Avatar de Mingolito
Membre extrêmement actif https://www.developpez.com
Le 16/10/2024 à 18:14
C'est pas des "calculs", si un illuminé a écrit un jour sur un forum qu'il faut manger des cailloux alors ChatGPT te dira de manger des cailloux, histoire vrai

Donc maintenant il y a 10 IA qui vont répondre à tous le monde que "oui il faut manger des cailloux", et ça sera répété encore sur les forums par les utilisateurs idiots, et même encore plus directement par des bots IA qui postent sur les forum, donc non seulement l'IA est conne mais en sus elle s'auto empoisonne, car L'IA c'est un perroquet, une IA ne sais pas raisonner, une IA ne fait que collecter un tas de données, dont un tas de conneries, y compris des livres de fictions qui l'empoisonnent encore plus, pour inventer encore plus de conneries, les IA "hallucinent", et d'après les chercheurs vont continuer à halluciner.

Si tu demandes à une IA de te pondre une fiction, ça sera bien une fiction. Si tu demandes à une IA de te pondre un rapport scientifique, ça sera encore une fiction, une hallucination, une connerie, ou une fake news, au choix.

Un site scientifique a déjà fermé suite à la pollution IA, par des rapports tous faux fait par des IA, et pas assez de chercheurs humains volontaires et disponible vérifier toute cette merde.
4  0 
Avatar de onilink_
Membre émérite https://www.developpez.com
Le 16/10/2024 à 21:36
Chose dont tous ceux qui connaissent un minimum le fonctionnement des modèles d'IA avaient prédit depuis des années.
De toute façon, OpenAI et consort ont déjà volé tout le contenu exploitable du web donc je ne pense pas que ce soit une grosse limitation pour eux.
La quantité de données étant limité, il va falloir jouer dans la qualité. Et c'est pas en aspirant le web post 2024 que l'on va en trouver.

Bref j'ai envie de dire "c'est pas trop tôt".

@revo2211
Même si les réponses étaient vrai, un LLM ou tout autre modèle qui mange ses propres sorties en entrée finis par devenir plus con.
C'est vraiment la base.

Et sur le plan "philosophique", chaque réponse mène à plus de questions.
Quand on a "toutes les réponses" c'est qu'on se plante quelque part. C'est un peu ce qui s'est passé avec la physique pre "quantique" d'ailleurs
3  0 
Avatar de SQLpro
Rédacteur https://www.developpez.com
Le 14/11/2024 à 14:14
On oublie juste de dire que la qualité du code pissé par ces intelligence est rarement optimal et parfois totalement à côté de la plaque...

Cela va provoquer moins de demandes basiques dans stackoverflow, mais des demandes plus précises, plus complexes, avec des réponses plus osphsitiquées...

A +
3  0 
Avatar de Minato Sensei
Membre habitué https://www.developpez.com
Le 15/10/2024 à 15:30
En même temps, fallait s'attendre à ce que les données disponibles pour les entraînements de l'IA se mettent à devenir rares
1  0 
Avatar de revo2211
Nouveau Candidat au Club https://www.developpez.com
Le 19/10/2024 à 9:07
L'IA actuelle n'est pas parfaite car elle est uniquement générative mais par un système de contrôle, les résultats s'amélioreront avec le temps. Actuellement ça génère mais ça ne valide pas.
L'IA génère des datas qui sont ensuite inclues comme source de données dans le modèle et à terme tout le contenu s'empoisonne de lui même. Je ne dirais pas que c'est du cannibalisme mais de l'empoisonnement.

Dans le cadre de l'informatique, il y a assez peu d'algorithme basé sur de l'aléatoire, donc l'IA sera capable de produire un résultat très qualitatif. Comme il y a des outils de validation syntaxique, de compilation, d'exécution et de test, l'IA devrait grandement aider dans ce domaine.

Je vois plutôt les LLM comme des moteurs de recherche. Google donne des liens mais pas de résultats, les LLM donnent des réponses qui peuvent être incorrectes. C'est à l'opérateur de valider les résultats.
Aujourd'hui c'est quand même beaucoup d'esbroufe
0  0 
Avatar de Jules34
Membre émérite https://www.developpez.com
Le 16/10/2024 à 15:55
Citation Envoyé par revo2211 Voir le message
Somme nous pas entrain de toucher un plafond de verre de l'informatique? Si tous les projets sont accomplis, la quête ultime du développeur est terminée. On a créé l'informatique pour automatiser, simplifier, digitaliser les interactions, il faut s'attendre un jour à terminer cette quête. Un peu comme dans un jeu vidéo.
On a créé l'informatique pour faire des calculs. Les relations sociales évolueront en fonction de la société et de ses normes et l'informatique ne sera jamais qu'une béquille à une chose en constante évolution.

Il y aura des calculs à faire aussi longtemps qu'il y aura des hommes. De 1 + 1 à la base de donnée.

Il y en aura toujours à faire. Ceux qui annoncent la fin du progrès ou la fin de l'histoire comme si la technologie actuelle était un graal se trompent à mon sens. L'humanité ne touchera jamais de plafond de verre en la matière, au contraire j'ai le sentiment qu'on s'en éloigne.
0  2 
Avatar de revo2211
Nouveau Candidat au Club https://www.developpez.com
Le 15/10/2024 à 21:04
Du coup l'IA en provoquant la diminution du contenu pertinent sur le web provoque sa propre auto destruction, puisqu'elle n’a plus assez de données pertinentes pour évoluer, et s'empoisone en aspirant son propre contenu.
Et si l'IA apporte des vraies réponses aux questions?, les solutions étant trouvées, les problèmes se résolvent mais le partage des réponses correctes n'a plus lieu.
Il faudrait aller exposer les réponses correctes des IA et ainsi le partage continue.

Quand on possède la réponse on ne poste pas de question sur stackoverflow. On ne pose pas non plus la question quand un proche répond à la question.
Il y a donc un process qui est suivi avant de poster une question sur stackoverflow. On peut d'abord faire une recherche sur google puis ensuite on va sur stackoverflow , en ultime quête.

Ce qui aurait vraiment de la valeur c'est de savoir si un individu trouve les réponses à ses questions et par quel moyen.
Le tout serait de savoir à quel type de question l'IA donne des réponses. Pour les questions simples, l'IA fait très bien son travail donc c'est une avancée.

Si une question est une équation, si l'IA résouds toutes les équations, il y aura moins d'équations.

Somme nous pas entrain de toucher un plafond de verre de l'informatique? Si tous les projets sont accomplis, la quête ultime du développeur est terminée. On a créé l'informatique pour automatiser, simplifier, digitaliser les interactions, il faut s'attendre un jour à terminer cette quête. Un peu comme dans un jeu vidéo.

La solution finale qui est que toutes les meilleures réponses à toutes les équations approchent avec le temps. Ce qui est logique vu que plus on avance, plus on comprend le monde et plus on résouds les équations.
A un moment donné on aura la réponse à toutes nos questions et dans ce cas quelle sera la prochaine quête?
0  4