Valider une idée d'IA avant de payer des tokens OpenAI

Validez une idée de produit IA avant de dépenser 0,01 € en inférence : landing pages, fake doors, pré-ventes. Le playbook pré-tokens en 14 jours, 200 €.

10 min de lecture

OpenAI ne sait pas si votre produit IA a des acheteurs. Anthropic non plus. Google non plus. Ils facturent au token dans tous les cas — et le compteur démarre à la seconde où votre premier utilisateur clique sur « générer ».

Nous avons vu des fondateurs accumuler 1 400 € de facture d'inférence en trois semaines sur un produit qui n'avait absolument aucune audience. La facture est arrivée. Les clients, non. Les fournisseurs de modèles ont été payés ; le fondateur, lui, a appris quelque chose.

La solution est structurelle : valider le wedge avec une landing page et des ads payantes AVANT d'écrire la moindre ligne de prompt, AVANT de payer le moindre coût d'inférence. 0 € en tokens. 200 € en ads. 14 jours pour un vrai signal. La dépense en tokens suit les clients qui paient — elle ne les précède jamais.

La facture d'inférence qui ne vous dit rien

Voilà le piège. Vous sortez un produit IA. Un peu de trafic arrive — Product Hunt, un post Reddit, un tweet. Les gens cliquent sur « générer » par curiosité. Le compteur de tokens monte.

À la fin du mois, vous avez une facture OpenAI de 380 € et 2 100 générations. Ça ressemble à de l'usage. Ça ressemble à du signal.

Ce n'est ni l'un ni l'autre. Ce sont des clics curieux, plus votre propre debug, plus trois copains. Aucune de ces personnes ne va vous payer. La facture vous dit exactement une chose : que votre pipeline d'inférence tourne. Elle ne dit rien sur le fait de savoir si quelqu'un veut le produit.

Nous avons vu ce schéma assez souvent pour lui donner un nom. La dépense en tokens est corrélée à l'usage, pas à la demande. Les deux divergent le plus violemment dans la catégorie IA, parce que les clics curieux y sont anormalement élevés — « AI » dans un hero attire 2 à 3 fois plus de clics que les catégories non-IA équivalentes. La plupart de ces clics sont des touristes.

Ce qu'il faut valider avant les tokens

Ce qui doit être validé avant que vous n'écriviez une ligne de glue LLM, c'est le wedge. Le wedge, ce sont trois choses empilées : une audience bornée, un workflow borné, un résultat borné. Si l'une des trois reste floue, le test ne vous sauvera pas.

Un wedge serré sur les trois axes :

« Pour les équipes sales-ops dans des SaaS de 50 à 500 employés, ça produit un brief de recherche de compte de 600 mots à partir d'un domaine et de 12 champs, en moins de 90 secondes, dans un ton que vous pouvez transmettre à votre AE. »

Audience bornée. Workflow borné. Résultat borné. La raison pour laquelle ChatGPT en direct ne règle pas le problème est implicite : 12 champs, répétable, revu pour le ton, intégré dans un workflow CRM.

Un wedge qui ne survivra pas au test : « de l'IA pour les commerciaux. » Trois axes, trois cases vides. Le marché ne peut rien vous dire parce que vous n'avez rien demandé de précis.

Le wedge doit convertir sur une landing page — trafic payant depuis le canal où vit l'audience, CTA coûteux, seuil ajusté pour l'IA — avant d'écrire le moindre prompt. Le cadre général a été posé dans notre article sur la validation des wrappers ChatGPT ; ce papier est le playbook opérationnel spécifique à l'IA qui vient s'empiler dessus.

Le playbook ajusté IA (les clics curieux changent les calculs)

Les seuils pré-lancement standards sur landing page — 5 % pour un CTA gratuit, 1,5 % pour un acompte payé — ne sont pas fiables dans la catégorie IA. L'audience clique sur tout ce qui porte le label « IA » par intérêt général, ce qui gonfle le haut du funnel sans gonfler l'intention.

On ajuste à la hausse. Les chiffres qu'on vise :

  • Waitlist gratuite / capture d'email : viser 6 % et plus, au lieu des 5 % standards
  • Acompte payé (réservation à 5 € et plus) : viser 2 % et plus, au lieu des 1,5 % standards
  • CTA B2B « réservez une démo de 15 min » : viser 2,5 % et plus, au lieu des 2 %
  • Slot de design partner (B2B, hook de rareté) : viser 3 % et plus

La raison de l'ajustement tient en une phrase : dans les catégories non-IA, un clic suppose en général que le visiteur a reconnu le problème. Dans la catégorie IA, un clic veut souvent juste dire que le visiteur a reconnu les lettres « AI ». Le seuil plus haut filtre les touristes hors du signal.

Si vous franchissez seulement le seuil standard mais ratez le seuil ajusté IA, traitez ça comme un feu jaune, pas vert. Vous convertissez peut-être de la curiosité, pas de l'intention.

Les techniques de fake door qui marchent en IA

La catégorie IA se prête bien à quelques techniques de fake door, parce que le visiteur s'attend à un côté techno-frontière — il est prêt à accepter « rejoignez l'early access » ou « on onboarde la première promo ».

Le bouton « essayer cette fonction IA ». Le hero a un bouton qui dit Essayer ou Générer. Le visiteur clique. Il atterrit sur une modale qui dit « On est en train de le construire. Rejoignez la waitlist pour l'early access — on onboarde les 50 premiers design partners le mois prochain. » Le taux de capture entre le clic du bouton et l'email est lui-même un signal : au-dessus de 40 %, c'est fort ; sous 20 %, c'est faible. Le clic du bouton vous a dit que le titre fonctionnait ; la capture sur la modale vous dit que l'offre fonctionne.

La landing page avec capture d'écran. Une image haute fidélité de l'UI du produit en train de faire la chose. Pas de vidéo, pas de démo — un seul screenshot haute résolution intégré à la page comme si le produit était déjà sorti. Des fondateurs avec qui on a travaillé font tourner ça avec le copy explicite « preview » ou « bientôt — réservez votre place ». La capture d'écran répond à la question « ça fait quoi concrètement » sans que vous écriviez la moindre ligne de prompt.

La vidéo de démo Wizard of Oz. Un screencast de 30 secondes où vous, le fondateur, faites tourner le workflow à la main et produisez le résultat. Vous générez le brief dans ChatGPT, vous le collez dans une page Notion, vous capturez. La vidéo montre le résultat, pas l'ingénierie. Les visiteurs ne savent pas — et ne doivent pas savoir — que le « produit » dans la démo, c'est vous avec trois onglets ouverts. Ils répondent au résultat, ce qui est exactement ce que vous voulez qu'ils fassent.

Chacune de ces techniques est honnête dans l'esprit : vous ne promettez pas un produit qui existe, vous promettez un produit que vous construirez si assez de gens le veulent. La waitlist ou l'acompte rendent ça clair. Aucune n'exige un seul token d'inférence.

Quand commencer vraiment à dépenser en tokens

Deux portes. Les deux doivent s'ouvrir.

Porte 1 : le wedge convertit au-dessus du seuil ajusté IA sur un test de trafic payant. 150 à 200 € en ads, le bon canal, le CTA coûteux. Des inconnus, du vrai argent en jeu. Si ça ne passe pas, vous ne dépensez rien en tokens. Vous pivotez le wedge ou vous tuez l'idée.

Porte 2 : vous livrez les 5 à 10 premières demandes à la main. C'est la porte dont on parle peu. Même quand le wedge convertit, la partie IA peut ne pas livrer ce que vous avez promis. La seule façon de le savoir sans cramer des milliers d'euros en inférence, c'est de faire le travail à la main pour la première fournée — ChatGPT dans un onglet, votre cerveau d'éditeur dans un autre, livraison en Google Doc.

Si la livraison manuelle vous prend 25 minutes par demande et que le client est ravi, vous avez un vrai produit à automatiser. Si elle vous prend 2 heures et que le résultat reste moyen même avec vous dans la boucle, la version 100 % LLM sera pire, pas meilleure. Aucun budget de tokens ne réparera ça.

C'est seulement quand les deux portes sont franchies — wedge qui convertit, livraison manuelle qui tient — qu'il vaut la peine de câbler le vrai pipeline d'inférence. À ce stade, vous savez que l'offre marche ET que la techno peut livrer, ET vous avez 5 à 10 clients qui paient pour financer le build.

La trajectoire des coûts

Les chiffres qu'on vise ressemblent à ça :

  • Phase de validation (14 jours) : 0 € en tokens. 150 à 200 € en ads. 0 à 20 € en outils (builder de landing, capture d'email). Le résultat : des données de conversion, des commentaires qualitatifs, et une décision tuer / continuer.
  • Phase de livraison manuelle (les 30 jours suivants) : 50 à 100 € en tokens. C'est vous qui faites tourner ChatGPT ou Claude à la main pour les 5 à 10 premiers clients qui paient. La dépense en tokens est incidente à votre propre usage. Le résultat : la validation de la livraison — l'IA peut-elle vraiment produire le résultat ?
  • Phase de build (seulement après les deux premières) : 500 € et plus en tokens, puis ça monte avec l'usage. À ce stade, vous avez des clients qui paient et qui financent l'inférence. La dépense en tokens suit le revenu, elle ne le précède plus.

La forme de cette trajectoire, c'est tout l'intérêt de la chose. La plupart des fondateurs IA la font dans l'autre sens : 500 € et plus en tokens pendant le build, 100 € en ads au lancement par-dessus la jambe, 0 € pour valider le wedge. Et après ils s'étonnent que le compteur tourne et que les clients ne soient pas là. Inverser l'ordre change l'économie.

Un cas concret : IA pour la recherche de comptes en sales-ops

Une équipe avec qui on a travaillé le trimestre dernier voulait construire un outil IA qui produit des briefs de recherche de comptes pour des équipes sales-ops. Plausible. Les deux co-fondateurs avaient passé quatre ans en revenue operations dans un SaaS B2B. Ils étaient prêts à dépenser trois mois et quelques milliers d'euros en prompt engineering.

À la place, ils ont fait tourner le playbook.

Wedge : « Pour les équipes sales-ops dans des SaaS, ça transforme 12 champs en un brief de recherche de compte de 600 mots, prêt à publier, en 90 secondes. »

Landing page : un seul hero, trois bénéfices, un mock screenshot du brief produit, un CTA : « Réservez une démo de 15 min — les 10 premiers design partners ont 6 mois à 0 €. »

Trafic : 217 € sur LinkedIn Ads, ciblés sur les titres « Sales Operations » dans des SaaS de 50 à 500 employés en Europe de l'Ouest.

Résultat sur 11 jours : 184 clics, 7 démos réservées, 4 slots de design partner pris à 99 € chacun. Conversion vers démo : 3,8 %. Conversion vers paiement : 2,2 %. Au-dessus du seuil ajusté IA, sur les deux.

Dépense en tokens pendant la validation : 0 €. Aucun prompt écrit.

Puis ils ont attaqué la Porte 2. Les 4 clients qui ont payé ont reçu leurs premiers briefs livrés à la main : ChatGPT-4 plus les fondateurs qui éditent le ton et la précision, livré en Google Doc sous 24 heures. Coût total en tokens sur les quatre livraisons manuelles : 38 €. Chaque brief a pris 35 minutes aux fondateurs — environ la moitié du temps que les clients disaient y consacrer en interne — et trois des quatre clients ont demandé quand ils pouvaient soumettre leur deuxième compte.

C'est seulement à ce moment-là que l'équipe a commencé à écrire le vrai produit. Ils savaient que le wedge convertissait. Ils savaient que le LLM pouvait livrer le résultat avec un humain dans la boucle. Ils avaient 396 € de revenu pour financer le premier mois d'inférence.

Total dépensé avant le début du build : 217 € en ads + 38 € en tokens + 0 € en ingénierie produit = 255 €. À comparer au plan initial — trois mois de prompt engineering avec 0 € de feedback client.

Pourquoi cet ordre compte plus en IA qu'ailleurs

L'inférence est l'une des très rares catégories où le coût du produit est variable, continu, et indexé sur les prix d'un tiers. Un SaaS classique qui rate sa cible voit sa facture d'hébergement rester à peu près la même. Un produit IA qui rate sa cible continue de payer pour chaque clic curieux. Le downside est asymétrique.

Combinez ça avec deux autres faits propres à l'IA : le problème des clics curieux qui gonfle le bruit en haut du funnel, et l'inférence devenue 30 à 100 fois moins chère depuis 2023 qui a inondé la catégorie de wrappers indifférenciés. Les deux effets rendent le « on lance et on voit » plus coûteux en espérance qu'il ne l'a jamais été.

Le playbook pré-tokens n'est pas une optimisation maline. C'est la seule séquence qui ne paie pas les fournisseurs de modèles pour apprendre ce que vous auriez pu apprendre pour 200 €.

Comment LemonPage s'inscrit là-dedans

LemonPage existe pour ce loop précis. Des landing pages spécifiques IA, les patterns de CTA coûteux ci-dessus, du trafic payant vers le bon canal, les seuils ajustés IA sauvegardés à côté du test, et un critère d'arrêt sur lequel vous vous engagez avant de lancer. On l'a construit parce que la friction de faire ça à la main — Webflow + campagnes LinkedIn + analytics + un tableur séparé pour le critère d'arrêt — c'est exactement la friction qui pousse les fondateurs IA à sauter la validation et à livrer dans le vide.

À lire ensuite : les wrappers ChatGPT sont-ils encore viables en 2026 · 11 nouveaux business rendus possibles par la baisse du prix de l'IA · comment valider une idée de startup en 2026.

Le compteur de tokens démarre à la seconde où votre premier utilisateur clique sur générer. Assurez-vous qu'il veut ce que vous vendez avant qu'il clique.