A propos des NPU, des TOPS et de l’IA marketing en général

Pas un seul communiqué de presse sans que l’on parle de TOPS ou d’IA. À se demander comment on faisait de l’informatique avant les NPU.

Les processeurs embarqués dans les ordinateurs aujourd’hui proposent des capacités de calcul liées à l’IA. Elles sont souvent proposées sous l’angle le plus flatteur. Soit en mettant en avant leur NPU qui est l’unité de calcul spécialisée dans cette tâche, soit en affichant une compétence de calcul globale. Par exemple un Core Ultra 9 285H d’Intel proposera 99 TOPS au total, en employant toutes ses ressources pour cela : processeur, circuit graphique qui calculera à lui seul 77 TOPS sur le total et son circuit AI Boost spécialisé, le fameux NPU.

Les puces Arrow Lake embarquent un NPU 13 TOPS

En solo, cette unité dédiée seule ne propose que 13.1 TOPS seulement. Ce qui est inférieur aux demandes de Microsoft pour pouvoir qualifier ce PC à une certification « Copilot+ ». Ce qui m’amène à quelques réflexions.

Une bonne partie La totalité des marques de MiniPC s’intéressent à l’IA aujourd’hui, ce qui semble logique puisque tout le monde s’intéresse à l’IA. J’ai reçu des communiqués de presse pour des réfrigérateurs pilotés par IA ou des batteries optimisées par IA. Comme me dit un copain aux US : « s’il n’y a pas écrit IA dans ta présentation de produit, ce n’est pas la peine de lancer tes slides. ». Et il est donc logique de voir d’un côté Microsoft ou Google qui essayent de tirer la couverture avec les marques « Copilot » et « Gemini » et de l’autre des fabricants d’ordinateurs tenter d’appâter le public avec des spécifications orientées pour mettre en valeur leurs capacités de calcul en IA.

Et je remarque un truc assez drôle avec tout cela. L’intérêt pour des standards comme « Copilot+ » n’intéressent les marques que dans la mesure où leur PC sera utilisé par le grand public et uniquement si leur machine atteint les 40 TOPS de puissance réclamés par Microsoft pour être certifiée « Copilot+ ». Si c’est bien le cas, alors le constructeur le fait clairement savoir. Ils n’ont rien à perdre à l’indiquer sur leur marketing. L’idée est de profiter du rebond du matraquage publicitaire de Microsoft pour vendre leurs engins.

Copilot veut être l’agent conversationnel de votre PC Windows avec les mêmes arguments qu’Internet Explorer, une installation par défaut

Mais si leurs PC est équipé d’un NPU ne correspondant pas au standard de Microsoft, qui ne propose donc pas un NPU déployant 40 TOPs, cela n’empêche absolument pas les marques d’indiquer que leur produit est « prêt pour l’IA ». D’abord parce que pour Intel comme pour AMD, leurs puces en sont tout à fait capables. Ensuite et surtout parce que les marques se fichent pas mal des recommandations spécifiques de Microsoft. Et si l’engin n’est pas « Copilotable », il n’en reste pas moins apte à beaucoup de choses en termes de calcul d’IA. Ce scénario qui consiste à regarder ailleurs quand on n’atteint pas les standards est classique. C’est ce que font tous les fabricants depuis toujours.

Mais là où c’est drôle pour l’IA, c’est quand le matériel vendu dépasse le cadre de ce que veut Microsoft. Windows a toujours donné le LA en termes d’usages informatiques grand public, c’est beaucoup moins vrai pour les machines spécialisées. Et l’Intelligence Artificielle cristallise ce constat de manière très crue. Dès que les 40 TOPS sont dépassés, ce n’est plus Windows qui est mis en avant mais directement l’outil IA que l’on va employer localement. Et c’est le LLM DeepSeek qui est le plus souvent porté par les marques. Le fait qu’un MiniPC propose un NPU spécialisé minimal mais puisse fournir au final beaucoup plus en capacité au global permet de sauter par-dessus le marketing de Microsoft pour aller mettre directement en avant des tâches plus avancées. Les constructeurs savent qu’ils s’adressent alors à des experts et n’ont alors plus aucun complexe de communication.

C’est d’autant plus amusant que, très clairement, le grand public ne s’intéresse pas spécialement aux usages locaux de l’IA sur PC. Ou plutôt, elle n’a pas attendu Copilot+ et ses copains pour flouter son arrière-plan en vidéo conférence, améliorer une photo ou enlever un bruit de fond d’un enregistrement sonore. On fait ça depuis des années maintenant.

Pour terminer mes digressions sur l’IA.

Je me rends compte que pour beaucoup d’utilisateurs, les termes TOPS ou INT restent des acronymes incompréhensibles. Le fonctionnement de l’Intelligence artificielle est complexe, mais les notions de base sont faciles à acquérir.

TOPS signifie « Trillions Operations Per Second » que l’on traduirait logiquement par trillions d’opérations par seconde. Mais un détail à son importance. Le Trillion est traduit différemment en France et aux USA. En France, un Trillion, c’est un milliard de milliards. Aux USA le mot « Trillion » désigne ce que chez nous, on appelle un « Billion ». Soit mille milliards. 13 TOPS c’est donc 13 000 milliards d’opérations par seconde.

La grosse différence entre un NPU et un CPU, entre la puce spécialisée dans ces calculs et un processeur classique, c’est sa capacité à traiter des tâches en parallèle. Imaginons que vous ayez à compter combien d’allumettes sont tombées par terre après avoir fait tomber la boite. Un processeur classique va les compter une par une ou 4 par 4 si elle a 4 cœurs. Mais elle mettra les tâches les unes à la suite des autres, ce qui va prendre du temps. Le NPU lui va compter l’ensemble des allumettes en parallèle, toutes en même temps, si elle a assez de TOPS. Un NPU avec 2 TOPS pourra compter 2 000 milliards d’allumettes en une seconde.

Et c’est très logique car les besoins d’un processeur classique suivent un chemin d’abord tracé par les développeurs du logiciel. On a besoin des calculs d’un premier élément pour continuer à calculer la suite. Pour un NPU cela n’est pas la même chose, les calculs sont effectués en parallèle, parce qu’ils sont indépendants les un des autres. C’est pour cela que Nvidia est si performant sur ce segment, ses circuits graphiques ont été pensés pour calculer de cette manière. Chaque cœur CUDA d’une carte graphique GeForce s’occupe de calculer un élément d’affichage dans son coin. Une réflexion lumineuse ou le déplacement d’un des trois points d’un triangle quand on déplace un objet en 3D à l’écran est calculé de manière indépendante. Une carte graphique GeForce RTX 4090 propose par exemple 1300 TOPS de puissance de calcul. Les puces dédiées de la marque ont simplement repris cette capacité graphique pour l’optimiser pour des calculs purement orientés vers l’Intelligence Artificielle.

À noter, une petite information importante tout de même pour finir, les TOPS sont souvent accompagnés d’un élément qui les qualifie. Les INT. Cette seconde indication, généralement notée en INT4 (4-bits) ou INT8 (8-bits), indique la précision du calcul pour parvenir à ce nombre d’opérations par seconde. Pour aller très vite, une machine qui proposera 10 TOPS INT8 fera donc 10 000 milliards d’opérations par seconde sur des entiers 8 bits. Cet élément est parfois important, car cela impacte la précision des calculs. Un nombre de TOPS indiqué en INT8 réfèrera à un calcul plus précis qu’un nombre identique de TOPS indiqué en INT4.

Cela ne brosse qu’à grands traits le tableau complexe des circuits spécialisés de l’IA, mais donnera une petite idée de ce qu’il se cache derrière ces chiffres. Et cela permet également de les relativiser. Car on se rend compte que la « normalisation » voulue par Microsoft est surtout basée sur son partenariat avec Qualcomm pour le lancement de ses PC sous SoC ARM « Copilot+ ». Les 40 TOPs demandés correspondent à ce que les puces Qualcomm Snadragon Elite pouvaient proposer alors. Un score loin devant ce qu’embarquaient les concurrents x86 Intel et AMD au moment de l’annonce et à des kilomètres derrière les capacités des cartes graphiques déjà en vente depuis des années.

On comprend que ce chiffre ne correspond pas à un usage réel au quotidien, tout simplement parce qu’aucun logiciel grand public ou presque ne les prenait alors en compte. Pour vous donner une idée, 5 TOPS vous suffisent largement à flouter votre arrière-plan lors d’une conversation en visioconférence ou à exécuter un filtre d’amélioration de votre voix en éliminant les bruits parasites. D’un autre côté, 40 TOPs ne seront pas suffisants, très loin de là, pour entrainer une IA à une tâche. Et toute exploitation d’une IA de génération d’image vous orientera vers le choix d’un PC avec, non pas un NPU, mais bien une carte graphique. Tout simplement parce que ces cartes offriront beaucoup plus de puissance et l’avantage d’une mémoire dédiée.

Bref, avant de vous enflammer pour un PC parce qu’il proposerait une compatibilité « IA », des tas de TOPS ou la présence absolument nécessaire de telle ou telle certification, il est toujours important de bien définir vos besoins. Un PC avec un gros score NPU apparaitra peut-être comme un investissement plus perenne sans qu’il ne soit forcément l’allié dont vous avez réellement besoin.

Microsoft annonce Copilot+, une IA intimement mêlée à Windows


Soutenez Minimachines avec un don mensuel : C'est la solution la plus souple et la plus intéressante pour moi. Vous pouvez participer via un abonnement mensuel en cliquant sur un lien ci dessous.
2,5€ par mois 5€ par mois 10€ par mois Le montant de votre choix

Gérez votre abonnement

21 commentaires sur ce sujet.
  • 23 mai 2025 - 14 h 29 min

    « s’il n’y a pas écrit IA dans ta présentation de produit »
    C’est un effet de mode. Il y a 9 ans, j’ai assisté à une présentation de la part d’un chercheur (en énergie) et il mentionnait la même chose quant à la recherche de fond pour les projets : si le pitch du projet ne mentionnait pas IA ce n’était même pas la peine de postuler.
    Alors que la plupart des projets se satisfaisaient très bien de déterminisme.
    Mais non, les juges voulaient de l’IA.

    À l’époque, IA signifiait Machine Learning et non LLM car les « transformers » n’ont été inventés qu’en 2018 par Google.
    Puis, dès l’année suivante, 2017, l’IA est tombée dans l’oubli (du grand public uniquement) pour revenir en force fin 2022 avec les LLMs.

    Ce sont des modes, demain, s’il n’y a pas quantique dans un projet, il sera inutile de postuler.
    Et puis autre chose viendra, etc, etc.

    Faut savoir jongler avec ça.
    db

    Reply
  • 23 mai 2025 - 14 h 34 min

    Précision, la distinction indiquée entre NPU et CPU existe déjà entre GPU et CPU.
    Une GPU n’est qu’un ensemble de micro-CPU interconnectées entre elles et partageant la même mémoire (c’est le plus important).
    Une telle petite CPU est 1 000 fois moins puissante (ordre d’idée) qu’une CPU classique mais il y en a 10 000 dans une GPU. Finalement, la somme est plus puissante qu’un tout.
    Et, effectivement, elles peuvent travailler toutes en parallèle grâce à la mémoire partagée.
    Le NPU n’est qu’une GPU « préparée » pour s’interfacer facilement avec les frameworks de gestion de réseaux de neurones (PyTorch, etc).
    db

    Reply
  • 23 mai 2025 - 14 h 36 min

    « J’ai reçu des communiqués de presse pour des réfrigérateurs pilotés par IA ou des batteries optimisées par IA. »

    Ha, ha, ha.
    Il y a 20 ans on a eu droit aux réfrigérateurs connectés en WiFi.
    Bah, « il suffirait de ne pas acheter pour que ça ne se vende pas ».
    db

    Reply
  • 23 mai 2025 - 15 h 09 min

    Je commence doucement à comprendre le concept de la ménagère de moins de 50 ans, étant passée légèrement au-delà, il devient de plus en plus difficile pour ne pas dire impossible de me refourguer un truc dont je ne veux pas, je suis devenue sourde aux sirènes du marketing.
    Il y a un auteur que j’aimais bien, Douglas Adams, qui a écrit :
    « Tout ce qui existe dans le monde à votre naissance est normal et ordinaire. Tout ce qui est inventé entre vos 15 et 35 ans est nouveau, excitant et révolutionnaire. Tout ce qui est inventé après vos 35 ans va à l’encontre de l’ordre naturel des choses. »
    Le bougre avait peut-être bien raison.

    Reply
  • 23 mai 2025 - 17 h 20 min

    En résumé (en tout droit) : J’avais des visées sur une bécane R7 8740 ou 8845 HS pour une utilisation sous Linux à 98% (et pas de jeux) les 16 TOPS du NPU n’apporte aucun intérêt mieux vaut (pour le portemonnaie) rester dans la série G (8700g et même patienter en attendant le 9700g)…

    Reply
  • 23 mai 2025 - 18 h 07 min

    Ce qui est en plus très embêtant avec les npu des diverses marques, c’est que de trouver les bibliothèques stables et fiables c’pas simple quand le commun des bricoleurs voudrait l’utiliser pour ses propres expérimentations.

    Reply
  • to
    23 mai 2025 - 18 h 23 min

    @david: c’et sans doute pour ca que nvidia en vends par palettes, du tops a gogo et des librairies utilisées par tout le monde (ou presque)

    Reply
  • 23 mai 2025 - 19 h 30 min

    @Gaduc: Nvidia nous démontre qu’avec CUDA et des librairies adaptées au machine learning (pardon à l’IA !), nul besoin de NPU sur nos ordinateurs, un GPU fera l’affaire et de manière bien plus efficace.
    Je me demande où en est Open CL sur ces travaux d’ailleurs concernant l’open source.

    Reply
  • Luc
    23 mai 2025 - 22 h 24 min

    On peut donc utiliser Copilot « hors ligne », c’était une de mes grandes interrogations.

    Bon, là c’est MS qui pousse à ça, donc j’imagine que c’est à peu près efficace et bien lié avec toutes les applis MS (Outlock, Office etc).

    Sinon, il faut que l’application utilisée tire vraiment parti de ces NPU. Soit c’est vraiment dédié (PyTorch, Deepeek etc), spécialisé (un plugin GIMP par ex :), mais sinon …

    De plus, le grand public est plutôt habitué à l’IA à effet « Wouah » (chatGpt qui fait des dissertations ou du code, la musique générée par IA, dles images et vidéos fake, …), j’ai donc du mal à voir ce que cela pourrait apporter « dans les coins » lors d’une utilisation au quotidien (je sais pas si c’est très clair !).

    Pour le moment, ce n’est pas vraiment ma préoccupation, mais un jour ou l’autre j’aurai à utiliser un poste W11 avec Copilot ou à changer d’ordi. Le coté « simple assistant » (et la hype actuelle) ne m’excite(nt) pas trop, ont même plutôt tendance à me contrarier, mais j’espère bien qu’on aura des applications qui feront appel à l’IA intelligemment (*) et en local tiens !

    (*) le routage automatique des pistes d’une PCB par KiCad par exemple ;)

    Reply
  • 24 mai 2025 - 8 h 44 min

    Ah ça ! Il faut mettre de l’IA partout.
    J’étais en train de regarder des clim mobiles avec split et je suis tombé sur un modèle sympa, mais trop cher, mais surtout « AVEC IA ».
    Tellement ridicule.
    Ajouter « avec IA » permet surtout de faire grimper les prix …

    Reply
  • 24 mai 2025 - 9 h 02 min

    ** gemini et claude
    INT4 utilise 4 bits
    INT8 utilise 8 bits

    Reply
  • gep
    24 mai 2025 - 9 h 29 min

    @Valérie M.: :) super cette phrase d’Adams. ça s’applique aussi au ménager de (presque) 50 ans.

    S’ajoute à ça que les llm avec réseau de neurones et autres apprentissage machine sont pour la plus part des modèles statistiques simples tes anciens (souvent conceptualisé et utilisé avant notre naissance avec des puissances de calculs limités) ‘rebrandés’ pour avoir le goût de la nouveauté.

    Reply
  • CHP
    24 mai 2025 - 12 h 48 min

    @Gaduc:

    A l’époque on appelait ça le mode « Programme » et non IA.
    On le retrouvait notamment dans les appareils photos, caméra, outillages divers, certains éléctro-ménagers mais pas que… Même les robots et automates industriels et il y avait des lagunages dédiés à ça).

    Le terme « IA », que l’on voit sur quasiment tous les produits actuels, n’a d’IA que l’étiquette sur laquelle ce mot est apposé. Souvent ces « IA » ne sont qu’un bout de programmes basé sur des tables de croisement de paramètres pour sélectionner la meilleure action à adopter.

    Bref, dans la majorité des équipements ayant ce « label », ils n’ont rien à voir avec l’IA mais c’est à la mode et les gens tombent dedans.

    Reply
  • CHP
    24 mai 2025 - 12 h 52 min

    Correction : Ah…. les correcteurs d’orthographe « automatiques » … il faut lire : et il y avait des langages dédiés à ça.

    Reply
  • 24 mai 2025 - 13 h 53 min

    je connais l’IA, l’IB (ration), l’IC (et collège), l’ID (en France on en a), l’IE (en 1970 sur porsche 911), l’IF ( ou « if ») , l’IG (en général avec les inspections) mais à quand l’IH ? l’Intelligence Humaine…à la fin du marketing ou du profit sans fin ?

    Reply
  • 24 mai 2025 - 14 h 18 min

    J’ai toujours penser que le T était pour tera.

    Reply
  • jle
    24 mai 2025 - 21 h 49 min

    @alain: En fait les deux sont valables. Selon le milieu où tu évolues, tu peux effectivement entendre davantage Tera que Trillion.
    Et en pratique, Tera Operations Per Seconds ne laisse pas place au doute, un Tera valant mille Giga. Et ça, c’est la même norme partout sur le globe (bon ok, sauf chez Microsoft, mais ils ne savent pas compter ^^).

    Reply
  • 26 mai 2025 - 11 h 06 min

    Je ne suis plus du tout dans l’informatique, mais dans le bâtiment. et je croise un tas de personnes qui utilisent l’IA
    comme moteur de recherche. et quand je demande la raison de cet usage : « il y a moins de pubs »
    généralement suivi de « je peux demander les sources et vérifier si la réponse est pertinente ».
    Spécialisé dans le bâti ancien, et en particulier dans la construction en terre, l’an passé les réponses étaient très correctes, voir pertinentes. Nouvel essai la semaine passée … la pertinence diminue, les généralités et approximations apparaissent dans les réponses. et les sources sont plus généralistes, et partiellement issues d’articles fourre tout sans doute rédigés par des IA état donné la jeunesse et le contenu « je sais tout sur tout » des sites contenant les articles utilisés.

    Reply
  • 26 mai 2025 - 11 h 29 min

    @Emmanuel: L’auto-empoisonnement des IA est un phénomène déjà fortement documenté, oui.

    Reply
  • 29 mai 2025 - 14 h 56 min
  • 10 juin 2025 - 15 h 57 min
  • LAISSER UN COMMENTAIRE

    *

    *


    GeekBuying Sponsor Officiel de Minimachines ZigBuy.fr Sponsor Officiel de Minimachines Geekom Sponsor Officiel de Minimachines Devenir Sponsor Officiel de Minimachines