VLC montre que l’utilisation de l’IA locale peut avoir du sens

VLC annonce une IA locale, totalement indépendante du web, capable de sous-titrer les vidéos lues dans plus de 100 langues.

VLC, le logiciel de lecture multimédia de VideoLAN, ajoute une nouvelle corde à son arc avec cette possibilité offerte aux utilisateurs de traduire en temps réel ses vidéos sous la forme de sous-titres. 

Vous l’avez surement lu un peu partout, VLC annonce le déploiement d’une IA locale, totalement indépendante qui se chargera de la traduction des contenus diffusés via des sous-titres.

Cela veut dire quoi en termes d’usage ? Que si vous regardez une vidéo en Grec, en Polonais ou une des 100 langues qui seront prises en compte par le logiciel, votre ordinateur personnel pourra générer en temps réel des sous-titres adaptés à ce que vous regardez. Et cela localement, sans passer par un service en ligne ni utiliser les données d’un serveur distant. Vous pourrez bénéficier de cette fonction au fin fond de la jungle pour suivre votre série préférée traduite automatiquement en local.

Parmi les points clés, VLC assurera la correspondance entre les sous-titres et le rythme à l’écran, que les paroles prononcées ne soient pas désynchronisées de leur traduction. Il sera même possible d’afficher deux sous-titres dans deux langues différentes par exemple. Et même d’enregistrer le fichier des sous-titres sur votre machine pour le conserver et, éventuellement, le modifier. Ce dernier reprendra le standard .srt qui est massivement employé pour cet usage.

Google fait pareil !

Oui Google, enfin Youtube, propose la même chose. En ligne. Pas en local. Google propose ce service en échange de publicités, de cookies et de la vente de votre profil d’internaute à des milliers de « partenaires » puisqu’il faut utiliser cet euphémisme. VLC le fait en local, le logiciel utilise son propre système et ne demande rien à personne. Une fois que vous aurez téléchargé votre mise à jour technique du logiciel qui devrait arriver plus tard cette année, vous n’aurez plus besoin de vous reconnecter.

Depuis des mois, des trimestres, des années, on nous bassine avec des IA sur nos PC. De nombreux utilisateurs ont acheté un matériel techniquement capable de piloter des IA sans avoir le choix, mais sans en avoir non plus le moindre usage local. Des NPU spécialisés dans le calcul nécessaires aux IA sont apparus dans de nombreuses machines et Microsoft exige que les PC disposent d’un certain niveau de ce type de calcul pour recevoir leur label « Copilot+ ». Mais pour la grande majorité des utilisateurs, l’exploitation de ces fonctions d’IA ne passe encore aujourd’hui que par des usages en ligne.

Bien peu nombreux sont les usages locaux de ces outils et VLC est un des premiers à proposer une IA locale et indépendante. Je soupçonne – avec beaucoup d’indices – que la majorité des usages locaux des grands développeurs seront très largement scannés et analysés en ligne lors de leur usage. 

On ne sait pas encore vraiment à quoi s’attendre avec VLC

Pour le moment, nous ne disposons que de très peu d’informations techniques de la part des équipes de VideoLAN. VLC ne donne pas de détails sur le matériel nécessaire à l’accomplissement de cette tâche. Est-ce qu’il faudra un matériel en particulier ? Un NPU avec un nombre de TOPS minimal ? Comment se débrouillera le moteur de traduction pour respecter le sens des contenus ? Est-ce qu’il sera aussi incompétent que celui de Google ou d’Amazon par exemple ?

Le métier de traducteur est bien plus complexe que le simple traitement mot à mot. Certains contre-sens sont régulièrement lisibles sur les sous-titrages des films sur différentes plateformes parce que le traitement des traductions n’est pas toujours fait par un humain. La simple existence d’une œuvre dans sa globalité, avec un développement complexe, peut nécessiter l’emploi d’un mot plutôt qu’un autre pour proposer une traduction valable. Selon chaque thématique de film, l’auteur pourra employer certains mots qui devront être traduits de manière particulière et pas forcément littérale. Et cela, les IA de traductions ne savent pas le faire, elles ne saisissent pas le sens d’un œuvre dans son ensemble et ne font que le choix en temps réel d’une traduction la plus logique possible. Parce qu’une IA ne peut pas traduire une œuvre comme un tout au même titre qu’un humain. Son travail reste ici d’ahaner une réponse plausible du mieux qu’elle peut. Mais quand un traducteur pro reviendra en arrière pour changer un verbe, une tournure, un adjectif ou tout le sens d’une phrase précédemment écrite, l’IA se contentera de deviner au mieux.

Cela fait des années que des sites de téléchargement de sous-titres proposent des conversions automatiques de contenus en se basant sur un sous-titre souvent en anglais pour le basculer dans une autre langue. Et le résultat n’est jamais fameux.

Je suis donc autant curieux que circonspect sur la proposition faite par les équipes de VideoLAN. Derrière VLC il y a, il faut bien l’avouer, des talents assez formidables et cette équipe propose depuis des années un excellent logiciel gratuit, libre, Open Source et sans publicité. Ils viennent d’ailleurs de fêter leur 6 milliardième téléchargement.

J’attends donc de voir ce que va donner cette nouvelle fonction IA, parce que beaucoup de contenus qui m’intéressent sont disponibles dans des langues que je ne maitrise pas. Sans pour autant me dire, comme j’ai pu le lire ces derniers jours, que l’arrivée de cette fonction signe la fin du métier de traducteur.


Soutenez Minimachines avec un don mensuel : C'est la solution la plus souple et la plus intéressante pour moi. Vous pouvez participer via un abonnement mensuel en cliquant sur un lien ci dessous.
2,5€ par mois 5€ par mois 10€ par mois Le montant de votre choix

Gérez votre abonnement

31 commentaires sur ce sujet.
  • 13 janvier 2025 - 7 h 55 min

    VLC. ♥
    Stou.

    Répondre
  • 13 janvier 2025 - 8 h 18 min

    VLC étant une des applications les plus portables que je connaisse : PC, Mac, Linux mais aussi Android , Android TV, iOS, Apple TV ….
    Je suis bien curieux de connaître le minimum des besoins en puissance et/ou NPU qu’il faudra pour activer cette option et comme le dis l’article : est ce enfin une nouvelle approche ? De fort doute subsiste…
    Reste plus qu’à attendre

    Répondre
  • 13 janvier 2025 - 9 h 01 min

    @FlyDutch: J’imagine qu’ils ont découplé le moteur de la méthode et qu’il sera possible d’utiliser la méthode avec plusieurs moteurs. Enfin, je ne vois pas trop d’autres solutions à vrai dire. A moins de faire dorénavant deux VLC différents avec des propositions techniques différentes.

    Répondre
  • 13 janvier 2025 - 9 h 01 min

    le batpème du feu va etre la resistance de cette traduction au noms et mots inconnus qui sont légions dans les films (science-fiction en particuliers).

    Répondre
  • 13 janvier 2025 - 9 h 31 min

    j’adore l’illustration de l’article et la reference à Days of the Tentacles ;-)
    Et effectivement VLC c’est top comme projet !

    Répondre
  • 13 janvier 2025 - 9 h 42 min

    L’illustration de l’article !!! Souvenirs, souvenirs… (Belle ref.)

    Répondre
  • 13 janvier 2025 - 10 h 03 min

    J’utilise en permanence les sous-titres, pour les programmes en VO comme…en VF, et c’est vrai que, parfois, c’est un peu a côté de la plaque.
    Maintenant, ce type de sous-titres générés par l’IA, même si ce n’est pas parfait, aura le mérite d’être la et va forcément s’améliorer avec le temps.
    C’est une bonne chose, aussi, pour les sourds et malentendants, et si c’est plus rapide que les sous-titres télétextes, c’est encore mieux!
    Juste a espérer que cette « option » soit disponible sur toutes les plateformes (os PC et OS mobile/TV)

    Répondre
  • 13 janvier 2025 - 10 h 13 min

    @Madwill: Oui ça reste formidable comme outil, mais de là à écrire que les traducteurs vont disparaitre comme j’ai pu le lire, c’est un peu fort.

    Répondre
  • gUI
    13 janvier 2025 - 10 h 17 min

    @R2D2: Il y aura évidemment plein de limites, c’est plutôt un dépannage que autre chose.

    En effet, pour les sous-titres on parle plutôt « d’adaptation » et pas de « traduction ». Cela comprend le fait qu’on ne puisse pas lire aussi vite qu’on parle, mais aussi qu’il faut parfois adapter le texte sur le plan culturel (références différentes). Sur ces plans-là je n’attends pas grand chose de l’IA, surtout d’une IA « low-cost » étant donné qu’elle sera censée tourner sur des configurations modestes (enfin, j’espère !).

    Mais l’initiative reste bonne, déjà ça sert vraiment à qqchose, et puis ça va montrer que l’IA locale c’est possible.

    Répondre
  • 13 janvier 2025 - 10 h 33 min

    Les traducteurs font voir leur métiers évoluer. Ils vont devenir des relecteurs/correcteurs.
    Cela ira plus vite et coûtera moins cher.

    Répondre
  • 13 janvier 2025 - 11 h 27 min

    @i18n: Disons que si on me propose un roman d’Umberto Eco à 10€ traduit par une IA relue par un humain et le même roman à 20€ traduit intégralement par un humain, je ne vais pas choisir celui à 10€. Mais pour traduire un téléfilm débile sur une plateforme de streaming, la version « relecteur » me conviendra probablement. De toute façon, la pingrerie des services ne me laissera pas d’autres choix.

    Répondre
  • 13 janvier 2025 - 12 h 01 min

    @Pierre Lecourt: Je pense que ce métier (comme d’autres métiers intellectuels ou artistiques) est voué a disparaître, de part l’outil qu’est l’IA mais également, et c’est la le plus triste, de part les consommateurs qui se contenteront de ce qu’on leur donne, c’est du business et l’on ne peut pas grand chose contre ça.

    HS: ça m’amuse un peu d’entendre la panique venant de tout ces métiers intellectuels et artistiques, la peur du « grand remplacement numérique ».
    Tout ces intellectuels et artistes qui nous vantaient le progrès, il y a 40ans, quand on commençait a remplacer les ouvriers par des machines dans les usines, sans se soucier des conséquences sociale.
    Personnes n’est a l’abri 😉

    Répondre
  • 13 janvier 2025 - 13 h 13 min

    Quand je vois DeepL qui est un des traducteurs textuels les plus avancés n’est pas capable de traduire des idiomes ultra fréquents je me dis que l’avenir est encore pour les traducteurs.

    Par contre pour le sujet de l’article je suis assez enthousiaste d’avoir accès à des sous-titres même grossiers pour m’aider sur des vidéos non traduites et non sous-titrées.

    Répondre
  • 13 janvier 2025 - 13 h 22 min

    @Madwill: Je ne suis pas persuadé de cela. Parce que la traduction est vraiment plus que ce que proposent les services d’IA les plus évolués aujourd’hui.

    Certains auteurs n’ont pas eu de succès chez nous à cause d’une mauvaise traduction, d’autres sont redécouverts après une nouvelle traduction. Alors qu’elles étaient opérées par des humains. Un auteur comme Pratchett a eu du succès en France parce que traduit avec brio par Patrick Couton. Et même l’IA la plus avancée n’aurait sans doute pas eu la sensibilité, la poésie et le génie lexical proposé par ce dernier.

    Le jour où une IA fera aussi bien ce métier qu’un traducteur de qualité, ce ne sera pas de cela que je craindrais des IA mais de bien autre chose. Car le niveau de sensibilité et d’intelligence nécessaire sont intensément plus complexes que ce que savent faire les IA aujourd’hui.

    Si le sujet de la traduction t’intéresse, il y a cet excellent bouquin d’Umberto Eco justement : https://www.grasset.fr/livre/dire-presque-la-meme-chose-9782246659716/

    Répondre
  • 13 janvier 2025 - 13 h 42 min

    @Pierre Lecourt: merci pour le lien 😉.
    Je ne dis pas que l’IA fera aussi bien, mais mieux qu’elle ne le fait aujourd’hui mais surtout, qu’il y est moins de monde pour se soucier de la qualité de traduction, dans l’avenir, car la culture semble de moins en moins présente chez la nouvelle génération.
    Après, c’est peut être un ressenti franco/français, on va pas se mentir, le niveau est « claqué au sol »…

    Répondre
  • Jle
    13 janvier 2025 - 14 h 13 min

    @Madwill:
    « Mieux qu’elle ne le fait aujourd’hui » -> le soucis, c’est que ces IA ont déjà arrêté de progresser depuis un moment. On voit des rustines, peu efficace et qui s’appliquent après le LLM, mais rien dans le sens d’une amélioration du fonctionnement de base. Les LLM ont leurs limites, et seuls les vendeurs de LLM prétendent que si, sur la vie de maman, ça va s’améliorer 😆 On le constate avec absolument tous les LLMs.

    Répondre
  • Grv
    13 janvier 2025 - 14 h 37 min

    @Madwill:

    Je suis de cet avis, pessimiste. Le capitalisme gagne toujours. Des décennies qu’on parle de l’impact sur la qualité de vie, voire l’espérance de vie, de certains choix (environnementaux, consommation, alimentation…) et le seul critère présent sur le long terme c’est le pognon. Alors oui, on a quelques consommateurs qui refusent amazon, temu ou similaires, mais rien de préjudiciable aux modèles economiques prédateurs. Pour moi, entre un truc déguelasse à 5€ et un truc haut de gamme à 10€, le 5€ sera quasi toujours privilégié. Appliqué à cet exemple, les traducteurs ont plutot du souci à se faire (même si je comprends très bien l’autre vision).

    Répondre
  • 13 janvier 2025 - 15 h 39 min

    @Pierre Lecourt: je ne connaissais pas ce bouquin de Eco ;-) (peut être un de ces derniers?). Je recommande la lecture de cet auteur à tous ceux qui pensent que l’auteur de DaVinci Code (dont le nom m’échappe, mais c’est normal, on a du l’oublier) est un grand auteur.

    @all : je ne suis pas trop pessimiste sur ce plan et suis un peu de l’avis de Pierre. Ces trucs de trad par IA ça va pour traduire un tuto Youtube par un influenceur Kazak ou le dernier feuilleton de grande consommation de Disneyflix/Mamazon. Je rejoins aussi @Jle sur les limites prochaines des technos actuelles de l’IA : on a fait un joli saut ces dernières années, mais possible qu’il faille attendre 15-20 ans pour les prochaines grosses avancées.

    Répondre
  • Xo7
    13 janvier 2025 - 17 h 14 min

    L’utilisation d’une IA à un cout, comment VLC s’en sort ?

    Répondre
  • 13 janvier 2025 - 17 h 17 min

    @Xo7: Je pense qu’ils ont développé leur propre outil.

    Répondre
  • gUI
    13 janvier 2025 - 19 h 10 min

    @Pierre Lecourt: J’espère au passage qu’ils auront entraîné l’IA avec des données libres, et pas en « piratant » des milliers de sous-titres de films…

    Répondre
  • 13 janvier 2025 - 19 h 29 min

    @gUI: Le passif de VideoLAN qui a toujours refusé de commercialiser son produit Open source et qui aurait pu se faire une montagne de fric avec ses 6 milliards de téléchargements me laisse à penser que c’est fait de manière propre.

    Répondre
  • 13 janvier 2025 - 20 h 20 min

    Le code de VLC étant en Open Source, l’examen du code va inspirer quantité de nouveaux développements

    Répondre
  • 13 janvier 2025 - 21 h 41 min

    Apparemment je lis autre part que ça s’appuie sur Whisper le modèle open source d’openAI. Ils ont du bricoler le truc là parce que les modèles multilingues c’est le large et le turbo (quand j’avais testé il n’y avait que le large) et ça bouffe 10go de ram. Et franchement c’était pas dingue la transcription. (Sur des entretiens audio, capturés sur un iPhone).
    À voir

    Répondre
  • 14 janvier 2025 - 10 h 37 min

    @Pierre Lecourt:

    Pour en côtoyer régulièrement, si : les traducteurs sont déjà en train de disparaître. Les entreprises vont au moins cher, s’en tapent de la qualité et généralement les IA pondent de toutes façons du texte suffisamment naturel maintenant pour que ça ne choque pas grand monde en cas d’inexactitude ; c’est l’IA qui gagne dans l’industrie, partout, pas les humains. Les seuls traducteurs épargnés sont ceux s’occupant de textes avec une valeur légale, mais l’activité ne suffit pas toujours pour payer un loyer.

    Répondre
  • 14 janvier 2025 - 11 h 18 min

    @CanardWC: Ouais, enfin j’imagine mal Rivages faire traduire le prochain Roman de James Ellroy par une IA tout de même. Alors oui, je suis d’accord pour dire que le métier va souffrir, mais il restera toujours des catégories nécessitant une approche humaine de ce travail.

    Après oui, malheureusement, comme souvent, les entreprises vont dans le sens du moins cher. L’enshitification continue. Jusqu’à quand ? J’espère qu’un jour, on reviendra à la raison et qu’on appréciera à nouveau un travail « bien fait ».

    Répondre
  • 14 janvier 2025 - 12 h 52 min
  • 14 janvier 2025 - 14 h 52 min

    En temps que devm et quelque soit la qualite, j’espere que la fonctionnalite sera accessible au system par API afin d’en faire beneficier d’autres services locaux et eviter les redondances.

    Répondre
  • 14 janvier 2025 - 18 h 00 min

    J’espère que VLC sera plus performant que les sous-titres de Google sur Youtube qui sont juste ridicules… C’est souvent n’importe quoi, ça n’a même pas de sens parfois. Mais vu la qualité de ce logiciel et donc les compétences des dév, on peut être raisonnablement optimiste.
    Longue vie à VLC !

    Répondre
  • 18 janvier 2025 - 11 h 28 min

    Rien n’est fait, si on se refere a la fameuse v4 qui devait sortir en fin d’année il y a 5 ou 6 ans….
    Vlc est fiable mais c’est vraiment un soft qui ne me donne absolument pas envie et les nightlies v4 sont beaucoup plus lourdes.

    Répondre
  • Tof
    2 février 2025 - 9 h 54 min

    L’IA locale a déjà ses utilisations dans l’open-source, deux autres exemples: HomeAssistant qui utilise Ollama pour la compréhension des commandes et PiperTTS pour le text-to-speech, Frigate qui fait l’analyse de caméras de surveillance avec l’IA en local (et l’aide d’un TPU ou d’un GPU).

    Répondre
  • LAISSER UN COMMENTAIRE

    *

    *