Pour sa première vidéo sur Youtube, Zoltan T a frappé assez fort. En associant le côté anecdotique et vintage d’un vieux téléphone à cadran et un ensemble de services assez modernes, il a réussi à recréer un vieux mythe de la science fiction des années 60-80 avec RotaryGPT
Il fût un temps où l’on pensait que les ordinateurs seraient des êtres omniscients, capables de tout savoir et de tout retenir. Des engins pouvant répondre de manière naturelle à toutes les questions qui nous passeraient par la tête de vive voix. Ce temps était celui de 2001 : l’odyssée de l’espace, ou des premières saisons de Star Trek. Un temps où l’on croyait vraiment à cette vertu encyclopédique et naturelle de l’interaction entre l’homme et la machine. Les années suivantes nous ont quelque peu désillusionnés.
Et cette invention qu’est RotaryGPT reprend ce vieux rêve d’un monde où l’on peut discuter avec son ordinateur comme avec une sorte de majordome, toujours à l’écoute, toujours prêt à vous rendre service. Capable de répondre à vos questions ou d’activer les différents appareils de votre logis.
Il s’agit d’une d’une solution composée de trois éléments distincts. D’abord un téléphone tout ce qu’il y a de plus classique qui communique vers un Raspberry Pi au travers d’un petit adaptateur qui va transformer son signal audio analogique en données numériques. On décroche, on cause, le Pi intercepte ce que l’on dit et le troisième temps entre en jeu. Un ensemble de services va interpréter votre voix, l’analyser, la traduire en langage compréhensible pour la machine et activer divers évènements.
Si vous chuchotez à RotaryGPT de mettre de la musique, d’activer divers produits domotiques et de lancer un film, le Pi prendra en charge l’ensemble de ces données et les éxécutera en suivant les routines que vous aurez programmé au préalable. Si vous posez une question d’ordre plus général, ce sera une exploitation de Chat-GPT qui sera mise en œuvre pour vous répondre du mieux possible via une voix synthétique dans le combiné.
Alors évidemment ce ne sera qu’une mise en scène de la vision de l’informatique de notre bonne vieille science fiction des années 60-80. Mais cela fera tout de même son petit effet. La méthode employée est décrite dans la vidéo mais des éléments supplémentaires pour réaliser votre propre téléphone sont également disponibles sur Github. Dernier point, à l’heure où j’écris ces lignes, Zoltan T n’a même pas 20 abonnés sur Youtube. C’est trop peu pour quelqu’un qui propose des projets de ce genre.
2,5€ par mois | 5€ par mois | 10€ par mois | Le montant de votre choix |
Question téléphone il y a ce « smartphone » français open source a 30€…
https://www.paxo.fr
Une mise en œuvre similaire par des Français en mixant Home Assistant et Chat GPT : https://www.youtube.com/watch?v=fhJK4Gjrj6k
Dans le même esprit avec les Frères Poulain
https://youtu.be/fhJK4Gjrj6k
Arf Imparfait Inconnu m’a doublé ;)
Les frères poulains ont fait la même chose cette semaine j’ai l’impression : https://www.youtube.com/watch?v=fhJK4Gjrj6k
@Orlanth: Du coup, commentaire à supprimer..
Ce qu’a fait mi-code a pas l’air mal non plus :
https://youtu.be/_1uN7o1PpZo
Je parle en tant que non spécialiste.
En tout cas , un beau clin d’œil à l’ordinateur HAL du film de 2001 : L’Odyssée de l’Espace.
Petite anecdote à propos du nom HAL : il suffit de remplacer chaque lettre par la lettre suivante dans l’alphabet. Cela donne au final H (I) A (B) L (M) = IBM.
Pour rendre plus flippant le concept, il faut l’utiliser avec un miroir connecté et mettre une image fantomatique en arrière plan quand GPT répond …
Le problème d’un raspberry pi c’est que la puissance de calcul est très très limitée !
Afin de faire fonctionner de l’ia sur ce matériel il faut donc utiliser des modèles très peu performents (mauvais résultats) ou alors dépendre des api commerciales (Open.ai, IBM, Amazon, etc), mais donc payantes et plus lentes car le resultat n’est pas local, il est transmit par internet.
Pour intégrer l’IA performente dans vos projets il vous faut du matériel spécialisé (pas un pi), ou alors payer des frais à l’utilisation et avoir une solution +- rapide.
Comme matériel spécialisé en IA on peut citer les minimachines Nvidia JETSON, ainsi que n’importe quel GPU nvidia avec beaucoup de VRAM. Je conseille les cartes NVIDIA TITAN et NVIDIA RTX vu que aucune GTX ne possède plus de 11go de VRAM. Par exemple : Titan X, Titan RTX, RTX 3060, RTX 3090, RTX 4080 RTX 4090. Il y a moyen de trouver des Nvidia Tesla pour pas trop cher mais il faut trouver une solution de refroidissement et il faut une 2eme partie graphique pour afficher quelque chose à l’écran (pas de video out sur les Tesla).
@Grégory:
PS : On ne peut pas édier le message donc je corrige ici : « Pour intégrer l’IA performANTE » ***