Rockchip RK3308, une solution sur mesures pour des objets à votre écoute…

C’est la mode, les enceintes connectées que l’on peut interroger pour qu’elles vous répondent ont le vent en poupe. Le Rockchip RK3308 est une solution taillée sur mesure pour cet usage et qui devrait prendre place dans des solutions toujours plus accessibles.

Le concepteur de puces ARM Rockchip vise donc ce nouveau marché des objets intelligents que l’on peut interroger à distance via un ordre vocal. Qu’il s’agisse de téléviseurs ou d’enceintes connectées, ces solutions rencontrent un beau succès auprès du public. Son Rockchip RK3308 est construit pour répondre au cahier des charges de ce type d’usage.

2018-03-12 13_09_57-minimachines.net

Construit autour d’une solution ARM constituée de quatre coeurs Cortex-A35 et d’un chipset audio sur huit canaux avec une fonction d’écoute basée sur la détection d’ordres vocaux. La puce ne dispose pas de circuit graphique et sera donc intégrée uniquement dans des enceintes connectées ou autres objets du genre.

Une seconde version de cette solution, au nom de code Gemini, devrait viser le secteur des  téléviseurs et autres machines nécessitant un affichage. Dans cette déclinaison, le Rockchip RK3308 “Gemini” embarquera un circuit vidéo Mali Dvalin MP21 pouvant prendre en charge des affichages externes LCD mais aussi capturer des signaux en provenance d’un capteur photo. Son circuit de rendu audio sera amélioré avec une promesse plus efficace sans que Rockchip ne donne de grands détails sur l’équipement embarqué.

2018-03-12 13_24_11-minimachines.net

Les deux pourront assumer les fonctions nécessaires aux ordres vocaux : Localisation sonore, diminution de l’écho, Anti réverbération, réduction de bruit et même réveil à la voix. Les puces pourront travailler avec les solutions Android Things de Google et donc répondre à un “Ok Google” par une phrase vocale ou l’exécution de différents actes au même titre qu’une solution Google Mini par exemple. La puce pourra également assumer les ordres d’Amazon Alexa. Le Rockchip RK3308 seront également compatibles avec des systèmes linux.

Google Home Mini

Google Home Mini

Enceinte connectée Google Home - Assistant Google avec gestion d'ordres vocaux - 1 HP de 40mm - 9.8 x 4.2 cm - 173 grammes - alimentation par MicroUSB.

Disponible à 49€


Avec ce type de solution, le monde du noname va pouvoir s’intéresser de près aux ordres vocaux. Je ne pense pas que le marché soit si ouvert que cela face à Google et ses produits déjà très bien placés niveau financier mais il y a surement moyen de casser encore le tarif de ce type d’engin en ne cherchant pas à les coupler à une solution audio interne. Construire un mauvais Google mini deux fois moins cher alors que ce dernier est positionné à 49€ parait un peu absurde même si il sera toujours possible de proposer la même chose à 29€ un jour ou l’autre. Par contre, il serait très intéressant de concevoir un appareil que l’on pourrait piloter à la vois et connecter facilement à un amplificateur audio de qualité au travers d’une interface analogique ou numérique. Cela permettrait de limiter le coût au maximum et d’ajouter la fonction d’écoute “Ok Google” à une source sonore digne de ce nom.

Autre fonction qui est à l’étude en ce moment chez divers fabricants, des solutions domotiques simples permettant de manipuler des objets à la vois. Un interrupteur avec un Rockchip RK3308 par exemple pourrait réagir à un ordre vocal simple d’allumage, de diminution ou d’extinction. Une telle solution à prix très bas aurait à mon sens beaucoup de succès. J’adorerais pouvoir dire à mon lampadaire de s’allumer ou s’éteindre avec un boitier à quelques euros seulement en interface de sa prise électrique. Enfin, c’est le genre de puce qui pourrait être déployé facilement dans un domaine électronique au travers de HAT pour le monde Raspberry Pi, par exemple.

Source : AndroidPC

Notes :

  1. Aucun détail sur ce circuit graphique particulier, on manque de beaucoup d’informations dessus, ARM n’a pas communiqué encore sur cette solution.
6 commentaires sur ce sujet.
  • 12 mars 2018 - 14 h 05 min

    perso, j’attends avec impatience une solution avec reco vocale excluivement faite en local, sans passer par des serveurs de l’un ou de l’autre. Et surtout qui soit performance dans sa qualité de reconnaissance.

    Malheureusement pour le moment, aucune solution performante n’émerge. J’ai notamment testé la reco. de windows avec un kinect comme ‘micro’ via le projet S.A.R.A.H., mais on reste très, très loin de la précision d’un google home mini, surtout pour les voix féminines et les enfants.

    Répondre
  • dja
    12 mars 2018 - 14 h 53 min

    @brazomyna: A date, il faut passer un peu de temps pour mettre ca en place surtout si tu veux contrôler réellement les flux et l’écoute.
    Essaie Jarvis, tu configures: Snowboy (keyword trigger en local) + Bing SpeachToText pour la phrase de commande. L’intérêt c’est que rien ne sort de chez toi tant que le keyword n’est pas lancé et tu en es sûr…
    Ensuite tu map la phrase (pattern text) à une action.

    J’ai mis ca chez moi, ca déclenche tous mes appareils en fonction des activités (on/off video, audio enceinte, audio casque), ca me donne la météo, etc… c’est plutôt trés stable car ultra simple.

    Répondre
  • 12 mars 2018 - 15 h 55 min

    @dja: est-ce que la qualité de reco est vraiment bonne ? y compris pour femme et enfants ? ça peut tourner sur du “full linux” ?

    Parce que pour le moment j’ai fait une entorse (temporaore) à mes principes de “full local” avec un google home mini car c’est le seul qui m’a donné des résultats satisfaisants.

    Répondre
  • dja
    12 mars 2018 - 16 h 16 min

    @brazomyna: Oui full linux. Chez moi ca tourne sur une debian 9 sur un NUC, qui a aussi un Kodi, et un mpd en bitperfect pour ma musique.

    Pour le SpeachToText, Bing API marche vraiment vraiment bien. C’est le meilleur que j’ai essayé à date, tout ca en francais. Rien à signaler. C’est juste l’enregistrement “gratuit” chez Microsoft qui est vraiment casse pied.
    Pour le keyword trigger, Snowboy, avec le keyword par défaut “snowboy” déclenche proprement avec n’importe qui car il a été généré en multi-voix. Il faut prendre un bon accent anglais et ca marche direct.

    Globalement, il faut juste un bon petit micro omni-directionnel. Chez moi, j’ai un mic usb a 15 euros tout petit que j’ai pris sur amazon et ca porte bien en omni dans une pièce de 20 mxm.

    Répondre
  • 12 mars 2018 - 23 h 52 min

    @dja: Merci pour ce feedback ; faudra que je prenne le temps de re-tester alors :-)

    Répondre
  • 13 mars 2018 - 8 h 50 min

    Les deux pourront assumer les fonctions nécessaires aux ordres vocaux

    Répondre
  • LAISSER UN COMMENTAIRE

    *

    *