La reconnaissance vocale pour communiquer plus efficacement avec la machine

Vivoka, société spécialisée dans les technologies vocales basées sur l’IA, a créé un kit logiciel de reconnaissance vocale qui permet aux développeurs de disposer d’un assistant vocal embarqué / hors ligne et sécurisé.

  • par Vivoka
  • 7 avril 2023
  • 222 affichages
  • Grâce au VDK, un mécanicien en garage automobile, les mains occupées mais équipé des lunettes connectées Epson Viverio, pourrait procéder à différentes commandes vocales.
    Grâce au VDK, un mécanicien en garage automobile, les mains occupées mais équipé des lunettes connectées Epson Viverio, pourrait procéder à différentes commandes vocales.
  • La solution de « Voice picking » permet une productivité accrue de l’ordre de 20% ainsi qu’une réduction des erreurs dans les commandes.
    La solution de « Voice picking » permet une productivité accrue de l’ordre de 20% ainsi qu’une réduction des erreurs dans les commandes.

Fondée en 2015 par William Simonin, Vivoka, société française spécialisée dans les technologies vocales basées sur l’IA, a créé le VDK (Voice Development Kit). Il s’agit d’un kit logiciel tout-en-un de reconnaissance vocale qui permet aux entreprises et développeurs de disposer facilement de leur propre assistant vocal embarqué / hors ligne et sécurisé.  Il permet d’insérer une brique de reconnaissance vocale au sein de robot et de nombreux autres équipements technologiques. Les commandes et l’interface vocales sont optimales pour permettre un échange homme-machine efficace.

Cet assistant vocal, basé sur l’intelligence artificielle, équipe aujourd’hui aussi bien des petits robots éducatifs à destination des enfants que les lunettes de réalité virtuelle de grands industriels, et bien d’autres appareils encore. Le point commun entre tous ces projets : le besoin d’avoir au cœur de ces robots et appareils un système de reconnaissance vocale, pour interagir entre l’homme et la machine. Et le monde de la voix est infini : langues, accents, genre, handicap d’élocution, …. Toutes les barrières tombent grâce à Vivoka pour permettre un échange optimal homme-machine.

 

Une technologie adoptée par Eiffage, Thalès et Suez

 

Eiffage, Thalès ou encore Suez font confiance à Vivoka. La société, qui a obtenu deux « CES Innovation Awards » (en 2019 et 2020), compte 35 collaborateurs et est à la recherche de 13 personnes pour rejoindre ses équipes.

Pendant longtemps, Vivoka a développé des solutions vocales personnalisées pour ses clients. Chaque projet était un véritable défi car il faisait appel à de multiples technologies disparates. C’est à partir de ce constat qu’est né le VDK Vivoka, dont la plus récente version se nomme Silbo. Elle agrège de multiples technologies vocales, partenaires et propriétaires, afin de permettre aux entreprises et développeurs de passer le cap de la révolution vocale.

Le VDK Silbo de Vivoka est constitué d’un kit de développement logiciel associé à une interface graphique intuitive spécialisée dans les cas d’usages de la voix. Il permet de configurer une solution vocale hors ligne composée d’une ou plusieurs technologies vocales (transcription, synthèse, biométrie vocale…). En étant embarqué / hors ligne, le VDK Silbo fonctionne parfaitement dans des endroits éloignés ou des environnements à faible connectivité. L’intelligence artificielle agit quant à elle sur les commandes et assimile les intentions au fur et à mesure des utilisations afin de répondre au mieux aux demandes variées des utilisateurs.

 

Reconnaissance vocale : plus de 27 milliards de dollars en 2026 ?

 

La reconnaissance vocale, dont le marché mondial devrait atteindre plus de 27 milliards de dollars en 2026 selon une étude du cabinet Mordor Intelligence, est désormais au centre de l’univers connecté, et le monde industriel est particulièrement concerné.

Si l’usage du VDK est aujourd’hui trans-sectoriel, cela n’a pas toujours été le cas.  « Les marchés historiquement adressés par Vivoka comme l’hôtellerie ont été drastiquement impactés par la crise du Covid-19. Nous avons réfléchi aux problématiques rencontrées par d’autres secteurs pour trouver la meilleure manière de les adresser », explique William Simonin. « De l’aéronautique au lunettes connectées, en passant par la réalité virtuelle et la logistique, l’interaction homme-machine peut être considérablement améliorée et optimisée. La voix est l’élément central de cette amélioration, c’est pourquoi les interfaces vocales sont aux cœurs des projets IT de nombreuses entreprises, quel que soit le secteur ».

 

Intégration de la voix dans les lunettes intelligentes

 

Vivoka a par exemple conclu un partenariat avec Epson afin de proposer aux éditeurs de logiciels travaillant sur la gamme de lunettes connectées Epson Moverio d’ajouter un assistant vocal dans leurs applications. Le VDK (Voice Development Kit) de Vivoka est compatible avec les lunettes intelligentes Moverio BT-40S et BT-45CS.

Les lunettes multimédia connectées Moverio BT-45CS avec contrôleur intelligent sont basées sur la technologie Si-Oled d’Epson. Elles combinent facilement du contenu numérique à un environnement réel. Dotées d’un bandeau confortable et d’une attache pour les fixer si besoin sur des casques de protection, elles répondent aux normes internationales de sécurité et de durabilité ; elles sont donc idéales pour l’assistance à distance, les instructions de travail et la formation dans le milieu industriel.

Les cas d’usage de ces produits sont multiples. Par exemple, un mécanicien en garage automobile, les mains occupées, pourrait procéder à différentes commandes vocales comme l’ouverture de la carte grise du véhicule, d’un tutoriel vidéo ou encore le lancement d’un appel à un collègue pour obtenir de l’aide. Un tel dispositif permet à l’entreprise et à l’employé de gagner du temps (lavage de mains, utilisation du téléphone ou d’un ordinateur, formation théorique…) et ainsi d’augmenter son efficacité.

Les éditeurs de logiciels ont la possibilité d’intégrer une interface vocale via le VDK de Vivoka dans leurs applications pour les lunettes connectées Epson Moverio. Le Voice Development Kit rassemble toutes les technologies vocales dans un outil unique, simple et polyvalent, qui permet de personnaliser toutes les commandes vocales hors ligne et de les activer en quelques minutes. Les lunettes sont prêtes à accueillir la voix car elles sont dotées d’un microphone et d’un haut-parleur.

 

Réalité augmentée pour la surveillance industrielle à distance.

 

Vivoka a également conclu un accord de collaboration avec Almer Technologies, une société suisse qui développe des lunettes de réalité augmentée. Le VDK Silbo, est utilisé pour activer les commandes vocales dans les lunettes de réalité augmentée de téléassistance. Les lunettes Almer Arc permettent ainsi aux opérateurs de résoudre des problèmes à distance et de réduire les temps d'arrêt au minimum, en affichant des informations importantes directement dans le champ de vision de l'opérateur. Grâce à la reconnaissance vocale ASR de Vivoka, les techniciens gagnent du temps en transmettant leurs commandes par la voix.

Almer a utilisé le kit de développement vocal VDK de Vivoka pour mettre en œuvre l'interface vocale. Almer Arc peut afficher des informations à l'utilisateur comme un affichage frontal personnalisé. Grâce à cette digitalisation, les entreprises industrielles, les laboratoires et les centres logistiques peuvent mieux utiliser la technologie et ainsi augmenter leur efficacité.

 

Optimiser la chaîne logistique grâce au « Voice Picking »

 

La technologie Vivoka est également adaptée au « Voice picking », une solution mains-libres basée sur la reconnaissance et l’assistance vocale. Elle permet d’accompagner les opérateurs dans leurs tâches de manutention. Le système est intégré dans des casques avec microphone industriel et utilisé pour optimiser les préparations de commandes grâce à la voix.

La solution de « Voice picking » permet une plus grande efficacité et une productivité accrue de l’ordre de 20%, ainsi qu’une réduction des erreurs dans les commandes, et donc de livrer plus rapidement et d’accroître la satisfaction clients

L’utilisation du picking vocal signifie aussi plus d’aisance dans les tâches pour les opérateurs, réduisant le besoin en ressources humaines. De plus, les multiples langues supportées par la technologie permettent aux individus ne parlant ou ne comprenant pas forcément bien une langue de pouvoir se référer à une autre avec laquelle ils sont plus à l’aise. Le recrutement de nouveaux employés est alors aussi simplifié.

On peut également noter d’autres avantages tels que la sélection accélérée des produits et composants grâce à des opérations yeux et mains-libres, une gestion précise du tri des produits par destination / client, la livraison plus rapide des produits périssables au point de vente, la préparation d’emballages pour les lignes d’assemblage différenciées par type de produit.

La plupart des activités de la chaîne d’approvisionnement sont des secteurs où la sécurité est une priorité. La technologie vocale libérant les yeux et les mains, les opérateurs utilisant ces solutions peuvent rester concentrés sur leurs tâches.

Par ailleurs, les solutions vocales sont si intuitives que tout le monde peut être entraîné à interagir correctement en quelques minutes. C’est d’autant plus pratique dans des secteurs tels que la logistique où la main d'œuvre est continuellement renouvelée avec des profils très différents.

Le système, une fois paramétré, est capable d’optimiser les flux de déplacement de l’opérateur en faisant en sorte qu’il démarre une tâche dans l’entrepôt, à l’endroit où il a fini la précédente (afin de réduire les déplacements inutiles).

 

Reconnaissance automatique de la parole

 

L’ASR (Automatic Speech Recognition), ou reconnaissance automatique de la parole, permet de construire un système de « Voice picking » flexible et fiable. Il est basé sur une grammaire dynamique comprenant le vocabulaire spécifique à l’industrie au même titre que plusieurs alternatives de mots.

Ensuite, le TTS (Text-To-Speech) ou synthèse vocale, remonte des informations à l’utilisation via une oreillette, ce qui permet de garder les mains libres, et même de faire travailler des personnes qui ne sauraient pas forcément lire et écrire.

Journaliste business, technologies de l'information, usine 4.0, véhicules autonomes, santé connectée

Plus d'articles Contact