NEWS #Digitale : envie de recevoir nos meilleurs articles ?  Inscription → 

Les Logiciels de Reconnaissance Vocale Gratuits & de Transcriptions

À quoi sert un logiciel de reconnaissance vocale ? Pourquoi est-ce une bonne idée d’en utiliser ? Tout est gratuit ?

Les logiciels de reconnaissance vocale sont de super outils qui peuvent te permettre de gagner du temps en utilisant l’intelligence artificielle. Découvre dans cet article les meilleurs logiciels de reconnaissance vocale et de transcription de paroles en textes.

Qu’est-ce que la reconnaissance vocale ? Comment transcrire une voix en texte ?

La reconnaissance vocale, ou parole en texte, est la capacité d’une machine ou d’un programme à identifier les mots prononcés à haute voix et à les convertir en texte lisible. Les logiciels de reconnaissance vocale rudimentaires ont un vocabulaire limité et ne peuvent identifier les mots et les phrases que lorsqu’ils sont prononcés clairement. Des logiciels plus sophistiqués peuvent gérer la parole naturelle, différents accents et différentes langues.

La reconnaissance vocale utilise un large éventail de recherches en informatique, en linguistique et en génie informatique. De nombreux appareils modernes programmes et axés sur le texte ont des fonctions de reconnaissance vocale pour permettre une utilisation plus facile.

La reconnaissance vocale et la reconnaissance de la parole sont deux technologies différentes et ne doivent pas être confondues :

  • La reconnaissance vocale est utilisée pour identifier les mots dans la langue parlée.
  • La reconnaissance de la parole est une technologie biométrique permettant d’identifier la voix d’un individu.

Comment fonctionne la reconnaissance vocale ?

Les systèmes de reconnaissance vocale utilisent des algorithmes informatiques pour traiter et interpréter les mots parlés et les convertir en texte. Un logiciel transforme le son enregistré par un microphone en un langage écrit que les ordinateurs et les humains peuvent comprendre, en suivant ces quatre étapes :

  • analyse l’audio
  • divise-le en plusieurs parties
  • numérise-le dans un format lisible par ordinateur
  • utilise un algorithme pour le faire correspondre à la représentation textuelle la plus appropriée.

Les logiciels de reconnaissance vocale doivent s’adapter à la nature hautement variable et contextuelle de la parole humaine. Les algorithmes logiciels qui traitent et organisent l’audio en texte sont formés sur différents modèles de parole, styles de parole, langues, dialectes, accents et phrasés. Le logiciel sépare également l’audio parlé du bruit de fond qui accompagne souvent le signal.

Pour répondre à ces exigences, les systèmes de reconnaissance vocale utilisent deux types de modèles :

  • Modèles acoustiques. Ceux-ci représentent la relation entre les unités linguistiques de la parole et les signaux audio.
  • Modèles de langage. Ici, les sons sont associés à des séquences de mots pour distinguer les mots qui se ressemblent.

Quels sont les avantages et inconvénients de la reconnaissance vocale ?

Avantages

L’utilisation d’un logiciel de reconnaissance vocale présente plusieurs avantages, notamment :

  • Communication machine-homme : La technologie permet aux appareils électroniques de communiquer avec les humains en langage naturel ou en conversation.
  • Facilement disponible : Ce logiciel est fréquemment installé sur des ordinateurs et des appareils mobiles, ce qui le rend accessible.
  • Facile à utiliser : Un logiciel bien conçu est simple à utiliser et s’exécute généralement en arrière-plan.
  • Amélioration continue et automatique : Les systèmes de reconnaissance vocale qui intègrent l’IA deviennent plus efficaces et plus simples à utiliser au fil du temps. Au fur et à mesure que les systèmes effectuent des tâches de reconnaissance vocale, ils génèrent plus de données sur la parole humaine et s’améliorent dans ce qu’ils font.

Inconvénients

Bien que pratique, la technologie de reconnaissance vocale a encore quelques problèmes à résoudre. Les limitations incluent :

  • Performances incohérentes : Les systèmes peuvent être incapables de capturer les mots avec précision en raison des variations de prononciation, du manque de prise en charge de certaines langues et de l’incapacité à trier les bruits de fond. Le bruit ambiant peut être particulièrement difficile. La formation acoustique peut aider à le filtrer, mais ces programmes ne sont pas parfaits. Il est parfois impossible d’isoler la voix humaine.
  • Vitesse : Certains programmes de reconnaissance vocale prennent du temps à déployer et à maîtriser. Le traitement de la parole peut sembler relativement lent.
  • Problèmes de fichier source : Le succès de la reconnaissance vocale dépend de l’équipement d’enregistrement utilisé, pas seulement du logiciel.

TOP 14 des meilleurs logiciels de reconnaissance vocale et de transcription gratuits

À savoir que de plus en plus sur les récents téléphones, on peut avoir une fonction de reconnaissance vocale grâce à l’application « Enregistreur vocal » ou « Dictaphone », le nom de l’application varie selon les modèles et marques de téléphone.

Kaldi

Kaldi est un logiciel gratuit de synthèse vocale pour les systèmes d’exploitation Windows et Linux et disponible sous la licence Apache. Le logiciel a été développé à l’Université John Hopkins et était destiné à offrir des solutions de reconnaissance vocale de très haute qualité pour plusieurs langues et domaines.

C’est l’un des rares logiciels de reconnaissance vocale entièrement pris en charge par les technologies de pointe. Kaldi est livré avec un support complet pour l’algèbre linéaire générale, ainsi qu’une conception extensible.

Le code du logiciel a été publié en 2014 et depuis lors, la plate-forme est connue pour son interface intuitive et sa norme de qualité la plus élevée pour la conversion de la parole en texte.

Simon

Simon est un logiciel de reconnaissance vocale technologiquement avancé et très flexible, disponible gratuitement pour Windows et Linux. Le logiciel offre une personnalisation de haut niveau pour toutes les applications et peut donc être utilisé avec tous les systèmes dans lesquels la reconnaissance vocale est requise. Ce qui est encore mieux, c’est que Simon n’est limité par aucune langue et peut travailler avec une grande précision avec tous les principaux dialectes. Le logiciel apporte essentiellement l’automatisation pour remplacer la souris et le clavier.

La technologie derrière Simon comprend les bibliothèques KDE, ainsi que HTK et CMU SPHINX. Le logiciel est disponible en open source et gratuitement pour les systèmes d’exploitation Windows et Linux. En plus d’être un logiciel de reconnaissance vocale, Simon permet également de contrôler les ordinateurs via des commandes vocales.

Le logiciel est de plus adapté aux personnes handicapées. L’architecture solide derrière Simon signifie qu’il peut facilement être utilisé avec toutes les langues et tous les dialectes. Simon peut être utilisé pour contrôler divers logiciels et applications, y compris les centres multimédias, les e-mails, les navigateurs Web, etc.

Speech Texter (Web Chrome, Android)

Speech Texter est un logiciel gratuit de conversion de la parole en texte qui fonctionne spécifiquement sur le navigateur Chrome ou avec Android. Bien que la politique de confidentialité de l’application mentionne qu’elle ne stocke aucun texte, le texte peut être traité par le serveur de Google (puisque tu le feras en ligne via le navigateur Chrome ou l’application Android). Donc, il faut garder cela à l’esprit.

L’application offre une transcription facile de la parole, avec une grande précision. La plate-forme permet la transcription en direct, où tu peux cliquer sur « Démarrer » et commencer à parler. Une fois la transcription terminée, le texte est affiché dans la fenêtre principale indiquant le pourcentage estimé de mots transcrits avec précision.

Saisie vocale Google Docs

Google Docs fait maintenant partie intégrante de la vie de la plupart des rédacteurs de contenu. Surtout situ es déjà un utilisateur des services Google. Donc, si tu souhaites utiliser des produits Google tels que Gmail et Google Drive et que tu as besoin d’un outil de dictée intégré, puissant, et gratuit, envisage d’utiliser Google Docs ou Google Slides et utilise l’outil de saisie vocale de Google.

Il te permet de taper avec ta voix et d’utiliser plus de 100 commandes d’affichage destinées explicitement à l’édition et au formatage de tes documents comme tu le souhaites. Y compris la création de puces, la modification du style du texte et le déplacement du curseur vers différentes parties du matériau.

Pour utiliser la saisie vocale via Google Docs, il te suffit de cliquer sur le bouton « Outils », puis de sélectionner « Saisie vocale », ensuite d’autoriser Google à accéder au microphone de ton ordinateur portable ou de ton PC.

Compatibilité : Tout appareil compatible Google Chrome

Prix ​​: Gratuit

Speechnotes

Basé sur le moteur de reconnaissance vocale de Google, Speechnotes est un outil en ligne simple pour les dictées et la transcription vocale. Étant donné que les téléchargements, les enregistrements ou les installations ne sont pas nécessaires pour utiliser Speechnotes, c’est donc de loin l’un des outils de dictée les plus accessibles disponibles sur Internet.

Speechnotes est également incroyablement convivial, il met automatiquement en majuscule le début de ta phrase, enregistre automatiquement tes documents et t’offre la possibilité de dicter et de taper tout en même temps. Tu peux gérer tes documents de multiples façons. Tu peux soit l’envoyer par e-mail, l’imprimer et l’archiver, l’exporter vers Google Drive ou télécharger les fichiers sur ton ordinateur.

Compatibilité : Tout appareil avec Google Chrome installé et un microphone

Prix ​​: Gratuit avec possibilité de faire un don et de passer à la version premium

Otter

Otter peut être utilisé pour prendre des notes et comme une application de collaboration qui enregistre et transcrit n’importe quelle source audio tant que le discours est cohérent. Les sources de données courantes incluent les réunions, les entretiens et autres interactions vocales avec traitement des données en temps réel. Créé par AISense, Otter utilise Ambient Voice Intelligence pour certains des outils de reconnaissance vocale les plus intelligents et les plus précis du marché. Les transcriptions sont disponibles en quelques minutes afin que tu puisses les partager avec ton équipe presque immédiatement.

Compatibilité : Android et iOS

Prix ​​: 600 minutes gratuites/mois ; 9,99 $ pour 6 000 minutes/mois

Saisie vocale Gboard

Parmi les nombreuses applications de clavier disponibles pour Android, Gboard est sans doute la plus populaire et l’un des meilleurs logiciels de synthèse vocale gratuits disponibles. Le clavier de Google est doté de plusieurs fonctionnalités attrayantes, telles que la saisie glissante et le mode à une main. Mais en plus de cela, il possède également de solides capacités de reconnaissance vocale.

Tu peux utiliser ta voix pour tout et n’importe quoi, de la rédaction d’e-mails à la réponse aux SMS. La saisie vocale de Gboard fonctionne avec n’importe quelle application Android qui accepte la saisie de texte. Pour utiliser la fonctionnalité, il te suffit d’appuyer sur l’icône du microphone (située sur le côté droit de la bande de suggestion de Gboard) et de commencer à dicter lorsque « Parlez maintenant » s’affiche.

Toute erreur dans le texte transcrit peut être corrigée manuellement. Tu peux également utiliser la fonctionnalité de saisie vocale de Gboard pour remplacer des mots dans n’importe quel document ou message. Pour cela, sélectionne le mot cible et appuis sur l’icône du microphone. Une fois que « Parlez maintenant » s’affiche, prononce le nouveau mot pour qu’il remplace le mot existant. Gboard prend en charge la dictée dans plusieurs langues et offre aussi une utilisation hors ligne.

Compatibilité : Tout appareil Android

Prix ​​: Gratuit

Dragon Anywhere

Dragon Anywhere t’offre des capacités de dictée supérieures où que tu sois avec une reconnaissance vocale et des applications de bureau de haute qualité. Bien qu’une connexion Internet soit indispensable, c’est un petit prix à payer pour ce logiciel polyvalent. Dragon Anywhere est la version mobile conçue pour les appareils Android et iOS, ce qui est rare. Cependant, Dragon n’importe où n’est en aucun cas « léger » et offre des possibilités de dictée complètes alimentées par le cloud.

L’application facilite également la suppression et l’ajout de blocs de texte passe-partout avec une seule commande, ainsi que la synchronisation automatique des vocabulaires personnalisés entre l’application mobile et le logiciel de bureau Dragon. Cependant, tu ne peux traduire du texte qu’à partir de Dragon Anywhere. Tu ne peux pas l’utiliser dans d’autres applications et saisir directement ton texte.

Néanmoins, même avec ces limitations, il s’agit toujours d’une excellente application à utiliser pour tous tes besoins de synthèse vocale.

Compatibilité : Android, iOS | Fonctionnalités : Dictée, synchronisation avec Dragon Professional et les services cloud

Prix ​​: essai gratuit de 7 jours ; 12 mois à 149,99 $/an ; 1 mois à 14,99 $/mois

Voice Texting Pro

Voice Texting Pro est une application professionnelle créée par Sparking Apps. Il nécessite iOS version 5.1.1 ou ultérieure, car cette application fonctionne mieux sur l’iPhone 5. De plus, tout comme la plupart des logiciels Apple, l’application donne la priorité à l’interface utilisateur (UI) avant tout, elle est donc facile à utiliser. Toutes ses fonctionnalités sont disponibles à partir d’un seul écran, et de nombreux achats intégrés sont disponibles, y compris les SMS vocaux et l’ajout de langues.

Compatibilité : appareils Mac/iOS

Prix ​​: Gratuit

Apple Dictaphone

Apple Dictaphone est l’un des meilleurs logiciels de synthèse vocale gratuits intégrés à la plupart des appareils Apple. Il utilise les serveurs de Siri pour traiter jusqu’à 30 secondes de parole à la fois (n’oublie pas de te connecter à Internet). Apple Dictate est l’option idéale pour mettre rapidement tes idées sur papier. Néanmoins, si tu souhaites créer du contenu avec plus de temps pour ta voix et que tu as mis à niveau le système d’exploitation de ton Mac vers la version 10.9 ou ultérieure, la meilleure option serait la dictée améliorée.

De plus, Apple Dictate t’aide à transcrire la parole en texte sans connexion Internet et est particulièrement pratique lorsque tu es confronté à des contraintes de temps. Avec plus de 70 commandes vocales, tu peux contrôler efficacement toutes les actions de ton Mac, y compris la saisie, l’édition et la mise en forme de n’importe quel document.

Compatibilité : Mac/iPhone

Prix ​​: Gratuit

Converse Smartly

Converse Smartly est un puissant logiciel de synthèse vocale qui convertit l’audio en texte. Il permet aux organisations et aux individus de travailler plus intelligemment, plus rapidement et avec une plus grande précision. L’application peut être utilisée pour analyser le dialogue ou le discours des réunions d’équipe, des entretiens, des conférences et des séminaires. Il permet aux organisations et aux individus de travailler plus rapidement et plus intelligemment avec une plus grande précision.

Créé par Folio3, l’objectif principal derrière Converse Smartly est d’augmenter l’efficacité du flux de travail de toute organisation. L’application utilise une technologie de reconnaissance vocale avancée basée sur l’API IBM Watson Speech et le Natural Language Processing ToolKit et est l’un des meilleurs logiciels de synthèse vocale avec des voix naturelles. Les principales fonctionnalités incluent :

  • Analyse de la parole
  • Analyse de texte
  • Génération de résumé
  • Générer un nuage de mots à partir de la parole et de l’écriture d’entrée
  • Identifier les entités et les thèmes clés lors d’un discours ou d’une conversation
  • Transcription audio en direct

Compatibilité : Tout appareil doté d’une connexion Internet, d’un navigateur et d’une connexion Internet

Prix ​​: version d’essai gratuite

Microsoft Dictate

Microsoft Dictate est là pour prouver que même le meilleur logiciel de synthèse vocale peut être gratuit et être aussi bon qu’un logiciel premium. Créée par Microsoft Garage (une division de l’entreprise où les employés travaillent sur leurs idées en tant que projets), cette application riche en fonctionnalités bénéficie de la même technologie avancée de reconnaissance vocale qui alimente l’assistant virtuel Microsoft Cortana.

Dictate est essentiellement un module complémentaire de Microsoft Office et fonctionne bien avec Word, PowerPoint et Outlook. Tu peux l’installer à partir de la boutique Microsoft si tu ne l’as pas déjà préinstallé avec une copie de Microsoft 365. Une fois installé, tu peux y accéder via l’onglet « Dictée » qui apparaît en haut à droite de la barre d’outils du ruban. L’application prend en charge les commandes vocales pour la plupart des opérations standard telles que la saisie ou la modification de texte, le déplacement du curseur vers une nouvelle ligne et l’ajout de ponctuations manuellement ou automatiquement.

De plus, l’application offre des fonctionnalités telles que la rétroaction visuelle pour spécifier qu’elle traite l’entrée vocale. Microsoft prend également en charge la dictée avec traduction en temps réel dans 60 langues différentes. Microsoft Dictate est compatible avec les versions Office 2013 et supérieures et fonctionne bien avec les versions Windows 8.1 et supérieures.

Compatibilité des applications : appareils Windows uniquement

Prix ​​: Gratuit

e-Speaking

e-Speaking est un logiciel de dictée qui est une option optimale pour Windows 11, car il utilise le programme d’application vocale de Microsoft, ainsi que l’interface et le framework net.

L’application te permet de contrôler ton ordinateur par ta voix. Tu peux dicter des documents, transcrire des messages vocaux, documenter des e-mails et même lire du texte à haute voix.

e-Speaking est livré avec plusieurs fonctions intégrées, qui te permet d’effectuer de nombreuses tâches ensemble. Par exemple, tu peux accéder à Internet et à Excel pendant la transcription. Parallèlement à cela, le logiciel est très personnalisable, car de nouvelles commandes peuvent y être ajoutées.

Avantages:

  • L’application s’intègre bien à Windows
  • Il est personnalisable et de nouvelles commandes peuvent être ajoutées pour répondre à tes opérations commerciales particulières
  • Il propose des tutoriels et un excellent support client
  • Le logiciel est très convivial et constitue une excellente option pour les utilisateurs handicapés

Les inconvénients:

  • e-Speaking n’est pas aussi précis que les autres logiciels de reconnaissance vocale

Tarification :

e-Speaking est très abordable, car une licence de mise à niveau coûte 14 USD. L’application propose également une version d’essai gratuite de 30 jours.

Speechmatics

Speechmatics est un logiciel de reconnaissance vocale qui automatise le processus de transcription grâce à sa technologie d’apprentissage automatique.

Speechmatics peut convertir les fichiers audio et vidéo enregistrés en texte, ainsi que les traduire en temps réel. L’application utilise également des commandes telles que la recherche de mots clés pour rendre les traductions plus complètes.

Speechmatics est également bien équipé pour prendre en charge une gamme d’accents.

Avantages:

  • Il peut comprendre plusieurs accents
  • Il peut comprendre plusieurs langues
  • Il est complet et possède des fonctionnalités telles que la recherche de mots-clés et le sous-titrage des médias
  • Il offre à la fois une vitesse et une précision élevées

Les inconvénients:

  • Il n’offre pas de version d’essai gratuite
  • Tu dois confirmer manuellement que ta transcription est terminée, cela ne t’informe pas automatiquement de la fin d’un document.
  • Les documents créés sont tous des PDF et ne peuvent pas être modifiés

Tarification :

Speechmatics offre 600 minutes de parole libre pour la reconnaissance de texte, mais il n’a pas de véritable essai gratuit. Speechmatics est disponible pour 8,33 USD par mois.

Quel est le meilleur logiciel de transcription ?

Il existe beaucoup de logiciels de transcription sur internet. Les logiciels de transcriptions vont t’aider à convertir automatiquement tes fichiers audio et vidéo en format texte que tu pourras réutiliser. La plupart de ces outils de transcription s’appuient sur des technologies d’intelligence artificielle telles que l’apprentissage automatique et le traitement du langage naturel pour transcrire l’audio en texte.

Le problème est qu’avec autant d’options, il est difficile de choisir le bon logiciel de transcription. La plupart de ces logiciels de transcriptions sont payant, mais assure une très bonne qualité.

Rev.com

Rev.com est un service audio ou vidéo vers texte avec un pool de transcripteurs, sous-titreurs et traducteurs professionnels agréés.

Ils t’aident à transformer tes enregistrements en texte écrit que tu peux modifier, enregistrer et exporter dans de nombreux formats différents. Ce système fonctionne en tandem avec des outils d’IA intégrés pour assurer la détection des erreurs pour plus de précision.

Le fonctionnement est très simple et facile d’utilisation. Il faudra que télécharge ton fichier audio ou vidéo à partir de ton système, ou tu pourras même copier-coller l’URL Web. Un de leurs professionnels transcrira ton dossier pour toi. Ils offrent une garantie à 100 % d’une précision de plus de 99 %. Enfin, tu recevras tes relevés de notes sous forme de document modifiable. Tu pourras également afficher et modifier le document à l’aide des outils d’édition intégrés de Rev.

Leur délai de livraison standard est de 12 heures pour la plupart des fichiers. Ils fournissent également une livraison urgente en environ quatre heures (encore une fois, pour les fichiers < 30 minutes).

Ils peuvent même gérer les audios avec un bruit de fond, plusieurs haut-parleurs et divers accents. À savoir que les transcriptions étrangères (dont la langue française) sera plus cher, car le site est anglais.

De plus, tu peux également demander des transcriptions automatisées si tu es pressé et souhaites recevoir des fichiers dans les cinq minutes. Il fonctionne en utilisant le concept de reconnaissance vocale, et il n’y a donc aucune intervention humaine.

Transcribe

Transcribe est un outil de transcription axé sur la confidentialité qui convient à la conversion automatique de fichiers audio en texte. Que tu écoutes des podcasts, de la musique ou même une réunion officielle, cela peut te faire gagner du temps et de l’argent et augmenter tes niveaux de productivité.

Transcribe est livré avec un lecteur audio spécialisé qui aide à décoder l’audio. Il fournit un support, ainsi qu’une excellente performance au ralenti. Le logiciel est livré avec un fichier d’aide dédié qui explique toutes ses fonctionnalités.

Ce service convient aux professionnels qui souhaitent d’une manière propre et privée de transcrire l’audio. Les raccourcis clavier sont pratiques et permettent d’effectuer des tâches telles que l’insertion d’horodatages.

En ce qui concerne les fonctionnalités, Transcribe te permet de créer des sous-titres pour les vidéos et d’exporter des transcriptions sous la forme de fichiers WebVTT ou SRT. Ceux-ci peuvent ensuite être utilisés pour sous-titrer des vidéos sur des plateformes de médias sociaux telles que YouTube ou Vimeo par exemple.

Les plans tarifaires de Transcript sont extrêmement simples. Il n’a que deux niveaux : un pour l’auto-transcription à partir de 20 $/an et l’autre pour la transcription automatique 20 $/an + 6 $/heure.

Temi

Temi est un outil utilisé pour la transcription de la parole en texte et est une version très avancée du logiciel de reconnaissance vocale. Cela fonctionne lorsque tu télécharges n’importe quel type de fichier, que ce soit de l’audio ou de la vidéo, et il le transcrit en moins de cinq minutes. Finalement, les fichiers peuvent être stockés dans des formats MS Word ou PDF qui appartiennent en particulier à Windows, et peuvent même être envoyés par courrier électronique.

Cet outil de transcription offre une facilité d’utilisation à ses utilisateurs, qui peuvent sans effort ajuster le son, la vitesse de lecture, sauter n’importe quelle partie si nécessaire et ajouter également des horodatages.

Cependant, la qualité de la transcription dépend de la qualité sonore du fichier téléchargé et meilleur est la qualité sonore, plus les résultats sont précis. De plus, si les fichiers sont trop volumineux, la transcription peut prendre beaucoup de temps et dépasser le repère de cinq minutes. Il a aussi un peu de mal à comprendre plusieurs accents différents.

Un point unique de Temi est qu’il a été construit par des experts en reconnaissance vocale qui sont également des maîtres de l’apprentissage automatique. Il y a un petit coût s’il y a besoin de l’ensemble du logiciel, cependant, plusieurs versions d’essai plus courtes sont disponibles gratuitement. Les journalistes, les blogueurs et les podcasteurs ou les auteurs peuvent utiliser au mieux cet outil pour leur domaine de travail.

Prix : 0,25 $ par minute

Descript

Descript permet l’édition de document simple à la création de transcriptions audio/vidéo. L’outil combine un transcripteur, un enregistreur d’écran et un éditeur dans le même package. Il comprend également des outils de publication alimentés par l’IA qui rendent l’édition audio/vidéo facile et simple d’utilisation.

L’utilisation de Descript est simple : il te suffit de glisser-déposer ton fichier multimédia sur l’éditeur et le logiciel transcrit l’audio en texte. La transcription textuelle est affichée dans un simple éditeur de documents, où tu peux le modifier comme bon te semble.

Descript est idéal pour collaborer sur des projets qui nécessitent plusieurs membres d’équipe. Outre la capture d’écran, l’enregistrement à distance et la conversion parole-texte, l’outil fournit une collaboration en direct et une synchronisation basée sur le cloud.

L’outil comprend un service gratuit qui te permet d’avoir jusqu’à trois heures de transcription.

Bien sûr, il existe beaucoup d’autres logiciels de transcription sur internet.

Comment dicter un texte sur Word ?

Si tu as un abonnement à Office 365, lances Microsoft Word et ouvre un document. Positionne ton curseur à l’endroit où tu souhaites commencer à dicter. Clique sur l’icône Dicter dans le ruban d’accueil. La première fois que tu effectues cette opération, Word peut te demander l’autorisation d’utiliser ton microphone. Accorde la permission et tu pourras commencer à parler.

Dicte des mots, des signes de ponctuation et des actions spécifiques, telles que « nouvelle ligne » et « nouveau paragraphe ». Tu voudras peut-être dicter quelques phrases ou un seul paragraphe à la fois, puis t’arrêter afin de pouvoir revoir ton texte à la recherche d’éventuelles erreurs. Pour arrêter la dictée, appuis à nouveau sur l’icône Dicter.

Après avoir activé l’outil, clique sur l’icône Paramètres dans la petite fenêtre Dicter en bas de l’écran. Ici, tu pourras activer la ponctuation automatique afin que ta dictée comprenne automatiquement des points, des virgules et d’autres marques sans que tu aies besoin de les prononcer. Tu peux également activer et désactiver le filtre de grossièretés. Avec ce filtre activé, tous les mots grossiers apparaissent sous la forme d’une série d’astérisques.

Tu peux également dicter du texte dans d’autres langues. Cliques sur l’icône Paramètres dans la fenêtre Dicter. Passe à la commande pour les langues parlées et choisis la langue que tu souhaites utiliser.

Comment dicter un texte sur PowerPoint, OneNote ?

Lance PowerPoint pour Office 365 et ouvre une présentation nouvelle ou existante. Clique simplement sur l’icône Dicter sur le ruban et dicte ton texte. Lorsque tu as terminé, clique à nouveau sur l’icône pour arrêter la dictée.

Tu peux dicter du texte dans deux versions différentes de OneNote. Accéde à Office sur le Web et choisis OneNote, ou utilise l’application OneNote sur ton bureau directement. Dans les deux versions, ouvre un document OneNote et clique sur le bouton Dicter du ruban Accueil, puis commence à dicter. Clique à nouveau dessus pour arrêter. Clique sur la flèche vers le bas pour voir d’autres langues pour la dictée.

Comment activer la dictée sur Excel ?

L’outil Microsoft Office Dictate ne fonctionne pas avec Excel ou les versions antérieures d’Office, et Dictate n’offre pas de moyen de corriger facilement les erreurs, d’ajouter des mots à un dictionnaire ou de gérer les paramètres. Une option qui peut dépasser ces limitations est l’outil de reconnaissance vocale de Windows intégré directement à Windows 10/11.

L’outil est compatible avec n’importe quel programme Windows, y compris toutes les versions d’Office, telles qu’Office 365, Office 2019 et les versions antérieures. Ouvre Word, Excel, PowerPoint ou tout autre programme, maintiens la touche Windows enfoncée et appuis sur H pour ouvrir une barre d’outils de dictée en haut de l’écran ou en bas selon ta version Windows. Tu pourras alors commencer à dicter.

Tu peux dicter la ponctuation et des actions spécifiques pour te déplacer sur l’écran. Par exemple, dites « tabulation » pour passer à la cellule suivante de la colonne ou « nouvelle ligne » pour passer à la cellule suivante de la ligne. Ou dites des choses comme « Annuler ça » pour effacer le dernier mot que tu as dicté. Microsoft fournit une liste complète de phrases et d’actions que tu peux dicter avec la reconnaissance vocale Windows.

Si tu ouvres le Panneau de configuration dans Windows 10/11 et que tu cliques sur Reconnaissance vocale, tu pourras configurer un microphone, entraîner la reconnaissance vocale ou suivre un didacticiel vocal.

Conseils d’utilisation d’un logiciel de reconnaissance vocale

Bien que le logiciel de dictée soit assez bon pour reconnaître différentes voix, il n’est pas parfait. Voici quelques conseils pour que cela fonctionne au mieux.

  1. Parle naturellement : Les applications de dictée apprennent de ta voix et tes schémas vocaux au fil du temps. Parles naturellement. Si tu n’obtiens pas une précision de 90 % au départ, essaies d’en énoncer davantage et de parler plus clairement.
  2. Ponctuation : Lorsque tu dictes, tu dois dire chaque point, virgule, point d’interrogation, etc. Le logiciel n’est pas assez intelligent pour le comprendre tout seul.
  3. Apprend quelques commandes : Prends le temps d’apprendre quelques commandes simples, telles que « nouvelle ligne » pour entrer un saut de ligne. Il existe différentes commandes pour composer, éditer. Les commandes peuvent différer d’une application à l’autre, alors découvres celles qui s’appliquent à l’outil que tu choisis.
  4. Connais tes limites : Surtout sur les appareils mobiles, certains outils ont une limite de temps pour la durée d’écoute, parfois aussi courte que 10 secondes. Jettes un coup d’œil à l’écran de temps en temps pour t’assurer que tu n’as pas dépassé le repère.
  5. Entraine-toi : Il faut du temps pour s’adapter au logiciel de reconnaissance vocale, mais cela devient plus facile à force de pratiquer. Certaines des applications les plus sophistiquées t’invite à t’entraîner en lisant des passages ou en faisant d’autres exercices courts. N’hésite pas à consulter les didacticiels, les menus d’aide, etc.

Conseils sur les microphones

Avec un logiciel de reconnaissance vocale, ta voix est captée par un microphone, qui est inclus sur ton appareil (ordinateur, tablette, mobile) ou dans le cadre d’une suite logicielle spécifique (par exemple, Microsoft Office). Pour l’utilisateur occasionnel de dictée qui capture des notes et des listes de courses, le microphone intégré devrait fonctionner correctement.

Mais si tu souhaites l’utiliser plus intensément (rédaction constante de contenu, dictée de réunions, envoi d’e-mails), penses à quelque chose qui capture plus efficacement les ondes sonores de ta voix. Pour moins de 100 euros, il existe de nombreuses options pour les casques avec micros ou microphones externes utilisés par les podcasteurs et les intervieweurs YouTube par exemple.

4.8/5 - (5 votes)

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.