Les services de transcription en ligne sont-ils sûrs et privés?



Autrefois, la transcription était une tâche manuelle et chronophage. Les professionnels, qu’ils soient médecins, journalistes ou autres, enregistraient leurs notes et conversations sur des magnétophones à cassettes, puis les retranscrivaient laborieusement sur ordinateur.

Aujourd’hui, en 2020, de nombreux outils sont disponibles pour convertir des enregistrements audio en texte sur écran. Toutefois, une question persiste : ces services sont-ils fiables ? En effet, on télécharge souvent des enregistrements de dialogues confidentiels ou de messages vocaux privés.

Examinons ces services de plus près et voyons comment protéger vos informations.

Comment fonctionnent les services de transcription audio ?

Les services de transcription audio se répartissent généralement en trois catégories. La première repose entièrement sur des systèmes informatiques et des algorithmes d’intelligence artificielle (IA) et d’apprentissage automatique pour traiter les échanges oraux. La seconde, plus coûteuse, implique principalement l’intervention humaine. La troisième est une combinaison des deux approches.

La première catégorie est probablement celle qui vous est la plus familière. Des services de transcription vocale, comme ceux proposés par Google, Apple ou encore Otter.ai, convertissent les ondes analogiques de votre voix en une représentation numérique. Ils divisent ensuite cette représentation en segments infimes, parfois un millième de seconde, et les associent à des « phonèmes », les unités sonores de base d’une langue.

Ces algorithmes analysent alors ces phonèmes dans leur contexte, les soumettent à des modèles statistiques et d’IA, pour produire finalement un texte. Ces services de transcription entièrement automatisés sont généralement les moins chers, mais leur précision peut être limitée, surtout dans les environnements bruyants ou lorsque plusieurs personnes parlent.

La transcription humaine, elle, s’appuie sur des plateformes telles que Rev, qui mettent en relation des clients et un réseau de transcripteurs certifiés. Il est également possible de faire appel à des transcripteurs indépendants via des plateformes comme Upwork ou Fiverr.

Enfin, certains services combinent les deux méthodes. Pour accélérer le processus, l’IA effectue un premier traitement, puis un humain relit et corrige le texte produit.

Les dérives des services de transcription

Ces dernières années, plusieurs services de transcription ont été impliqués dans des scandales et des atteintes à la vie privée.

Le cas le plus ancien, et probablement le plus choquant, est celui de SpinVox. Dans les années 2000, cette entreprise proposait un service qui convertissait les messages vocaux en SMS, une véritable prouesse technologique pour l’époque. Elle a rapidement séduit la presse, les clients et les investisseurs.

Mais il y avait un problème : à l’insu des clients, leurs messages vocaux étaient traités par des opérateurs travaillant dans des centres d’appels situés dans des pays comme le Pakistan, l’île Maurice ou l’Afrique du Sud. Un ancien employé a révélé que seulement 2% des messages étaient traités par des machines, le reste étant confié à environ 10 000 travailleurs sous-payés.

Lorsque les employés d’un centre pakistanais n’ont plus été payés, ils ont commencé à envoyer des messages directement aux clients pour se plaindre. La supercherie a été dévoilée, et la valeur de SpinVox s’est effondrée. Les vestiges de l’entreprise ont finalement été vendus à Nuance, un des leaders mondiaux de la reconnaissance vocale.

Plus récemment, le journaliste spécialisé en cybersécurité Brian Krebs a révélé une faille de sécurité majeure chez MEDantex, un prestataire de services de transcription vocale pour les professionnels de santé basé au Kansas. Des données, dont certaines remontaient à 2007, contenant des informations médicales confidentielles, ont été divulguées. Elles étaient téléchargeables via un portail non sécurisé sous forme de fichiers Microsoft Word.

Même les services de transcription numérique ne sont pas infaillibles. En effet, une entreprise peut avoir recours à des sous-traitants humains pour assurer le contrôle qualité, même si elle prétend utiliser un service entièrement automatisé.

En 2019, le site d’actualité belge VRT NWS a révélé que des sous-traitants de Google écoutaient des conversations entre des utilisateurs et leurs assistants vocaux Google Home. Un de ces sous-traitants a même fourni à VRT NWS des enregistrements de conversations, dont beaucoup étaient de nature extrêmement sensible, voire intime.

Amazon, Apple et Microsoft avaient également recours à ce type de pratiques. Autrement dit, quelqu’un pourrait très bien écouter les enregistrements vocaux de votre assistant virtuel.

Les services de transcription en ligne sont-ils sûrs ?

La question essentielle est donc de savoir si les services de transcription en ligne sont sûrs. Malheureusement, la réponse est nuancée.

Le marché de la transcription vocale est aujourd’hui relativement mature et les abus les plus flagrants ont été corrigés.

Néanmoins, lorsque vous confiez vos données, en l’occurrence des conversations privées, à un tiers, vous comptez sur sa capacité à les protéger. Cela vaut aussi bien pour les services en ligne que pour les transcripteurs humains.

En fin de compte, deux questions importantes se posent : faites-vous confiance au service en question ? Quelle est la sensibilité des conversations que vous souhaitez transcrire ?

Avant de choisir un service de transcription, il est essentiel de se renseigner. L’entreprise a-t-elle une bonne réputation ? Est-elle bien établie ? A-t-elle été victime de fuites de données dans le passé ? Sa politique de confidentialité précise-t-elle clairement comment vos données seront traitées et sécurisées ?

Comme nous l’avons mentionné, les services basés sur l’IA font souvent appel à des employés ou des sous-traitants pour effectuer des contrôles qualité. Bien que ces vérifications ne concernent qu’une petite partie des transcriptions, il existe toujours une possibilité que quelqu’un écoute vos conversations.

Dans de nombreux cas, ce n’est pas un facteur décisif. Cependant, si vos conversations sont de nature extrêmement privée ou sensible d’un point de vue commercial, il peut être préférable de transcrire vos enregistrements manuellement, en ouvrant un éditeur de texte.