API Speech-To-Text : quelles sont ses avantages et ses limites ?

Emmanuelle ABOAF

Ma présentation version speech-to-text

bonjour je m'appelle emmanuel et je suis développeuse chez des hub des robes et un et binet de haïti spécialisée dans le développement le lahoud n'y a l'abbaye et la data mes sacs préférés sont ces sharp dunet et anular le bail gens entrent régulièrement et t'as un problème de time à haute je m'intéresse également aux aspects de l'intelligence artificielle notamment le speech tout texte thème on va aborder aujourd'hui étant sourde je lutte jour pour la cessibilité dans mon monde idéal tout doit être accessible aussi bien dans la vraie vie et dans le web

Bonjour, je m'appelle Emmanuelle et je suis développeuse chez Dcube. Dcube est un cabinet de conseil IT spécialisé dans le développement, le cloud, l'IA, la BI et la data. Mes stacks préférés sont C# .NET et Angular. Le bug que je rencontre régulièrement est un problème de timeout. Je m'intéresse également aux aspects de l'intelligence artificielle notamment le Speech-To-Text, thème qu'on va aborder aujourd'hui. Etant sourde, je lutte chaque jour pour l'accessiblité. Dans mon monde idéal, tout doit accessible aussi bien dans la vraie vie que dans le Web.

Mon expérience

Démos

Démo 1 : Samuel

Texte à vocaliser

Les services publics numériques et certains services privés ont l'obligation d'être accessibles de façon équivalente à tout citoyen, qu'il soit ou non en situation de handicap (visuel, auditif, moteur, trouble dys...). Un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous. Pour faciliter la mise en œuvre de l'accessibilité numérique, la DINUM édite depuis 2009 le référentiel général d'amélioration de l'accessibilité – RGAA, créé pour mettre en œuvre l'article 47 de la loi handicap de 2005 et son décret d'application actualisé en 2019. Il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du Web mais aussi aux changements de normes et réglementations.

Deepgram

Les services publics numérique et certains services privées ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'elle soit ou non en situation de handicap visuel auditif moteur troubles 10 etc un service numérique accessible plus facile à utiliser pour les personnes handicapées et de qualité pour tous faciliter la mise en oeuvre de l'accessibilité numérique la et dite depuis 2009 le référentiel général d'amélioration de l'accessibilité rg créée pour mettre en oeuvre l'article 47 dans la loi handicap 2005 et son décret d'application actu en 2019 fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web et aussi au changements de normes et réglementations

77,78 % de réussite

Google

Les services publics numérique et certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'ils soient ou non en situation de handicap visuel auditif moteur trouble et cetera un service numérique accessible et plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en œuvre de l'accessibilité numérique l'a dit num et depuis 2009 le référentiel général d'amélioration de l'accessibilité RG2 a créé pour mettre en œuvre l'article 47 de la loi Handicap 2005 et son décret d'applicationactualisant demain il fait régulièrement l'objet de nouvelle version est mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations

85,47 % de réussite

Microsoft

les services publics numériques et certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'il soit ou non en situation de handicap visuel auditif moteur trouble 10 et cetera un service numérique accessible et plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en œuvre de l'accessibilité numérique la dinum édite depuis 2009 le référentiel général d'amélioration de l'accessibilité RG 2A crée pour mettre en œuvre l'article 47 de la loi handicap de 2005 et son décret d'application actualité en 2019 il fait réulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations

94,87% de réussite

Mozilla

les services publics numérique certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'ils soient ou non en situation de handicap visuel auditif moteur trouble.dys cetera un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en œuvre de l'accessibilité numérique l'a dit num et dit depuis 2009 le référentiel général d'amélioration de l'accessibilité RG2 a créé pour mettre en œuvre l'article 47 de la loi Handicap 2005 et son décret d'application actualiser en 2019 il fait régulièrement l'objet de nouvelle version est mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations.

86,32% de réussite

Démo 2 : Anne-Laure

Texte à vocaliser

Les services publics numériques et certains services privés ont l'obligation d'être accessibles de façon équivalente à tout citoyen, qu'il soit ou non en situation de handicap (visuel, auditif, moteur, trouble dys...). Un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous. Pour faciliter la mise en œuvre de l'accessibilité numérique, la DINUM édite depuis 2009 le référentiel général d'amélioration de l'accessibilité – RGAA, créé pour mettre en œuvre l'article 47 de la loi handicap de 2005 et son décret d'application actualisé en 2019. Il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du Web mais aussi aux changements de normes et réglementations.

Deepgram

les services publics numériques et certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'il soit ou non en situation du handicap et visuel auditif moteur troubles 10 etc et un service numérique accessible est plus facile à utiliser pour les personnes handicapée et de meilleure qualité pour tous faciliter la mise en oeuvre de l'accessiblité numérique la est dite depuis 2009 le référentiel général d'amélioration de l'accessibilité rg créé pour mettre en oeuvre l'article de la loi handicap de 2005 et son décret d'application actu en 2019 il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web aussi au changement de normes et réglementations

85,47 % de réussite

Google

les services publics numérique et certains services privés ont l'obligation d'etre accessible de façon équivalente à tout citoyen qu'ils soient ou non en situation de handicap visuel auditif moteur trouble et cetera un service numérique accessible et plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en oeuvre de l'accessibilité numérique l'a dit num et depuis 2009 le référentiel général d'amélioration de l'accessibilité RG2 a créé pour mettre en euvre l'article 47 d la loi Handicap de 2005 et son décret d'application actualiser en 2019 il fait régulièrement l'objet de nouvelle version est mise à jour pour s'adapter aux évolutions du web et aussi au changement de normes et réglementations

85,47 % de réussite

Microsoft

les services publics numériques et certains services privés ont l'obligation d'être accesible de façon équivalente à tout citoyen qu'il soit ou non en situation de handicap visuel auditif moteur trouble 10 et cetera un service numérique accessible et plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en euvre de l'accessibilité numérique la dénommée dite depuis 2009 le référentiel général d'amélioration de l'accessibilité RG 2A créée pour mettre en oeuvre l'article 47 de la loi Handicap de 2005 et son décret d'application actualisé en 2019 il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web mais aussi au changement de normes et réglémentations

91,45% de réussite

Mozilla

les services publics numérique et certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'ils soient ou non en situation handicap visuel auditif moteur trouble.dys et cetera un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en oeuvre de l'accessibilité numérique l'a dit num et dit depuis 2009 le référentiel général d'amélioration de l'accessibilité RG 2 a créé pour mettre en oeuvre l'article 47 de la loi Handicap de 2005 et son décret d'application actualiser en 2019 il fait régulièrement l'objet de nouvelle version est mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglémentations

87,17 % de réussite

Démo 3 : Emmanuelle

Texte à vocaliser

Les services publics numériques et certains services privés ont l'obligation d'être accessibles de façon équivalente à tout citoyen, qu'il soit ou non en situation de handicap (visuel, auditif, moteur, trouble dys...). Un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous. Pour faciliter la mise en œuvre de l'accessibilité numérique, la DINUM édite depuis 2009 le référentiel général d'amélioration de l'accessibilité – RGAA, créé pour mettre en œuvre l'article 47 de la loi handicap de 2005 et son décret d'application actualisé en 2019. Il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du Web mais aussi aux changements de normes et réglementations.

Deepgram

les services plus certain service privé une l'obligation d'être accessible de façon équivalente à tout citoyen ils soient où non en situation de handicap visuel auditif moteur un service numérique accessible et pu facile à utiliser pour les personnes en handicapées de meilleure qualité pour tous pour faciliter la mise en euvre de l'accessibilité inédite depuis 2009 ne référentiel général d'amélioration de l'accessibilité perché 2 pour mettre en oeuvre en de la loi on et de 2005 sont des prêts en 2019 il régulièrement l'objet de nouvelles version et mise à jour pousse la aux évolutions du web mais aussi au changements de normes et expérimentation

67,52 % de résultat

Google

mes services numériques et certains services privés une obligation d'être incessible de façon et ils sont à tous les citoyens soient ou non en situation de handicap visuel auditif hauteur trompé dit un service numérique incessible et plus facile à utiliser pour les personnes en est de meilleure qualité pour tous pour faciliter la mise en oeuvre de la nuit depuis 2009 le référentiel général ration de la sociabilité chercher 2 ans pour mettre en oeuvre l'article 41 de la loi 2005 et son décret d'application actualiser en 2019 il fait hier m'enlève j'ai des nouvelles versions et mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations

74,35 % de résultat

Microsoft

les services publics numériques et certains services privés ont l'obligation d'être accessible de façon unie valente à tout citoyen il soit ou non en situation de handicap visuel audtif moteur trompé 10 un service numérique incessible et plus facile à utiliser pour les personnes handicapées et limière pour tous pour faciliter la mise en oeuvre de la cessibilité numérique qui 2009 le référentiel général d'amélioration de l'accessibilité RG 2A créée pour mettre en oeuvre l'article enceinte de la loi handicap 2005 ils sont des applications actualisées en 2009 il fait l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web mais aussi au changement de norme et réglementation

77,78 % de résultat

Mozilla

mes services numériques et certains services privés une obligation d'être incessible de façon et ils sont à tous citoyens ils sont ou non en situation de handicap visuel auditif hauteur trompé 10 un service numérique accessible est plus facile à utiliser pour les personnes handicapées et demi-heure a été pour tous pour faciliter la mise en oeuvre de l'accessibilité et depuis 2009 le référentiel général Damien ration de l'accessibilité chercher 2 ans pour mettre en oeuvre l'article 47 de la loi de 2005 et son décret d'application actualiser en 2019 il fait hier j'ai des nouvelles versions et mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations

75,36 % de résultat

Biais

Problème de biais

YouTube’s auto captions consistently performed better on male voices than female voice.

More recent research has found the same effect: ASR systems make more errors for Black speakers than white speakers

For every hundred words, the systems made 19 errors for white speakers compared to 35 errors for Black speakers — nearly twice as many. That is 35% Black speakers versus 19% White speakers.

Why does this bias exist ? (...) The underlying reason may be that databases have lots of white male data, and less data on female and minority voices. For example, TED Talks are frequently analyzed by speech scientists, and 70% of TED speakers are male.

Common Voice

Datasets des voix pour la langue française
Version	Date	Nombre de voix	Répartition de voix masculines *	Répartition de voix féminines *
1.0	25/02/2019	1 697	72%	7%
2.0	11/06/2019	2 985	70%	9%
3.0	24/06/2019	3 005	70%	9%
4.0	10/12/2019	8 164	65%	12%
5.1	22/06/2020	11 960	65%	11%
6.1	11/12/2020	12 953	65%	10%
7.0	21/07/2021	15 391	63%	11%
8.0	19/01/2022	16 082	62%	11%
9.0	27/04/2022	16 291	62%	10%
10.0	04/07/2022	16 510	62%	10%
11.0	21/09/2022	16 785	61%	10%

* Le reste des voix proviennent des voix anonymes

Chaque voix compte.

Y compris :

celles des femmes
celles des personnes issues de la minorité
celles des personnes ayant des accents
celles des personnes ayant des voix atypiques ou déformées
celles des personnes ayant des troubles du langage

La langue française

Nouvelle démo de Samuel

Texte à vocaliser

Samuel, développeur au sein de l'entreprise Dcube, rencontre souvent des problèmes de timeout sur les gros traitements des demandes entrantes et il n'est pas le seul. 3, 4, 5 personnes de l'équipe également dont sa collègue Emmanuelle. Leur PO tèj souvent ses US et réalise des tool-in-actions. Samuel a une chatte qui s'appelle Qwerty. Emmanuelle déteste les homonymes surtout quand elle essaie de comprendre en lisant sur les lèvres : "le ver vert va vers le verre vert".

Deepgram

samuel développeur au sein de l'entreprise des cubes rencontre souvent des problèmes de time sur les gros traitements des demandes et il n'est pas le seul 3 4 5 personnes de l'équipe également dans sa collègue emmanuel leur po souvent ses us réalise des to action mène à une chatte qui s'appelle q emmanuel déteste les homo surtout quand elle essaie de en lisant sur les lèvres le vert vers vers le vert vert

73,68 % de réussite

Google

Samuel développeur au sein de l'entreprise de l'écume rencontre souvent des problèmes de timeout sur les gros traitements des demandes d'entente et il n'est pas le seul trois quatre cinq personnes de l'équipe également donc ca y est manuel leur POP j' souvent CUS réalisent et tu line action à une chatte s'appelle quarti Emmanuel déteste les homonymes surtout quand elle essaie de comprendre en lisant sur les lèvres le vert vert va vers le verre vert

68,42 % de réussite

Microsoft

samuel développeur au sein de l'entreprise des cubes rencontre souvent des problèmes de timeout sur les gros traitements des demandes entrantes et il n'est pas le seul 345 personnes de l'équipe également dont sa collègue emmanuel leur po tags souvent ces US réalise des tounes actions samuel a une ***** qui s'appelle qwerty emmanuel déteste les homonymes surtout quand elle essaie de comprendre en lisant sur les lèvres le verre vert va vers le verre vert

84,21 % de réussite

Mozilla

Samuel développeur au sein de l'entreprise des cubes rencontre souvent des problèmes de timeout sur les gros traitement des demandes d'entente et il n'est pas le seul trois quatre cinq personnes de l'équipe également donc sa collègue Emmanuel leur POP ais-je souvent CUS réalisent et tu line actions à mener à une chatte s'appelle quarti Emmanuel déteste les homonymes surtout quand elle essaie de comprendre en lisant sur les lèvres le verre vert va vers le verre vert

72,37 % de réussite

La langue française

Une langue riche et complexe ;
avec ses règles de grammaire, de conjugaison et d'orthographe ;
ses homonymes

des noms communs ;
des noms propres ;
des acronymes ;
le langage métier, fonctionnel et technique ;
les termes franco-anglais ;
et même le verlan.

Quelques perles des sous-titres automatiques
Mot dit	Mot transcrit automatiquement
timeout	time à haute / time août
IT	Haïti
tool in actions	tooline actions
stack	sac
validisme	vally 10 mhz
demande entrante	demande en 30
snippets	slips
speaker	piqueur
DevRel	frêles
sketchstorm	tempête
speech-to-text	speech tout texte
Chat GPT	Chat j'ai pété

Je suis en train de reprendre les sous-titres automatiques d'une vidéo syndicale. Je vous présente l'orthographe automatique de validisme: vally 10 mhz
— @riroumourir 13 mars 2022

"J'étais fâché comme un pull."
J'utilise un logiciel de transcription automatique pour transcrire plus rapidement des entretiens pour ma thèse. Ca marche plutôt pas mal, mais ça donne aussi lieu à qq cafouillages assez drôles.
— @LanguesdeCha 15 mars 2022

J'adore la transcription automatique Youtube. Dans son podcast, @LostInBrittany dit qu'il est responsable des DevRel OVH. La transcription dit qu'il est responsable des frêles OVH. 🤣 Faut-il prendre ça pour une attaque perso de la part de Google ?
— @bdauvissat 29 mai 2022

La conjugaison

Nouvelle démo d'Anne-Laure

Texte à vocaliser

Annie est arrivée à la maison. Elle est arrivée à la maison. Nous, les filles, sommes arrivées à la maison.

Deepgram

Annie est arrivé à la maison. Elle est arrivée à la maison. Nous les filles sommes arrivés à la maison.

Google

Annie est arrivé à la maison. Elle est arrivée à la maison. Nous les filles sommes arrivés à la maison.

Microsoft

Annie est arrivé à la maison. Elle est arrivée à la maison. Nous les filles sommes arrivés à la maison.

Mozilla

Annie est arrivé à la maison. Elle est arrivée à la maison. Nous les filles sommes arrivés à la maison.

Peut-on accorder les verbes en se basant sur la voix de la personne ?
- Dominique ou Camille est-elle une femme ou est-il un homme ?
- Est-ce Emmanuelle ou Emmanuel ?
- Annie ou Hany ?

Les mots grossiers ou familiers

*****, ça a **** ! C’est quoi ce ****** ?! Alors là, je suis sur le *** ! ******, c’est ***** ! Voilà ce que les sous-titres automatiques peuvent afficher. Ça peut être anodin pour vous mais moi, ça m’agace.
— Emmanuelle ABOAF (@eaboaf_) 23 novembre 2021

Ce matin, en testant la retranscription automatique via word/O365 comme base de mon article du dernier épisode avec @Cindyagility 🦮 (et en vue de transcription intégrale bientôt @podcaccessible !), j'ai pris un fou rire en voyant le mot "*******" 🤣 Alors vous avez trouvé ? 🐕

Avec ma première ****** qui n'était pas la plus facile, elle était assez têtu quand même. Ouais, heu ouais, c'était, c'était une, une gentille ****** adorable. Vraiment niveau.
Au niveau, on a dire chien de compagnie.
Elle était parfaite.
Une ****** gentille, jamais un geste plus haut que l'autre, vraiment une gentille petite ******
Arpès, au niveau du guidage, il est très têtu. Et puis au final, elle s'est avérée être un peu lente pour moi parce que moi le le chien guide enfin, ça m'a redonner une liberté comme comme à tout le monde d'ailleurs, j'ai envie de dire mais.

— Futur Chien Guide (@FuturChienGuide) 21 novembre 2021

Sans paramétrage, les mots grossiers et familiers sont automatiquement censurés.
Certains mots non grossiers sont censurés car à cause de la traduction automatique français vers anglais, ils peuvent devenir grossiers.
Censurer les mots grossiers ne rend pas l'information accessible à tous.

La ponctuation

Il y a aussi des phrases sans fin sans point et que des virgules. Avec une phrase sans fin, le sens est difficile à comprendre. Par ex avec cet épisode du podcast « La Table Ovale ». Il me faut lire mot à mot pour réaliser que là c’est la fin de la phrase et là le début.

"Mais il y a un moment, enfin, souvent avec la, dans la relation avec les marques, tu vois, il y a un moment ou genre juste, ils veulent commencer à négocier alors que moi je, je veux vraiment garder la la casquette concept et artistique entre guillemets, donc cette discussion là elle est OK en direct avec les marques, ça arrive de temps en temps, pas tout le temps parce que sinon c'est chiant mais mais dès que ca parle de 2€ quoi, globalement je dis Ah non, alors je vous présente Sophie, elle est très sympa, elle est ici."

— Emmanuelle ABOAF (@eaboaf_) 3 octobre 2021

Qui parle ?

Le problème principal qu’en lisant plusieurs transcriptions automatiques sans écouter est que je ne sais pas du tout qui parle et quand on change d’interlocuteur. De plus, je ne sais pas à qui attribuer les paroles quand je lis la transcription. Il y a aucun nom.
— Emmanuelle ABOAF (eaboaf_) 3 octobre 2021

c'est pas mal pour de l'automatique, mais on a quand même du mal à savoir qui parle ou du moins quand ca change de personne.
— @cyberbaloo_ 2 juin 2022

Aujourd’hui c’est son point faible, soit l’IA en détecte trop (au moindre changement de ton ou de puissance de la voix par ex.) soit pas assez comme c’est le cas ici. Nous travaillons à l’analyse de l’image et de la ponctuation pour espérer placer des tirets où il faut.
— @matt_parmentier 29 avril 2022

Sous-titrage automatique et surdité

Une suppléance mentale très élevée quand les sous-titres sont incomplètes ou incorrectes : on essaie de combler les trous ;
Des solutions de sous-titrage automatique très inégales des unes des autres : on cherche toujours le meilleur outil ;
Les voix atypiques et accents non prises en compte dans les traitements de données : l'IA ne comprend pas les personnes sourdes ou malentendantes.

Conséquence directe : les sous-titres automatiques non correctes ont un impact très important sur la vie quotidienne et professionnelle de la personne sourde ou malentendante.

Conclusion

AI is good but it’s not that good !

Tim Cook à l'université Gallaudet, le 14 mai 2022.

Mélanger l'intelligence artificielle et l'intelligence humaine

pour rendre l'expérience encore meilleure.

Utiliser les outils automatiques
et corriger les fautes générées de la reconnaissance vocale

Soyez près de votre micro (et par la même occasion, ayez un bon micro)
Minimiser les bruits en arrière-plan
Parlez très clairement et pas trop vite

Le sous-titrage en temps réel au quotidien

sur vos ordinateurs, tablettes et téléphones.

Lorsque vous faites une présentation avec PowerPoint
Lorsque vous dictez avec la Dictée vocale sous Word
Lorsque vous dictez avec la Saisie vocale sous Google Docs
Lorsque vous voulez faire sous-titrer une conversation avec Microsoft Translator
Lorsque vous voulez faire sous-titrer une conversation avec Live Transcribe de Google sous Android
Lorsque vous voulez faire sous-titrer vos conversations, vos appels ou vos vidéos Live Captions d'Apple (prochainement disponible sous IOS 16 sur les terminaux IPhone, IPad et Mac)
Dès qu'il y a du son sur votre PC, ça sous-titre avec Live Captions de Microsoft sous Windows 11 (disponible en anglais, prochainement en français)
Et pleins d'autres outils automatiques...

Critères RGAA

Critère 4.1. Chaque média temporel pré-enregistré a-t-il, si nécessaire, une transcription textuelle ou une audiodescription (hors cas particuliers) ?

Critère 4.2. Pour chaque média temporel pré-enregistré ayant une transcription textuelle ou une audiodescription synchronisée, celles-ci sont-elles pertinentes (hors cas particuliers) ?

Critère 4.3. Chaque média temporel synchronisé pré-enregistré a-t-il, si nécessaire, des sous-titres synchronisés (hors cas particuliers) ?

Critère 4.4. Pour chaque média temporel synchronisé pré-enregistré ayant des sous-titres synchronisés, ces sous-titres sont-ils pertinents ?

Média temporel seulement audio : contenu sonore (Wav, Mp3…) ;
Média temporel seulement vidéo : images ou photos en mouvement ou en séquence ;
Média temporel synchronisé : flux audio ou vidéo synchronisé avec un autre format pour présenter de l’information et/ou comportant des composants temporels interactifs. Un média temporel peut être consulté de 2 manières différentes :
- Fichier à télécharger consultable avec un logiciel externe à la page web ;
- Contenu embarqué dans la page web et consultable dans la page web via :
  - Un plugin (par exemple une vidéo diffusée par un lecteur Flash) ;
  - L’élément video (par exemple une vidéo) ;
  - L’élément audio (par exemple un podcast) ;
  - L’élément svg (par exemple un dessin animé vectoriel) ;
  - L’élément canvas (par exemple un dessin animé en image bitmap) ;
  - L’élément bgsound pour diffuser un arrière-plan sonore à la page web.

Un média temporel peut être diffusé en temps réel ou être proposé en lecture de manière asynchrone (média pré-enregistré).

Source : Média temporel type son vidéo et synchronisé

Règle Opquast

Règle n° 116 - Chaque contenu audio et vidéo est accompagné de sa transcription textuelle.

Les vidéos et sons contiennent des textes qui ne sont pas perceptibles par les non-voyants, les sourds ou les moteurs de recherche. Cette bonne pratique montre comment faire en sorte que ces contenus soient lisibles et indexés.

Expérimentation de France TV Lab

Testez et évaluez la solution de sous-titrage automatique de franceinfo

Ressources techniques

Deepgram

Google

Microsoft

Mozilla

Articles techniques

Autres

Autres ressources

Articles en français

Articles en anglais

Projets

Autres

Merci !

Retrouvez ma présentation : https://emma11y.github.io/speech-to-text-conference/
Retrouvez la transcription écrite de ma présentation : https://github.com/emma11y/speech-to-text-conference/
Retrouvez les sources de mon projet Speech-To-Text en Angular : https://github.com/emma11y/speech-to-text

Touche	Action
`CTRL + Espace`	Page suivante avec la dernière version de NVDA ou JAWS 18
`Espace` ou `Flèche droite`	Page suivante dans les autres cas
`MAJ + CTRL + Espace`	Page précédente avec la dernière version de NVDA ou JAWS 18
`MAJ + Espace` ou `Flèche gauche`	Page précédente dans les autres cas
`Début`	Première page
`Fin`	Dernière page
`ALT + 0 (zéro)`	Sommaire