API Speech-To-Text : quelles sont ses avantages et ses limites ?
Emmanuelle ABOAF
Ma présentation version speech-to-text
bonjour je m'appelle emmanuel et je suis développeuse chez des hub des robes et un et binet de haïti spécialisée dans le développement le lahoud n'y a l'abbaye et la data mes sacs préférés sont ces sharp dunet et anular le bail gens entrent régulièrement et t'as un problème de time à haute je m'intéresse également aux aspects de l'intelligence artificielle notamment le speech tout texte thème on va aborder aujourd'hui étant sourde je lutte jour pour la cessibilité dans mon monde idéal tout doit être accessible aussi bien dans la vraie vie et dans le web
Bonjour, je m'appelle Emmanuelle et je suis développeuse chez Dcube. Dcube est un cabinet de conseil IT spécialisé dans le développement, le cloud, l'IA, la BI et la data. Mes stacks préférés sont C# .NET et Angular. Le bug que je rencontre régulièrement est un problème de timeout. Je m'intéresse également aux aspects de l'intelligence artificielle notamment le Speech-To-Text, thème qu'on va aborder aujourd'hui. Etant sourde, je lutte chaque jour pour l'accessiblité. Dans mon monde idéal, tout doit accessible aussi bien dans la vraie vie que dans le Web.
Mon expérience
Démos
Démo 1 : Samuel
Texte à vocaliser
Les services publics numériques et certains services privés ont l'obligation d'être accessibles de façon équivalente à tout citoyen, qu'il soit ou non en situation de handicap (visuel, auditif, moteur, trouble dys...). Un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous. Pour faciliter la mise en œuvre de l'accessibilité numérique, la DINUM édite depuis 2009 le référentiel général d'amélioration de l'accessibilité – RGAA, créé pour mettre en œuvre l'article 47 de la loi handicap de 2005 et son décret d'application actualisé en 2019. Il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du Web mais aussi aux changements de normes et réglementations.
Deepgram
Les services publics numérique et certains services privées ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'elle soit ou non en situation de handicap visuel auditif moteur troubles 10 etc un service numérique accessible plus facile à utiliser pour les personnes handicapées et de qualité pour tous faciliter la mise en oeuvre de l'accessibilité numérique la et dite depuis 2009 le référentiel général d'amélioration de l'accessibilité rg créée pour mettre en oeuvre l'article 47 dans la loi handicap 2005 et son décret d'application actu en 2019 fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web et aussi au changements de normes et réglementations
77,78 % de réussite
Les services publics numérique et certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'ils soient ou non en situation de handicap visuel auditif moteur trouble et cetera un service numérique accessible et plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en œuvre de l'accessibilité numérique l'a dit num et depuis 2009 le référentiel général d'amélioration de l'accessibilité RG2 a créé pour mettre en œuvre l'article 47 de la loi Handicap 2005 et son décret d'applicationactualisant demain il fait régulièrement l'objet de nouvelle version est mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations
85,47 % de réussite
Microsoft
les services publics numériques et certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'il soit ou non en situation de handicap visuel auditif moteur trouble 10 et cetera un service numérique accessible et plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en œuvre de l'accessibilité numérique la dinum édite depuis 2009 le référentiel général d'amélioration de l'accessibilité RG 2A crée pour mettre en œuvre l'article 47 de la loi handicap de 2005 et son décret d'application actualité en 2019 il fait réulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations
94,87% de réussite
Mozilla
les services publics numérique certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'ils soient ou non en situation de handicap visuel auditif moteur trouble.dys cetera un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en œuvre de l'accessibilité numérique l'a dit num et dit depuis 2009 le référentiel général d'amélioration de l'accessibilité RG2 a créé pour mettre en œuvre l'article 47 de la loi Handicap 2005 et son décret d'application actualiser en 2019 il fait régulièrement l'objet de nouvelle version est mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations.
86,32% de réussite
Démo 2 : Anne-Laure
Texte à vocaliser
Les services publics numériques et certains services privés ont l'obligation d'être accessibles de façon équivalente à tout citoyen, qu'il soit ou non en situation de handicap (visuel, auditif, moteur, trouble dys...). Un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous. Pour faciliter la mise en œuvre de l'accessibilité numérique, la DINUM édite depuis 2009 le référentiel général d'amélioration de l'accessibilité – RGAA, créé pour mettre en œuvre l'article 47 de la loi handicap de 2005 et son décret d'application actualisé en 2019. Il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du Web mais aussi aux changements de normes et réglementations.
Deepgram
les services publics numériques et certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'il soit ou non en situation du handicap et visuel auditif moteur troubles 10 etc et un service numérique accessible est plus facile à utiliser pour les personnes handicapée et de meilleure qualité pour tous faciliter la mise en oeuvre de l'accessiblité numérique la est dite depuis 2009 le référentiel général d'amélioration de l'accessibilité rg créé pour mettre en oeuvre l'article de la loi handicap de 2005 et son décret d'application actu en 2019 il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web aussi au changement de normes et réglementations
85,47 % de réussite
les services publics numérique et certains services privés ont l'obligation d'etre accessible de façon équivalente à tout citoyen qu'ils soient ou non en situation de handicap visuel auditif moteur trouble et cetera un service numérique accessible et plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en oeuvre de l'accessibilité numérique l'a dit num et depuis 2009 le référentiel général d'amélioration de l'accessibilité RG2 a créé pour mettre en euvre l'article 47 d la loi Handicap de 2005 et son décret d'application actualiser en 2019 il fait régulièrement l'objet de nouvelle version est mise à jour pour s'adapter aux évolutions du web et aussi au changement de normes et réglementations
85,47 % de réussite
Microsoft
les services publics numériques et certains services privés ont l'obligation d'être accesible de façon équivalente à tout citoyen qu'il soit ou non en situation de handicap visuel auditif moteur trouble 10 et cetera un service numérique accessible et plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en euvre de l'accessibilité numérique la dénommée dite depuis 2009 le référentiel général d'amélioration de l'accessibilité RG 2A créée pour mettre en oeuvre l'article 47 de la loi Handicap de 2005 et son décret d'application actualisé en 2019 il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web mais aussi au changement de normes et réglémentations
91,45% de réussite
Mozilla
les services publics numérique et certains services privés ont l'obligation d'être accessible de façon équivalente à tout citoyen qu'ils soient ou non en situation handicap visuel auditif moteur trouble.dys et cetera un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous pour faciliter la mise en oeuvre de l'accessibilité numérique l'a dit num et dit depuis 2009 le référentiel général d'amélioration de l'accessibilité RG 2 a créé pour mettre en oeuvre l'article 47 de la loi Handicap de 2005 et son décret d'application actualiser en 2019 il fait régulièrement l'objet de nouvelle version est mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglémentations
87,17 % de réussite
Démo 3 : Emmanuelle
Texte à vocaliser
Les services publics numériques et certains services privés ont l'obligation d'être accessibles de façon équivalente à tout citoyen, qu'il soit ou non en situation de handicap (visuel, auditif, moteur, trouble dys...). Un service numérique accessible est plus facile à utiliser pour les personnes handicapées et de meilleure qualité pour tous. Pour faciliter la mise en œuvre de l'accessibilité numérique, la DINUM édite depuis 2009 le référentiel général d'amélioration de l'accessibilité – RGAA, créé pour mettre en œuvre l'article 47 de la loi handicap de 2005 et son décret d'application actualisé en 2019. Il fait régulièrement l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du Web mais aussi aux changements de normes et réglementations.
Deepgram
les services plus certain service privé une l'obligation d'être accessible de façon équivalente à tout citoyen ils soient où non en situation de handicap visuel auditif moteur un service numérique accessible et pu facile à utiliser pour les personnes en handicapées de meilleure qualité pour tous pour faciliter la mise en euvre de l'accessibilité inédite depuis 2009 ne référentiel général d'amélioration de l'accessibilité perché 2 pour mettre en oeuvre en de la loi on et de 2005 sont des prêts en 2019 il régulièrement l'objet de nouvelles version et mise à jour pousse la aux évolutions du web mais aussi au changements de normes et expérimentation
67,52 % de résultat
mes services numériques et certains services privés une obligation d'être incessible de façon et ils sont à tous les citoyens soient ou non en situation de handicap visuel auditif hauteur trompé dit un service numérique incessible et plus facile à utiliser pour les personnes en est de meilleure qualité pour tous pour faciliter la mise en oeuvre de la nuit depuis 2009 le référentiel général ration de la sociabilité chercher 2 ans pour mettre en oeuvre l'article 41 de la loi 2005 et son décret d'application actualiser en 2019 il fait hier m'enlève j'ai des nouvelles versions et mise à jour pour s'adapter aux évolutions du web mais aussi aux changements de normes et réglementations
74,35 % de résultat
Microsoft
les services publics numériques et certains services privés ont l'obligation d'être accessible de façon unie valente à tout citoyen il soit ou non en situation de handicap visuel audtif moteur trompé 10 un service numérique incessible et plus facile à utiliser pour les personnes handicapées et limière pour tous pour faciliter la mise en oeuvre de la cessibilité numérique qui 2009 le référentiel général d'amélioration de l'accessibilité RG 2A créée pour mettre en oeuvre l'article enceinte de la loi handicap 2005 ils sont des applications actualisées en 2009 il fait l'objet de nouvelles versions et mises à jour pour s'adapter aux évolutions du web mais aussi au changement de norme et réglementation
77,78 % de résultat
Mozilla
mes services numériques et
certains services privés
une obligation d'être
incessible de façon
et ils sont à tous citoyens ils sont
ou non en situation de handicap visuel auditif
hauteur trompé 10 un
service numérique accessible est plus facile à
utiliser pour les personnes handicapées et
demi-heure a été pour tous
pour faciliter la mise en oeuvre de l'accessibilité
et depuis 2009 le
référentiel général
Damien ration de
l'accessibilité
chercher 2 ans pour mettre
en oeuvre l'article 47 de la loi
de 2005 et son
décret d'application
actualiser en 2019 il fait
75,36 % de résultat
Biais
Problème de biais
YouTube’s auto captions consistently performed better on male voices than female voice.
More recent research has found the same effect: ASR systems make more errors for Black speakers than white speakers
For every hundred words, the systems made 19 errors for white speakers compared to 35 errors for Black speakers — nearly twice as many. That is 35% Black speakers versus 19% White speakers.
Why does this bias exist ? (...) The underlying reason may be that databases have lots of white male data, and less data on female and minority voices. For example, TED Talks are frequently analyzed by speech scientists, and 70% of TED speakers are male.
Common Voice
Version | Date | Nombre de voix | Répartition de voix masculines * | Répartition de voix féminines * |
---|---|---|---|---|
1.0 | 25/02/2019 | 1 697 | 72% | 7% |
2.0 | 11/06/2019 | 2 985 | 70% | 9% |
3.0 | 24/06/2019 | 3 005 | 70% | 9% |
4.0 | 10/12/2019 | 8 164 | 65% | 12% |
5.1 | 22/06/2020 | 11 960 | 65% | 11% |
6.1 | 11/12/2020 | 12 953 | 65% | 10% |
7.0 | 21/07/2021 | 15 391 | 63% | 11% |
8.0 | 19/01/2022 | 16 082 | 62% | 11% |
9.0 | 27/04/2022 | 16 291 | 62% | 10% |
10.0 | 04/07/2022 | 16 510 | 62% | 10% |
11.0 | 21/09/2022 | 16 785 | 61% | 10% |
* Le reste des voix proviennent des voix anonymes
Chaque voix compte.
Y compris :
- celles des femmes
- celles des personnes issues de la minorité
- celles des personnes ayant des accents
- celles des personnes ayant des voix atypiques ou déformées
- celles des personnes ayant des troubles du langage
La langue française
Nouvelle démo de Samuel
Texte à vocaliser
Samuel, développeur au sein de l'entreprise Dcube, rencontre souvent des problèmes de timeout sur les gros traitements des demandes entrantes et il n'est pas le seul. 3, 4, 5 personnes de l'équipe également dont sa collègue Emmanuelle. Leur PO tèj souvent ses US et réalise des tool-in-actions. Samuel a une chatte qui s'appelle Qwerty. Emmanuelle déteste les homonymes surtout quand elle essaie de comprendre en lisant sur les lèvres : "le ver vert va vers le verre vert".
Deepgram
samuel développeur au sein de l'entreprise des cubes rencontre souvent des problèmes de time sur les gros traitements des demandes et il n'est pas le seul 3 4 5 personnes de l'équipe également dans sa collègue emmanuel leur po souvent ses us réalise des to action mène à une chatte qui s'appelle q emmanuel déteste les homo surtout quand elle essaie de en lisant sur les lèvres le vert vers vers le vert vert
73,68 % de réussite
Samuel développeur au sein de l'entreprise de l'écume rencontre souvent des problèmes de timeout sur les gros traitements des demandes d'entente et il n'est pas le seul trois quatre cinq personnes de l'équipe également donc ca y est manuel leur POP j' souvent CUS réalisent et tu line action à une chatte s'appelle quarti Emmanuel déteste les homonymes surtout quand elle essaie de comprendre en lisant sur les lèvres le vert vert va vers le verre vert
68,42 % de réussite
Microsoft
samuel développeur au sein de l'entreprise des cubes rencontre souvent des problèmes de timeout sur les gros traitements des demandes entrantes et il n'est pas le seul 345 personnes de l'équipe également dont sa collègue emmanuel leur po tags souvent ces US réalise des tounes actions samuel a une ***** qui s'appelle qwerty emmanuel déteste les homonymes surtout quand elle essaie de comprendre en lisant sur les lèvres le verre vert va vers le verre vert
84,21 % de réussite
Mozilla
Samuel développeur au sein de l'entreprise des cubes rencontre souvent des problèmes de timeout sur les gros traitement des demandes d'entente et il n'est pas le seul trois quatre cinq personnes de l'équipe également donc sa collègue Emmanuel leur POP ais-je souvent CUS réalisent et tu line actions à mener à une chatte s'appelle quarti Emmanuel déteste les homonymes surtout quand elle essaie de comprendre en lisant sur les lèvres le verre vert va vers le verre vert
72,37 % de réussite
La langue française
- Une langue riche et complexe ;
- avec ses règles de grammaire, de conjugaison et d'orthographe ;
- ses homonymes
- des noms communs ;
- des noms propres ;
- des acronymes ;
- le langage métier, fonctionnel et technique ;
- les termes franco-anglais ;
- et même le verlan.
Mot dit | Mot transcrit automatiquement |
---|---|
timeout | time à haute / time août |
IT | Haïti |
tool in actions | tooline actions |
stack | sac |
validisme | vally 10 mhz |
demande entrante | demande en 30 |
snippets | slips |
speaker | piqueur |
DevRel | frêles |
sketchstorm | tempête |
speech-to-text | speech tout texte |
Chat GPT | Chat j'ai pété |
Je suis en train de reprendre les sous-titres automatiques d'une vidéo syndicale. Je vous présente l'orthographe automatique de validisme: vally 10 mhz
— @riroumourir 13 mars 2022
"J'étais fâché comme un pull."
— @LanguesdeCha 15 mars 2022
J'utilise un logiciel de transcription automatique pour transcrire plus rapidement des entretiens pour ma thèse. Ca marche plutôt pas mal, mais ça donne aussi lieu à qq cafouillages assez drôles.
J'adore la transcription automatique Youtube. Dans son podcast, @LostInBrittany dit qu'il est responsable des DevRel OVH. La transcription dit qu'il est responsable des frêles OVH. 🤣 Faut-il prendre ça pour une attaque perso de la part de Google ?
— @bdauvissat 29 mai 2022
La conjugaison
Nouvelle démo d'Anne-Laure
Texte à vocaliser
Annie est arrivée à la maison. Elle est arrivée à la maison. Nous, les filles, sommes arrivées à la maison.
Deepgram
Annie est arrivé à la maison. Elle est arrivée à la maison. Nous les filles sommes arrivés à la maison.
Annie est arrivé à la maison. Elle est arrivée à la maison. Nous les filles sommes arrivés à la maison.
Microsoft
Annie est arrivé à la maison. Elle est arrivée à la maison. Nous les filles sommes arrivés à la maison.
Mozilla
Annie est arrivé à la maison. Elle est arrivée à la maison. Nous les filles sommes arrivés à la maison.
- Peut-on accorder les verbes en se basant sur la voix de la personne ?
-
-
Comment deviner le sexe de la personne avec les
prénoms unisexes ou qui se ressemble :
- Dominique ou Camille est-elle une femme ou est-il un homme ?
- Est-ce Emmanuelle ou Emmanuel ?
- Annie ou Hany ?
Les mots grossiers ou familiers
*****, ça a **** ! C’est quoi ce ****** ?! Alors là, je suis sur le *** ! ******, c’est ***** ! Voilà ce que les sous-titres automatiques peuvent afficher. Ça peut être anodin pour vous mais moi, ça m’agace.
— Emmanuelle ABOAF (@eaboaf_) 23 novembre 2021
Ce matin, en testant la retranscription automatique via word/O365 comme base de mon article du dernier épisode avec @Cindyagility 🦮 (et en vue de transcription intégrale bientôt @podcaccessible !), j'ai pris un fou rire en voyant le mot "*******" 🤣 Alors vous avez trouvé ? 🐕
— Futur Chien Guide (@FuturChienGuide) 21 novembre 2021Avec ma première ****** qui n'était pas la plus facile, elle était assez têtu quand même. Ouais, heu ouais, c'était, c'était une, une gentille ****** adorable. Vraiment niveau.
Au niveau, on a dire chien de compagnie.
Elle était parfaite.
Une ****** gentille, jamais un geste plus haut que l'autre, vraiment une gentille petite ******
Arpès, au niveau du guidage, il est très têtu. Et puis au final, elle s'est avérée être un peu lente pour moi parce que moi le le chien guide enfin, ça m'a redonner une liberté comme comme à tout le monde d'ailleurs, j'ai envie de dire mais.
- Sans paramétrage, les mots grossiers et familiers sont automatiquement censurés.
- Certains mots non grossiers sont censurés car à cause de la traduction automatique français vers anglais, ils peuvent devenir grossiers.
- Censurer les mots grossiers ne rend pas l'information accessible à tous.
La ponctuation
Il y a aussi des phrases sans fin sans point et que des virgules. Avec une phrase sans fin, le sens est difficile à comprendre. Par ex avec cet épisode du podcast « La Table Ovale ». Il me faut lire mot à mot pour réaliser que là c’est la fin de la phrase et là le début.
— Emmanuelle ABOAF (@eaboaf_) 3 octobre 2021"Mais il y a un moment, enfin, souvent avec la, dans la relation avec les marques, tu vois, il y a un moment ou genre juste, ils veulent commencer à négocier alors que moi je, je veux vraiment garder la la casquette concept et artistique entre guillemets, donc cette discussion là elle est OK en direct avec les marques, ça arrive de temps en temps, pas tout le temps parce que sinon c'est chiant mais mais dès que ca parle de 2€ quoi, globalement je dis Ah non, alors je vous présente Sophie, elle est très sympa, elle est ici."
Qui parle ?
Le problème principal qu’en lisant plusieurs transcriptions automatiques sans écouter est que je ne sais pas du tout qui parle et quand on change d’interlocuteur. De plus, je ne sais pas à qui attribuer les paroles quand je lis la transcription. Il y a aucun nom.
— Emmanuelle ABOAF (eaboaf_) 3 octobre 2021
c'est pas mal pour de l'automatique, mais on a quand même du mal à savoir qui parle ou du moins quand ca change de personne.
— @cyberbaloo_ 2 juin 2022
Aujourd’hui c’est son point faible, soit l’IA en détecte trop (au moindre changement de ton ou de puissance de la voix par ex.) soit pas assez comme c’est le cas ici. Nous travaillons à l’analyse de l’image et de la ponctuation pour espérer placer des tirets où il faut.
— @matt_parmentier 29 avril 2022
Sous-titrage automatique et surdité
- Une suppléance mentale très élevée quand les sous-titres sont incomplètes ou incorrectes : on essaie de combler les trous ;
- Des solutions de sous-titrage automatique très inégales des unes des autres : on cherche toujours le meilleur outil ;
- Les voix atypiques et accents non prises en compte dans les traitements de données : l'IA ne comprend pas les personnes sourdes ou malentendantes.
Conséquence directe : les sous-titres automatiques non correctes ont un impact très important sur la vie quotidienne et professionnelle de la personne sourde ou malentendante.
Conclusion
AI is good but it’s not that good !
Tim Cook à l'université Gallaudet, le 14 mai 2022.
Mélanger l'intelligence artificielle et l'intelligence humaine
pour rendre l'expérience encore meilleure.
-
Ce qui signifie que vous pouvez :
- Utiliser les outils automatiques
- et corriger les fautes générées de la reconnaissance vocale
-
Si vous voulez que la reconnaissance vocale fonctionne bien
pour vous :
- Soyez près de votre micro (et par la même occasion, ayez un bon micro)
- Minimiser les bruits en arrière-plan
- Parlez très clairement et pas trop vite
Le sous-titrage en temps réel au quotidien
sur vos ordinateurs, tablettes et téléphones.
- Lorsque vous faites une présentation avec PowerPoint
- Lorsque vous dictez avec la Dictée vocale sous Word
- Lorsque vous dictez avec la Saisie vocale sous Google Docs
- Lorsque vous voulez faire sous-titrer une conversation avec Microsoft Translator
- Lorsque vous voulez faire sous-titrer une conversation avec Live Transcribe de Google sous Android
- Lorsque vous voulez faire sous-titrer vos conversations, vos appels ou vos vidéos Live Captions d'Apple (prochainement disponible sous IOS 16 sur les terminaux IPhone, IPad et Mac)
- Dès qu'il y a du son sur votre PC, ça sous-titre avec Live Captions de Microsoft sous Windows 11 (disponible en anglais, prochainement en français)
- Et pleins d'autres outils automatiques...
Critères RGAA
Critère 4.1. Chaque média temporel pré-enregistré a-t-il, si nécessaire, une transcription textuelle ou une audiodescription (hors cas particuliers) ?
Critère 4.2. Pour chaque média temporel pré-enregistré ayant une transcription textuelle ou une audiodescription synchronisée, celles-ci sont-elles pertinentes (hors cas particuliers) ?
Critère 4.3. Chaque média temporel synchronisé pré-enregistré a-t-il, si nécessaire, des sous-titres synchronisés (hors cas particuliers) ?
Critère 4.4. Pour chaque média temporel synchronisé pré-enregistré ayant des sous-titres synchronisés, ces sous-titres sont-ils pertinents ?
- Média temporel seulement audio : contenu sonore (Wav, Mp3…) ;
- Média temporel seulement vidéo : images ou photos en mouvement ou en séquence ;
-
Média temporel synchronisé : flux audio ou vidéo
synchronisé avec un autre format pour présenter de
l’information et/ou comportant des composants
temporels interactifs. Un média temporel peut être
consulté de 2 manières différentes :
- Fichier à télécharger consultable avec un logiciel externe à la page web ;
-
Contenu embarqué dans la page web et consultable
dans la page web via :
- Un plugin (par exemple une vidéo diffusée par un lecteur Flash) ;
-
L’élément
video
(par exemple une vidéo) ; -
L’élément
audio
(par exemple un podcast) ; -
L’élément
svg
(par exemple un dessin animé vectoriel) ; -
L’élément
canvas
(par exemple un dessin animé en image bitmap) ; -
L’élément
bgsound
pour diffuser un arrière-plan sonore à la page web.
Un média temporel peut être diffusé en temps réel ou être proposé en lecture de manière asynchrone (média pré-enregistré).
Règle Opquast
Règle n° 116 - Chaque contenu audio et vidéo est accompagné de sa transcription textuelle.
Les vidéos et sons contiennent des textes qui ne sont pas perceptibles par les non-voyants, les sourds ou les moteurs de recherche. Cette bonne pratique montre comment faire en sorte que ces contenus soient lisibles et indexés.
Expérimentation de France TV Lab
Testez et évaluez la solution de sous-titrage automatique de franceinfo
Ressources techniques
Autres ressources
Articles en français
- La traduction automatique statistique, comment ça marche ?
- Reconnaissance vocale et respect de la vie privée : la voix Inria se fait entendre
Articles en anglais
Merci !
- Retrouvez ma présentation : https://emma11y.github.io/speech-to-text-conference/
- Retrouvez la transcription écrite de ma présentation : https://github.com/emma11y/speech-to-text-conference/
- Retrouvez les sources de mon projet Speech-To-Text en Angular : https://github.com/emma11y/speech-to-text