Seeing Ai de Microsoft - Version 4.1.1

L'essentiel

La chaîne monde - Seeing AI
  • Date de publication :
  • Mots-clés :
  • Créée pour les personnes déficientes visuelles et disponible gratuitement sous iOS, l’application Seeing AI est compatible avec le lecteur d’écran Voice Over. Elle utilise la caméra du smartphone et l’intelligence artificielle pour donner une description de l’environnement par l’intermédiaire d’un carrousel de fonctionnalités appelées « chaines » par l’application : lecture de texte imprimé, reconnaissance de produits par leurs codes-barres, reconnaissance de visages, des éléments de l’environnement proche ou ceux d’une capture photo, identification des billets de banques, des couleurs, détection du niveau de luminosité…

Les nouveautés de la version 4.1.1

  • Exploration des photos au toucher pour obtenir la description des éléments présents sur la photo en appuyant le doigt sur une les différentes parties de l’image. Cette fonction est également disponible pour des photos stockées sur le smartphone ou pour celles en provenance des réseaux sociaux…
  • Prise en charge des tablettes iPad et de leurs capacités d’affichage plus grande que sur un smartphone.
  • Personnalisation de l’ordre d’affichage des chaînes afin d’accéder plus rapidement aux fonctionnalités les plus utilisées.
  • Reconnaissance faciale par la chaine « personne » avec émissions de bips lors de l’analyse d’une photo invoquée par le menu contextuel d’une application tierce.

Utilisation

Au démarrage de l’application, l’interface de Seeing AI propose neuf chaînes représentées par des vignettes au bas de l’écran, chacune correspondant aux neuf fonctions permettant une représentation auditive des éléments de l’environnement capturés par la caméra du mobile.

Les canaux « Texte court » et « Document » permettent la reconnaissance de caractères et la lecture audio des textes au survol de la caméra du smartphone ou après une prise de vue secondée par un repérage auditif des bords du document. 

« Produit » localise et identifie les code-barres des produits de consommation.

« Personne » effectue une reconnaissance faciale des individus avec une description de leurs caractéristiques et émotions.

« Billets » donne la valeur faciale des billets de banque.

« Scène » pour une décrit le contenu d’une capture effectuée par le smartphone.

La chaîne « Monde » informe en temps des éléments présent lors du balayage de l’environnement par la caméra. Cette fonction utilise la technologie LIDAR du mobile pour analyser la distance entre le smartphone et l’objet détecté et permet de poser une balise afin d’être guidé vers un objet repéré.

« Couleur » détecte et énonce la couleur pointée par la caméra.

Manuels d'utilisation fournis

  • Aide utilisateur en ligne / tutoriels
    • oui ( https://www.microsoft.com/fr-fr/ai/seeing-ai )
    • Langue : français (choix de la langue des sous-titres pour les vidéos)
  • Accessibilité des document / contenus web
    • bonne
  • Manuel d’utilisation ou guide de référence rapide imprimé « en noir »
    • non
  • Manuel d’utilisation ou guide de référence rapide en braille
    • non
  • Manuel d’utilisation ou guide de référence rapide audio
    • non

Seeing AI version 4.1.1

Titre affiché : Seeing AI lecture de textes en temps réel par la chaîne « Texte court ».

  • Message audio : « Texte court ».
  • Vidéo : une boîte de conserve apparaît sur l’écran.
  • Message audio : « conserverie depuis 1877, foie de morue au citron ».

Titre affiché : Seeing AI lecture de texte par la chaîne « Document ».

  • Message audio : « Document ».
  • Vidéo : une page de texte est progressivement visualisée dans son ensemble.
  • Message audio : bord visible, bords haut et gauche non visibles, ne bouger plus. Traitement en cours…
  • Émission de bips pendant le traitement.
  • Lecture du texte reconnu : Postérité. La Joconde exprime le bonheur et la sérénité dans le silence d’un sourire. Célèbre entre tous, ce portrait connait une destinée pour le moins paradoxale. Volé ou détourné, mais incontournable, il fait l’unanimité, il inspire, il agace.

Titre affiché : Seeing AI détection de code barre par la chaîne « Produit »

  • Message audio : « Produit »
  • Vidéo : une boîte de sel est tournée devant la caméra du smartphone jusqu’à visualisation du code barre.
  • Émission de bips pendant le traitement.
  • Message audio et affichage : « Traitement en cours… »
  • Message audio et affichage : Sel fin iodé Fluoré

Titre affiché : Seeing AI reconnaissance faciale par la chaîne « Personne »

  • Message audio : « Personne »
  • Le portrait d’Albert Einstein apparaît à l’écran
  • Message audio : Albert à proximité de bord inférieur à moins d’un mètre
  • Le portrait de Marilyn Monroe apparaît à l’écran
  • Message audio : Marilyn à proximité de bord inférieur à moins d’un mètre
  • Le portrait de Winston Churchill apparaît à l’écran
  • Message audio : Winston à proximité de center inférieur à moins d’un mètre

Titre affiché : Seeing AI valeur faciale de billets de banque par la chaîne « Billet »

  • Un billet de 10 euros est glissé sous l’optique du smartphone
  • Message audio : 10 euros
  • Le billet de 10 euros est enlevé, un billet de 5 euros est glissé sous l’optique du smartphone
  • Message audio : 5 euros
  • Le billet de 5 euros est enlevé, un billet de 20 euros est glissé sous l’optique du smartphone
  • Message audio : 20 euros

Titre affiché : Seeing AI identification des éléments d’une photo par la chaîne « Scène »

  • Prise en hauteur d’une photo montrant une série d’immeuble, une rue, des voitures stationnées et des piétons sur le trottoir
  • Émission de bips pendant le traitement.
  • Message audio et affichage : « Traitement en cours… »
  • Message audio et affichage : probablement une rue avec des voitures et des bâtiments

Titre affiché : Seeing AI identification des éléments capturés en temps réel par la chaîne « Monde »

  • La caméra du mobile est déplacée lentement sur 360°
  • Message audio et affichage sur les éléments détectés pendant la prise de vue : écran, chaise, clavier, table, tasse, bouteille, téléphone mobile, tasse, clavier, écran, livre, écran, écran, table, chaise, chaise, chaise, écran, écran, table, chaise, chaise.
  • Sur ce dernier élément le menu contextuel est appelé et affiché à l’écran
  • Affichage des derniers éléments détectés et de leurs éloignements par rapport au mobile
  • Pose d’une balise sur l’élément chaise le plus proche
  • Retour à la visualisation en temps réel de l’environnement
  • Signaux sonores avec identification par flèches directive et indication de la distance vers l’objet balisé
  • Émission d’un signal sonore spécifique lorsque l’objet balisé se trouve à portée

Titre affiché : Seeing AI Détection de couleur par la chaîne « Couleur »

  • L‘optique du mobile es déplacée au-dessus de trois éléments de couleurs jaune, bleu et mauve puis revient à sa position initiale
  • Message audio : jaune, bleu, rose, bleu, jaune

Titre affiché : Seeing AI Détection du niveau de luminosité par la chaîne « Luminosité »

  • L’optique du mobile est déplacée dans la pièce des zones les plus sombres vers une zone éclairée par une lampe
  • Émission de signaux sonores de plus en plus aigüe au fur et à mesure du déplacement de l’optique vers les zones les plus lumineuses