• Caméra visioconférence intelligence artificielle

    L’intelligence artificielle (IA) au service de la vidéo dans les caméras de visioconférence

    La démocratisation des  équipements de visioconférence dans les entreprises s’accompagne d’un fort développement des innovations technologiques, la promesse des marques étant de proposer des produits permettant de vivre une expérience de réunion similaire que ce soit à distance ou dans la salle de réunion. Pour ce faire, les performances audio et vidéo sont sans cesse améliorées, et pour y parvenir, les fabricants utilisent l’intelligence artificielle, aussi appelée IA ou AI.

     

    Cet ensemble de théories et de techniques qui a pour but de simuler l’intelligence humaine, donne la possibilité d’automatiser certaines actions et d’augmenter significativement la qualité des échanges audio et vidéo. A l'origine utilisée dans le monde de la vidéosurveillance, la caméra intelligente devient aujourd'hui un standard pour la visio.

    Première partie de ce tour d'horizon de l'intelligence artificielle dans le matériel de visioconférence professionnel : la vidéo. Nous aborderons ensuite le sujet de l'audio et de l'analyse de données, toujours par le prisme des caméras Poly, marque américaine leader du marché de la visioconférence.

     

    Découvrez les caméras Poly

    Pour qu’une visioconférence se déroule au mieux, il est nécessaire d’être correctement vu et entendu par ses interlocuteurs. C’est pourquoi, les caméras disponibles sur le marché ne se contentent pas seulement de capturer une image brute. 

    Dans un premier temps, les marques se sont attelées à améliorer la qualité de l’image, via des réglages automatiques, avant d’aller plus loin et de se servir de l’intelligence artificielle pour remplacer la télécommande et les logiciels de contrôle manuel.


    La gestion des conditions d'éclairage

    La majorité des webcams individuelles et caméras pour salle de réunion sont capables d’optimiser automatiquement les réglages pour offrir des images avec un rendu naturel et lumineux en toutes circonstances. L’utilisateur n’a plus besoin de se préoccuper des paramétrages de sa caméra et peut lancer sa visio avec la certitude d’être correctement vu.

    Gestion condition d'éclairage - Caméra visioconférence

    Parmi les paramètres qui sont automatiquement corrigés, on retrouve :

    • Les bruits vidéo, qui se caractérisent par l'apparition de grains sur l'image et qui dégradent la qualité de celle-ci,
    • La faible luminosité, lorsque la caméra est placée dans une pièce mal éclairée,
    • La saturation, qui révèle une image aux couleurs très vives et peu naturelles,
    • La balance des blancs, qui corrige la température des couleurs pour que le blanc ne soit pas jaune ou bleuté, mais bien blanc,
    • Le contre-jour, lorsque la lumière vient de derrière la caméra et que l'image s'obscurcie,
    • etc.

    C’est par exemple le cas pour la webcam professionnelle Poly Studio P5 qui dispose de la compensation automatique en cas de faible luminosité et qui offre des images aux couleurs naturelles. Elle se dote également de l’autofocus

    Découvrez la Webcam Poly Studio P5


    La mise au point automatique

    La mise au point automatique - ou autofocus - est un dispositif présent dans les caméras, qui permet de ne jamais être flou à l’image. Plus précisément, elle règle la netteté en fonction de la distance qui sépare la personne de la caméra. Ainsi, même en mouvement, le participant reste toujours nette et visible par les interlocuteurs. 

    Si la plus grande partie des caméras sont aujourd’hui dotées d’un autofocus, il reste des webcams avec un focus fixe. Ce dernier ne fait pas de différence entre le sujet et l'arrière-plan. Plus exigent, il demande à ce que la personne ne soit pas trop éloignée de la caméra et qu'elle ne soit pas en mouvement.

    L'autofocus offre une plus grande liberté à l'utilisateur, qui n'a pas à réfléchir à la distance à laquelle il doit se placer, ni de ces déplacements. La caméra le rendra nette, dans toutes les situations .


    Le recadrage automatique autour des participants ou auto-framing

    Fini les réglages à la télécommande pour contrôler le zoom de la caméra, avec une caméra AI, l’image se recadre automatiquement autour des participants. C’est ce qu’on appelle l’auto-framing

    Grâce à l’intelligence artificielle, la caméra se dote d'un système de reconnaissance faciale et comprend où se situent les participants dans la salle. Ainsi, s’il n’y a que 3 personnes dans une grande salle et qu’elles se trouvent assez éloignées de la caméra, celle-ci va pouvoir zoomer pour qu’elles soient correctement visibles par les interlocuteurs. Si une personne supplémentaire entre dans la pièce, le cadre va s’élargir pour entrer dans le champ de vision de la caméra et si, au contraire, quelqu’un quitte la réunion, l’image va se resserrer sur les participants restants. 

    Chez Poly, cette technologie est intégrée dès le modèle Poly Studio P15 adaptée à un usage individuelle ou dans une focus room.

    Caméra visioconférence auto-framing

    Découvrez les caméras Poly avec recadrage auto


    Le zoom sur l’orateur ou speaker-tracking

    Autre mode de visualisation, le speaker-tracking fait un zoom serré sur la personne qui parle, et peut effectuer un suivi automatique dans ses déplacements. Cette technologie peut fonctionner de 2 façons. Soit l’intelligence artificielle va utiliser les microphones de la caméra pour localiser les voix, soit elle va détecter les silhouettes humaines. La détection de la silhouette est souvent appelée “mode présentation”. 

    Dans le cas de la localisation de la voix, l'objectif de la caméra fait un zoom et cadre sur la personne qui prend la parole puis revient en plan large dès qu’elle s’arrête de parler. Dans le cadre d'une visioconférence dans une salle de réunion, les interlocuteurs ont une meilleure vision de la personne qui parle parmi les différents participants présents. 

    La fonction de zoom sur l'orateur est présente dans l’ensemble des solutions pour salle de visioconférence Poly, et notamment dans la gamme Studio X avec le Poly DirectorAI.

    Caméra avec PolyDirectorAI

    Découvrez les caméras Poly avec Zoom sur l'orateur

    Pour la détection de la silhouette, c’est un peu différent puisque la caméra va continuer de suivre l'orateur jusqu’à ce qu’elle ait une indication qui lui fasse changer de personne. Cette indication peut venir d’un clic sur la télécommande, d’un geste de main… C'est une fonctionnalité que l'on retrouve majoritairement dans les caméras PTZ pour conférencier seul sur scène.

    Découvrez les caméras autosuiveuses


    Le mode conversation

    Encore plus poussé que le zoom sur l'orateur, le mode conversation permet de zoomer sur 2 orateurs simultanément. Il affiche alors de façon séparée 2 personnes présentent dans la même pièce (mais non obligatoirement côte à côte) qui prennent la parole conjointement.

    Ce système pallie au problème du speaker-tracking qui ne cadre que sur une personne à la fois, ce qui peut entraîner un changement d'image rapide et désagréable lors d'un débat entre 2 orateurs. On retrouve cette fonctionnalité sur la barre de collaboration tout en un Poly Studio USB.

    Mode Conversation Poly

    Découvrez la barre vidéo Poly Studio USB


    L'incrustation d'image ou picture-in-picture (PiP)

    Disponible le plus souvent sur les caméras ayant un double objectif, la fonction PiP permet d'avoir 2 images à l'écran. La première en plein écran, la seconde dans une petite fenêtre venant se placer sur l'image principale. 

    Grâce au Picture-in-Picture, vous pouvez garder une vision globale de la salle de réunion, même lorsque le speaker-tracking est activé et fait un zoom sur l'un des participants. 

    Caméra Picture in Picture


    L'affichage vignette des participants

    Dernière technologie développée par les marques de matériel de visioconférence, l’affichage en vignettes est la manière la plus immersive de faire des conférences vidéo actuellement.

    En fonction des marques, on retrouvera ce mode d'affichage sous le nom de :

    La caméra IA est capable de reconnaître chaque participant et de le représenter individuellement dans une case unique. Ainsi, les personnes dans la salle de réunion sont tous représentés de la même manière à l'écran. Grâce à cette fonction, les détails des expressions du visage et le langage corporel sont beaucoup plus visibles.

    Cette fonctionnalité se retrouve notamment dans la barre audio vidéo tout en un, Poly Studio X70, conçue pour les grandes salles de réunion. 

    Caméra visioconférence Smart Gallery

    Découvrez la barre Poly Studio X70

    IntelliFrame Cloud dans les salles Microsoft Teams

    Pour que chaque participant soit affiché de manière équitable, Microsoft Teams a développé son propre système. Cette solution n’est pas matérielle mais logicielle. Nommée IntelliFrame, elle permet aux participants d’être affichés dans une vignette individuelle (jusqu’à 9 vignettes maximum). IntelliFrame Cloud est utilisé dans le cadre d’une salle de réunion intelligente, Microsoft Teams Rooms. Pour bénéficier de la fonctionnalité IntelliFrame, l’entreprise doit disposer d'une licence MTR Pro. Dans ce cas de figure, la caméra utilisée ne nécessite pas d'intégrer l'intelligence artificielle nécessaire à l'affichage vignette car le découpage est directement pris en charge par Microsoft Teams. La liste des caméras prenant en charge l'IntelliFrame est à retrouver sur le site de Microsoft.


    Le périmètre de captation vidéo, barrière visuelle

    poly director AI perimeter

    Pour une captation vidéo précise, certains fabricants proposent une fonctionnalité pouvant être qualifiée de “barrière visuelle”. Le but est de définir un périmètre dans lequel la caméra capte les visages (lors du recadrage automatique). Toutes les personnes situées en dehors de la zone de captation prédéfinie ne sont pas prises en compte par la caméra. Cette fonctionnalité est particulièrement utile dans les espaces où des cloisons en verre sont présentes, car cela évite les personnes présentes dans le couloir soient captées par inadvertance. Selon les marques, on trouve cette fonctionnalité sous le nom de :

    • Vidéo Fence chez Yealink
    • Caméra Zone chez Yealink
    • Director AI Perimeter chez Poly
    • Intelligent Meeting Space chez Jabra

    L'avenir de l'intelligence artificielle pour les caméras de visioconférence

    Intelligence Artificielle NVIDIA Eye ContactL'intelligence artificielle ne cesse de se développer. En 2023, de nouvelles options vont encore voir le jour et s'intégrer dans le matériel de visioconférence professionnel. Parmi les fonctionnalités les plus attendues, se trouvent celles présentées par NVIDIA : 

    • L'EyeContact aligne automatiquement le regard avec la caméra de sorte que l'on ait l'impression que la personne regarde toujours l'objectif, même quand ce n'est pas le cas.

    • La traduction des paroles en temps réel avec synthèse vocale et synchronisation des lèvres permet à des personnes du monde entier de collaborer plus simplement.

    Vous souhaitez en savoir plus sur l'intelligence artificielle dans les caméras de visioconférence ? Consultez nos pages sur les fonctionnalités audio et sur l'analyse de données. Et pour tout conseil sur les produits Poly, prenez contact avec notre équipe d'experts. OfficeEasy est revendeur agrée Poly