IA POLY google beam

IA POLY

L’intelligence artificielle (IA) au service de la vidéo dans les caméras de visioconférence

Découvrez les caméras poly

La démocratisation des  équipements de visioconférence dans les entreprises s’accompagne d’un fort développement des innovations technologiques, la promesse des marques étant de proposer des produits permettant de vivre une expérience de réunion similaire que ce soit à distance ou dans la salle de réunion. Pour ce faire, les performances audio et vidéo sont sans cesse améliorées, et pour y parvenir, les fabricants utilisent l’intelligence artificielle, aussi appelée IA ou AI.

Cet ensemble de théories et de techniques qui a pour but de simuler l’intelligence humaine, donne la possibilité d’automatiser certaines actions et d’augmenter significativement la qualité des échanges audio et vidéo. A l'origine utilisée dans le monde de la vidéosurveillance, la caméra intelligente  devient aujourd'hui un standard pour la visio.

Première partie de ce tour d'horizon de l'intelligence artificielle dans le matériel de visioconférence professionnel : la vidéo. Nous aborderons ensuite le sujet de l'audio et de l' analyse de données , toujours par le prisme des caméras HP Poly, marque américaine leader du marché de la visioconférence.

Pour qu’une visioconférence se déroule au mieux, il est nécessaire d’être correctement vu et entendu par ses interlocuteurs. C’est pourquoi, les caméras disponibles sur le marché ne se contentent pas seulement de capturer une image brute. 

Dans un premier temps, les marques se sont attelées à améliorer la qualité de l’image, via des réglages automatiques, avant d’aller plus loin et de se servir de l’intelligence artificielle pour remplacer la télécommande et les logiciels de contrôle manuel en proposant différents modes de cadrages pour optimiser l'affichage des participants.

Caméra visioconférence intelligence artificielle

 

eclairage

La gestion des conditions d'éclairage

La majorité des webcams individuelles et caméras pour salle de réunion sont capables d’optimiser automatiquement les réglages pour offrir des images avec un rendu naturel et lumineux en toutes circonstances. L’utilisateur n’a plus besoin de se préoccuper des paramétrages de sa caméra et peut lancer sa visio avec la certitude d’être correctement vu.

Parmi les paramètres qui sont automatiquement corrigés, on retrouve :

•Les bruits vidéo, qui se caractérisent par l'apparition de grains sur l'image et qui dégradent la qualité de celle-ci,
•La faible luminosité, lorsque la caméra est placée dans une pièce mal éclairée,
•La saturation, qui révèle une image aux couleurs très vives et peu naturelles,
•La balance des blancs, qui corrige la température des couleurs pour que le blanc ne soit pas jaune ou bleuté, mais bien blanc,
•Le contre-jour, lorsque la lumière vient de derrière la caméra et que l'image s'obscurcie, etc.

mise au point

La mise au point automatique

La mise au point automatique - ou autofocus - est un dispositif présent dans les caméras, qui permet de ne jamais être flou à l’image. Plus précisément, elle règle la netteté en fonction de la distance qui sépare la personne de la caméra. Ainsi, même en mouvement, le participant reste toujours nette et visible par les interlocuteurs. 

Si la plus grande partie des caméras sont aujourd’hui dotées d’un autofocus, il reste des webcams avec un focus fixe. Ce dernier ne fait pas de différence entre le sujet et l'arrière-plan. Plus exigent, il demande à ce que la personne ne soit pas trop éloignée de la caméra et qu'elle ne soit pas en mouvement.

L'autofocus offre une plus grande liberté à l'utilisateur, qui n'a pas à réfléchir à la distance à laquelle il doit se placer, ni de ces déplacements. La caméra le rendra nette, dans toutes les situations.

poly x72

 

 

recadrage automatique par IA

L'auto-framing : Le recadrage automatique autour des participants

Fini les réglages à la télécommande pour contrôler le zoom de la caméra, avec une caméra AI, l’image se recadre automatiquement autour des participants. C’est ce qu’on appelle l’auto-framing.

Grâce à l’intelligence artificielle, la caméra se dote d'un système de reconnaissance faciale et comprend où se situent les participants dans la salle. Ainsi, s’il n’y a que 3 personnes dans une grande salle et qu’elles se trouvent assez éloignées de la caméra, celle-ci va pouvoir zoomer pour qu’elles soient correctement visibles par les interlocuteurs. Si une personne supplémentaire entre dans la pièce, le cadre va s’élargir pour entrer dans le champ de vision de la caméra et si, au contraire, quelqu’un quitte la réunion, l’image va se resserrer sur les participants restants. Le but est d'optimiser au maximum le cadrage et l'espace libre autour des participants.

Caméra visioconférence auto-framing

 

zoom

Le cadrage de l'intervenant : zoom sur l’orateur

Autre mode de visualisation, le cadrage de l'intervenant fait un zoom serré sur la personne qui parle.

Cette technologie peut fonctionner de 2 façons. Soit l’intelligence artificielle va utiliser les microphones de la caméra pour localiser les voix, soit elle va détecter les silhouettes humaines. La détection de la silhouette est souvent appelée “mode présentation”. 

Dans le cas de la localisation de la voix, l'objectif de la caméra fait un zoom et cadre sur la personne qui prend la parole puis revient en plan large dès qu’elle s’arrête de parler. Dans le cadre d'une visioconférence dans une salle de réunion, les interlocuteurs ont une meilleure vision de la personne qui parle parmi les différents participants présents. 

La fonction de zoom sur l'orateur est présente dans l’ensemble des solutions pour salle de visioconférence Poly, et notamment dans la gamme Studio X gen 2 avec le Poly DirectorAI.

Pour la détection de la silhouette, c’est un peu différent puisque la caméra va continuer de suivre l'orateur jusqu’à ce qu’elle ait une indication qui lui fasse changer de personne. Cette indication peut venir d’un clic sur la télécommande, d’un geste de main… C'est une fonctionnalité que l'on retrouve majoritairement dans les caméras PTZ pour conférencier seul sur scène.

suivi

Le speaker-tracking : suivi de l'orateur

En plus du Zoom sur l'orateur, la caméra peut avoir une fonction de Speaker Tracking. Dans ce cas, en plus de réaliser un zoom serré sur l'orateur, elle effectue un suivi automatique, en temps réel, dans ses déplacements afin qu'il reste à l'image même s'il bouge. Ce mode est utilisé lors de présentations, de formations ou autre type d'événement public.

Caméra avec PolyDirectorAI

 

Suivi

Le mode conversation

Encore plus poussé que le zoom sur l'orateur, le mode conversation permet de zoomer sur 2 orateurs simultanément. Il affiche alors de façon séparée 2 personnes présentent dans la même pièce (mais non obligatoirement côte à côte) qui prennent la parole conjointement.

Ce système pallie au problème du speaker-tracking qui ne cadre que sur une personne à la fois, ce qui peut entraîner un changement d'image rapide et désagréable lors d'un débat entre 2 orateurs. On retrouve cette fonctionnalité sur la barre de collaboration tout en un Poly Studio USB.

Mode Conversation Poly

 

affichage individuel

L'affichage vignette des participants

Dernière technologie développée par les marques de matériel de visioconférence, l’affichage en vignettes est la manière la plus immersive de faire des conférences vidéo actuellement.

En fonction des marques, on retrouvera ce mode d'affichage sous le nom de :

People Framing ou Smart Gallery chez Poly
Neat Symmetry chez Neat
Smart Gallery chez AVer
Multi Focus Framing chez Yealink
Dynamic Composition ou Gallery View chez Jabra
RightSight 2 Grid view chez Logitech

La caméra IA est capable de reconnaître chaque participant et de le représenter individuellement dans une case unique. Ainsi, les personnes dans la salle de réunion sont tous représentés de la même manière à l'écran. Grâce à cette fonction, les détails des expressions du visage et le langage corporel sont beaucoup plus visibles.

Cette fonctionnalité se retrouve dans la plupart des barres de visioconférence HP Poly, notamment dans la barre audio vidéo tout en un, HP Poly Studio V72 , conçue pour les grandes salles de réunion.

Caméra visioconférence Smart Gallery

 

microsoft teams

IntelliFrame Cloud dans les salles Microsoft Teams

Pour que chaque participant soit affiché de manière équitable, Microsoft Teams a développé son propre système. Cette solution n’est pas matérielle mais logicielle. Nommée IntelliFrame, elle permet aux participants d’être affichés dans une vignette individuelle (jusqu’à 9 vignettes maximum). IntelliFrame Cloud est utilisé dans le cadre d’une salle de réunion intelligente, Microsoft Teams Rooms. Pour bénéficier de la fonctionnalité IntelliFrame, l’entreprise doit disposer d'une licence MTR Pro. Dans ce cas de figure, la caméra utilisée ne nécessite pas d'intégrer l'intelligence artificielle nécessaire à l'affichage vignette car le découpage est directement pris en charge par Microsoft Teams. La liste des caméras prenant en charge l'IntelliFrame est à retrouver sur le site de Microsoft.

mtr poly

 

video fence

Le périmètre de captation vidéo, barrière visuelle

Pour une captation vidéo précise, certains fabricants proposent une fonctionnalité pouvant être qualifiée de “barrière visuelle”. Le but est de définir un périmètre dans lequel la caméra capte les visages (lors du recadrage automatique). Toutes les personnes situées en dehors de la zone de captation prédéfinie ne sont pas prises en compte par la caméra. Cette fonctionnalité est particulièrement utile dans les espaces où des cloisons en verre sont présentes, car cela évite les personnes présentes dans le couloir soient captées par inadvertance. Selon les marques, on trouve cette fonctionnalité sous le nom de :

Vidéo Fence chez Yealink
Director AI Perimeter chez HP Poly
Intelligent Meeting Space chez Jabra

poly director AI perimeter

 

google beam

L'avenir de l'intelligence artificielle pour les caméras de visioconférence

L'intelligence artificielle ne cesse de se développer. En 2025, HP Poly annonce la sortie de Google Beam : un projet de visioconférene 3D immersif conçu pour plus de dimension humaine, même dans les échanges à distance.

Vous souhaitez en savoir plus sur l'intelligence artificielle dans les caméras de visioconférence ? Consultez nos pages sur les fonctionnalités audio et sur l' analyse de données . Et pour tout conseil sur les produits Poly, prenez contact avec notre équipe d'experts, gratuitement, par téléphone ou via le chat.

Intelligence Artificielle NVIDIA Eye Contact

par Chloé Caille le mardi 15 juillet 2025