Articles Tagués ‘DeepMind’

quake2

Chers amis lecteurs, comme vous le savez, j’ai aujourd’hui de nouvelles responsabilités. Je prends à compter de ce jour avec enthousiasme et fierté la direction de la nouvelle Agence de l’Innovation de Défense du Ministère des Armées. Je ne cesserai pas d’écrire dans ce blog, à titre personnel, mais je dois avouer que ces jours, et ces dernières semaines, la préparation de la création de l’Agence a pris la totalité de mon temps de cerveau disponible.

Je vous promets donc très rapidement de reprendre le cours normal de ce blog, d’autant que de nombreuses technologies utiles pour la défense font aujourd’hui l’actualité: malwares utilisant l’IA, course à l’hypervélocité, ou agents coopératifs intelligents… Tiens, juste pour pour vous mettre en appétit: connaissez vous Quake III Arena? C’est un jeu connu depuis… oulah, pas mal de temps, qui consiste à opposer deux équipes dans un environnement en 3D temps réel, chaque équipe ayant pour objectif de capturer le pavillon de l’ennemi.

Pour la première fois, une équipe de 2 agents dotés d’intelligence artificielle a battu une équipe humaine très expérimentée. Bon, dit comme cela, rien d’étonnant… sauf que l’IA n’a pas utilisé d’informations numériques (distance entre les adversaires, statut de chaque entité…) mais a appris toute seule à comprendre l’environnement virtuel 3D présenté à l’écran, comme le ferait un joueur humain. L’IA a ainsi appris de manière autonome, en jouant 450 000 parties contre elle-même. Le résultat: l’équipe « IA » (en réalité celle de Google Deepmind) a gagné avec un taux de 74% de réussite contre des joueurs humains aguerris (65% dans un jeu de 4 contre 4, ce qui est toujours mieux que des adversaires humains). Dans le graphe ci-dessous, l’IA correspond à l’équipe FTW.

CTF_Fig_Tagging_180703_r01.width_1500

Ce résultat montre qu’il est possible, pour des agents artificiels coopératifs, d’apprendre de manière autonome, en s’aidant uniquement des informations visuelles et contextuelles de l’environnement (certes simplifié dans le cadre de cette expérimentation), donc sans tricher. Maintenant, je suis bien évidemment conscient de la simplification de cette expérimentation, et en particulier du jeu utilisé (règles élémentaires, environnement simpliste). Je ne dis certainement pas qu’il s’agit d’une révolution dans le domaine de l’apprentissage, mais je trouve juste l’approche intéressante. Appliquée à un environnement militaire, cette expérimentation amène à considérer des systèmes intelligents, capables d’élaborer et de faire émerger des tactiques en fonction des seuls indices présents dans l’environnement.

L’IA est donc encore une fois une technologie d’importance militaire évidente; j’aborde ce sujet dans l’émission « Géopolitique: le débat » de RFI dont vous retrouverez le podcast ici, dans l’attente de vous retrouver dès lors que ce blog aura repris son fil normal. Amicalement à tous mes lecteurs, et à bientôt.

son8

Il y a un domaine dont on parle peu, mais qui finalement est aussi important que la vision artificielle ou la robotique : il s’agit du son. La recherche et l’innovation en acoustique sont en effet au cœur des problématiques de défense et de sécurité, comme en témoignent les récentes « attaques » subies par des diplomates américains en Chine et à Cuba. On se rappelle que douze diplomates américains de l’ambassade de La Havane à Cuba ainsi que deux employés du consulat américain de Canton, en Chine, ont présenté sans raison apparente des symptômes similaires à ceux d’une commotion cérébrale, ainsi qu’une surdité subite. A tel point que l’on a parlé « d’attaques sonores » menées contre les diplomates.

son7

Si l’on pense qu’en définitive, de telles attaques sont en réalité le résultat d’interférences entre différents systèmes d’écoute et de transmission par ultrasons, il n’en est pas moins vrai que le son peut, en soi, jouer le rôle d’une arme. De telles armes « soniques », il y en a de plusieurs types. En premier lieu, celles qui utilisent les fréquences audibles par l’oreille humaine (entre 20 Hertz et 20 000 Hertz). De telles armes peuvent être utilisées par exemple comme outils non létaux pour dissiper une foule hostile – j’avais écrit sur ce sujet il y a quelques temps dans cet article.

son4

C’est par exemple le cas du LRAD-100X (l’acronyme correspond à Long Range Acoustic Device) qui utilise un dispositif de transduction piézoélectrique afin de créer un signal sonore concentré et amplifié, capable de calmer même l’individu le plus agressif en focalisant sur lui une onde sonore capable d’atteindre les 120dB (ou même plus – le souci étant qu’à 160 dB, vos tympans explosent).

son1

Les individus qui ont subi une attaque de LRAD mentionnent des symptômes insupportables (le sentiment que les sinus s’enflamment, un saignement des oreilles, une migraine tenace, et même la paralysie et l’insensibilité des parties du corps exposées au signal).

Voici une vidéo déjà ancienne, mais qui illustre bien l’utilisation du LRAD :

En mode infrasonique (en-dessous de 20 Hertz), le principe est le même, mais les effets sont plus… dérangeant puisqu’ils vont du sentiment de coup de poing dans le ventre, au sentiment de nausées et de migraines et jusqu’à… la libération involontaire du contenu de vos intestins (!).

Si l’on s’intéresse à l’autre extrémité du spectre, les ultrasons, les choses sont différentes. Car l’effet des ultrasons sur le corps ne se limite pas à l’audition. En premier lieu, ils ont tendance à chauffer le corps à la manière d’un four à micro-ondes, ce qui peut causer des dommages importants à nombre de cellules. Mais cela se combine à un autre phénomène, comparable à ce qu’il se passe dans le monde sous-marin : la cavitation. Lorsqu’une onde ultrasonique traverse le corps, elle peut générer une cavitation d’autant plus importante que l’onde est forte, ce qui génère la formation de bulles dans le corps, par exemple dans le liquide de l’oreille interne.

Toutefois, les ultrasons perdent rapidement de leur puissance avec la distance, ce qui les rends inadaptés à un emploi opérationnel, à moins de combiner plusieurs faisceaux. C’est d’ailleurs ce qui a pu se produire, de manière involontaire, pour les malheureux diplomates, pris dans des zones d’interférences entre plusieurs faisceaux ultrasoniques équipant des matériels d’écoute. C’est en tout cas la théorie qui prédomine aujourd’hui pour expliquer les prétendues attaques.

Innover dans le domaine sonore, c’est aussi essayer de capturer au mieux le son à des fins d’écoute ou d’espionnage. De nombreux dispositifs existent, et permettent par exemple « d’arroser » le visage d’une personne par des ultrasons, lesquels vont se réfléchir et être capturés ensuite par un dispositif audio classique. A la manière d’un radar, cette réflexion varie en fonction par exemple des mouvements de la bouche, ce qui permet ensuite de reconstituer la voix, en particulier dans des environnements bruités. On peut par exemple mentionner le système SAVAD pour « Super-Audible Voice Activity Detection » qui fonctionne sur ce principe.

son5

Dans ce domaine, l’intelligence artificielle (oui, encore elle) peut venir à la rescousse de l’espion. Tout d’abord en gommant les bruits parasites de fond. La revue Science vient en effet de publier un article dans lequel un système d’intelligence artificielle apprend à distinguer une voix en se guidant sur les mouvements des lèvres et sur l’analyse des différents sons. La combinaison « analyse des sons » et « analyse des indices visuels » semble se révéler bien plus efficace que l’analyse sonore seule. Pour ceux que cela intéresse, le système sera présenté au prochain SIGGRAPH.

Un autre usage de l’IA consiste directement à lire sur les lèvres. On rappelle en particulier que DeepMind, l’IA développée par Google, a développé il y a quelques temps une application de lecture sur les lèvres, entraînée à partir de 5.000 heures de programmes télévisés de la BBC.

son3

Le système est parvenu à un taux de réussite de 46,8 %, un chiffre très impressionnant si on le compare à la performance d’un expert humain entraîné (entre 12 et 20% de réussite). En particulier, le système semble plus robuste aux homophones (ver, verre, vert…), et peut consolider son analyse en généralisant la détection à partir de l’observation de plusieurs orateurs. De là à imaginer une IA observant à distance les lèvres pour capturer et reconstituer la parole, il n’y a qu’un pas;  guerre du son, intelligence artificielle, armes infrasoniques… les meilleurs auteurs de science-fiction n’ont qu’à bien se tenir.