Canal-U

Mon compte
Inria

Action recognition from video: some recent results


Envoyer la page à un ami

Copier le code pour partager la vidéo :
<div style="position:relative;padding-bottom:56.25%;padding-top:10px;height:0;overflow:hidden;"><iframe src="http://canaludev.canal-u.tv/video/inria/embed.1/action_recognition_from_video_some_recent_results.7945?width=100%&amp;height=100%" style="position:absolute;top:0;left:0;width:100%;height: 100%;" width="550" height="306" frameborder="0" allowfullscreen scrolling="no"></iframe></div> Si vous souhaitez partager une séquence, indiquez le début de celle-ci , et copiez le code : h m s
Auteur(s) :
SCHMID Cordelia

Producteur Canal-U :
Inria
Contacter le contributeur
J’aime
Imprimer
partager facebook twitter Google +

Action recognition from video: some recent results

While recognition in still images has received a lot of attention over the past years, recognition in videos is just emerging. In this talk I will present some recent results.
Bags of features have demonstrated good performance for action recognition in videos. We briefly review the underlying principles and introduce trajectory-based video features, which have shown to outperform the state of the art. These features are obtained by dense point sampling in each frame and tracking them based on displacement information from a dense optical flow field. Trajectory descriptors are obtained from motion boundary histograms, which are robust to camera motion.
We then show how to integrate temporal structure into a bag-of-features model based on so-called actom sequences. We localize actions based on sequences of atomic actions, i.e., represent the temporal structure by sequences of histograms of actom-anchored visual features. This representation is flexible, sparse and discriminative. The resulting model is shown to significantly improve performance over existing methods for temporal action localization. Finally, we show how to move towards more structured representations by explicitly modeling human-object interactions. We learn how to represent human actions as interactions between persons and objects. We localize in space and track over time both the object and the person, and represent an action as the trajectory of the object with respect to the person position, i.e., our human-object interaction features capture the relative trajectory of the object with respect to the human. This is shown to improve over existing methods for action localization.

  •  
    Label UNT : Unisciel, UNIT
  •  
    Date de réalisation : 1 Décembre 2011
    Durée du programme : 45 min
    Classification Dewey : Vision par ordinateur
  •  
    Catégorie : Conférences
    Niveau : niveau Master (LMD), niveau Doctorat (LMD), Recherche
    Disciplines : Informatique, Informatique
    Collections : Colloquium Jacques Morgenstern : recherches en STIC - nouveaux thèmes scientifiques, nouveaux domaines d’application, et enjeux
    ficheLom : Voir la fiche LOM
  •  
    Auteur(s) : SCHMID Cordelia
    producteur : Région PACA , INRIA (Institut national de recherche en informatique et automatique)
    Réalisateur(s) : VSP - Vidéo Sud Production
    Editeur : INRIA (Institut national de recherche en informatique et automatique) , UNS , CNRS - Centre National de la Recherche Scientifique
  •  
    Langue : Anglais
    Mots-clés : apprentissage, analyse video, interprétation scène, reconnaissance video
 

commentaires


Ajouter un commentaire Lire les commentaires
*Les champs suivis d’un astérisque sont obligatoires.
Aucun commentaire sur cette vidéo pour le moment (les commentaires font l’objet d’une modération)
 

Dans la même collection

 Number-theoretic methods in quantum computing
 Observations on doing research and on creating sublime user experiences
 Prototypage virtuel de système sur puce pour une simulation rapide et fidèle (1/2)
 Esterel et SCADE : de la recherche à l'industrie : La vision labo (cycle de cours et séminaires du collège de France en extérieur) 1/3
 Esterel et SCADE de la recherche à l'industrie : la vision industrielle (cycle de cours et séminaires du collège de France en extérieur) 2/3
 Urgences scientifiques posées par l'industrie : masquages d'horloges, circuits multi-horloges, ECOs et vérification formelle (cycle de cours et séminaires du collège de France en extérieur) 3/3
 Une fréquence peut-elle être instantanée (cycle de cours et séminaires du collège de France en extérieur)
 Le traitement du temps en automatique (cycle de cours et séminaires du collège de France en extérieur)
 The Changing Nature of Invention in Computer Science
 Un regard géométrique sur l’action anthropomorphique
 Music and Text Generation "in the style of"
 Optimisation et apprentissage
 Scalable personalization infrastructures
 Can it be done in software ?
 Comment passent à l'échelle les systèmes de la nouvelle vague de technologies (Scaling behaviors of systems of the new technology wave)
 Théorie du Contrôle, 50 ans après
 Les mathématiques sont-elles utiles pour explorer le cerveau humain et mieux comprendre son fonctionnement ?
 Quantum Turing Test
 La programmation du Web diffus
 Speculating Seriously in Distributed Computing
 The Frobenius Problem and Its Generalizations
 Approches multiéchelles du cerveau visuel : des échos synaptiques à la perception des formes et du mouvement (série : Colloquium Jacques Morgenstern)
 Seismic tomography : A giiant inverse problem
 Risque, science, et pluralisme
 Sécurité sur Internet ? La logique à la rescousse...
 La parcimonie : une valeur d'avenir ? (série : Colloquium Jacques Morgenstern)
 Calculer avec des modèles analogiques ou avec des aspects analogiques (série : Colloquium Jacques Morgenstern)
 Réseaux d'automates: trente ans de recherche
 Introduction to Kernelization
 Mathematical models for the cardiovascular system
 Competition and Cooperation
 Graphes, hypergraphes et réseaux (série : Colloquium Jacques Morgenstern)
 Swarms: First Class Citizens in the Future Internet (série : Colloquium Jacques Morgenstern)
 Recent research at Pixar
FMSH
 
Facebook Twitter Google+
Mon Compte