Categorização de ações em vídeos de futebol utilizando uma arquitetura CNN-RNN

Autores

  • Matheus de Sousa Macedo FURG
  • Diana Francisca Adamatti FURG

DOI:

https://doi.org/10.5335/rbca.v15i3.14743

Palavras-chave:

Ações de Futebol, Classificação de Vídeos, Redes Neurais Convolucionais, Redes Neurais Recorrentes

Resumo

A extração de informações semânticas de vídeos de futebol tem diversas aplicações, como publicidade contextual, resumo de partidas e extração de destaques. As aplicações de análise de vídeos de futebol podem ser categorizadas em Detecção de Ações, Rastreamento de jogadores e/ou bola e Análise de jogo. Utiliza-se como base de dados uma versão modificada
do Dataset SoccerNet-v2, afim de reduzir o Poder Computacional mínimo exigido. A tarefa de Detecção de Ações torna-se difícil por conta da sobreposição de ações e também por causa das condições de captura de vídeo que tem diversos ângulos, anúncios e cortes de câmera. Para superar esses desafios, a Rede Neural Convolucional (CNN) e a Rede Neural Recorrente (RNN) são utilizadas em conjunto para classificar diferentes comprimentos de vídeos de ações do futebol.Utiliza-se uma CNN, InceptionV3, pré-treinada para a extração de características espaciais. Posteriormente, uma RNN, Unidades Recorrentes Fechadas (GRU), para o reconhecimento de sequências, que trata a dependência temporal e resolve o problema do desaparecimento de gradiente. Por fim, a camada Softmax atribui probabilidades decimais a cada classe. Chega-se a uma configuração de rede, com quatro ações classificáveis, e uma acurácia de 94%.

Downloads

Os dados de download ainda não estão disponíveis.

Downloads

Publicado

27-11-2023

Edição

Seção

Artigo Original

Como Citar

[1]
2023. Categorização de ações em vídeos de futebol utilizando uma arquitetura CNN-RNN. Revista Brasileira de Computação Aplicada. 15, 3 (nov. 2023), 1–14. DOI:https://doi.org/10.5335/rbca.v15i3.14743.