Você provavelmente nunca ouviu falar sobre o YouTube-8M, mas é um grande negócio para quem trabalha no campo da aprendizagem de máquinas. Em suma, é um grande banco de dados de conteúdo de vídeo etiquetado que os programadores podem usar para testar seus algoritmos.
Leia também:
YouTube agora tem mais de um bilhão de vídeos com legendas automáticas
YouTube cancela a série original de PewDiePie após controvérsia nazista
Hoje, a Google anunciou que o YouTube-8M está recebendo uma grande atualização, com ainda mais rótulos em mais vídeos, além de elementos de áudio. E a empresa também pretende tornar o conjunto de dados ainda melhor com uma competição Kaggle, que oferecerá um prêmio de US $ 100.000 às equipes que construírem os melhores algoritmos para marcar cerca de 700.000 novos vídeos (usando o conjunto de dados 8M para treinamento).
“O conjunto de dados foi criado a partir de mais de 7 milhões de vídeos do YouTube (450.000 horas de vídeo) e inclui etiquetas de vídeo a partir de um vocabulário de 4716 classes (3.4 etiquetas / vídeo em média”, escreveu a Google na página da competição. Extraiu as características áudio & visuais de cada segundo do vídeo (3.2B vetores da característica no total). ”
A Google diz que anunciará as equipes vencedoras no Workshop YouTube-8M realizado durante a Conferência da IEEE sobre Visão Computacional e Reconhecimento de Padrões em julho. Com até US $ 30.000 concedidos por equipe, há uma boa chance da Google acabar atraindo alguns desenvolvedores ansiosos. A empresa também oferece alguns créditos gratuitos do Google Cloud para os primeiros participantes.
Embora os resultados da competição não afetem diretamente os consumidores por um tempo, engenheiro de software do Google Paul Natsev observa que tudo o que aprender será útil em muitos tipos diferentes de vídeos. Esperemos que isso possa levar a uma melhor pesquisa e filtragem de conteúdo na linha no YouTube.
Fonte: