190 likes | 312 Views
Large-Scale Music Annotation and Retrieval: Learning to Rank in Joint Semantic Spaces. Jason Weston, Samy Bengio , and Philippe Hamel Google, USA. Journal N ew R esearch Music – 2012 Citado por 3 artigos Alex Amorim Dutra. Sumário.
E N D
Large-Scale Music Annotation and Retrieval: Learning to Rank in Joint Semantic Spaces • Jason Weston, SamyBengio, and Philippe Hamel • Google, USA Journal New Research Music – 2012 Citadopor 3 artigos Alex Amorim Dutra
Sumário • Large-Scale Music Annotation and Retrieval: Learning to Rank in Joint Semantic Spaces • Trabalhosrelacionados/Serviços • Vantagens • Algoritmo • Resultados • Conclusões • Referências
Large-Scale Music Annotation and Retrieval • Predição de artistas • Predição de músicas • Artistassimilares • Músicassimilares • Predição de tags: retornaumalista de tags, (e.g. rock, guitar, fast, . . . ).
Trabalhos Relacionados e Serviços • LastFm, Pandora, iTunes • Sugestõesdapróximamúsicaqueirátocar. • Sugestão de artistas dado um conjunto de ratings de artistas, músicas e albuns. • Pesquisaporgenero, estilos, humor.
Vantagens • Aplicadoaomundo real. • Exibiualtasperfomancesemtodastarefaspropostas. • Melhores performances sobre o baseline. • Baixoconsumo de memória.
Fase de treinamento • Encontrarosmelhoresparâmetros. • Minimizar a função: • Utilizou AUC Margin Ranking Loss e WARP Loss.
Emsemble • Como utilizado stochastic gradient descent cadamodeloaprendeparametros com valores um poucodiferentes. • A média das funções:
Features • Meta dados - Cold start se utilizarsomentefiltragemcolaborativa. • Baseadaemconteúdo: MFCCs (Mel Frequency CepstralCoefficient) e (SAI) Stabilized Auditory Image.
Base de testes • TagATune– Tem um conjunto de clips contendo 30 segundos. Tem anotaçõesassociadas. Coletadoporusuáriosem forma de jogo. • TagATuneusado no MIREX 2009 desafio de classificação de tags. • Para comparaçãoutilizadomesmas tags e bases de treino.
Medida de performance • precision@k number of true positives in the top k position k
Conclusões • Otimizandop@kmelhora performance. • Os dados apresentam a distribuição de caudalonga. • O modelo tem respostasrápidas e baixaconsumo de memória.
Referências • Weston, J., Bengio, S., Usunier, N.: Large scale image annotation: Learning to rank with joint word-image embeddings. In: European conference on Machine Learning. (2010) • Robbins, H., Monro, S.: A stochastic approximation method. Annals of Mathematical Statistics 22 (1951) 400–407 • Pampalk, E., Dixon, S., Widmer, G.: On the evaluation of perceptual similarity measures for music. In: Intl. Conf. on Digital Audio Effects. (2003) • Law, E., West, K., Mandel, M., Bay, M., Downie, J.S.: Evaluation of algorithms using games: the case of music tagging. In: Proceedings of the 10th International Conference on Music Information Retrieval (ISMIR). (October 2009) 387–392 • Foote, J.T.: Content-based retrieval of music and audio. In: SPIE. (1997) 138–147