Relaciona cada palabra con su imagen correspondiente
relaciona la imagen con el audio correspondiente