Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

come capire l'URL di origine dei video VIMEO in una pagina web #149

Open
cirospat opened this issue May 15, 2020 · 11 comments
Open

come capire l'URL di origine dei video VIMEO in una pagina web #149

cirospat opened this issue May 15, 2020 · 11 comments

Comments

@cirospat
Copy link
Contributor

salve,
come faccio a capire l'url di origine dei video VIMEO in questa pagina:
https://sites.google.com/regione.veneto.it/progetto-vela/formazione/lavorare-smart

@aborruso
Copy link
Member

Caro @cirospat ma tu che test hai fatto prima di chiedere qui??

Per molti siti, la modalità di base è una:

  • aprire il sito (ad esempio con un browser);
  • aprire la vista codice con CTRL + U;
  • cercare dentro al codice.

Se cerchi "vimeo", trovi quello che cerchi (vedi immagine).

image

È poco comprensibile la struttura, ma l'URL si vede ed è copiabile. Ad esempio:

https://www.google.com/url?q=https%3A%2F%2Fplayer.vimeo.com%2Fvideo%2F347700231&sa=D&sntz=1&usg=AFQjCNHgiHEnE1IQ3IPvx143oW_AvUUF2g

È un po' più leggibile se lo fai dalla console di sviluppo del browser:

  • F12 per aprirla;
  • poi (in Chrome) vai nel tab Elements;
  • in questo CTRL + F e cerca vimeo.

In questo modo è più leggibile e si vede la struttura, è un <div> che contiene un <iframe>

image

Sottolineo la struttura, perché sul codice di una pagina HTML si possono fare query sfruttando la struttura: sono le query XPATH. Ci sono un milione di tutorial online e centinaia di tool per eseguirle.

Puoi partire sempre dalla console di un browser (F12). Dicevamo che è un <div> che contiene un <iframe>, che in XPATH è //div[iframe]. Se lo usi per cercare, potrai saltare direttamente a quello che ti interessa.

image

Puoi fare ancora di più usando la console del browser, e incollandoci dentro $x("//div[iframe]/@data-url") e pigiando invio. Estrarrai la proprietà data-url del div, che è quello che cerchi.

image

Una pagina di riferimento bella, è questa https://librarycarpentry.org/lc-webscraping/02-xpath/index.html

@pigreco
Copy link
Contributor

pigreco commented May 16, 2020

@cirospat
usando la shell di linux basterebbe scrivere questo comando per avere subito un file csv con i link

curl "https://sites.google.com/regione.veneto.it/progetto-vela/formazione/lavorare-smart" | scrape -be "//div[iframe]"  | xq -r '.html.body.div[]."@data-url"' >vivaAndy.csv

(comando rubato a @aborruso ) :-)

@cirospat
Copy link
Contributor Author

Grazie
Si praticamente sono andato di CTRL + U.
Ma non riuscivo a scorgere i link di Vimeo.
Da quanto leggo ora dovevo allargare la vista e cercare meglio Vimeo trovandolo in url "strani".

@cirospat
Copy link
Contributor Author

cirospat commented May 16, 2020

@aborruso
mi sono letto con attenzione i due percorsi che hai illustrato.
La prima è più semplice e fa raggiungere l'obiettivo, che è la cosa che conta.
La seconda fa raggiungere l'obiettivo e fa conoscere qualcosa che può tornare utile in futuro in situazioni analoghe a queste.

tu che test hai fatto prima di chiedere?

Avevo aperto (con CTRL + U) il codice della pagina web. Ma mi ero perso perché non trovavo l'URL in questa maniera: https://player.vimeo.com/video/347700231.

@pigreco
non conosco la shell di Linux. Un giorno ci arriverò. Grazie.

Ringrazio molto entrambi.

@pigreco
Copy link
Contributor

pigreco commented May 16, 2020

@cirospat
solo per farti capire le potenzialità della riga di comando, ho registrato un minuto di video

https://www.loom.com/share/50c7264d37294f95b133ff1f3e9870d3

saluti

@cirospat
Copy link
Contributor Author

@cirospat
solo per farti capire le potenzialità della riga di comando, ho registrato un minuto di video

grazie tantissimo @pigreco
me lo studio,
tanto lo so che prima o poi atterro su visidata ;)

@pigreco
Copy link
Contributor

pigreco commented May 17, 2020

@aborruso la ricetta è stata fatta??
se si dove la trovo??

@aborruso
Copy link
Member

Ho chiuso, perché Ciro ha usato soltanto il "trova" nel codice.

Non mi sembra da ricetta

@pigreco
Copy link
Contributor

pigreco commented May 17, 2020

@aborruso
@cirospat quando ha tempo e voglia mette in bella quello che hai scritto tu.

Altrimenti lo faccio io.

È un peccato perdere tutto questo.

@pigreco pigreco reopened this May 17, 2020
@cirospat
Copy link
Contributor Author

cirospat commented May 18, 2020 via email

cirospat added a commit to opendatasicilia/tansignari-md that referenced this issue May 18, 2020
@cirospat
Copy link
Contributor Author

ho cominciato a scrivere la ricetta:
https://github.com/opendatasicilia/tansignari-md/blob/master/content/it/ricette/riga_comando/Capire_URL_video_in_una_pagina_web.md

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants