Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Create a crawler to this list #8

Open
mazulo opened this issue Jan 22, 2016 · 8 comments
Open

Create a crawler to this list #8

mazulo opened this issue Jan 22, 2016 · 8 comments

Comments

@mazulo
Copy link
Member

mazulo commented Jan 22, 2016

Web crawler to create a newsletter from these blogs

@drgarcia1986
Copy link
Contributor

Gostaria de fazer um BOT para ficar verificando atualizações nos feeds desses blogs e ir postando no twitter por exemplo, talvez abrir issues no repositório se algum blog sair do ar, etc.

Fiz algumas brincadeiras até para validar o conceito, mas seria mais legal se adicionarmos o endereço do feed em algum lugar, como é o caso do planet, pois nas magias negras que fiz para descobrir automágicamente o endereço do feed, não tive muito sucesso.

@mazulo
Copy link
Member Author

mazulo commented Mar 28, 2016

Cara, sensacional! Sobre o endereço do feed, você diz do feed de cada blog listado aqui? Se for, sem problemas. Posso começar a ir pegando e adicionando na listagem

@drgarcia1986
Copy link
Contributor

Sim, porque eu estava procurando algo como <link href="link_do_feed" type="application/atom+xml" rel="alternate" title="Titulo do Feed" />, mas para dois blogs falhou (um não tinha essa tag e o outro aponta para um endereço errado).

Também posso manter dessa maneira e tentarmos entrar em contato com os donos dos blogs e informar esse problema.

Penso também que se só adicionar o link do feed no README, pode deixar mais complexo para fazer o parse com o BeautifulSoup.

@mazulo
Copy link
Member Author

mazulo commented Mar 29, 2016

Se só adicionar o link do feed do README deixar mais complicado, podemos fazer assim: você finaliza com o script que fez, e os que não derem certo eu procuro entrar em contato.

O que você vai usar pra deixar o script rodando? Ou vai portar o código pra algum framework web?

@drgarcia1986
Copy link
Contributor

Hoje fiz algumas brincadeiras com Django + Celery, ai seria legal que daria pra arrumar a url dos feeds pelo admin mesmo, ok acha?
Acho que vou subir em um repositório e podemos ir trocando ideia la de como pode funcionar

@mazulo
Copy link
Member Author

mazulo commented Mar 29, 2016

Acho show. Já mexi um tempo atrás com Django + Celery. Na hora que vc criar o repositório, só dar um ping aqui (ou no Telegram: @ mazulo)

@drgarcia1986
Copy link
Contributor

Criei o repositório, mas mesmo nos últimos dias de férias não consegui dar tanta atenção quanto queria ao projeto. Volto a trabalha amanhã ai acho que só conseguirei ir dando sequencia no fim de semana, mas teoricamente não falta muita coisa para subir um beta. De maior acho que falta só as notificações (e.g. integração com twitter).

Se der uma olhada e gostar, vamos ir trocando ideia pelo telegram (@ drgacia1986 ) e ir tocando o projeto 😄

@mazulo
Copy link
Member Author

mazulo commented Mar 30, 2016

Show! Continuamos no Telegram 😄

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants