Video: https://vimeo.com/325325628
Likedin: https://www.linkedin.com/in/johnpguimaraes/ Lattes: http://lattes.cnpq.br/6867869930931896
Projeto básico de estudo pessoal com foco em acessibilidade na internet
"De acordo com a WFD (Federação Mundial dos Surdos, na sigla em inglês), 80% dos surdos de todo o mundo têm baixa escolaridade e problemas de alfabetização. E no Brasil a situação não é diferente, já que a grande maioria dos surdos não tem uma boa compreensão do português, ou seja, não entendem ou têm dificuldades para ler e escrever. Por conta disso isso, eles dependem exclusivamente da língua de sinais para se comunicar e obter informação. A dificuldade de aprendizado da língua portuguesa escrita pode estar ligada a diversos fatores, como a impossibilidade de aprender através da fonética e som, a aquisição de linguagem tardia, ou mesmo, a diferença da estrutura gramatical da Libras e do português." HandTalk, http://blog.handtalk.me/5-fatos-comunidade-surda-libras/
A idéia principal é extrair textos de imagens e converter audio de videos em textos Com os textos em mãos, utilizar o software, que possuo uma agrande adiração, VLIBRAS (https://www.vlibras.gov.br/)
Foi utilizado duas linguagens de back-end. PHP e em Python. Em meus estudos, PHP se saiu melhor para o download e extração do texto de imagens (OCR - Optical Character Recognition).
Para extração do texto de audio, Python com suas bibliotecas de Machine Learning tiveram melhores resultados.
Também foi testado utilizando o IBM Watson (Speech to Text language). Foi adquirido melhores resultados porém, como é necessário o envio a API Watson, o tempo de espera começou a se tornar um problema com arquivos de videos com mais de 2 minutos.
Sinta-se livre para melhora-lo :D