-
Notifications
You must be signed in to change notification settings - Fork 282
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
请问该框架与ncnn的区别与联系? #31
Comments
关于与ncnn的区别联系参考 #6 , 量化会做 但是不是当前最重要的事情,单精度仍有不少潜力可以继续做下去。 |
了解,在做量化之前,先做出一个基于float32的稳定的版本是更重要的,如果后面做量化的话,是否可以交流一下呢?我目前也在看量化方面。 |
@JSnobody armv8.2以下指令集其实对int8计算不是很友好,理论上fp32和int8的乘加op吞吐率是一样的,所以一个稳定高效的fp32是更加重要的,当然后面avx512或者dot int8的指令是另外一回事了。 @turbo0628 加油鸭 |
@BUG1989 如果我没记错的话,caffe-int8-convert-tools 是你做的吧,这几天刚认识caffe-int8-convert-tools,准备仔细研究一下 |
@BUG1989 我看主流的框架和平台的int8量化,只针对训练后量化,主要分为tensorflow和tensorRT两个流派,有的是用tensorflow'的思想和流程,有的采用tensorRT思想结合KL散度校准,从结果上看,tensorRT的准确率会有提升。关于tensorRT和tensorflow量化你怎么看,推理框架也需要反量化嘛? |
修改一下:tensorRT较比tensorflow准确率会有提升。 |
现在还有第三个流派是,trainning int8,鼻祖可以参考Ristretto caffe,分为两个步骤:
|
@BUG1989 Ristretto caffe我前几天看到过,当时看的不仔细,通过你的介绍我学习了。 |
@BUG1989 这三个流派,你觉得哪个比较好,各自优缺点是什么? |
我想请教下,如果不做量化,那大概从哪些方面做加速, 除了合并层这个方式以外,其他都是通过指令集来实现加速么? |
@huangrichen11 有好多种方式 |
有没有相关的资料,想了解下?对这方面没有接触过 |
你好,请问该框架与ncnn的区别与联系?有哪些优势?另外我看ncnn实现了int8量化,但是会比较简单,你们有什么样的计划,是否会做出新的方法?
期待你们的回复,谢谢!
The text was updated successfully, but these errors were encountered: