Skip to content

Navigation Menu

Explore
By company size
By use case
By industry
View all solutions
Topics
- AI
- DevOps
- Security
- Software Development
- View all
Explore
- GitHub Sponsors
  Fund open source developers
- The ReadME Project
  GitHub community articles
Repositories
- Enterprise platform
  AI-powered developer platform
Available add-ons
Pricing

Search code, repositories, users, issues, pull requests...

Search

Clear

Search syntax tips

Provide feedback

We read every piece of feedback, and take your input very seriously.

Include my email address so I can be contacted

Saved searches

Use saved searches to filter your results more quickly

Name

Query

To see all available qualifiers, see our documentation.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.

Dismiss alert

wangzhaode / mnn-llm Public

Notifications You must be signed in to change notification settings
Fork 162
Star 1.5k

Code
Issues 2
Pull requests
Discussions
Actions
Projects
Security
Insights

Additional navigation options

Code
Issues
Pull requests
Discussions
Actions
Projects
Security
Insights

Releases: wangzhaode/mnn-llm

Releases · wangzhaode/mnn-llm

llama3-8b-instruct-mnn

19 Apr 05:27

wangzhaode

llama3-8b-instruct-mnn

Compare

Choose a tag to compare

Loading

llama3-8b-instruct-mnn Latest

Latest

Llama-3-8B-Instruct导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embeddings_bf16.bin
lm.mnn
block_[0-31].mnn

Assets 37

block_0.mnn

111 MB 2024-04-19T05:10:44Z
block_1.mnn

113 MB 2024-04-19T05:13:26Z
block_10.mnn

113 MB 2024-04-19T05:10:44Z
block_11.mnn

113 MB 2024-04-19T05:10:44Z
block_12.mnn

113 MB 2024-04-19T05:10:44Z
block_13.mnn

113 MB 2024-04-19T05:10:44Z
block_14.mnn

113 MB 2024-04-19T05:11:48Z
block_15.mnn

113 MB 2024-04-19T05:11:49Z
block_16.mnn

113 MB 2024-04-19T05:11:49Z
block_17.mnn

113 MB 2024-04-19T05:11:49Z
Source code (zip)

2024-04-19T05:23:43Z
Source code (tar.gz)

2024-04-19T05:23:43Z

cgisky1980, Jason-cs18, and GrantLau1226 reacted with thumbs up emoji

All reactions

👍 3 reactions

3 people reacted

qwen1.5-7b-chat-mnn

13 Mar 08:23

wangzhaode

qwen1.5-7b-chat-mnn

Compare

Choose a tag to compare

Loading

qwen1.5-7b-chat-mnn

Qwen1_5-7B-Chat导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embeddings_bf16.bin
lm.mnn
block_[0-31].mnn

Assets 37

Loading

All reactions

qwen1.5-4b-chat-mnn

13 Mar 06:19

wangzhaode

qwen1.5-4b-chat-mnn

Compare

Choose a tag to compare

Loading

qwen1.5-4b-chat-mnn

Qwen1_5-4B-Chat导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embedding.mnn
embeddings_bf16.bin
lm.mnn
block_[0-39].mnn

Assets 46

Loading

hyaihjq reacted with thumbs up emoji

All reactions

👍 1 reaction

1 person reacted

qwen1.5-1.8b-chat-mnn

13 Mar 06:18

wangzhaode

qwen1.5-1.8b-chat-mnn

Compare

Choose a tag to compare

Loading

qwen1.5-1.8b-chat-mnn

Qwen1_5-1_8B-Chat导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embedding.mnn
embeddings_bf16.bin
lm.mnn
block_[0-23].mnn

Assets 30

Loading

All reactions

qwen1.5-0.5b-chat-mnn

13 Mar 06:17

wangzhaode

qwen1.5-0.5b-chat-mnn

Compare

Choose a tag to compare

Loading

qwen1.5-0.5b-chat-mnn

Qwen1_5-0_5B-Chat导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embedding.mnn
embeddings_bf16.bin
lm.mnn
block_[0-23].mnn

Assets 31

Loading

All reactions

yi-6b-chat-mnn

24 Jan 06:46

wangzhaode

Compare

Choose a tag to compare

Loading

yi-6b-chat-mnn

Yi-6B-Chat导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embedding.mnn
lm.mnn
block_[0-31].mnn

Assets 37

Loading

All reactions

deepseek-7b-chat-mnn

24 Jan 12:58

wangzhaode

deepseek-7b-chat-mnn

Compare

Choose a tag to compare

Loading

deepseek-7b-chat-mnn

deepseek-llm-7b-chat导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embedding.mnn
lm.mnn
block_[0-29].mnn

Assets 35

Loading

cgisky1980 and flashekjkj reacted with thumbs up emoji

All reactions

👍 2 reactions

2 people reacted

tinyllama-1.1b-chat-mnn-int8

23 Jan 08:54

wangzhaode

tinyllama-1.1b-chat-mnn-int8

Compare

Choose a tag to compare

Loading

tinyllama-1.1b-chat-mnn-int8

TinyLlama-1.1B-Chat导出onnx转换得到的int8量化版本mnn模型。

模型列表：

tokenizer.txt
embedding.mnn
lm.mnn
block_[0-22].mnn

Assets 27

Loading

All reactions

bge-large-zh-mnn

17 Jan 08:16

wangzhaode

bge-large-zh-mnn

This commit was created on GitHub.com and signed with GitHub’s verified signature.

GPG key ID: B5690EEEBB952194

Learn about vigilant mode.

Compare

Choose a tag to compare

Loading

bge-large-zh-mnn

bge-large-zh导出onnx转换得到的int8量化版本mnn模型。

模型列表：

bge-large-zh-int8.mnn

Assets 3

Loading

All reactions

mnn-llm-apk

25 Dec 07:33

wangzhaode

Compare

Choose a tag to compare

Loading

mnn-llm-apk

基于mnn-llm构建的Android apk, apk中不含模型文件。使用方法如下：

下载想要测试的模型文件夹，可以参考README中的链接下载, 注意文件夹名称需要包含模型名称；
将下载好的文件夹使用adb推动到/data/local/tmp/mnn-llm目录下，命令行如下：

adb shell mkdir /data/local/tmp/mnn-llm
adb push ./qwen-1.8b-mnn  /data/local/tmp/mnn-llm

下载安装apk，打开后在下拉列表中选择要测试的模型文件目录，点击加载模型按钮；
进入聊天界面，进行聊天测试；

Assets 3

Loading

ggiidd and flashekjkj reacted with thumbs up emoji

flashekjkj reacted with laugh emoji

All reactions

👍 2 reactions
😄 1 reaction

2 people reacted

Previous 1 2 3 Next

Previous Next

Footer

© 2024 GitHub, Inc.

Footer navigation

Terms
Privacy
Security
Status
Docs
Contact

You can’t perform that action at this time.