收集国学/汉语字词拼音相关资源,以备研究学习使用,欢迎补充。
单字频率列表:
双字组频率列表:
来自Yabla资源,仅供学习使用,如有侵权请
- Mandarin Chinese Pinyin Audio
- 现代汉语所有带声调拼音,注意:最后 3 列(也就是
ê:ê̄,ế,ê̌,ề|m:m̄,ḿ, ,m̀,|n: ,ń,ň,ǹ
)为罕见音节,m
音节没有上声,n
音节没有阴平。
汉字转拼音有多种语言实现,但是转换质量、效果参差不齐。
- php : overtrue/pinyin
- ruby : janx/ruby-pinyin
- python :mozillazg/python-pinyin
- java :stuxuhai/jpinyin
- node/javascript :hotoo/pinyin
- javascript :sxei/pinyinjs
延伸阅读:《我爱拼音》
最近 AI 及其模型发展很迅猛,一些大模型本身就训练不少中文资料,尝试可以使用它来做一些中文字词、拼音等相关的研究工作。
- AI Web Chat: 低成本新秀 Deepseek、创始者ChatGPT 与 马斯克的 Grok 等;当然国内三巨头也有 AI布局:阿里的通义千问,字节的豆包以及腾讯的元宝。
- 基于大模型的声音克隆与合成框架:ChatTTS、Seed-TTS 、Fish-Speech、OpenVoice 与 FunAudioLLM/CosyVoice 等等。
- AI 应用示例:使用 AI 结合康熙字典、中国传统古典著作(如诗经、楚辞、论语、唐诗与宋词等)等数据给宝贝取名;在聊天 IM 中接入 AI 机器人来实现成语接龙、诗词飞花令等寓教于乐小游戏;借助复杂的智能体及工作流来生成启蒙识字卡片、儿童睡前故事等。