380000-Groups-Uighur-Chinese-Parallel-Corpus-Data

Description

Uighur language and its parallel corresponding Chinese text data, 38,000 groups in total. They been cleaned, desensitized and gone through quality check. It can be used as base corpus for text data analysis in machine translation and related fields.

For more details, please refer to the link: https://www.nexdata.ai/datasets/194?source=Github

Specifications

Storage format

TXT

Data content

Uighur-Chinese Parallel Corpus Data

Data size

0.38 million pairs of Uighur-Chinese Parallel Corpus Data

Language

Uighur, Chinese

Application scenario

machine translation

Licensing Information

Commercial License

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
APY170601243_demo.jpg		APY170601243_demo.jpg
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

APY170601243_demo.jpg

APY170601243_demo.jpg

README.md

README.md

Repository files navigation

380000-Groups-Uighur-Chinese-Parallel-Corpus-Data

Description

Specifications

Storage format

Data content

Data size

Language

Application scenario

Licensing Information

About

Releases

Packages

Nexdata-AI/380000-Groups-Uighur-Chinese-Parallel-Corpus-Data

Folders and files

Latest commit

History

APY170601243_demo.jpg

APY170601243_demo.jpg

README.md

README.md

Repository files navigation

380000-Groups-Uighur-Chinese-Parallel-Corpus-Data

Description

Specifications

Storage format

Data content

Data size

Language

Application scenario

Licensing Information

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages