Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

คำสะกดไม่ถูก #680

Open
phitcphu opened this issue Jun 20, 2022 · 4 comments
Open

คำสะกดไม่ถูก #680

phitcphu opened this issue Jun 20, 2022 · 4 comments
Labels
bug bugs in the library
Projects
Milestone

Comments

@phitcphu
Copy link

คำว่า ปลาอินทรีย์ ไม่ถูกแก้ให้ถูกเป็น ปลาอินทรี

@github-actions
Copy link

Hello @tuakapiak, thank you for your interest in our work!

If this is a bug report, please provide screenshots and minimum viable code to reproduce your issue, otherwise we can not help you.

@phitcphu
Copy link
Author

CheckSpell

@wannaphong
Copy link
Member

อันนี้ตัวแก้คำผิดจะดึง dict มาใช้งานนะครับ ไม่แน่ เราอาจจะแก้โดยเพิ่ม dict คำที่ถูกต้อง ที่ไม่มีคำผิดเลยมาใช้งานกับฟังก์ชันนี้ คุณ @bact คิดเห็นว่าอย่างไรครับ

@bact
Copy link
Member

bact commented Oct 11, 2022

ตัวพจนานุกรมมาตรฐานที่ใช้อยู่ตอนนี้ มาจาก Thai National Corpus

if not custom_dict: # default, use Thai National Corpus
custom_dict = tnc.word_freqs()

ซึ่งจะเก็บคำตามที่ปรากฏในภาษา รวมถึงคำที่สะกดผิดด้วย

ในอนาคต ควรจะมีพจนานุกรมที่มีเฉพาะคำที่สะกดถูก

ในระหว่างนี้ สามารถสร้าง spellchecker ขึ้นได้เอง จาก class NorvigSpellChecker และส่งพจนานุกรม ที่มีเฉพาะคำที่ถูกเข้าไปครับ

@bact bact added the bug bugs in the library label Oct 11, 2022
@bact bact added this to the Future milestone Oct 11, 2022
@bact bact added this to To do in PyThaiNLP Oct 11, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug bugs in the library
Projects
PyThaiNLP
  
To do
Development

No branches or pull requests

3 participants