AI를 공부하며 작성한 코드들을 정리해놓는 저장소
-
특정단어.ipynb
- Genomics & Informatics 논문지의 특정 단어 논문별/연도별 분포 구하는 코드
-
findSegmentationProblem.ipynb
- 문장 단위 Segmentation 문제점 찾아내는 코드
-
G&I-Corpus-preprocessing.ipynb
- Genomics-Informatics-Corpus/raw_text2 폴더의 논문들 중 몇개를 선택하여 토큰화 과정 중 나타나는 문제점을 찾아 수정하는 코드
-
find-Abbreviation.ipynb
- G&I 논문지의 전문용어, 약어 모두 출력하는 코드
-
POS-Tagging.ipynb
- 주어진 임의의 문장 POS Tagging을 하는 코드
-
NLTK_POS_Tagging.ipynb
- nltk를 이용하여 POS Tagging 실습했던 코드
-
scikit-learn.ipynb
- scikit-learn 클래스 실습했던 코드
-
iris data clustering using k -means.ipynb
- iris data와 k-means를 이용하여 clustering 실습했던 코드
-
Iris data Lab.ipynb
- iris data를 분석하는 실습을 했던 코드
-
Sentence Tokenization.ipynb
- 지도학습 기반하여 G&I 문장 경계선 구분하기 위한 코드/코퍼스 작성하는 실습을 진행했던 코드
-
G&I-corpus-Unsupervised-learning/final project1/gni_clustering.ipynb
- G&I corpus에 대하여 unsupervised learning을 적용하는 코드. 적용한 결과를 clustering 하여 이미지로 보여주게 됨.
-
G&I-corpus-Unsupervised-learning/final project2/gni_clustering_final2.ipynb
~/gni_clustering.ipynb
에서 G&I corpus에 적용한 것을 더 발전시켜 두가지의 방법을 시행하는 코드
- 총 302개의 G&I의 논문에 대해서 POS 태깅을 한 후, brown corpus를 이용 하여 트레이닝 한 t2를 이용하여 테스트 데이터와 정확도를 분석
- 비지도 학습에 대해 추출된 클러스터들에 대해서 사용 빈도를 출력해보고, 이 에 대한 워드 클라우드를 만들었다.
-
PythonPractice 폴더
- 파이썬 공부를 위해 연습하는 코드