Trial and Error/Python

Trial and Error/Python

파이썬 konlpy이용해서 명사 빈도 수 세기

어렵지 않다. 진짜.. import pandas as pd from konlpy.tag import Okt 검색하면 꽤 많이 나오는 Twitter가 5.0버전부터 Okt로 바뀌었다고 한다. f = open('title.txt', 'rt', encoding='UTF8') lines = f.read() f.close() 파일은 열면 닫는 습관을 갖는게 좋다고 누군가가 말했다. 기억은 안난다. split = Okt() nouns = split.nouns(lines) 이렇게 하면 title.txt파일에서 읽어온 문장들의 명사만 남게 된다. word_list = [] for n in nouns: if len(n)>=2: word_list.append(n) 한글자 짜리는 핵심적인 키워드로 사용하기도 힘들고 대부분 ..

Trial and Error/Python

주피터 노트북에 아나콘다 가상환경 추가하기

1. 라이브러리 설치 $ pip install ipykernel 2. 가상환경 추가 $ python -m ipykernel install --user --name 가상환경이름 --display-name "주피터 노트북에서 뭐라고 보이게 할건지" 3. 가상환경 삭제 $ conda remove --name 가상환경이름 --all

Trial and Error/Python

konlpy DLL load failed 설치 오류

ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다. 어제도 이 오류가 떠서 그냥 잤는데 무사해결했다! 회사 컴퓨터에서도 똑같은 오류가 뜨니 이상해서 혹시나하고 확인해보니 pip uninstall jpype1 pip install jpype1 이렇게 다시 설치해주면 된다!

Trial and Error/Python

파이썬 비트 확인하는 법

import platform print(platform.architecture())

Trial and Error/Python

파이썬 단어 빈도 계산하기

파이썬에서 엑셀 파일 불러오기 import pandas as pd df = pd.read_excel(r'파일 경로') print(df) 이렇게 파일을 불러오면 이런식으로 리스트가 쭉쭉쭉 나온다. 여기서 가장 빈도가 높게 나오는 단어들을 찾을거다. plist = df.values.tolist() 이렇게하면 dataframe에서 list로 변환을 할 수 있다. 리스트로 변환을 하는 이유는... 나는 리스트를 사용하는 걸 좋아하기 때문이다... 그런데 위에서 보면 알겠지만 제목 옆에 1.0 이랑 NaN이라는 값이 있다. 저건 내 나름대로 필요해서 엑셀파일에 표시해놨지만 지금은 필요없다. 그래서 저게 없는, 순수하게 제목만 있는 리스트를 만들었다. title = [] for i in range(len(plist..

박한결
'Trial and Error/Python' 카테고리의 글 목록