어렵지 않다. 진짜.. import pandas as pd from konlpy.tag import Okt 검색하면 꽤 많이 나오는 Twitter가 5.0버전부터 Okt로 바뀌었다고 한다. f = open('title.txt', 'rt', encoding='UTF8') lines = f.read() f.close() 파일은 열면 닫는 습관을 갖는게 좋다고 누군가가 말했다. 기억은 안난다. split = Okt() nouns = split.nouns(lines) 이렇게 하면 title.txt파일에서 읽어온 문장들의 명사만 남게 된다. word_list = [] for n in nouns: if len(n)>=2: word_list.append(n) 한글자 짜리는 핵심적인 키워드로 사용하기도 힘들고 대부분 ..
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다. 어제도 이 오류가 떠서 그냥 잤는데 무사해결했다! 회사 컴퓨터에서도 똑같은 오류가 뜨니 이상해서 혹시나하고 확인해보니 pip uninstall jpype1 pip install jpype1 이렇게 다시 설치해주면 된다!
파이썬에서 엑셀 파일 불러오기 import pandas as pd df = pd.read_excel(r'파일 경로') print(df) 이렇게 파일을 불러오면 이런식으로 리스트가 쭉쭉쭉 나온다. 여기서 가장 빈도가 높게 나오는 단어들을 찾을거다. plist = df.values.tolist() 이렇게하면 dataframe에서 list로 변환을 할 수 있다. 리스트로 변환을 하는 이유는... 나는 리스트를 사용하는 걸 좋아하기 때문이다... 그런데 위에서 보면 알겠지만 제목 옆에 1.0 이랑 NaN이라는 값이 있다. 저건 내 나름대로 필요해서 엑셀파일에 표시해놨지만 지금은 필요없다. 그래서 저게 없는, 순수하게 제목만 있는 리스트를 만들었다. title = [] for i in range(len(plist..