1. 라이브러리 설치하기 # docx pip install python-docx # pdf pip install pypdf2 # rss pip install feedparser # corpus # nltk 설치 후 www.nltk.org/data.html에서 데이터를 다운로드 할 것 pip install nltk 2. 워드 읽기 import docx def read_docx(filename): file = docx.Document(filename) content = [] for p in file.paragraphs: content.append(p.text) # print('단락 스타일:', p.style) # print('단락 수:', len(file.paragraphs)) return '\n'.join..
문제 - programmers.co.kr/learn/courses/30/lessons/70129?language=python3 코딩테스트 연습 - 이진 변환 반복하기 programmers.co.kr import re def solution(s): count, num_zero = 0, 0 while 1: tmp = len(re.sub('[0]', '', s)) num_zero += len(s)-tmp s = format(tmp, 'b') count += 1 if s == '1': break return [count, num_zero] regular expression과 format 을 사용하면 간단하게 풀 수 있는 문제였다. 문제 - programmers.co.kr/learn/courses/30/lesso..
기간 2020.07.01-2021.02.28 직무 DevOps 엔지니어 1. 계기 4학년 1학기, 졸업 프로젝트를 마치고 앞으로 뭘 해야 할지 고민할 때 즈음 친구가 현장실습을 지원한다는 말을 듣고 나도 직무 경험을 더 해봐야겠다는 생각에 현장실습을 지원하게 됐다. 졸업학점도 다 채우고, 더 이상 들어야 하는 강의도 없었기에 학기 대체를 해서 돈도 벌면서 취업 준비도 해보겠다는 그런 생각으로 현장실습에 지원하게 됐다. 하지만 그런 생각은.. 정말 내가 나를 모르고 지원했던 거였다. 나는 118%로 초과해서 들은 전공 수업에서도 시험을 보지 않고 팀 프로젝트로만 평가하거나 시험 비중이 낮은 PBL(Problem Based Learning) A0, A+만 받았던 사람이다... 나는.. 개인과제를 하지못하는 ..
어렵지 않다. 진짜.. import pandas as pd from konlpy.tag import Okt 검색하면 꽤 많이 나오는 Twitter가 5.0버전부터 Okt로 바뀌었다고 한다. f = open('title.txt', 'rt', encoding='UTF8') lines = f.read() f.close() 파일은 열면 닫는 습관을 갖는게 좋다고 누군가가 말했다. 기억은 안난다. split = Okt() nouns = split.nouns(lines) 이렇게 하면 title.txt파일에서 읽어온 문장들의 명사만 남게 된다. word_list = [] for n in nouns: if len(n)>=2: word_list.append(n) 한글자 짜리는 핵심적인 키워드로 사용하기도 힘들고 대부분 ..
https://hello-i-t.tistory.com/9 Git remote branch 가져오기 기존에 학교에 다닐때는 git commit -m, git push, git pull 정도만 써서 branch를 도대체 어떻게 해야하는지 어려웠고, 분명 인터넷에 나온대로 했는데도 계속 오류가 생겨서 힘들었다. 그래서 공부했다. 1 hello-i-t.tistory.com 위의 글에서 언급한 것 처럼 나는 리모트 브랜치 이름도 잘못 만들어서 변경을 해야했고, 커밋 메시지도 형식에 맞추어 만들지 않아서 내용을 변경해야 했다. 그런데 어떻게 해야하는지 몰라서 한참을 헤맸다 ㅎㅎ 5시 퇴근인데 5시 16분까지 남아있다가(오류가 4시 55분에 생겨서 퇴근할까 말까 하다가 역시 오류를 남겨두고 퇴근하는건 찝찝해서) 16..
도대체 .git 폴더가 뭐길래 계속 생기는지, 이게 왜 필요한지 궁금했다. 그런데 구글에서 찾다보니 너무 어려웠다. 그래서 쉽게 나온 블로그들 글을 찾다 찾다 나온 내용은 아래와 같다! .git의 정체는 Git 저장소이자 git으로 추적, 관리하는 대상이다. object 디렉토리에 객체가 생성되는 시점을 git add 명령어로 파일을 스테이징 시킬 때, staging area에 파일을 등록한다. 여기서 staging area란 직후의 commit에 어떤 것들이 포함될 지 알려주는 정보를 가지고 있는 파일을 말한다. 그러니까 즉, 우리가 github에서 프로젝트를 로컬로 클론하고 git add, git commit 이런식으로 변경사항을 만드는데, 바로 이런 변경사항을 .git 폴더에 저장을 해서, 우리가 ..
기존에 학교에 다닐때는 git commit -m, git push, git pull 정도만 써서 branch를 도대체 어떻게 해야하는지 어려웠고, 분명 인터넷에 나온대로 했는데도 계속 오류가 생겨서 힘들었다. 그래서 공부했다. 1. Git remote 갱신 $ git remote update2. 원격 저장소 branch 확인 $ git branch -r # -r(remote) 옵션으로 원격 저장소의 branch list를 볼 수 있다. $ git branch -a # -a(all) 옵션으로 로컬과 원격 저장소 모두의 branch list를 볼 수 있다.3. 원격 저장소 branch 가져오기 $ git checkout -t remote_branch_name이거 몰랐는데,, 나중에 오류가 생기고 나서 검색해..
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다. 어제도 이 오류가 떠서 그냥 잤는데 무사해결했다! 회사 컴퓨터에서도 똑같은 오류가 뜨니 이상해서 혹시나하고 확인해보니 pip uninstall jpype1 pip install jpype1 이렇게 다시 설치해주면 된다!
파이썬에서 엑셀 파일 불러오기 import pandas as pd df = pd.read_excel(r'파일 경로') print(df) 이렇게 파일을 불러오면 이런식으로 리스트가 쭉쭉쭉 나온다. 여기서 가장 빈도가 높게 나오는 단어들을 찾을거다. plist = df.values.tolist() 이렇게하면 dataframe에서 list로 변환을 할 수 있다. 리스트로 변환을 하는 이유는... 나는 리스트를 사용하는 걸 좋아하기 때문이다... 그런데 위에서 보면 알겠지만 제목 옆에 1.0 이랑 NaN이라는 값이 있다. 저건 내 나름대로 필요해서 엑셀파일에 표시해놨지만 지금은 필요없다. 그래서 저게 없는, 순수하게 제목만 있는 리스트를 만들었다. title = [] for i in range(len(plist..
목표 컴퓨터 비전을 사용해서 자율 주행 기부 로봇 만들기 기간 2019.09-2019.12 역할 소프트웨어 개발 담당 언어/환경 Python3/Ubuntu 18.04(Tx2 board, logitech depth camera) 라이브러리 torch, numpy, cv2, preprocess, argparse, pickle 1. 계기 자율 주행 로봇 개발은 [지능형 로봇 크래쉬 랩]이라는 로봇 공학과의 PBL 수업이었다. 이미 졸업에 필요한 전공 학점을 다 채운 나에게 필요한 과목이 아니었다. 즉 단순히 흥미를 위해 신청한 과목이었다(그리고 재밌을 것 같았다). # 세상은_내가_원하는대로만_굴러가지_않는다 원래 이 과목은 소프트웨어학부 학생 2명, 로봇 공학과 학생 3명으로 팀이 이루어지는 과목이었다. 그..