반응형

파이썬 3

[Python] HTML 테이블 파이썬 List로 만들기(feat. 파일첨부)

개요 파이썬으로 웹페이지에서 Table을 추출 후, List로 만들어 보겠습니다. 단순히 Row by Row의 경우가 아닌 셀이 합쳐진 경우에 대해서 다뤄보겠습니다. 문제정의 테이블은 기본적으로 n*m의 체계를 가지고 있습니다. 하지만 사용자 편의에 따라 몇몇 셀들이 합쳐지기도 합니다. 이런 테이블의 경우 단순히 한줄씩 루프를 돌리는 방식으로 해결되지 않습니다. 대표적인 형태는 아래와 같습니다. 거의 반나절을 해결해보려 했지만 결국 제 손에선 실패했습니다. 하지만 인터넷은 훌륭합니다. 코드가 있어서 첨부합니다. def table_to_2d(table_tag): rowspans = [] # track pending rowspans rows = table_tag.find_all('tr') # first sc..

기타/공부노트 2021.01.21

[Python / request] request를 이용해 csv파일 가져오기.

개요 오늘은 request를 이용해서 csv 파일을 가져와보도록 하겠습니다. 발단 : wget 사용불가 요즘 배우는 머신러닝 예제 중, wget을 이용해서 csv를 다운로드 받아야 하는 부분이 있었습니다. 그래서 우선 wget을 이용해 보기로 했습니다. wget 기본구문 import wget print('Beginning file download with wget module') url = 'http://i3.ytimg.com/vi/J---aiyznGQ/mqdefault.jpg' wget.download(url, 'cat4.jpg') wget은 매우 간단했습니다. 위의 스크린 캡쳐는 왜 !wget인지 잘 모르겠지만. 순서는 다음과 같이 볼 수 있습니다. 라이브러리를 임포트한다 인터넷상의 url을 지정한다..

기타/공부노트 2021.01.18

[파이썬 / python]챕터5: 튜플, 리스트, 앨리어싱, 변경가능, 복제 (Tuples, Lists, Aliasing, Mutability, Cloning)

※ MIT 6-0001-fall-2016 강의내용 정리입니다. 원 내용은 MIT Opencourseware에서 찾아 보실 수 있습니다. ※ 설명용 그림들은 아이폰 크기를 기준으로 만들었습니다. PC로 보시는 분들은 브라우저 가로 사이즈를 줄이시면 한눈에 보실 수 있습니다. 튜플 튜플의 정의 및 특성 an ordered sequence of elements, can mix element types cannot change element values, immutable represented with parentheses 요소의 정렬된 배열이며, 여러가지 타입을 섞을 수 있다 요소들의 값을 바꿀 수 없다. ()로 표현한다 예시 코드 te = () -> 비어있는 tuple 생성 t = (2,"mit",3) pr..

기타/공부노트 2021.01.17
반응형