본문 바로가기
728x90

분류 전체보기122

숫자에서 쉼표제거하기 - 파이썬 숫자를 크롤링할 경우 보통 쉼표를 포함하고 있는데 이럴 경우 파이썬은 숫자로 인식하지 않아 연산을 할 수 없다. ​그럴 경우 아래와 같이 쉼표를 제거해야한다. ​num = "123,123"print(num.replace(",","")) 2024. 7. 2.
검색어가 들어있는 tr 찾기 - 파이썬 모든 tr 을 가져와 '남성', '여성' 단어가 들어가 있는 tr 만 뽑아오기​nameList = bsObj.findAll("tr")for tr in nameList: chk = tr.find("th",string={"남성","여성"}) if chk!=None: print(tr) 2024. 7. 2.
문자열에서 숫자만 가져오기 - 파이썬 문자열에 들어있는 숫자만 가져오는 방법​import re ​string = 'aaa1234, ^&*2233pp' numbers = re.sub(r'[^0-9]', '', string) print(numbers) 2024. 7. 2.
네이버tv 재생수 가져오기 - 파이썬, 크롤링 네이버tv 화면에 표시되는 재생 수를 크롤링하여 가져오기​재생 수는 play 아이디를 사용하는 span 태그안에 있다​​from urllib.request import urlopenfrom bs4 import BeautifulSoupimport re​try:html = urlopen("https://tv.naver.com/v/24002047/list/67096")bsObj = BeautifulSoup(html.read(), "html.parser")​nameList = bsObj.findAll("span", {"class": "play"})for name in nameList: numbers = re.sub(r'[^0-9]', '', name.get_text()) print(numbers)except H.. 2024. 7. 2.
csv 파일 읽어오기 - 파이썬 from urllib.request import urlopenfrom io import StringIOimport csv​data = urlopen("http://test.co.kr/test.csv").read().decode('ascii','ignore')dataFile = StringIO(data)csvReader = csv.reader(dataFile)​for row in csvReader:print(row) 2024. 7. 2.
파일 읽어오기 - 파이썬 from urllib.request import urlopentxtPage = urlopen("https://www.test.co.kr/test.txt")print(txtPage.read())​//인코딩시print(str(txtPage.read(), 'utf-8')) 2024. 7. 2.
반응형