728x90 분류 전체보기122 숫자에서 쉼표제거하기 - 파이썬 숫자를 크롤링할 경우 보통 쉼표를 포함하고 있는데 이럴 경우 파이썬은 숫자로 인식하지 않아 연산을 할 수 없다. 그럴 경우 아래와 같이 쉼표를 제거해야한다. num = "123,123"print(num.replace(",","")) 2024. 7. 2. 검색어가 들어있는 tr 찾기 - 파이썬 모든 tr 을 가져와 '남성', '여성' 단어가 들어가 있는 tr 만 뽑아오기nameList = bsObj.findAll("tr")for tr in nameList: chk = tr.find("th",string={"남성","여성"}) if chk!=None: print(tr) 2024. 7. 2. 문자열에서 숫자만 가져오기 - 파이썬 문자열에 들어있는 숫자만 가져오는 방법import re string = 'aaa1234, ^&*2233pp' numbers = re.sub(r'[^0-9]', '', string) print(numbers) 2024. 7. 2. 네이버tv 재생수 가져오기 - 파이썬, 크롤링 네이버tv 화면에 표시되는 재생 수를 크롤링하여 가져오기재생 수는 play 아이디를 사용하는 span 태그안에 있다from urllib.request import urlopenfrom bs4 import BeautifulSoupimport retry:html = urlopen("https://tv.naver.com/v/24002047/list/67096")bsObj = BeautifulSoup(html.read(), "html.parser")nameList = bsObj.findAll("span", {"class": "play"})for name in nameList: numbers = re.sub(r'[^0-9]', '', name.get_text()) print(numbers)except H.. 2024. 7. 2. csv 파일 읽어오기 - 파이썬 from urllib.request import urlopenfrom io import StringIOimport csvdata = urlopen("http://test.co.kr/test.csv").read().decode('ascii','ignore')dataFile = StringIO(data)csvReader = csv.reader(dataFile)for row in csvReader:print(row) 2024. 7. 2. 파일 읽어오기 - 파이썬 from urllib.request import urlopentxtPage = urlopen("https://www.test.co.kr/test.txt")print(txtPage.read())//인코딩시print(str(txtPage.read(), 'utf-8')) 2024. 7. 2. 이전 1 ··· 16 17 18 19 20 21 다음 반응형