728x90 분류 전체보기122 문자열 함수 - 파이썬 #특정 문자열 이후 제거temp = "테스트 문자열 입니다"temp = temp.split("문자열", 1)[0]print(temp) -> 결과 -> 테스트#특정 문자 제거temp.replace("문자", "") 2024. 7. 3. selenium 크롬창 띄우지 않고 크롤링하기 - 파이썬 옵션을 주지 않고 실행하면 크롬창이 하나 출력되고 크롤링이 된다. 이 새로운 창을 띄우지 않고 실행하는 방법이다. from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom selenium.webdriver.common.by import Byfrom webdriver_manager.chrome import ChromeDriverManageroptions = webdriver.ChromeOptions()options.add_argument('headless')options.add_argument('window-size=1920x1080')options.add_argument("disable-gpu")dr.. 2024. 7. 2. find_elements 함수 사용 - 파이썬, selenium By.ID 태그의 id값으로 추출By.NAME 태그의 name값으로 추출By.XPATH 태그의 경로로 추출By.LINK_TEXT 링크 텍스트값으로 추출By.PARTIAL_LINK_TEXT 링크 텍스트의 자식 텍스트 값을 추출By.TAG_NAME 태그 이름으로 추출By.CLASS_NAME 태그의 클래스명으로 추출By.CSS_SELECTOR css선택자로 추출from selenium.webdriver.common.by import Bydriver.find_elements(By.XPATH, '//button[text()="Some text"]')driver.find_elements(By.XPATH, '//button')driver.find_elements(By.ID, 'loginForm')driver.fi.. 2024. 7. 2. selenium class 가져오기 - 파이썬 구글 뉴스에 들어가서 class 명 DY5T1d 로 되어 있는 타이틀들을 가져오는 소스이다처음에는 find_element_by_css_selector를 사용했는데 아래와 같은 경고 메세지가 나왔다DeprecationWarning: find_elements_by_* commands are deprecated찾아보니 find_elements_by_* 사용하지 말고 find_elements 를 사용하란다from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom selenium.webdriver.common.by import Byfrom webdriver_manager.chrome import ChromeD.. 2024. 7. 2. selenium + chrome 사용설정 - 파이썬 selenium + chrome 을 사용하기 위한 절차이다. 1. selenium 패키지 설치2. webdriver-manager 패키지 설치3. 아래와 같이 소스를 사용하여 현재 OS에 설치된 크롬 브라우저를 사용하도록 세팅from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom webdriver_manager.chrome import ChromeDriverManagerdriver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))driver.get("https://www.google.com") 2024. 7. 2. 두번째 td 값 가져오기 - 파이썬 아래와 같은 tr 에서 두번 째 td 값을 가져오고 싶을 경우남성264,271 (52.48)2,123 (51.40)0.80nameList = bsObj.findAll("tr")for tr in nameList: print(tr.select('td')[1].span.text)출력값은 2,123 이다. 2024. 7. 2. 이전 1 ··· 15 16 17 18 19 20 21 다음 반응형