본문 바로가기
728x90

분류 전체보기122

문자열 함수 - 파이썬 #특정 문자열 이후 제거temp = "테스트 문자열 입니다"temp = temp.split("문자열", 1)[0]print(temp) -> 결과 -> 테스트​#특정 문자 제거temp.replace("문자", "") 2024. 7. 3.
selenium 크롬창 띄우지 않고 크롤링하기 - 파이썬 옵션을 주지 않고 실행하면 크롬창이 하나 출력되고 크롤링이 된다. 이 새로운 창을 띄우지 않고 실행하는 방법이다. ​from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom selenium.webdriver.common.by import Byfrom webdriver_manager.chrome import ChromeDriverManager​options = webdriver.ChromeOptions()options.add_argument('headless')options.add_argument('window-size=1920x1080')options.add_argument("disable-gpu")​dr.. 2024. 7. 2.
find_elements 함수 사용 - 파이썬, selenium By.ID 태그의 id값으로 추출By.NAME 태그의 name값으로 추출By.XPATH 태그의 경로로 추출By.LINK_TEXT 링크 텍스트값으로 추출By.PARTIAL_LINK_TEXT 링크 텍스트의 자식 텍스트 값을 추출By.TAG_NAME 태그 이름으로 추출By.CLASS_NAME 태그의 클래스명으로 추출By.CSS_SELECTOR css선택자로 추출​from selenium.webdriver.common.by import By​driver.find_elements(By.XPATH, '//button[text()="Some text"]')driver.find_elements(By.XPATH, '//button')driver.find_elements(By.ID, 'loginForm')driver.fi.. 2024. 7. 2.
selenium class 가져오기 - 파이썬 구글 뉴스에 들어가서 class 명 DY5T1d 로 되어 있는 타이틀들을 가져오는 소스이다​처음에는 find_element_by_css_selector를 사용했는데 아래와 같은 경고 메세지가 나왔다​DeprecationWarning: find_elements_by_* commands are deprecated​찾아보니 find_elements_by_* 사용하지 말고 find_elements 를 사용하란다​from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom selenium.webdriver.common.by import Byfrom webdriver_manager.chrome import ChromeD.. 2024. 7. 2.
selenium + chrome 사용설정 - 파이썬 selenium + chrome 을 사용하기 위한 절차이다. ​1. selenium 패키지 설치​2. webdriver-manager 패키지 설치​3. 아래와 같이 소스를 사용하여 현재 OS에 설치된 크롬 브라우저를 사용하도록 세팅​from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom webdriver_manager.chrome import ChromeDriverManager​driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))driver.get("https://www.google.com") 2024. 7. 2.
두번째 td 값 가져오기 - 파이썬 아래와 같은 tr 에서 두번 째 td 값을 가져오고 싶을 경우​남성264,271 (52.48)2,123 (51.40)0.80​nameList = bsObj.findAll("tr")for tr in nameList:  print(tr.select('td')[1].span.text)​출력값은 2,123 이다. 2024. 7. 2.
반응형