-
[모각코+] 파이썬 크롤링 2월 과정 14일차모각코+/파이썬 크롤링 2022. 2. 24. 23:45728x90
네이버 스포츠 야구 선수 개인기록 크롤링 by Qcell | 코드메이트
이번 자유로운 크롤링 시간에 저는 목표로 삼았던 KBO 선수들의 선수 개인기록을 투수 / 타자 부문으로 나누어 동적 크롤링을 시도해 보았습니다 :) 코드 파일 from selenium import webdriver from selenium.we
codemate.kr
네이버 스포츠 야구 선수 개인기록 크롤링
이번 자유로운 크롤링 시간에 저는 목표로 삼았던 KBO 선수들의 선수 개인기록을
투수 / 타자 부문으로 나누어 동적 크롤링을 시도해 보았습니다 :)
코드 파일
from selenium import webdriver from selenium.webdriver.chrome.service import Service from webdriver_manager.chrome import ChromeDriverManager from selenium.webdriver.common.by import By import time chrome_driver = ChromeDriverManager().install() service = Service(chrome_driver) driver = webdriver.Chrome(service=service) baseball_url = "https://sports.news.naver.com/kbaseball/record/index?category=kbo" driver.get(baseball_url) time.sleep(3) pitcher = driver.find_element(By.ID,"_pitcherRecord").text print(pitcher) xpath = "/html/body/div[2]/div[2]/div/div[1]/div/div[5]/div/ul/li[2]/a/span" button = driver.find_element(By.XPATH,xpath) button.click() time.sleep(3) batter = driver.find_element(By.ID,"_batterRecord").text print(batter) driver.close()
실행 결과
투수 부문
타자 부문
원하는 기록을 모두 긁어오는데 성공했으나, 출력 양식을 어떻게 다루어야 할지 고민에 빠졌습니다.
차후에 csv 라이브러리를 활용하여 엑셀에 정리하는게 베스트라고 판단됩니다.
728x90'모각코+ > 파이썬 크롤링' 카테고리의 다른 글
[모각코+] 파이썬 크롤링 2월 과정 12일차 (0) 2022.02.22 [모각코+] 파이썬 크롤링 2월 과정 11일차 (0) 2022.02.21 [모각코+] 파이썬 크롤링 2월 과정 9일차 (0) 2022.02.17 [모각코+] 파이썬 크롤링 2월 과정 8일차 (0) 2022.02.16 [모각코+] 파이썬 크롤링 2월 과정 7일차 (0) 2022.02.15