모각코+/파이썬 크롤링

[모각코+] 파이썬 크롤링 2월 과정 14일차

Jshrewd 2022. 2. 24. 23:45
728x90

https://codemate.kr/@Qcell/%EB%84%A4%EC%9D%B4%EB%B2%84-%EC%8A%A4%ED%8F%AC%EC%B8%A0-%EC%95%BC%EA%B5%AC-%EC%84%A0%EC%88%98-%EA%B0%9C%EC%9D%B8%EA%B8%B0%EB%A1%9D-%ED%81%AC%EB%A1%A4%EB%A7%81

 

네이버 스포츠 야구 선수 개인기록 크롤링 by Qcell | 코드메이트

이번 자유로운 크롤링 시간에 저는 목표로 삼았던 KBO 선수들의 선수 개인기록을 투수 / 타자 부문으로 나누어 동적 크롤링을 시도해 보았습니다 :) 코드 파일 from selenium import webdriver from selenium.we

codemate.kr

네이버 스포츠 야구 선수 개인기록 크롤링

이번 자유로운 크롤링 시간에 저는 목표로 삼았던 KBO 선수들의 선수 개인기록을

 

투수 / 타자 부문으로 나누어 동적 크롤링을 시도해 보았습니다 :)

 

코드 파일

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
import time


chrome_driver = ChromeDriverManager().install()
service = Service(chrome_driver)
driver = webdriver.Chrome(service=service)


baseball_url = "https://sports.news.naver.com/kbaseball/record/index?category=kbo"
driver.get(baseball_url)


time.sleep(3)


pitcher = driver.find_element(By.ID,"_pitcherRecord").text
print(pitcher)


xpath = "/html/body/div[2]/div[2]/div/div[1]/div/div[5]/div/ul/li[2]/a/span"
button = driver.find_element(By.XPATH,xpath)
button.click()
time.sleep(3)


batter = driver.find_element(By.ID,"_batterRecord").text
print(batter)
driver.close()

 

 

실행 결과

 

투수 부문

 

타자 부문

 

원하는 기록을 모두 긁어오는데 성공했으나, 출력 양식을 어떻게 다루어야 할지 고민에 빠졌습니다.

차후에 csv 라이브러리를 활용하여 엑셀에 정리하는게 베스트라고 판단됩니다.

728x90