Community

개발자 99% 커뮤니티에서 수다 떨어요!

← Go back
웹 스크래핑 강의 입니다 대략 #2.5에서 부터 원하는 결과값이 나오질 않네요
#python
2년 전
7,693
6

##main.py

from indeed import extract_indeed_pages, extract_indeed_jobs

last_indeed_page = extract_indeed_pages()

indeed_jobs = extract_indeed_jobs(last_indeed_page)

print(indeed_jobs)

##indeed.py

import requests

from bs4 import BeautifulSoup

LIMIT = 50

URL = "http://www.indeed.com/jobs?q=python&limit={LIMIT}"

def extract_indeed_pages():

result = requests.get(URL)

soup = BeautifulSoup(result.text, "html.parser")

pagination = soup.find("div", {"class":"pagination"})

links = pagination.find_all('a')

pages = []

for link in links[:-1]:

pages.append(int(link.string))

max_page = pages[-1]

return max_page

def extract_indeed_jobs(last_page):

jobs = []

result = requests.get(f"{URL}&start={0*LIMIT}")

soup = BeautifulSoup(result.text, "html.parser")

results = soup.find_all("div", {"class": "jobsearch-SerpJobCard"})

for result in results:

title = result.find("div", {"class": "title"}).find("a")["title"]

company = result.find("span", {"class": "company"})

company_anchor = company.find("a")

if company_anchor is not None:

company = str(company_anchor.string)

else:

company = str(company.string)

company = company.strip()

print(company)

return jobs

정확히 이렇게 치고 실행하는데 []라는 결과값만 뜨고 아무 값도 반환이 안 되네요

(그냥 결과값으로 빈칸만 나옵니다)

제 스스로 어느 정도는 해결이 되야 그 다음 강의를 들으면서 진행이 될 거같은데

여기서 막혀서 진행이 안 됩니다

조금만 도와주세요

indeed페이지 설정 자체가 바뀌어서 그런 건지 제가 뭔가 잘못 입력해서 그런 것인지

모르겠습니다

6 comments