티스토리

운클라우드
Wooncloud Blog
운클라우드
  • 분류 전체보기
    • 이야기
      • 일기
      • 개발일지
      • 제품 리뷰
      • 기타
    • 정보
      • 유용한 사이트
    • 개발 아카이브
      • HTML, CSS
      • Javascript
      • SVELTEKIT
      • Node Js
      • JAVA
      • Spring
      • 코드 저장소
      • 라이브러리
      • 개발 관련 지식
      • AWS, Cloud, Server
      • DATABASE
    • 스터디
      • 정보처리기사
      • 친절한 SQL 튜닝 스터디

블로그 메뉴

  • 홈
  • 방명록
  • 운구름 웹
  • 벨로그
  • 깃허브
  • 리틀리
  • 도시부엉

인기 글

최근 글

태그

  • 코드저장소
  • TurboFan
  • 자바
  • 튜닝
  • 회고
  • 이클립스
  • API
  • 라이브러리
  • javascript
  • html
  • 폰트
  • Java
  • CSS
  • 스터디
  • 웹디자인
  • 리뷰
  • 마크다운
  • 자바스크립트
  • SQL
  • 정보처리기사
전체 방문자
오늘
어제
hELLO · Designed By 정상우.
운클라우드

Wooncloud Blog

[Python]NHN 채용 공고 크롤링, 검색, 추출 코드
개발 아카이브/코드 저장소

[Python]NHN 채용 공고 크롤링, 검색, 추출 코드

2021. 8. 10. 15:13
반응형

본 포스팅은 유용한 코드를 개인적으로 쓰기위한 코드저장을 포스팅입니다.

다른 기업 채용사이트에 비해 NHN 채용사이트는 특정 키워드로 검색하는 기능이 없길래 심심해서 만들었습니다.

 

 

필수 라이브러리

  • requests
  • BeautifulSoup

 

코드

import requests
from bs4 import BeautifulSoup
from datetime import datetime

URL = 'https://recruit.nhn.com'
param={'type':'company'}
recruit_list = []
selected_recruits = []

# 채용공고 리스트 추출
print('>> 리스트 추출 중...')
responce = requests.get(URL + '/ent/recruitings', params=param)
html = BeautifulSoup(responce.text, 'html.parser')
emts = html.select('.tbl_lst .frst_td > a')

for e in emts:
	recruit_one = [e.get_text(), e.get('href')]
	recruit_list.append(recruit_one)


# 각 공고 방문 후 관련 키워드 추출
print('-------------------------------------------')
print('키워드를 입력하시면 입력하신 키워드로 공고를 검색합니다.')
print('예 : spring, java, python, 신입, 경력, 딥러닝 등..')
search_text = input('키워드를 입력하세요. (1개만 가능) : ')


print('>> 각 공고 방문 후 관련 키워드 추출...')

for r in recruit_list:
	rec_html = requests.get(URL + r[1]).text
	rec_html = rec_html.lower()
	if rec_html.find(search_text) != -1:
		selected_recruits.append(r)
	

# print(selected_recruits)

# 관련 키워드로 추출한 공고 Export
print('>> Export...')
today = datetime.today()

fileName = "NHN_" + str(today)[:10] + "_" + (str(today).replace(":", "_"))[11:19] + ".csv"
f = open(fileName, 'w')

for rec in selected_recruits:
	f.write(rec[0] + "," + URL + rec[1] + "\n")

f.close()

print('파일명 : ' + fileName + '으로 추출이 완료 되었습니다.\n>> [종료됨]')

 

반응형
저작자표시 비영리 변경금지 (새창열림)

'개발 아카이브 > 코드 저장소' 카테고리의 다른 글

정규표현식 문법 공부하기  (0) 2021.09.30
하노이탑 코드 저장  (0) 2020.10.31
[자바스크립트] 날짜 형식 yyyy-MM-dd로 변환  (0) 2020.10.27
[자바스크립트] 날짜에 일수 더하기  (0) 2020.10.15
[자바스크립트] 변수에 빈값인지 체크하기  (0) 2020.10.13
    '개발 아카이브/코드 저장소' 카테고리의 다른 글
    • 정규표현식 문법 공부하기
    • 하노이탑 코드 저장
    • [자바스크립트] 날짜 형식 yyyy-MM-dd로 변환
    • [자바스크립트] 날짜에 일수 더하기

    티스토리툴바