Day17-4 정적 웹사이트 파이썬을 이용한 크롤링 & MongoDB 저장

JX405기_비트/mongoDB

Day17-4 정적 웹사이트 파이썬을 이용한 크롤링 & MongoDB 저장

_하루살이_ 2023. 2. 8. 13:46

from bs4 import BeautifulSoup
import urllib.request
stores=[]; // 결과를 저장할 리스트
encText = urllib.parse.quote('서울') 

for page in range(1, 17) :
    Hollys_url = 'https://www.hollys.co.kr/store/korea/korStore2.do?pageNo=%d&gugun=&store=&sido='%(page)
    print(Hollys_url)
    html = urllib.request.urlopen(Hollys_url)
    soupHollys = BeautifulSoup(html, 'html.parser')
    tag_tbody = soupHollys.find('tbody')
    for store in tag_tbody.find_all('tr'):
        store_info = dict() // 개별 매장 정보를 사전 형태로 저장
        store_td = store.find_all('td')
        store_name = store_td[1].string; store_info["store_name"] = store_td[1].string
        store_sido = store_td[0].string; store_info["store_sido"] = store_td[0].string
        store_address = store_td[3].string; store_info["store_address"] = store_td[3].string
        store_phone = store_td[5].string; store_info["store_phone"] = store_td[5].string
        print('매장명', store_name, '시도구', store_sido, '주소', store_address, '전화번호', store_phone)
        stores.append(store_info) 
    for store in stores : 
        print(store)

db에 저장

import pymongo

conn=pymongo.MongoClient()
db = conn.bitDB

db.hollys.insert_many(stores)

저작자표시 비영리 변경금지 (새창열림)

'JX405기_비트 > mongoDB' 카테고리의 다른 글

Day18-1 동적 웹페이지 크롤링 (0)	2023.02.08
Day17-3 몽고 디비와 Phyton 연동 (0)	2023.02.08
Day17-2 MongoDB 연습 문제3 (0)	2023.02.08
Day17 -1 인덱싱(단일 인덱스, 복합인덱스), 텍스트 인덱스, 공간 정보 쿼 (0)	2023.02.08
Day17-0 MongoDB Day16 요약 & SQL과 비교 (0)	2023.02.08

현재글Day17-4 정적 웹사이트 파이썬을 이용한 크롤링 & MongoDB 저장

oneulCoding

Today :
Yesterday :

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

oneulCoding

Day17-4 정적 웹사이트 파이썬을 이용한 크롤링 & MongoDB 저장

'JX405기_비트 > mongoDB' 카테고리의 다른 글

'JX405기_비트/mongoDB'의 다른글

티스토리툴바

Day17-4 정적 웹사이트 파이썬을 이용한 크롤링 & MongoDB 저장

'JX405기_비트 > mongoDB' 카테고리의 다른 글

'JX405기_비트/mongoDB'의 다른글

관련글

티스토리툴바